07、poly-A内参和杂交内参(arrayanalysis的问题)
為了驗證雜交的質量,Affymetrix公司加入了兩類嵌入探針組:
?
一、poly-A內參:包括lys、phe、thr、dap
對應的探針組名稱為:AFFX-r2-Bs-lys-3_at、AFFX-r2-Bs-dap-3_at、
AFFX-r2-Bs-phe-3_at、AFFX-r2-Bs-thr-3_s_at
(注意:一般只取3’的表達值)
期望檢測到的信號強度為lys<phe<thr<dap
期望lys檢測值(Detection?Call)為P
?
以樣品GSM362947_LTT.CEL和GSM362948_LTT.CEL為例:
?
1)獲取lys、phe、thr、dap的信號強度
library(yaqcaffy)
rawData<-ReadAffy("GSM362947_LTT.CEL","GSM362948_LTT.CEL")
yaqcResult<-yaqc(rawData)
>?yaqcResult@morespikes[grep("(lys|phe|thr|dap).*3",rownames(yaqcResult@morespikes),?ignore.case?=?TRUE),]
?????GSM362947_LTT.CEL?GSM362948_LTT.CEL
dap3?????????621.85881?????????618.93019
thr3?????????157.46776?????????141.04182
lys3??????????26.22679??????????24.34060
phe3??????????80.33482??????????78.98733
???????????????
在這個例子中,兩個樣品的lys、phe、thr、dap信號強度都符合lys<phe<thr<dap
?
?
2)arrayanalysis的問題
用R語言軟件arrayanalysis分析以上樣品得出的結論卻是:
這明顯不符合lys<phe<thr<dap,這是為什么?
我們先來看看yaqcResult@morespikes是什么:
?
?????GSM362947_LTT.CEL?GSM362948_LTT.CEL
b5???????????102.92636?????????123.20557
b3????????????98.75225?????????106.84035
bm???????????113.12133?????????129.45077
c5???????????298.87382?????????322.52600
c3???????????361.89032?????????421.07440
d5??????????1289.20872????????1334.69642
d3??????????1489.85897????????1702.89382
dap5?????????303.57364?????????156.58720
dap3?????????621.85881?????????618.93019
dapm?????????414.50848?????????333.24881
thr5?????????108.41316??????????39.60845
thr3?????????157.46776?????????141.04182
thrm?????????129.56930??????????98.51053
lys5??????????23.28581??????????21.26793
lys3??????????26.22679??????????24.34060
lysm??????????30.29455??????????28.88963
phe5??????????31.29219??????????12.49173
phe3??????????80.33482??????????78.98733
phem??????????47.31779??????????32.76261
?
?
在arrayanalysis的源碼functions_imagesQC.R中,先用正則表達提取出yaqcResult@morespikes中符合"(lys|phe|thr|dap).*3"條件的:
>?spnames<-rownames(yaqcResult@morespikes[grep("(lys|phe|thr|dap).*3",?#?only?3'?!
+?rownames(yaqcResult@morespikes),?ignore.case?=?TRUE),])
>?spnames
[1]?"dap3"?"thr3"?"lys3"?"phe3"
注意到spnames的順序是"dap3"?"thr3"?"lys3"?"phe3"而不是"lys3"?"phe3"?"thr3"?"dap3"
?
?
然后把名稱為spnames的探針組也就是"dap3"?"thr3"?"lys3"?"phe3"的信號強度賦給sprep
>?sprep<-t(yaqcResult@morespikes[spnames,])
>?sprep
??????????????????????dap3?????thr3?????lys3?????phe3
GSM362947_LTT.CEL?621.8588?157.4678?26.22679?80.33482
GSM362948_LTT.CEL?618.9302?141.0418?24.34060?78.98733
?
sprep的數(shù)據(jù)就直接用來作圖了,所以上圖的信號強度趨勢的順序應該是dap、thr、lys、phe,而不是預想的lys、phe、thr、dap
?
(現(xiàn)在我所使用的arrayanalysis版本確實存在這個問題,但是也許以后會改進)
?
?
?
3)獲取lys的檢測值:
calls<-detection.p.val(rawData)$call
lysCall<-calls[rownames(calls)[grep("AFFX-r2-Bs-lys-3_at",rownames(calls),?ignore.case?=?TRUE)],]
>?lysCall
GSM362947_LTT.CEL.present ?GSM362948_LTT.CEL.present?
??????????????????????"P"???????????????????????"P"?
結論:兩個樣品的lys的檢測值都為P
?
?
二、雜交內參:包括BioB、BioC、BioD、CreX
對應的探針組名稱為:AFFX-r2-Ec-bioB-3_at、AFFX-r2-Ec-bioC-3_at、
AFFX-r2-Ec-bioD-3_at、AFFX-r2-P1-cre-3_at
(注意:一般只取3’的表達值)
期望檢測到的信號強度為BioB<BioC<BioD<CreX
期望BioB檢測值(Detection?Call)為P
?
?
以樣品GSM286756.CEL為例:
?
1)獲取BioB、BioC、BioD、CreX的信號強度
library(simpleaffy)
qcResult<-qc(rawData)
>?spikeInProbes(qcResult)
??????????????????AFFX-r2-Ec-bioB-3_at?AFFX-r2-Ec-bioC-3_at
GSM362947_LTT.CEL?????????????6.625742?????????????8.499409
GSM362948_LTT.CEL?????????????6.739313?????????????8.717931
??????????????????AFFX-r2-Ec-bioD-3_at?AFFX-r2-P1-cre-3_at
GSM362947_LTT.CEL?????????????10.54096????????????12.37574
GSM362948_LTT.CEL?????????????10.73377????????????12.48219
???????
在這個例子中,兩個樣品的BioB、BioC、BioD、CreX信號強度都符合BioB<BioC<BioD<CreX
?
2)獲取BioB的檢測值:
>?show(yaqcResult)
??????????????????????????GSM362947_LTT.CEL???GSM362948_LTT.CEL?
……
AFFX-r2-Ec-bioB-3_at_call? "P"?????????????????"P"
……
?
結論:兩個樣品的BioB檢測值都為P
?
?
三、計算poly-A內參和雜交內參的信號強度表達值采用了JustMAS算法,芯片中必須含有MM探針。除此之外,芯片中還要包含AFFX-r2-Bs-lys-3_at、AFFX-r2-Bs-dap-3_at、AFFX-r2-Bs-phe-3_at、AFFX-r2-Bs-thr-3_s_at、AFFX-r2-Ec-bioB-3_at、AFFX-r2-Ec-bioC-3_at、AFFX-r2-Ec-bioD-3_at、AFFX-r2-P1-cre-3_at探針組。不過這些步驟都由yaqc和qc函數(shù)完成了,讀者不必過多關心JustMAS算法。yaqc和qc有一點不同,就是計算出信號強度表達值x后,yaqc會取2的x次方,qc則是2的x次方再取2的對數(shù),也就是又變回x了。
?
轉載于:https://www.cnblogs.com/xianwen/p/4522286.html
總結
以上是生活随笔為你收集整理的07、poly-A内参和杂交内参(arrayanalysis的问题)的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 关于回溯和后宫
- 下一篇: 理解统计信息(6/6):统计信息汇总贴