芯片无忧的使用教程_HTA芯片(学徒探索任务)
年前我們布置過一個 agilent芯片的探索任務,很可惜,沒有人接單,也許是得等我某一天遇到了,或者時間充裕了會去解決它吧!現在再來一個疑難雜癥吧,就是生不逢時的Affymetrix Human Transcriptome Array 2.0芯片的數據處理。
前面我提到過[HTA-2_0] Affymetrix Human Transcriptome Array 2.0芯片的分析其實挺麻煩的,首先需要搞清楚下面3個平臺的差異:
GPL17586 ? ?[HTA-2_0] Affymetrix Human Transcriptome Array 2.0 [transcript (gene) version]
GPL19251 ? ?[HuGene-2_0-st] Affymetrix Human Gene 2.0 ST Array [probe set (exon) version]
GPL16686 ? ?[HuGene-2_0-st] Affymetrix Human Gene 2.0 ST Array [transcript (gene) version]
HTA芯片設計的時候覆蓋了 ~560?k exons and ~340?k exon-exon junctions , 而且比mRNA-Seq 便宜,穩定性好。
看看TP53這個基因上面的探針設計
我們在 https://www.easana.com/ 網頁搜索,可以看到主要的探針都集中在TP53中間的外顯子上面:
TP53基因上面的HTA芯片探針如果具體看探針的坐標,如下:
一個基因的全部探針的坐標可以看到是29個探針,序列也清清楚楚,還可以csv下載,探針主要是集中是e5-e15, 跟TP53基因結構示意圖吻合。
如果以外顯子為單位看表達差異
反正都是表達矩陣,以外顯子為單位和基因為單位,理論是差不多啦,沒有根據注釋文件映射到基因名字之前,都是一個ID而已。在 https://www.easana.com/ 網頁可視化如下:
以外顯子為單位看表達差異但是這樣的示意圖肯定沒辦法發表咯,你可以嘗試新的可視化花樣。
關于EASANA
其實EASANA是商業軟件genosplice的一個可視化功能而已,上面的示意圖比較好的介紹了HTA芯片的基因的多個探針的表達量差異情況。
我簡單摸索了一下,沒有看到人家下載,看樣子是需要發郵件給這個商業軟件的銷售人員一對一的講解和獲取。一般來說,這樣的軟件在中國大陸是沒有市場的, 所以干脆略過了。
實際上affymetrix公司自己有TAC軟件
比如有一些文章里面就會明確寫出來,采用的是affymetrix公司出品的軟件 TAC進行處理。一般來說,購買的如果是商業公司提供的芯片服務,肯定是會有配套的數據分析。可惜的是,大多數情況下,真心想用好HTA芯片數據的小伙伴并不是購買服務的人,而是想挖掘它背后價值的。
TAC軟件可以看到這個軟件有一個探索可變剪切的模塊,而且這個也的確是大量使用了HTA芯片的文章寫作落腳點。如果你發現你的領域有一個公共數據庫就是HTA芯片,但是創造數據集的研究者們并沒有落腳到可變剪切。那么你就應該是意識到,這可能是你可以努力的方向。
另外一個商業軟件partek也很流行
partek這個軟件應該是在海外非常流行,我看到不少文獻提到了partek,甚至跟affymetrix公司出品的軟件 TAC差不多的使用頻率。
image-20200205121009699當然了,具體我也沒有用過啦。
學徒作業
跟agilent芯片一樣,agilent芯片需要摸索使用 Agi4x44PreProcess包完成E-MTAB-3017數據集的表達矩陣獲取。當然了,也可以根據分組,走一下差異分析標準代碼。
而我們的HTA芯片,也是需要摸索一個包,好像還在GitHub上面,就是EventPointer,Romero et al. BMC Genomics (2016) 17:467 DOI 10.1186/s12864-016-2816-x 有時間,又想做一些挑戰性的數據分析的朋友可以考慮入坑!
走標準分析流程,火山圖,熱圖,GO/KEGG數據庫注釋等等。這些流程的視頻教程都在B站和GitHub了,目錄如下:
第一講:GEO,表達芯片與R
第二講:從GEO下載數據得到表達量矩陣
第三講:對表達量矩陣用GSEA軟件做分析
第四講:根據分組信息做差異分析
第五講:對差異基因結果做GO/KEGG超幾何分布檢驗富集分析
第六講:指定基因分組boxplot指定基因list畫熱圖
感興趣可以細讀表達芯片的公共數據庫挖掘系列推文 ;
解讀GEO數據存放規律及下載,一文就夠
解讀SRA數據庫規律一文就夠
從GEO數據庫下載得到表達矩陣 一文就夠
GSEA分析一文就夠(單機版+R語言版)
根據分組信息做差異分析- 這個一文不夠的
差異分析得到的結果注釋一文就夠
生信技能樹的2019年終總結??這里面記錄著我博士期間抽空做的一點教程分享事業
2020學習主旋律,B站74小時免費教學視頻為你領路?這里面記錄著我為生物信息學教學行業做的一點貢獻
總結
以上是生活随笔為你收集整理的芯片无忧的使用教程_HTA芯片(学徒探索任务)的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: APP控制智能家居
- 下一篇: onvif客户端(转载)