数据挖掘肿瘤预测_科研套路不嫌多,数据挖掘发3分
生活随笔
收集整理的這篇文章主要介紹了
数据挖掘肿瘤预测_科研套路不嫌多,数据挖掘发3分
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
解螺旋公眾號·陪伴你科研的第2003天
如何復現一篇3分生信研究做科研需要先學習套路,才能超越套路。今天給大家介紹的套路文獻是今年發表在《Oncology reports》(IF= 3.041)上的一篇文章。文章的標題雖然看上去比較泛,但也讓讀者一眼就能知道主題了,“molecular mechanism”、“potential drugs”、“papillary renal cell carcinoma(PRCC)”,所用的研究數據就是“TCGA and Cmap datasets”了。當然,也有一些同學看到TCGA這幾個字母,就敬而遠之了,大家可以翻翻我們之前寫的文章,抑或學習下我們的課程,讓這些同學們不再只是“遠觀”,而且可以“褻玩”。首先,給大家簡單介紹下文章method的主要內容:1. 作者首先用GEPIA做了個差異表達(沒錯,就是那個網頁工具);2. 用MetaScape進行GO的富集分析,用Webgestalt進行KEGG通路富集分析;3. 根據上面得到的差異表達基因用Cmap和Drug Pair Seeker進行藥物分子預測,前者是Broad下的網頁工具,后者是需要下載使用的工具,不過兩者都是基于Connectivity Map;4. 構建藥物-通路網絡:基于Cmap的數據找到受藥物影響的差異表達基因,然后將這些基因做基因富集分析;5. 構建藥物-靶標網絡:作者從DrugBank里弄到了潛力位于top10的藥物的分子結構,然后去STITCH數據庫里找他們的靶基因;6. 進一步探索PRCC的潛在藥物:作者首先用STRING的數據和差異表達的基因,然后在Cytoscape里的CentiScape插件尋找其中的hub基因,再用GEPIA確認hub基因的表達水平。然后在Human Protein Atlas數據庫里找了C3和ANXA1的免疫組化結果。最后作者用systemsDock(也是個網頁版工具)做了個hub基因蛋白與藥物之間的分子對接。對于新手或者不太熟悉的同學,筆者建議將上述工具和數據庫都去學一學用一用,技多真的不壓身!(基本都是網站和一些簡單的工具)
下面我們來看看文章的主要結果:1. Table1和Table2分別展示了PRCC中差異表達基因的GO和KEGG的富集分析結果:2. Figure1和Figure2也是展示PRCC中差異表達基因的GO和KEGG的富集分析結果:3.?展示了打分最高最有潛力靶向RPCC的10個藥物分子4. 展示了潛在的靶向藥物與信號通路之間的網絡關系。藍色的表示藥物,紅色的表示受藥物影響的通路。5. 然后作者展示了基于STITICH數據庫構建藥物分子和靶點之間網絡關系的結果。6.?作者在Cytoscape里找到了hub基因,并展示了這些hub基因之間的PPI網絡:7. 然后作者用GEPIA驗證了上面的hub基因在PRCC和癌旁組織中存在差異表達(沒錯,就是GEPIA!)8. 然后作者在TCPA中用C3和ANXA1的蛋白數據做了個生存分析(然而兩者都不顯著啊,為什么不在GEPIA里也做一個mRNA的生存分析呢?)9. 作者用Protein Atlas的數據驗證了C3和ANXA1兩個基因的蛋白在腫瘤中表達比較高,在60%以上的病人中都檢測到了,位列前茅。10.?然后作者展示了免疫組化的結果比較了正常組織和腫瘤組織中的差異(數據挖掘真好,抗體的費用都省了)11. 隨后作者秀了下C3和ANXA1兩個蛋白與藥物分子的對接效果圖,展示了藥物能結合的氨基酸殘基和空間距離。以上就是這篇文章的主要結果,這篇文章對于想要學習數據挖掘的小白們來說,還是值得學習的,至少其中所涉及到的工具還是有不少的,推薦大家去看看學習。筆者也隨手給大家提兩個建議,如果大家對生信技能稍微熟悉一點,這篇文章里前面的GO和KEGG可以用GSEA來作,這樣的結果會更靠譜一點,結果圖也可以更多一些。然后就是可以用TCIA或者TIMER里的免疫細胞浸潤數據分析比較一下正常和腫瘤組織間的免疫浸潤差異嘛。祝大家都能有所收獲,多發文章,發高分文章!—END—相關文章
看看這個套路,低分論文你可以發一打
9分期刊提出的“癌王”治療新思路
骨髓細胞一定有免疫抑制功能嗎?
點下“在看”,多根頭發總結
以上是生活随笔為你收集整理的数据挖掘肿瘤预测_科研套路不嫌多,数据挖掘发3分的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 匿名类接口对象
- 下一篇: plex android tv版,PLE