mysql的genelog_小白实战课堂!转录因子的候选靶基因查询~~
原標題:小白實戰課堂!轉錄因子的候選靶基因查詢~~
一文學會Harmonizonme和hTFtarget數據庫使用方法
嗨,小伙伴們大家好!這里是每周一弘毅專欄,我志向用小小文字助力你的SCI發表之路。接上周話題,轉錄因子相關課題經常遇到的兩個問題,一是已知靶基因尋找它上游的轉錄因子?二是已知轉錄因子尋找它可能的靶基因?前一個問題上周已經給大家做過演示,本周針對第二個問題給大家介紹Harmonizonme和hTFtarget數據庫,跟著弘毅的腳步一起來看看吧~!
前情提要
1.轉錄因子相關名詞
DBD(DNA binding domain)
TFBS(ranion factor binding site)
Target genes
2.轉錄因子結合位點預測
JASPAR
NCBI
UCSC數據庫
Harmonizonme數據庫
數據庫概覽
進入Harmonizonme主頁(https://maayanlab.cloud/Harmonizome/),點擊About可見數據庫簡介,于2016年發布,目前收錄來自66個在線數據庫的114個基因組學、轉錄組學、蛋白質組學和代謝組學數據集,著重于定義基因和不同屬性之間的關聯,屬性可以是基因、蛋白質、細胞系、組織、實驗干預因素、疾病、表型或藥物,并構建基因與基因和屬性與屬性的相似性網絡。本文重點介紹轉錄因子和靶基因數據集。
功能及操作演示
轉錄因子靶基因預測,進入Harmonizonme主頁,點擊SEARCH進入檢索界面,下拉菜單選擇Database,檢索框輸入tranion factors targets,回車得到14條檢索結果,前6個為轉錄因子靶基因數據庫。
選擇CHEA Tranion Factor Targets進入功能頁面,首先是該數據庫簡介,包括數據來源和參考文獻,頁面下拉依次是不同數據集下載鏈接,以及該數據庫收錄的各個轉錄因子詳細信息。
以人類SOX2為例,檢索框輸入SOX2,點擊進入詳情頁面,頁面下拉可見該數據庫收錄的SOX2靶基因共8156個。
點擊Downloads & Tools后面的下載按鈕可以下載靶基因列表,該文件為Json文件,對于不熟悉R語言的小伙伴來說極為不友好,可按照另一種方法獲取靶基因列表。
返回上一級頁面,下拉到Data Access,點擊 Gene-Attribute Edge List下載該數據庫全部的轉錄因子和靶基因信息列表,用Excel打開,其中source列是靶基因,`target列是轉錄因子,分別提供Gene symbols和Gene ID。
使用數據篩選功能,在target列檢索SOX2,刪除source列重復值,可以得到8156個靶基因結果。
同樣的方法得到其他5個數據集收錄的SOX2靶基因列表,JASPAR Predicted Tranion Factor Targets Dataset中有5個靶基因結果,TRANSFAC Predicted Tranion Factor Targets Dataset中有1228個靶基因結果,TRANSFAC Curated Tranion Factor Targets Dataset、MotifMap Predicted Tranion Factor Targets和ENCODE Tranion Factor Targets Dataset中無SOX2靶基因信息。
hTFtarget數據庫
數據庫概覽
點擊(http://bioinfo.life.hust.edu.cn/hTFtarget#!/),進入hTFtarget (Database of Human Tranion Factor Targets)主頁,該數據庫收錄399種細胞系、129種組織或細胞和141種干預因素共569種條件下的7190個實驗樣本大規模ChIP-Seq數據中659個TFs相關信息。點擊Document可看到hTFtarget中關于TFs靶基因數據是基于ChIP-Seq數據分析和TFBSs分析兩方面的結果。
功能及操作演示
轉錄因子靶基因預測,進入hTFtarget主頁,點擊TF進入檢索界面,檢索框輸入SOX2,點擊進入詳情頁面, 點擊下載按鈕得到SOX2靶基因列表。
最后將以上兩個數據庫查到的靶基因列表繪制Venn圖取交集,可以使用在線Venn圖繪制工具(http://bioinformatics.psb.ugent.be/webtools/Venn/),分別輸入CHEA中8156個靶基因,JASPAR中5個靶基因結果,TRANSFAC中1228個靶基因和hTFtarget獲取的靶基因列表,結果顯示4個數據庫共有的SOX2靶基因數目為0,CHEA、TRANSFAC和hTFtarget共有的SOX2靶基因有1個,為RBBP9,Pubmed檢索未見報道,可以嘗試實驗驗證一波。
文獻單圖復現
文獻案例: PMID: 33144585,IF=6.304分
本文Figure6A,本文已實驗驗證主變量miR-671-5的靶基因為轉錄因子NFIA,隨后通過Harmonizome預測到NFIA的1404個候選靶基因,并在GSE21034 數據集獲得85個表達差異基因(adjust_P<0.05,|Fold change?|?>2),二者取交集獲得11個候選靶基因,再然后使用cBioPortal分析NFIA與11個候選靶基因相關性,結合Pubmed數據,以及qPCR和WB實驗結果,最終能否證實NFIA可以靶向CRYAB并調節其表達。
單圖復現如下:
進入GEO數據庫檢索GSE21034 ,進入該數據集詳情頁面,可見該數據集包含GPL5188和GPL10264兩個平臺測序結果,點擊Analyze with GEO2R,選擇GPL5188平臺加載185個樣本,其中包含131例原發腫瘤組織和29例癌旁正常組織,分別添加到分組后,點擊Analyze得到差異分析結果,下載后Excel打開,依次如下操作
(1)一個基因對應多個探針的情況保留logFC最大值;
(2)一個探針對應多個基因的情況刪除該條目;
(3)空白無名稱條目刪除;
(4)篩選功能,篩選條件為adjust_P<0.05,|Fold change?|?>2。最終得到85個表達差異基因。
進入Harmonizonme主頁,點擊SEARCH進入檢索界面,下拉菜單選擇Database,檢索框輸入tranion factors targets,得到6個轉錄因子靶基因數據庫,同前法查詢NFIA靶基因,結果只有TRANSFAC Predicted Tranion Factor Targets中查詢到NFIA的靶基因1404個,其余5個數據庫未收錄其靶基因信息,同前法獲得NFIA的靶基因列表。
將GEO獲得的差異表達基因與Harmonizonme獲得的NFIA靶基因列表分別輸入在線Venn圖繪制工具(http://bioinformatics.psb.ugent.be/webtools/Venn/ ),即可得到Venn圖,PS或AI添加交集部分包含的基因名稱,即可得到本文Figure6A。
投我以桃,報之以李,開發并維護數據庫不易,小伙伴們使用Harmonizonme和hTFtarget時,別忘記引用以下參考文獻哦!~
寫在結尾
我有雙份的快樂,一份留給我家可可愛愛的寶寶和我的family members,一份留給不經意間看到的你!好啦~關于Harmonizonme和hTFtarget數據庫加餐就到這里啦!欲知更多生信知識,我們相約“挑圈聯靠”公眾號~下期再見了~~!
小白實戰課堂開課啦!手把手教你轉錄因子與靶基因預測操作~!
歡迎大家關注解螺旋生信頻道-挑圈聯靠公號~
撰文丨弘 毅
排版丨四金兄
值班 | 阿 琛
責任編輯:
總結
以上是生活随笔為你收集整理的mysql的genelog_小白实战课堂!转录因子的候选靶基因查询~~的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 亲影:您的相册需要一个专属管家
- 下一篇: 基于opencv的手势识别(HSV)控制