NAR | 陈加余/陈亮合作建立R-loop全基因组分布与调控的专家数据库
R-loop是由RNA:DNA雜合鏈和非模板單鏈DNA構成的三鏈結構,廣泛存在于從細菌到人類等物種的基因組中。R-loop結構主要隨細胞轉錄活動產生,受細胞精細調控而處于高度動態變化當中。生理水平下的R-loop結構密切參與轉錄調控、組蛋白與DNA的表觀遺傳修飾調控、DNA損傷修復、免疫球蛋白類型轉換等生物學過程,并作為調控網絡的一環,與蛋白因子協同發揮著重要的調控作用。另一方面,R-loop調控異常會造成染色質狀態改變,基因轉錄失調和基因組穩定性下降等。研究表明R-loop調控蛋白的突變與R-loop的異常積累是導致神經退行性疾病、癌癥、自身免疫性疾病等的潛在誘因之一。
正是由于R-loop在生理和疾病條件下發揮著重要功能,R-loop受到了科學家們的廣泛關注。特別是近年來,多種R-loop高通量測序技術的涌現極大推動和拓展了我們對R-loop調控與功能的認知。但是也因此產生了長期困擾領域內學者的若干問題:由于不同R-loop鑒定技術的原理和實驗流程存在巨大差異,目前已發表的R-loop圖譜數據存在明顯的技術偏好性,領域內學者對R-loop的具體分布以及相關的調控機制和分子功能爭論不斷;此外,目前我們對R-loop的調控網絡和不同生理和病理條件下R-loop的調控機制與功能都還缺乏系統性認知,因此距離利用該機制進行疾病的干預研究尚有較大距離。如何應對和解決這些科學問題,推動R-loop基礎理論積累與健康研究相結合正是領域內的研究熱點方向。
針對上述問題,2021年11月18日,南京大學陳加余研究員團隊與武漢大學陳亮研究員團隊在Nucleic Acids Research上發表了題為R-loopBase: a knowledgebase for genome-wide R-loop formation and regulation的論文,構建了首個集R-loop分布與調控于一體的數據庫R-loopBase,從統一不同檢測技術的共性以鑒定高置信度的R-loop形成區域,到對R-loop調控蛋白的系統梳理和注釋等方面做出了相應的信息整合與可視化呈現,為領域內學者以及對R-loop有興趣的其它研究人員提供了一個便于檢索查閱的數據資源。
首先,作者收集了目前已發表的來源于11種R-loop檢測技術、26種人類組織和細胞的107套高質量全基因組R-loop檢測數據,并經過嚴格質控和標準化分析,最終形成R-loopBase的基礎支撐數據。與先前的研究一致,作者發現不同技術甚至同一技術檢測到的R-loop在基因組中的分布存在巨大差異。為了從繁雜且高異質性的數據中找到真實的R-loop 形成區域并總結其特征,作者通過數據整合分析,將全基因組所有可能的R-loop形成區域分成了不同置信度等級。數據表明,高置信度的R-loop與已知的R-loop結構的序列和生化特征高度吻合,支持了該整合分析過程的魯棒性,其結果也為R-loop在全基因組中的確切分布提供了重要參考,便于使用者從中查詢感興趣的研究區域。
其次,作者整合了人、小鼠、酵母和大腸桿菌中所有已知的1293個R-loop調控蛋白,并對這些蛋白的分子功能和基因表達譜等一一進行了詳細注釋。通過蛋白質互作網絡分析與GO、KEGG富集分析,作者揭示了R-loop整體調控的全景圖,為R-loop調控蛋白提供了系統性的認識(圖1)。進一步,作者鑒定了這些R-loop調控蛋白的目標調控區域,為R-loop的相關調控機制提供了重要的參考。
圖1. R-loop調控蛋白的互作網絡圖
最后,為了方便R-loop相關研究者能充分利用上述信息,作者進一步整合了豐富的多維組學數據資源并構建了一個交互式R-loop專家數據庫界面R-loopBase(圖2)。用戶可以通過基因名稱、位置坐標和序列檢索自己感興趣區域的R-loop形成情況;可以在“R-loop調控蛋白”界面檢索感興趣的蛋白,了解其與R-loop相關的調控信息及調控區域;另外,用戶可通過R-loopBase的基因組瀏覽器對上述數據進行可視化。該數據庫有望成為研究R-loop生物學的重要利器。
圖2. R-loopBase的數據資源(A)與架構(B)
南京大學陳加余研究員、武漢大學陳亮研究員和芝加哥大學鐘曉明博士為論文的共同通訊作者。南京大學碩士研究生林若堯、周永莉,芝加哥大學的鐘曉明博士為論文的共同第一作者。
原文鏈接:
https://academic.oup.com/nar/advance-article/doi/10.1093/nar/gkab1103/6430826
制版人:BioArt十一
往期精品(點擊圖片直達文字對應教程)
機器學習
后臺回復“生信寶典福利第一波”或點擊閱讀原文獲取教程合集
總結
以上是生活随笔為你收集整理的NAR | 陈加余/陈亮合作建立R-loop全基因组分布与调控的专家数据库的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: VTK一个面向对象的可视化类库
- 下一篇: STM32----摸石头过河系列(六)