易基因 | 文献速递:RRBS方法绘制1538例乳腺癌甲基化图谱并预测癌症发生/预后
大家好,這里是專(zhuān)注表觀組學(xué)十余年,領(lǐng)跑多組學(xué)科研服務(wù)的易基因。
錯(cuò)過(guò)RRBS技術(shù)在人和小鼠疾病表觀遺傳特征研究的可點(diǎn):Mol Biol Evol | 利用RRBS技術(shù)多維度分析人和小鼠的疾病表觀遺傳特征
今天一起來(lái)看看發(fā)表于Nat Commun期刊的利用RRBS測(cè)序分析技術(shù)繪制了1538例乳腺癌組織樣本和244個(gè)相鄰正常組織樣本的DNA甲基化圖譜,并揭示了乳腺癌的形成和進(jìn)展與復(fù)制相關(guān)的DNA甲基化時(shí)鐘過(guò)程(replication-linked clock)、表觀基因組不穩(wěn)定性(epigenomic instability)和啟動(dòng)子/遠(yuǎn)端元件的順式調(diào)控(cis-regulation)有關(guān)。
標(biāo)題:DNA methylation landscapes of 1538 breast cancers reveal a replication-linked clock,epigenomic instability and cis-regulation
期刊:nature communications(Nat Commun,英國(guó)nature集團(tuán)旗下的子刊,專(zhuān)門(mén)發(fā)表生物學(xué)、物理學(xué)和化學(xué)等各領(lǐng)域的高質(zhì)量研究論文。)
2021影響因子: IF 14.919/Q1
發(fā)表時(shí)間:2021.09.13
方法:RRBS
關(guān)于RRBS
簡(jiǎn)化甲基化測(cè)序(Reduced Representation Bisulfite Sequencing,RRBS)是利用限制性內(nèi)切酶對(duì)基因組進(jìn)行酶切,富集啟動(dòng)子及CpG島等重要的表觀調(diào)控區(qū)域并進(jìn)行重亞硫酸鹽測(cè)序。該技術(shù)顯著提高了高CpG區(qū)域的測(cè)序深度,在CpG島、啟動(dòng)子區(qū)域和增強(qiáng)子元件區(qū)域可以獲得高精度的分辨率,是一種準(zhǔn)確、高效、經(jīng)濟(jì)的DNA甲基化研究方法,在大規(guī)模臨床樣本的研究中具有廣泛的應(yīng)用前景。為了適應(yīng)科研技術(shù)的需要,我們進(jìn)一步開(kāi)發(fā)了可在更大區(qū)域內(nèi)捕獲CpG位點(diǎn)的雙酶切RRBS(dRRBS),可研究更廣泛區(qū)域的甲基化,包括CGI shore等區(qū)域。
為助力低樣本量多維度分析,我們開(kāi)發(fā)了富集覆蓋CpG島、啟動(dòng)子、增強(qiáng)子、CTCF結(jié)合位點(diǎn)的甲基化靶向測(cè)序方法:extended-representation bisulfite sequencing(XRBS),實(shí)現(xiàn)了高靈敏度和樣本復(fù)用,使其具有高度可擴(kuò)展性,并適用于有限的樣本和單個(gè)細(xì)胞。
研究摘要
DNA甲基化在癌癥中是異常的,但這種表觀遺傳學(xué)變化的動(dòng)力學(xué)作用、調(diào)控作用和臨床意義仍然知之甚少。
METABRIC隊(duì)列中包含了2000多個(gè)乳腺癌樣本,這些樣本此前已在臨床、遺傳和轉(zhuǎn)錄方面進(jìn)行了廣泛表征。本文作者使用RRBS測(cè)序分析技術(shù)對(duì)其DNA甲基化狀態(tài)進(jìn)行研究。來(lái)自METABRIC隊(duì)列的1538例乳腺癌組織和244個(gè)相鄰正常乳腺組織的簡(jiǎn)化甲基化測(cè)序(RRBS)譜,在豐富的基因組、轉(zhuǎn)錄組和臨床數(shù)據(jù)背景下對(duì)DNA甲基化進(jìn)行深度分析。來(lái)自免疫和間質(zhì)標(biāo)記物的腫瘤DNA甲基化狀態(tài)被反褶積(deconvoluted),從而導(dǎo)致在非CpG位點(diǎn)發(fā)現(xiàn)與全基因組甲基化丟失的腫瘤復(fù)制相關(guān)時(shí)鐘(replication-linked clock)。出乎意料的是,在大部分CpG區(qū)域甲基化遵循兩個(gè)獨(dú)立于復(fù)制的獲得(MG)或丟失(ML)過(guò)程,稱(chēng)之為表觀基因組不穩(wěn)定性,表觀基因組不穩(wěn)定性與腫瘤分級(jí)/分期、TP53突變和較差預(yù)后相關(guān)。另外,研究人員在數(shù)百個(gè)啟動(dòng)子和數(shù)千個(gè)遠(yuǎn)端元件中發(fā)現(xiàn)了順式特異性甲基化(cis-specific methylation)和表達(dá)相關(guān),包括一些已知的腫瘤抑制因子和致癌基因,證明了數(shù)百個(gè)啟動(dòng)子和數(shù)千個(gè)遠(yuǎn)端元件中的甲基化水平和特異性順式作用下的基因表達(dá)相關(guān),突出了全基因組甲基化水平變化在腫瘤轉(zhuǎn)錄改變中的重要作用,包括典型的BRCA1高甲基化效應(yīng)。
項(xiàng)目設(shè)計(jì)
(1)樣本選取:
從METABRIC數(shù)據(jù)庫(kù)中選取1538個(gè)原發(fā)性乳腺癌組織樣本和244個(gè)相鄰組織的正常樣本,共1782個(gè)樣本進(jìn)行了DNA甲基化測(cè)序分析(RRBS),并建立導(dǎo)致乳腺癌DNA甲基化過(guò)程的多因素統(tǒng)一模型。
?(2)RRBS測(cè)序流程
實(shí)驗(yàn)結(jié)果
(1)乳腺癌與復(fù)制相關(guān)的DNA甲基化時(shí)鐘過(guò)程相關(guān)
(1.1)METABRIC 隊(duì)列的甲基化分析
從METABRIC隊(duì)列中選取1538個(gè)原發(fā)性乳腺癌組織樣本和244個(gè)相鄰組織的正常樣本,利用可獲得的臨床、基因組和轉(zhuǎn)錄組數(shù)據(jù)來(lái)分析甲基化過(guò)程(圖1a),研究人員利用RRBS測(cè)序方法對(duì)這1782個(gè)樣本以30.4B reads來(lái)覆蓋廣泛的基因組分布,有助于分析全基因組甲基化變化趨勢(shì)及調(diào)控元件和啟動(dòng)子的甲基化變化。RRBS測(cè)序方法使93%的樣本被超過(guò)1 M CpG位點(diǎn)的10個(gè)以上reads覆蓋(圖1b),9%的reads被映射到真正的啟動(dòng)子區(qū)域(圖1c),75%的啟動(dòng)子區(qū)域平均覆蓋超過(guò)20個(gè)reads(平均覆蓋246個(gè)),有助于下游的定量分析(圖1d)。
(1.2)乳腺癌甲基化的分層建模
以METABRIC數(shù)據(jù)庫(kù)為模型,研究人員開(kāi)發(fā)了一種半監(jiān)督算法(Methylayer),用于腫瘤甲基化動(dòng)力學(xué)的分層建模(圖1e)。Methylayer的基本原理依賴于基因表達(dá)、遺傳學(xué)和臨床信息的整合,計(jì)算混雜因素(腫瘤微環(huán)境[TME]效應(yīng)),以此推斷可隨機(jī)影響全基因組甲基化變化趨勢(shì),Methylayer可以強(qiáng)有力地篩選表觀遺傳順式調(diào)控的候選基因,并得出預(yù)后指標(biāo)。將Methylayer分別應(yīng)用于METABRIC隊(duì)列的ER+和ER-腫瘤樣本,并比較兩類(lèi)腫瘤樣本的動(dòng)力學(xué)。
數(shù)據(jù)結(jié)果發(fā)現(xiàn),基因表達(dá)的整合使Methyllayer將TME效應(yīng)識(shí)別為主要數(shù)據(jù)混雜因素,從而促進(jìn)從腫瘤活檢中獲得的甲基化圖譜多樣化(圖1f)。該算法在基因表達(dá)和啟動(dòng)子甲基化狀態(tài)的相互關(guān)聯(lián)中檢測(cè)到一個(gè)強(qiáng)大的免疫標(biāo)記,即TME標(biāo)記與腫瘤分級(jí)相關(guān)(圖1g),并通過(guò)獨(dú)立的反褶積表達(dá)譜和病理指標(biāo)進(jìn)行驗(yàn)證。在對(duì)TME標(biāo)記進(jìn)行推斷之后,研究人員應(yīng)用了一種新的K-nn歸一化算法(K-nn normalization algorithm Methods,圖1h),該算法在推斷下游腫瘤甲基化區(qū)域時(shí),驗(yàn)證了Methyllayer顯著降低了TME偏差。
(1.3)復(fù)制相關(guān)的甲基化時(shí)鐘過(guò)程與腫瘤中甲基化丟失相關(guān)
與對(duì)照組相比,基于TME標(biāo)準(zhǔn)甲基化的Methyllayer聚類(lèi)在腫瘤樣本中鑒定出一組高度相關(guān)的CpG區(qū)域 (圖1i),這一甲基化區(qū)域與腫瘤分級(jí)不相關(guān)(圖1j),將其標(biāo)記為時(shí)鐘層(clock layer),盡管與啟動(dòng)子相關(guān)的遠(yuǎn)端定位相關(guān),但時(shí)鐘層CpG顯示出較低的CpG含量(圖1k),因此在推定的調(diào)控元件(基于組蛋白修飾)中代表性不足。
基因組通過(guò)定義早期和晚期復(fù)制域的調(diào)控過(guò)程在S期復(fù)制。有趣的是,在S晚期復(fù)制域中,時(shí)鐘層的腫瘤甲基化減少更為強(qiáng)烈(圖1l,m)。這與此前研究一致,表明衰老和癌癥中DNA甲基化的丟失可能與復(fù)制過(guò)程中相關(guān)的甲基化異常積累(“epi-mutations”,表突變)相關(guān)。篩選跨METABRIC的基因表達(dá)特征并未發(fā)現(xiàn)與甲基化時(shí)鐘層相關(guān)的常規(guī)轉(zhuǎn)錄程序??傊?#xff0c;這些數(shù)據(jù)共同表明癌癥中甲基化丟失時(shí)鐘的動(dòng)力學(xué)與基因組復(fù)制過(guò)程密切相關(guān)。
?Fig.1: Dissecting tumor, immune, and CAF methylation in the METABRIC cohort
(2)乳腺癌的表觀基因組不穩(wěn)定性
Methyllayer分析鑒定出了兩個(gè)具有顯著不同特征的全基因組甲基化區(qū)域(圖2a)。一區(qū)為表觀基因組不穩(wěn)定性甲基化獲得(MG)區(qū),主要涉及在正常組織樣本中未甲基化,但在腫瘤組織樣本中呈現(xiàn)高甲基化水平的CpG區(qū)域(圖2b)。值得注意的是,45%中高CpG含量增強(qiáng)子和2995個(gè)啟動(dòng)子顯示出與MG區(qū)(圖2c)的強(qiáng)相關(guān)性。另一區(qū)域占CpG位點(diǎn)的一小部分,是表觀遺傳不穩(wěn)定性甲基化丟失(ML)區(qū),涉及在正常組織樣本中部分甲基化,但在腫瘤中顯示低甲基化的區(qū)域。
量化METABRIC上的甲基化MG區(qū)和甲基化ML區(qū),結(jié)果顯示ER+ 呈現(xiàn)腫瘤分級(jí)依賴性分布(圖2d、e,其中高分表示與正常組織的差異較大)。此外,MG區(qū)甲基化與大量基因的反式表達(dá)正相關(guān)(圖2f),包括有絲分裂紡錘體的形成和調(diào)控、DNA損傷修復(fù)、DNA復(fù)制、幾種胚胎發(fā)育同源盒轉(zhuǎn)錄因子(如早期間充質(zhì)因子Msx1)、鈣信號(hào)傳導(dǎo)通路和甾醇代謝基因相關(guān)的基因(圖2g)。
以上分析表明,除復(fù)制相關(guān)的甲基化時(shí)鐘過(guò)程外,大量基因座(loci)還受到甲基化獲得 (MG) 和丟失 (ML) 過(guò)程的影響,并且該過(guò)程與腫瘤進(jìn)展、基因組亞型和腫瘤基因表達(dá)狀態(tài)相關(guān)。
?Fig. 2: Epigenomic instability in breast cancers.
(3)在數(shù)百個(gè)啟動(dòng)子和數(shù)千個(gè)遠(yuǎn)端元件中發(fā)現(xiàn)了順式特異性甲基化和表達(dá)相關(guān)
研究人員通過(guò)比較啟動(dòng)子甲基化與自身表達(dá)之間的相關(guān)性以及與其他9360個(gè)基因表達(dá)譜之間的相關(guān)性,并與隨機(jī)對(duì)照組進(jìn)行比較,結(jié)果在ER+中鑒定出423個(gè)啟動(dòng)子、ER?中鑒定出185個(gè)啟動(dòng)子通過(guò)順式甲基化來(lái)調(diào)控表達(dá)(圖3a,b)。在順式作用下的甲基化和表達(dá)相關(guān)性研究中,觀察到腫瘤抑制和誘導(dǎo)基因與高甲基化相關(guān)(圖3c,d)。為了確定這些特定的順式調(diào)控基因哪些是共同調(diào)控基因組的一部分(圖3e),研究人員計(jì)算了基因表達(dá)譜的相關(guān)性,鑒定出這些特定基因不是常規(guī)表達(dá)基因組的一部分。值得注意的是,這些啟動(dòng)子的epi-polymorphism分析驗(yàn)證了甲基化多樣性顯著降低,特別是當(dāng)甲基化水平較低時(shí)(圖3f,P?<0.001,表示這些位點(diǎn)的epi多態(tài)性較低),提示在腫瘤發(fā)生過(guò)程中這些位點(diǎn)的表觀遺傳特征一致。
隨后,研究人員為每個(gè)甲基化位點(diǎn)鑒定與其密切相關(guān)的基因表達(dá)譜,并選擇了位于直接染色體區(qū)域位點(diǎn)的最佳相關(guān)伙伴基因(i.e., its TSS)(圖3g,h)。epi-polymorphism分析在ER+中鑒定出2680個(gè)遠(yuǎn)端順式調(diào)控元件,在ER?中鑒定出1332個(gè)遠(yuǎn)端順式調(diào)控元件,且結(jié)果與啟動(dòng)子一致。Motif分析及與ChIP-seq圖譜的對(duì)比表明啟動(dòng)子和遠(yuǎn)端元件位點(diǎn)的甲基化水平變化是由順式作用調(diào)控的,而不是由反式作用中的常規(guī)機(jī)制調(diào)控的。
總之,以上研究表明,盡管全基因組甲基化丟失時(shí)鐘和表觀基因組不穩(wěn)定性涉及了基因組中幾乎所有的CpG,但啟動(dòng)子和遠(yuǎn)端元件的部分甲基化與順式作用調(diào)控下的數(shù)百個(gè)基因相關(guān),并且可能特異性的調(diào)控這些基因。例如,BRCA1啟動(dòng)子甲基化與乳腺癌ER-中的BRCA1基因表達(dá)呈特異性強(qiáng)相關(guān)性,而KRT7啟動(dòng)子甲基化與ER+ 腫瘤中的KRT7基因表達(dá)相關(guān)(圖 3e),表明一些順式作用調(diào)控的基因如BRCA1參與腫瘤發(fā)生。
Fig. 3: Expression–methylation correlation in cis.
(4)乳腺癌的甲基化狀態(tài)與基因組畸變相關(guān),并可預(yù)測(cè)生存率
研究人員使用降維算法工具(UMAP)對(duì)樣本的2D整體甲基化狀態(tài)進(jìn)行映射,突出顯示所有乳腺癌組織樣本和正常組織樣本的表觀遺傳特征組合(圖 4a),篩選了5種與表觀遺傳不相關(guān)的METABRIC基因組數(shù)據(jù)。將腫瘤分為五個(gè)級(jí)別,并在每個(gè)級(jí)別檢測(cè)了 171 SNV基因(圖4b)的外顯率,結(jié)果揭示了與TP53、PIK3CA、CDH1、GATA3和CBFB SNV等基因的顯著強(qiáng)相關(guān)性(圖 4b),且在腫瘤內(nèi)異質(zhì)性突變程度較低。類(lèi)似的分析驗(yàn)證了ER+ 腫瘤中較高的表觀遺傳不穩(wěn)定性與較高的染色體不穩(wěn)定性(CIN)相關(guān)(圖 4c)。
為評(píng)估表觀遺傳特征的臨床影響,研究人員分析了按表觀遺傳評(píng)分分層來(lái)預(yù)測(cè)患者生存率(圖 4d),結(jié)果表明高M(jìn)G表觀遺傳不穩(wěn)定性預(yù)示著生存率低。ER+和 ER-腫瘤的五年生存率分別從 91% (64%) 降至 83% (55%)。而ML表觀遺傳不穩(wěn)定性也與ER+腫瘤中較差的生存率相關(guān)。相比之下,與復(fù)制相關(guān)的丟失時(shí)鐘則顯示與患者生存率不相關(guān)。
最后,研究人員進(jìn)行了Cox比例風(fēng)險(xiǎn)分析(Cox proportional hazard analysis),即使在考慮臨床、遺傳因素和轉(zhuǎn)錄評(píng)分的背景下,也證明了基于表觀遺傳不穩(wěn)定性評(píng)分的15年預(yù)后價(jià)值(圖 4e)。總之,以上數(shù)據(jù)結(jié)果驗(yàn)證了表觀遺傳特征,特別是表觀遺傳不穩(wěn)定性和腫瘤的基因組特征及較差的預(yù)后相關(guān)。
?Fig. 4: Epigenomic instability correlates with genomic features and with poor survival.
易基因小結(jié)
在本研究中,研究人員對(duì)來(lái)自METABRIC數(shù)據(jù)庫(kù)的1538個(gè)原發(fā)性乳腺癌組織樣本和244個(gè)相鄰組織的正常樣本進(jìn)行RRBS測(cè)序和深度分析,得出以下結(jié)論:
????? 癌癥中甲基化丟失時(shí)鐘的動(dòng)力學(xué)與基因組復(fù)制過(guò)程密切相關(guān)
????? 癌癥中表觀遺傳特征不穩(wěn)定性與腫瘤進(jìn)展、基因組亞型和腫瘤基因表達(dá)狀態(tài)相關(guān)
????? 癌癥種啟動(dòng)子和遠(yuǎn)端元件位點(diǎn)的甲基化水平變化由順式作用調(diào)控
????? 癌癥的甲基化狀態(tài)與基因組畸變相關(guān),并可預(yù)測(cè)生存率
以上研究結(jié)果揭示DNA甲基化狀態(tài)對(duì)腫瘤的發(fā)生、發(fā)展和預(yù)后有非常重要的作用,為臨床科研和診療工作帶來(lái)新的方向。
作為本研究的亮點(diǎn)技術(shù)——RRBS,易基因配合強(qiáng)大的生信分析實(shí)力,提供的不僅是海量的測(cè)序數(shù)據(jù),而且可以根據(jù)您的研究目的,有針對(duì)性地挖掘提煉出個(gè)性化分析結(jié)果及見(jiàn)刊圖片。
文獻(xiàn)來(lái)源:DOI: 10.1038/s41467-021-25661-w
?
文獻(xiàn)解讀:
文獻(xiàn)速遞 | RRBS方法繪制1538例乳腺癌甲基化圖譜并預(yù)測(cè)癌癥發(fā)生/預(yù)后https://mp.weixin.qq.com/s?__biz=MzAwNTY3NDIxMw==&mid=2650648958&idx=1&sn=50180a68424143c0300cb279dbd9b45b&chksm=831014f4b4679de248f2936a8d7e8baec57cd589cd5b4db13ec344129e794c20ca41c1f4a67f&token=276961837&lang=zh_CN#rd
總結(jié)
以上是生活随笔為你收集整理的易基因 | 文献速递:RRBS方法绘制1538例乳腺癌甲基化图谱并预测癌症发生/预后的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: 兴趣爱好选择
- 下一篇: 4种超好用的PS调色小技巧,知道的人不多