对链特异性建库的理解
剛接觸高通量測序的時候就知道有鏈特異性建庫這么個概念,當時也了解可以利用加U法,但是沒有思考其中的細節。最近把這個概念掰開了揉碎了好好理解,終于填上了這個坑。
正式講之前,有幾個概念是要明確的。
DNA 的正鏈和負鏈,就是那兩條反向互補的鏈。參考基因組給出的那個鏈就是所謂的正鏈(forword),另一條鏈是反鏈(reverse)。但是這正反一定不能和正義鏈(sense strand)反義鏈(antisense strand)混淆。
正義鏈(sense strand):兩條互補的DNA鏈其中一條攜帶編碼蛋白質信息的鏈稱為正義鏈,又稱編碼鏈,因為它的序列與mRNA相同。
反義鏈(antisense strand):另一條與之互補的稱為反義鏈。而反義鏈雖然和RNA反向互補,但它可是真正給RNA當模板的鏈,因此反義鏈也是模板鏈。
要注意的是:在一條包含有若干基因的雙鏈DNA分子中,各個基因的正義鏈并不都是在同一條鏈上。
也就是說,有的基因的正義鏈是正鏈(forword strand),有的基因的正義鏈是反鏈(reverse strand)。所以,DNA雙鏈中的一條鏈對某些基因來說是正義鏈,對另一些基因來說則是反義鏈
總結兩點
正義鏈(sense strand)= 編碼鏈(coding strand)= 非模板鏈
forword strand 上可以同時有sense strand 和 antisense strand。因為這完全是兩個不同的概念
下面通過這張建庫示意圖來看看普通RNA-Seq建庫和鏈特異性建庫的差異在什么地方
首先說說普通的RNA-Seq建庫方式:它是在RNA逆轉錄成雙鏈cDNA的兩端,對稱地加上了兩個Y型的接頭,然后變成文庫。它有一個缺點,就是它是以雙鏈DNA進行測序。所以測完序后,我們無法知道測出來的reads是來自正鏈還是負鏈。
而鏈特異性建庫(以圖中間的dUTP方法為例)則是首先利用隨機引物合成RNA的一條cDNA鏈,在合成第二條鏈的時候用dUTP代替dTTP,加adaptor后用UDGase處理,將有U的第二條cDNA降解掉。降解發生之后,雙鏈的文庫就只剩下了一條鏈(負鏈)。而這條鏈的兩頭是接的不同序列的接頭。通過PCR擴增,最終只保留了第一條cDNA(負鏈)上級測序。這樣最后的insert DNA fragment都是來自于第一條cDNA(負鏈),也就是dUTP叫fr-firststrand的原因。在測序的過程中先測得正鏈reads,再測得負鏈reads(能區分正負鏈reads,這就是和普通建庫最根本的不同)。在這些reads比對到參考基因組時,那些比對到基因方向(正義鏈方向)的正鏈reads就是正義鏈reads,但是那些比對到基因方向反方向(反義鏈方向)的正鏈reads就是反義鏈reads。那么同樣,比對到基因方向的負鏈reads就是正義鏈reads,而比對到基因方向反方向(反義鏈方向)的負鏈reads就是反義鏈reads。從而最終將所有正義鏈reads和反義鏈reads區分開來。因此在確定基因表達水平時,可以避免基因反義鏈上的reads匹配的干擾,從而更加準確的檢測基因轉錄表達水平。而且LncRNA的測序也離不開鏈特異性建庫技術。原因有三:
1)lncRNA的來源是具有鏈特異性的;
2)lncRNA來源就是編碼蛋白(mRNA)?基因的反義鏈,是傳說中的天然反義lncRNA(NAT-antisense lncRNA);如果是普通非鏈特異性建庫,那么序列是來自mRNA,還是NAT-antisence LncRNA就難以區分了;
3)?鏈特異性建庫可更準確地統計轉錄本的數量和確定基因的結構,準確區分獲得的轉錄本來自基因組哪條鏈。?
總結
以上是生活随笔為你收集整理的对链特异性建库的理解的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 套路(Jony J)
- 下一篇: SOPC教学笔记01——绪论