rrnDB数据库简介-16S基因多拷贝数的证据
16S基因作為mark gene在微生物群落結構的研究中發揮中重要作用, 但是候選的mark gene 肯定不止16S 一種,最新比較火熱的功能基因,也可以作為mark gene。利用功能基因作為mark? gene, 相比16S有什么優勢呢?
在功能基因的文獻中指出了兩點:
1) 不同物種的16S基因序列可能完全相同,尤其是在二代測序中,我們通常指擴增16S的部分序列,這樣不同物種擴增出來的序列完全相同的概率大大增加,這樣不同有效的區分物種,所以說利用16S基因做的species 水平的注釋,可信度一般;
2)16S基因在一個物種中會有多拷貝,這樣PCR是會有多個擴增產物,這樣導致在OTU 定量會引入錯誤,比如物種A只有1個16S基因,物種B有2個16S基因,在群落中,二者豐度相同,經過相同循環次數的PCR , 理論上最終測序得到的reads中,物種B的reads會是物種A的2倍; 在16S研究中,我們通常使用reads 表征某個OTU的分度,盡管在群落中物種A和B相同,但是由于拷貝數的差異,所以定量的結果,不能正確的反映在群落中二者的豐度比例;豐度定量不準確,對于后續的alpha 和 beta 多樣性的分析都會有影響;
之前只是文章中這么一說,對于某個物種16S的拷貝數也沒有認真去研究過,今天看到了rrnDB 這個數據庫;
這個數據庫中收錄了16S基因為多拷貝的物種;可以直觀的看到16S基因多拷貝的現象;
數據庫網址如下:
https://rrndb.umms.med.umich.edu/
點擊導航欄的 search 按鈕,先看一下數據庫中的具體記錄
先用默認的關鍵字進行檢索,看下檢索出來的記錄,點擊下圖的Search 按鈕,
檢索的結果如下:
?第一列Data source record id 是物種基因組在NCBI中的版本號,Data source organism name 是物種名稱,RDP? taxa 是在RDP 數據庫中的注釋信息,最后一列16S copies 就是在該物種中16S基因的拷貝數;
從檢索的結果可以直觀的看出,還是有很多的物種存在16S基因多拷貝的現象;
最新更新的RDP Classifier 程序中,考慮了16S基因的多拷貝現象,對于16S基因的多拷貝數問題,通過這個數據庫可以更加直觀的了解。
?
與50位技術專家面對面20年技術見證,附贈技術全景圖總結
以上是生活随笔為你收集整理的rrnDB数据库简介-16S基因多拷贝数的证据的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: Python第二十二天 stat模块
- 下一篇: BZOJ 4974: 字符串大师