现有物种的参考基因组都是可靠的吗?
生活随笔
收集整理的這篇文章主要介紹了
现有物种的参考基因组都是可靠的吗?
小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.
不一定全部可靠。隨著測序技術(shù)的迅速發(fā)展和測序成本的極速降低,越來越多基因組數(shù)據(jù)的出現(xiàn),不可避免的有“魚目混珠”現(xiàn)象發(fā)生。近期,就有科研人員發(fā)現(xiàn),現(xiàn)在生物界普遍使用的一個數(shù)據(jù)庫genebank中存儲的基因組草圖并不是完全可靠的,不少動植物基因組中存在細菌,病毒或其他微生物污染,具體有在綿羊和奶牛的基因組草圖中發(fā)現(xiàn)了淋球菌基因的存在,推測源自微生物污染。這項研究值得科研人員們反思,大部分情況下,genebank上的基因組都被認為是完整可信的,但最近的研究不僅發(fā)現(xiàn)動植物基因組中可能存在微生物基因污染,甚至有些微生物本以為是完成圖的基因組圖譜也可能是引入了DNA插入錯誤的草圖而已。這些錯誤的發(fā)生可能源于測序過程中的外部污染,也可能是研究者們對數(shù)據(jù)組裝工具的誤用,甚至可能是基于不完整的草圖進行分析時產(chǎn)生的錯誤。比如微生物基因組,大部分能得到的數(shù)據(jù)都是草圖,其中還有多個gap,而后續(xù)分析往往基于此結(jié)果進行,這時候如果不深入分析,很可能會將誤認為這些是基因水平轉(zhuǎn)移導致的。至于測序過程中的污染問題,可能發(fā)生于多個環(huán)節(jié),從DNA提取到最終加接頭測序,都有污染的可能。特別是針對一些昆蟲等小型生物,進行基因組測序時需要的DNA量常常需要對這些生物的整個個體進行DNA抽提,這樣發(fā)生污染的幾率就會更高。
細思極恐呀。。。。。隨著基因組測序技術(shù)的飛速發(fā)展以及測序成本的快速降低,全基因組數(shù)據(jù)也在急速增加。盡管參考基因組數(shù)據(jù)是非常有價值的資源,但是由于測序過程中的外源污染或者研究者對數(shù)據(jù)組裝方法的誤用,使得基因組數(shù)據(jù)面臨很多問題。近日,約翰霍普金斯大學的研究者在《Peer J》上發(fā)表一項研究,發(fā)現(xiàn)Genbank上存儲的動植物基因組草圖中存在細菌及病毒污染。這些物種間交叉污染會給微生物分析的發(fā)展造成很多問題,例如,即便在動物測序數(shù)據(jù)中出現(xiàn)部分基因序列可以證明生命起源,但實際上這部分序列可能是來自是微生物污染。該研究的另一個驚人的發(fā)現(xiàn)是,在奶牛和綿羊的基因組草圖中發(fā)現(xiàn)了淋球菌!盡管Genbank上存儲的基因組被認為是完整的,但一些細菌的基因組其實是含有多處DNA插入錯誤的草圖。從1995年,測序獲得了第一個細菌全基因組——流感嗜血桿菌基因組,到現(xiàn)在,Genbank數(shù)據(jù)庫上存儲了大約2萬7千個原核生物基因組以及1千6百個真核生物基因組。但絕大部分數(shù)據(jù)是基因組草圖,序列中存在多處gap(漏洞),而后續(xù)分析都是基于這些不完整的基因組草圖。如果不深入分析判斷,很可能認為只是基因水平轉(zhuǎn)移引起這些錯誤,因此需要更科學的、正確的分析基因組中出現(xiàn)的錯誤?;蚪M測序的第一步是提取DNA,根據(jù)物種的不同,獲取DNA的方式也是各式各樣。對于動物,通常從血液中提取DNA,但是像昆蟲這樣的微小動物,需要從整個個體中提取測序所需的DNA。從DNA提取到測序,都存在污染的可能性。計算機對測序原始數(shù)據(jù)的過濾只能去除例如大腸桿菌一類實驗室常見污染,對于其它種類的污染是很難去除的。需要強調(diào)的是,不僅要對即將發(fā)表的基因組進行仔細篩查,還包括那些已經(jīng)發(fā)表的數(shù)據(jù)。轉(zhuǎn)自:http://weibo.com/biodiscover%3 ... %23_0
正常情況下應該基本可靠的吧,這些數(shù)據(jù)庫都來自實驗數(shù)據(jù),一般情況下不會出什么差錯。但偏差難免會有,比如如果測序的取材不當,或者一些工作者在測序中的失誤造成的比必要的偏差現(xiàn)在可能也難以避免,我覺得這些數(shù)據(jù)庫應該建立相應的驗證機制。
細思極恐呀。。。。。隨著基因組測序技術(shù)的飛速發(fā)展以及測序成本的快速降低,全基因組數(shù)據(jù)也在急速增加。盡管參考基因組數(shù)據(jù)是非常有價值的資源,但是由于測序過程中的外源污染或者研究者對數(shù)據(jù)組裝方法的誤用,使得基因組數(shù)據(jù)面臨很多問題。近日,約翰霍普金斯大學的研究者在《Peer J》上發(fā)表一項研究,發(fā)現(xiàn)Genbank上存儲的動植物基因組草圖中存在細菌及病毒污染。這些物種間交叉污染會給微生物分析的發(fā)展造成很多問題,例如,即便在動物測序數(shù)據(jù)中出現(xiàn)部分基因序列可以證明生命起源,但實際上這部分序列可能是來自是微生物污染。該研究的另一個驚人的發(fā)現(xiàn)是,在奶牛和綿羊的基因組草圖中發(fā)現(xiàn)了淋球菌!盡管Genbank上存儲的基因組被認為是完整的,但一些細菌的基因組其實是含有多處DNA插入錯誤的草圖。從1995年,測序獲得了第一個細菌全基因組——流感嗜血桿菌基因組,到現(xiàn)在,Genbank數(shù)據(jù)庫上存儲了大約2萬7千個原核生物基因組以及1千6百個真核生物基因組。但絕大部分數(shù)據(jù)是基因組草圖,序列中存在多處gap(漏洞),而后續(xù)分析都是基于這些不完整的基因組草圖。如果不深入分析判斷,很可能認為只是基因水平轉(zhuǎn)移引起這些錯誤,因此需要更科學的、正確的分析基因組中出現(xiàn)的錯誤?;蚪M測序的第一步是提取DNA,根據(jù)物種的不同,獲取DNA的方式也是各式各樣。對于動物,通常從血液中提取DNA,但是像昆蟲這樣的微小動物,需要從整個個體中提取測序所需的DNA。從DNA提取到測序,都存在污染的可能性。計算機對測序原始數(shù)據(jù)的過濾只能去除例如大腸桿菌一類實驗室常見污染,對于其它種類的污染是很難去除的。需要強調(diào)的是,不僅要對即將發(fā)表的基因組進行仔細篩查,還包括那些已經(jīng)發(fā)表的數(shù)據(jù)。轉(zhuǎn)自:http://weibo.com/biodiscover%3 ... %23_0
正常情況下應該基本可靠的吧,這些數(shù)據(jù)庫都來自實驗數(shù)據(jù),一般情況下不會出什么差錯。但偏差難免會有,比如如果測序的取材不當,或者一些工作者在測序中的失誤造成的比必要的偏差現(xiàn)在可能也難以避免,我覺得這些數(shù)據(jù)庫應該建立相應的驗證機制。
總結(jié)
以上是生活随笔為你收集整理的现有物种的参考基因组都是可靠的吗?的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 三星Note20 Ultra相机、充电细
- 下一篇: 中移动5G消息系统设备集采:以虚拟化方式