大数据在基因检测行业作用重要吗?基因检测的哪个环节需要大数据的数据库?
生活随笔
收集整理的這篇文章主要介紹了
大数据在基因检测行业作用重要吗?基因检测的哪个环节需要大数据的数据库?
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
未病基因檢測(疾病風險評估):尚屬非常初期階段,需要未來研究支持及大數據支撐。未病基因檢測是指通過對人體進行基因測序,結合一些已知的疾病和基因之間的關聯數據,“推測”出該個體患某種疾病的概率。基于與基因檢測靶向藥物相同的原因,以及我們所知的疾病是外界環境和內在基因共同作用的結果,未病基因檢測(疾病風險評估)尚屬非常初期階段。
目前基因檢測手段很成熟,很多實驗室都能實現,然而檢測結果的解讀卻非常困難,因為這依賴于基于大數據上的數據庫。比如,Myriad最值得驕傲的就是擁有專有數據庫,它用來解釋不確定的遺傳檢測結果。如果其他公司不被允許在BRCA基因測試中使用Myriad的私有數據庫,這道屏障和戰略優勢將非常顯著。當然,隨著時間的推移這種優勢會慢慢減弱,但是無論如何,這從側面說明了數據庫在基因檢測中的核心作用。一些主做基因檢測試劑盒的跨國公司的轉型的事實非常有說服力,據悉它們已經開始把未來的業務重點放在了基因信息學之上,雖然短時期內還未能帶來任何利潤,但已經成為“行業進化”中的必須環節。臨床驗證是在需要大量的時間和金錢花費,而更廣泛的驗證才能構建真正的數據庫,因為這些新設備和新技術變得更便宜和可用。但如何將轉化為生物或臨床結果還是很難。而且,很多國家的醫院醫生并沒有更多的遺傳性和信息學知識,對遺傳密碼更是一無所知。
說一說基因測序里的大數據分析吧。目前的主流測序方法是二代測序。而二代測序方式會產生大量的數據(測一段DNA會產生幾十幾百G的數據吧),而由于測出來的數據是基因片段數據,還需要用算法進行數據拼接等工作。所以需要的計算量還是挺大的。而且現在測序儀器越來越好,產生的數據量越來越多,所以需要計算的東西就更多了。因此,現在測序領域的算法設計是很重要的。設計一個高效的算法,可以把計算時間大大減少。至于大數據的數據庫(例如Hadoop、Hbase之類的工具),跟所謂的基因數據庫并不是同一個層面的東西。大數據的數據庫是為了存放和處理大量數據的軟件,而基因數據庫,例如NCBI,則是一個應用,直接負責收集和提供數據了。
目前基因檢測手段很成熟,很多實驗室都能實現,然而檢測結果的解讀卻非常困難,因為這依賴于基于大數據上的數據庫。比如,Myriad最值得驕傲的就是擁有專有數據庫,它用來解釋不確定的遺傳檢測結果。如果其他公司不被允許在BRCA基因測試中使用Myriad的私有數據庫,這道屏障和戰略優勢將非常顯著。當然,隨著時間的推移這種優勢會慢慢減弱,但是無論如何,這從側面說明了數據庫在基因檢測中的核心作用。一些主做基因檢測試劑盒的跨國公司的轉型的事實非常有說服力,據悉它們已經開始把未來的業務重點放在了基因信息學之上,雖然短時期內還未能帶來任何利潤,但已經成為“行業進化”中的必須環節。臨床驗證是在需要大量的時間和金錢花費,而更廣泛的驗證才能構建真正的數據庫,因為這些新設備和新技術變得更便宜和可用。但如何將轉化為生物或臨床結果還是很難。而且,很多國家的醫院醫生并沒有更多的遺傳性和信息學知識,對遺傳密碼更是一無所知。
說一說基因測序里的大數據分析吧。目前的主流測序方法是二代測序。而二代測序方式會產生大量的數據(測一段DNA會產生幾十幾百G的數據吧),而由于測出來的數據是基因片段數據,還需要用算法進行數據拼接等工作。所以需要的計算量還是挺大的。而且現在測序儀器越來越好,產生的數據量越來越多,所以需要計算的東西就更多了。因此,現在測序領域的算法設計是很重要的。設計一個高效的算法,可以把計算時間大大減少。至于大數據的數據庫(例如Hadoop、Hbase之類的工具),跟所謂的基因數據庫并不是同一個層面的東西。大數據的數據庫是為了存放和處理大量數據的軟件,而基因數據庫,例如NCBI,則是一個應用,直接負責收集和提供數據了。
總結
以上是生活随笔為你收集整理的大数据在基因检测行业作用重要吗?基因检测的哪个环节需要大数据的数据库?的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 张腾岳晒火龙果“修仙”视频:夜晚要用补光
- 下一篇: 求一个微信网名带安字的网名