全基因组测序的序列拼接主要使用哪种软件,优势又有哪些?
生活随笔
收集整理的這篇文章主要介紹了
全基因组测序的序列拼接主要使用哪种软件,优势又有哪些?
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
序列的拼接與組裝是基因組測序數據處理中一個至關重要的步驟,對于高通量測序產生的海量短序列,拼接與組裝顯得尤為重要。下面是19個可用于高通量測序序列拼接與組裝的軟件及它們的網站,這19個軟件中除了SHORTY之外,都可以用于對Illunina高通量測序儀產生的序列進行de novo組裝,對454測序應該也可以,SHORTY用于組裝ABI SOLiD產生的序列。這些軟件都需要在高性能工作站、計算機集群甚至大型計算機上運行,大部分都只有Linux版本,不能在Windows系統下運行,所采用的算法基本都是圖論中的Overlap Graph和De Bruijn Graph算法。ABYSShttp://www.bcgsc.ca/platform/b ... abyssALLPATHShttp://tinyurl.com/3htptdzCLC NGS Cell,這是一個商業軟件http://www.clcbio.com/index.php?id=1331Curtaina,是一個基于Velvet的Pipelinehttp://code.google.com/p/curtain/Edenahttp://www.genomic.ch/edena.phpEuler-SRhttp://euler-assembler.ucsd.edu/portal/FuzzyPathftp://ftp.sanger.ac.uk/pub/zn1/fuzzypath/Oasesbhttp://www.ebi.ac.uk/~zerbino/oases/QSRAhttp://qsra.cgrb.oregonstate.edu/SASSY網站未找到SeqConshttp://www.seqan.de/projects/seqcons.htmlSHARCGShttp://sharcgs.molgen.mpg.de/SHORTYhttp://www.cs.sunysb.edu/~skiena/shorty/SOAPdenovo,這個是由中國華大基因開發的。http://soap.genomics.org.cn/soapdenovo.htmlSOPRAhttp://www.physics.rutgers.edu/~anirvans/SOPRA/SSAKEhttp://www.bcgsc.ca/platform/b ... ssakeTaipanhttp://taipan.sourceforge.net/VCAKEhttp://sourceforge.net/projects/vcake/Velvethttp://www.ebi.ac.uk/~zerbino/velvet/
目前關于基因組拼接軟件應用較為廣泛的主要有以下四種。 ** Velvet 軟件**由歐洲生物信息中心( EMB -EBI) 的Daniel Zerbino 和Ewan Birney ( 2008 年) 開發,是一款在Unix 下運行的從頭( de novo) 拼接軟件,主要用于拼接長度為25 ~ 500bp 的序列。它執行的是一種基于de Bruijn 算圖( de Bruijn graphs) 的算法,在構建算圖后會運行各種糾錯步驟。Velvet通過尋找read 中的重疊區域( overlap) ,將高質量的匹配片段拼接成contig 序列,最后生成完整的基因序列。Velvet 程序包是目前廣泛使用的拼接短reads 的首選拼接工具,已成功用于拼接細菌基因組。不足之處是現有的 Velvet 程序無法利用多個CPU 進行序列拼接。Velvet 程序包及相關文檔可以在以下網址獲得: http: / /www. ebi. ac. uk / ~ zebino /velvet /。 ABySS 程序最初是被開發用于基因組的從頭拼接,特別是對大型基因組進行拼接。由于ABySS 拼接軟件的優點在于它可以進行平行運算,同時運行多拼接任務,因此可能處理的基因組比Velvet 大得多。ABySS 的拼接算法也是基于de Bruijn 算圖法( de Bruijn graphs)。ABySS 的源代碼和文件可在網址http: / /www. bcgsc. ca /platform/bioinfo /software/ ABySS 免費下載。ABySS 拼接軟件需要在C+ + 環境中運行,安裝ABySS 時,只需輸入命令: . /configure && make。若要將ABySS 安裝到指定文件目錄下,則輸入命令行: . /configure - - prefix = /opt /ABySS && make && sudo make install 即可安裝成功。 ** SOAPdenovo** 是由華大基因開發出一個高通量測序從頭拼接軟件,它采用一種新型短read 拼接方法,能夠構建出人類基因組大小的從頭拼接草圖。SOAPdenovo 主要用于對大型動植物基因組進行從頭拼接工作,當然對于細菌和真菌基因組的拼接同樣也表現出色。該程序專門用于拼接由Illumina GA 生成的短reads 測序數據。SOAPdenovo 為構建參比序列提供了新途徑,為未知基因組高效精確分析提供了一種工具。SOAPdenovo 執行的也是基于de Bruijn graphs 法的類似拼接算法,該拼接工具的細節還未發布。SOAPdenovo 需要在擁有至少5GB內存的64 位Linux 系統( x86 處理器類型) 下運行。對于人類這樣的大型基因組來說,進行拼接工作則需要150GB 的內存。安裝SOAPdenovo 時,只需將SOAPdenovo 軟件壓縮文件包解壓,就會解壓出3 個文件,分別為一個可執行文件“soapdenovo”,soapdenovo”,一個模擬的配置文件“example. contig”以及一個說明書文檔。運行該程序之前,需要編輯一個配置文件以設定一些拼接參數,配置文件的編輯可以參照軟件自帶的example. contig 文件。 ** CLC Genomic Workbench**( 簡稱CLC) 生物是世界領先的生物信息學解決方案供應商丹麥的Aarhus公司研發的軟件,是針對下一代高通量測序的綜合性跨平臺分析軟件,CLC 采用用戶友好的圖形界面運行,可分析來自多個平臺( Illumina、SOLiD、454、HeliScope) 的基因組、轉錄和表觀基因組數據,并且以可視化方式顯示拼接結果。CLC Gene Workbench是一款非免費軟件,CLC Genomics Workbench 可用于Windows,Mac OS X 和Linux 三大操作系統。系統要求: 對于小數據量( < 50M bp,或者<10M reads) ,內存要求至少2 GB RAM,推薦4 GB RAM;對于中等數據量( < 100M reads) ,內存要求至少4GB RAM,推薦8 GB RAM; 對于大數據量( > 100M reads) ,內存要求至少8 GB RAM,推薦16 GB RAM。 若想得知更多信息,可參看文章鏈接。 http://www.cnki.net/KCMS/detai ... T0%3D$9A4hF_YAuvQ5obgVAqNKPCYcEjKensW4IQMovwHtwkF4VYPoHbKxJw!!&v=MDc4MTVGWUlSOGVYMUx1eFlTN0RoMVQzcVRyV00xRnJDVVJMNmZZT2RxRkN2aFVyck5QVFhZZWJHNEg5RE1yWTk=
目前關于基因組拼接軟件應用較為廣泛的主要有以下四種。 ** Velvet 軟件**由歐洲生物信息中心( EMB -EBI) 的Daniel Zerbino 和Ewan Birney ( 2008 年) 開發,是一款在Unix 下運行的從頭( de novo) 拼接軟件,主要用于拼接長度為25 ~ 500bp 的序列。它執行的是一種基于de Bruijn 算圖( de Bruijn graphs) 的算法,在構建算圖后會運行各種糾錯步驟。Velvet通過尋找read 中的重疊區域( overlap) ,將高質量的匹配片段拼接成contig 序列,最后生成完整的基因序列。Velvet 程序包是目前廣泛使用的拼接短reads 的首選拼接工具,已成功用于拼接細菌基因組。不足之處是現有的 Velvet 程序無法利用多個CPU 進行序列拼接。Velvet 程序包及相關文檔可以在以下網址獲得: http: / /www. ebi. ac. uk / ~ zebino /velvet /。 ABySS 程序最初是被開發用于基因組的從頭拼接,特別是對大型基因組進行拼接。由于ABySS 拼接軟件的優點在于它可以進行平行運算,同時運行多拼接任務,因此可能處理的基因組比Velvet 大得多。ABySS 的拼接算法也是基于de Bruijn 算圖法( de Bruijn graphs)。ABySS 的源代碼和文件可在網址http: / /www. bcgsc. ca /platform/bioinfo /software/ ABySS 免費下載。ABySS 拼接軟件需要在C+ + 環境中運行,安裝ABySS 時,只需輸入命令: . /configure && make。若要將ABySS 安裝到指定文件目錄下,則輸入命令行: . /configure - - prefix = /opt /ABySS && make && sudo make install 即可安裝成功。 ** SOAPdenovo** 是由華大基因開發出一個高通量測序從頭拼接軟件,它采用一種新型短read 拼接方法,能夠構建出人類基因組大小的從頭拼接草圖。SOAPdenovo 主要用于對大型動植物基因組進行從頭拼接工作,當然對于細菌和真菌基因組的拼接同樣也表現出色。該程序專門用于拼接由Illumina GA 生成的短reads 測序數據。SOAPdenovo 為構建參比序列提供了新途徑,為未知基因組高效精確分析提供了一種工具。SOAPdenovo 執行的也是基于de Bruijn graphs 法的類似拼接算法,該拼接工具的細節還未發布。SOAPdenovo 需要在擁有至少5GB內存的64 位Linux 系統( x86 處理器類型) 下運行。對于人類這樣的大型基因組來說,進行拼接工作則需要150GB 的內存。安裝SOAPdenovo 時,只需將SOAPdenovo 軟件壓縮文件包解壓,就會解壓出3 個文件,分別為一個可執行文件“soapdenovo”,soapdenovo”,一個模擬的配置文件“example. contig”以及一個說明書文檔。運行該程序之前,需要編輯一個配置文件以設定一些拼接參數,配置文件的編輯可以參照軟件自帶的example. contig 文件。 ** CLC Genomic Workbench**( 簡稱CLC) 生物是世界領先的生物信息學解決方案供應商丹麥的Aarhus公司研發的軟件,是針對下一代高通量測序的綜合性跨平臺分析軟件,CLC 采用用戶友好的圖形界面運行,可分析來自多個平臺( Illumina、SOLiD、454、HeliScope) 的基因組、轉錄和表觀基因組數據,并且以可視化方式顯示拼接結果。CLC Gene Workbench是一款非免費軟件,CLC Genomics Workbench 可用于Windows,Mac OS X 和Linux 三大操作系統。系統要求: 對于小數據量( < 50M bp,或者<10M reads) ,內存要求至少2 GB RAM,推薦4 GB RAM;對于中等數據量( < 100M reads) ,內存要求至少4GB RAM,推薦8 GB RAM; 對于大數據量( > 100M reads) ,內存要求至少8 GB RAM,推薦16 GB RAM。 若想得知更多信息,可參看文章鏈接。 http://www.cnki.net/KCMS/detai ... T0%3D$9A4hF_YAuvQ5obgVAqNKPCYcEjKensW4IQMovwHtwkF4VYPoHbKxJw!!&v=MDc4MTVGWUlSOGVYMUx1eFlTN0RoMVQzcVRyV00xRnJDVVJMNmZZT2RxRkN2aFVyck5QVFhZZWJHNEg5RE1yWTk=
總結
以上是生活随笔為你收集整理的全基因组测序的序列拼接主要使用哪种软件,优势又有哪些?的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 为你变的不一样是什么歌啊
- 下一篇: 姚明身材发福引网友热议 笑称:姚明变“女