基因组组装程序linux,基因组组装软件SOAPdenovo安装使用
一.下載并安裝這個軟件
下載地址進下面,但是下載源碼安裝總是很困難,我直接下載bin文件可執行程序。
解壓進入目錄
首先make
然后make?install即可
安裝總是失敗,我也不知道怎么回事,懶得解決了。
直接去我老師那里把這個程序拷貝進來了。
也可以直接下載bin程序
二.準備測試數據
類似于這樣的幾個文庫的左右兩端測序數據。
我這里用一個小樣本的單端數據做測試
三,參考命令
You?may?run?it?like?this:
總共就四個步驟,介紹如下。
./pregraph_sparse?[parameters]
./SOAPdenovo-63mer?contig?[parameters]
./SOAPdenovo-63mer?map?[parameters]
./SOAPdenovo-63mer?scaff?[parameters]
i)?preparing?the?pregraph.?This?step?is?similar?to?velveth?for?velvet.
ii)?Determining?contigs.?This?step?is?similar?to?velvetg?for?velvet.
iii)?Mapping?back?reads?on?to?contigs.
iv)?Assembling?contigs?into?scaffolds.
SOAPdenovo-63mer??sparse_pregraph??-s?config_file?-K?45?-p?28?-z?1100000000?-o?outPG
SOAPdenovo-63mer?contig??-g?outPG
SOAPdenovo-63mer?map?-s?config_file?-g?outPG?-p?28
SOAPdenovo-63mer??scaff?-g?outPG?-p?28
官網給出的步驟如下
這個命令還需要一個配置文件
max_rd_len=99?設置最大reads長度,具體情況具體定義
[LIB]?第一個文庫數據
avg_ins=225
reverse_seq=0
asm_flags=3
rank=1
q1=runPE_1.fq
q2=runPE_2.fq
[LIB]?第二個文庫數據
avg_ins=2000
reverse_seq=1
asm_flags=2
rank=2
q1=runMP_1.fq
q2=runMP_2.fq
也可以全部一次性的搞一個命令
all?-s?config_file?-K?63?-R?-o?graph_prefix?1>ass.log?2>ass.err
我簡單修改了一下參考博客的代碼跟官網的代碼,然后運行了我自己的代碼
/home/jmzeng/bio-soft/SOAPdenovo2-bin-LINUX-generic-r240/SOAPdenovo-127mer
all?-s?config_file?-K?63?-R?-ograph_prefix?1>ass.log?2>ass.err
反正我也不懂,就先跑跑看咯
我選取的是7個單端數據,所以我的配置文件是
max_rd_len=500
[LIB]
avg_ins=225
reverse_seq=0
asm_flags=3
rank=1
p=SRR072005.fa
p=SRR072010.fa
p=SRR072011.fa
p=SRR072012.fa
p=SRR072013.fa
p=SRR072014.fa
p=SRR072029.fa
四.輸出數據解讀
好像我的數據都比較小,就7個三百多兆的fasta序列,幾個小時就跑完啦
四個步驟都有輸出數據
好像組裝效果慘不忍睹呀!共86萬的contig,50多萬的scaffold
scaffolds>100? 505473 99.60%
scaffolds>500? 113523 22.37%
scaffolds>1K?? 48283 9.51%
scaffolds>10K? 0 0.00%
scaffolds>100K 0 0.00%
scaffolds>1M?? 0 0.00%
這其實都相當于沒有組裝了,因為我的測序判斷本來就很多是大于500的!
可能是我的kmer值選取的不對
Kmer為63跑出來的效果不怎么好,86萬的contig,50萬的scaffold的
Kmer為35跑出來的效果更慘,203萬的contig,近60萬的scaffold。
我覺得問題可能不是這里了,可能是沒有用到那個20k和3k的雙端測序庫,唉,其實我習慣了illumina的測序數據,不太喜歡這個454的
感覺組裝好難呀,業余時間搞不定呀,希望有高手能一起交流,哈哈,我自己再慢慢來試試。
總結
以上是生活随笔為你收集整理的基因组组装程序linux,基因组组装软件SOAPdenovo安装使用的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: linux打补丁前如何备份,关于Linu
- 下一篇: linux 两个驱动 竞态,第7章 Li