HMMPfam的安装使用手记(转载)
轉(zhuǎn)載至:http://blog.sina.com.cn/s/blog_3f6403290100rb61.html(感謝原文作者)
HMMPfam的安裝使用手記
前言
簡要介紹一下 HMMPfam吧。這還要從HMMER說起,HMMER是基于隱馬爾可夫模型(profile HMMs),用于生物序列分析工作的一個非常強大的軟件包,而hmmpfam就是HMMER軟件包中的一個重要組成部分。同時,我們還需要了解Pfam (Protein families database of alignments and HMMs),它實際上是一個涵蓋了生物蛋白質(zhì)序列中常見結(jié)構(gòu)域的序列及其相對應(yīng)的隱馬爾科夫模型的數(shù)據(jù)庫,由英國的Sanger Institute維護。hmmpfam的工作原理簡單的說就是將用戶所提交的查詢序列在Pfam庫中做比對計算,然后預(yù)測出查詢序列中所隱含的結(jié)構(gòu)域信息。
正文
通過前面的簡介,我們知道要使hmmpfam能成功運行,需要同時安裝HMMER軟件包和Pfam數(shù)據(jù)庫。下面就讓我們開始吧:)
HMMER軟件包從http://hmmer.janelia.org/下載,現(xiàn)在的版本為2.3.2。下載下來的應(yīng)該是源碼壓縮包,放在任意目錄下解壓
$ tar xvf hmmer.tar.gz
切換到解壓后的目錄
$ cd hmmer-2.3.2
下面運行configure進行配置,其實默認(rèn)配置很簡單,直接用./configure 就行了,不用加任何參數(shù)。但我自己裝的時候設(shè)了以下兩個參數(shù)。--enable-threads 是多線程支持,因為我是在服務(wù)器上安裝,我們實驗室的服務(wù)器為4顆雙核CPU,因此在這里開啟了HMMER對多線程的支持(默認(rèn)可以使用所有可用的cpu 同時進行運算),第二個參數(shù)--enable-lfs是開啟對大于2G的文件的讀寫支持,以備不時之需。其它參數(shù)可以根據(jù)自己需要設(shè)置,我這里沒有特別設(shè)定。
$ ./configure --enable-threads --enable-lfs
后面就很簡單了,按部就班三步走。其中make install要在root權(quán)限下進行,默認(rèn)安裝路徑為(程序:/usr/local/bin/ ,幫助文件: /usr/local/man/man1)
$ make
$ make check
# make install
這樣HMMER就裝好了,還是很簡單的吧:)
下面從ftp://ftp.sanger.ac.uk/pub/databases/Pfam/current_release/上下載Pfam的數(shù)據(jù)庫,現(xiàn)在的最新版本是23.0。Pfam的數(shù)據(jù)庫主要有兩個,Pfam_ls和Pfam_fs,我們主要使用Pfam_ls,所以就只下了這一個:Pfam_ls.gz ,解壓后實際大小約700M。這里建議新建一個名字叫Pfam的工作文件夾,并把解壓后的庫文件放在這個文件夾下,以后做hmmpfam分析時的輸入輸出序列也放在這個文件夾下,這樣使用起來不用特別指定目錄,比較方便,個人經(jīng)驗,僅供參考,呵呵。
這樣一切準(zhǔn)備工作就都做好了,可以運行hmmpfam做分析啦:P
切換到Pfam目錄下,并運行hmmfam程序。
$ hmmpfam --cpu 4 -E 0.0001 Pfam_ls InputSeq.fas>OutResults.fas
運行hmmpfam時我一般會設(shè)這兩個參數(shù),--cpu<n> 用于指定本次hmmpfam程序運行時使用的cpu個數(shù),-E<n> 用于設(shè)定E-value的閾值。其實hmmpfam還提供了其它很多參數(shù),具體使用時根據(jù)需要選用,下面簡要列幾個:
Usage: hmmpfam [-options]
Available options are:
-h : help; print brief help on version and usage
-n : nucleic acid models/sequence (default protein)
-A : sets alignment output limit to best domain alignments
-E : sets E value cutoff (globE) to ; default 10
-T : sets T bit threshold (globT) to ; no threshold by default
-Z : sets Z (# models) for E-value calculation
后記
回頭看看這個安裝過程,其實還是挺簡單的,只要認(rèn)真看看Manual文件,絕對沒問題。
我對Linux其實也是一知半解,所以基本就是在摸著石頭過河,在摸索中前進,在前進中提高嘛,呵呵。
另外,以上安裝所使用的OS平臺為:
Redhat Enterprise Linux Server Release 5.2 (Tikanga)
總結(jié)
以上是生活随笔為你收集整理的HMMPfam的安装使用手记(转载)的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: OpenCV:使用 随机森林与GBDT
- 下一篇: WiFi密码多复杂都被邻居蹭网?这几招必