2021.3.17丨致病菌毒力因子(VFDB)数据库注释
生活随笔
收集整理的這篇文章主要介紹了
2021.3.17丨致病菌毒力因子(VFDB)数据库注释
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
- 摘要
- 接到一個常規細菌的組裝注釋項目,不過客戶提出想要獲取關于組裝結果與病毒之間的聯系/按之前的操作,dfast沒有病毒相關的數據庫,無法滿足客戶需求。一番查閱,發現大家用這個VFDB數據庫進行常規的病毒注釋,下面將介紹一下使用該數據庫進行注釋的過程。由于比對工具diamond之前沒有介紹過,此次也將一并介紹。
- 介紹
- DIAMOND簡介
- DIAMOND是用于蛋白質和翻譯DNA的搜索序列比對工具,旨在用于大序列數據的高性能分析。
- 主要功能包括:
- BLAST以100x-10,000x的速度對蛋白質和翻譯的DNA進行成對比對。
- 移碼比對,用于較長讀段分析。
- 資源需求低,可以在標準臺式機或筆記本電腦上運行。
- 各種輸出格式,包括BLAST成對,表格和XML,還可以進行標準分類。
- VFDB數據庫簡介
- 毒力因子(Virulence factor,VFs)指由細菌,病毒,真菌等代謝產生的帶有侵襲力和毒素等毒力性質的分子,主要用于微生物感染宿主時,通過抑制或逃避宿主的免疫反應等出入宿主組織細胞,并從宿主獲得營養及自身增殖生長的目的。毒力因子可編碼在可移動遺傳元件(比如質粒、基因島、噬菌體等)上并進行水平基因轉移(傳播),使無害細菌變成危險的病原菌,所以在鑒定毒力因子時一般會考慮基因島、分泌蛋白等。
- 病原菌毒力因子數據庫 VFDB 由中國醫學科學院研發,收集整理了24個屬100多種重要醫學病原菌已知毒力因子的組成、結構、功能、致病機理、毒力島、序列和基因組信息等內容,被廣泛應用于毒力因子基因鑒定。
- DIAMOND簡介
- 材料與方法
- 環境配置
- Version:Linux version 3.10.0-1160.15.2.el7.x86_64 (mockbuild@kbuilder.bsys.centos.org) (gcc version 4.8.5 20150623 (Red Hat 4.8.5-44) (GCC) ) #1 SMP Wed Feb 3 15:06:38 UTC 2021
cat /proc/version
- CPU(s): 64
lscpu- 型號名稱: Intel(R) Xeon(R) Silver 4216 CPU @ 2.10GHz
- Mem: 256G
free -g- Swap: 15G
交換內存,一般設置為0-10
- Swap: 15G
- Version:Linux version 3.10.0-1160.15.2.el7.x86_64 (mockbuild@kbuilder.bsys.centos.org) (gcc version 4.8.5 20150623 (Red Hat 4.8.5-44) (GCC) ) #1 SMP Wed Feb 3 15:06:38 UTC 2021
- DIAMOND安裝使用
- 安裝方式
- conda安裝:conda install diamond
- 下載安裝包:GitHub - bbuchfink/diamond: Accelerated BLAST compatible local sequence aligner.
- 安裝方式
- VFDB數據庫使用
- 官網地址:http://www.mgc.ac.cn/VFs/ 在官網下載數據庫時,帶有setA 的庫為VFDB數據庫核心庫(set A),而setB為全庫(setB), 其中setA僅包含經實驗驗證過的毒力基因,而setB則在setA的基礎上增加了預測的毒力基因,選擇好數據庫后,直接用blast即可完成注釋。
- 下載setA庫:http://www.mgc.ac.cn/VFs/Down/VFDB_setA_pro.fas.gz
- 構建數據庫
- gunzip VFDB_setA_pro.fas.gz #解壓縮
- diamond makedb --in /home/yangxin/db/vfdb/VFDB_setA_pro.fas --db /home/yangxin/db/vfdb/VFDB_setA #構建數據庫
- diamond blastp -db VFDB_setA_pro.fas.dmnd --query protein.fa --out vf_anno.txt #進行數據庫比對注釋
- 環境配置
- 結果展示
- 本地注釋結果
- 結果說明
- 結果說明
- 在線注釋
- 本地注釋的結果沒有很好體現了毒力因子的基因名稱以及相關描述,后來又使用VFDB在線BLASTP進行注釋,得到了另一個結果。注釋鏈接:VFDB: Virulence Factors of Bacterial Pathogens (mgc.ac.cn)
- 注釋結果
- 該表格為網絡視圖復制粘貼后進行了分列處理得到的結果,對于客戶而言更加直觀。于是將該表格作為注釋交付結果。
- 本地注釋結果
- 總結
- 盡管在線工具方便,但畢竟需要手動處理。還是建議探索本地分析,能夠更好構建分析流程。
- ?
總結
以上是生活随笔為你收集整理的2021.3.17丨致病菌毒力因子(VFDB)数据库注释的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: python一行输出多个数据_如何在Py
- 下一篇: 企业网站建设需要多少钱?