打开 igv java_必备可视化Integrative Genomic Viewer(IGV)
你會用到的網(wǎng)站:
寫在前面:
之前mac不小心升級了一下java,然后igv就不能用了,要寫教程必須降級java首先,看官方說明,需要安裝Java -8,9以上版本不支持。我的mac不知道什么時(shí)候更新到了java 10,按說可以向下兼容,但是事與愿違,igv不能正常使用了。
需要降級Java,mac用戶可以直接參考,windows可以試下直接下載安裝IGV:先刪除原來的javaterminal打開終端,復(fù)制粘貼一下三條命令:sudo rm -fr /Library/Internet\ Plug-Ins/JavaAppletPlugin.plugin
sudo rm -fr /Library/PreferencesPanes/JavaControlPanel.prefPane
sudo rm -fr ~/Library/Application\ Support/Java??:不要通過/usr/bin 刪除 Java 工具來卸載 Java。此目錄是系統(tǒng)軟件的一部分,下次對操作系統(tǒng)執(zhí)行更新時(shí),Apple 會重置所有更改。
finder中進(jìn)入 /Library/Java/JavaVirtualMachines,然后刪除之前的jdk.版本號
【W(wǎng)indows用戶下載,解壓后,點(diǎn)擊igv.bat文件即可啟動;如果啟動失敗,用記事本打開并編輯igv.bat文件,在文件的最后新起一行輸入pause,保存后,再嘗試打開,就可以在Windows下的命令行界面(cmd命令提示符)看到錯誤信息,再根據(jù)信息提示去解決問題;不過一般問題不大】
IGV安裝
正文開始:
好啦,問題解決啦,開始正式IGV介紹!
什么是IGV
它是一款本地的探索基因組數(shù)據(jù)的可視化瀏覽器,有多個(gè)系統(tǒng)版本,支持多種不同類型的輸入格式,包括芯片測序、二代測序、基因組注釋文件等。推薦使用BAM與SAM格式,主要格式見下表數(shù)據(jù)來源文件格式序列比對SAM/BAM
顯示覆蓋率TDF
拷貝數(shù)SNP、CN
基因表達(dá)GCT、RES
基因注釋GFF3/GTF、BED
突變數(shù)據(jù)MUT
追蹤參考基因組覆蓋度、測序深度(UCSC)WIG、BW
一睹IGV
每次打開會自動加載hg19.fa文件,也就是人類基因組,一會進(jìn)入主界面
主界面
自己構(gòu)建基因組信息
這里我會舉一個(gè)昆蟲中一種——棉鈴蟲,這個(gè)基因組是17年2月更新在NCBI傷的,屬于小眾物種,IGV并沒有收錄。正好拿來練手,當(dāng)然如果你研究的領(lǐng)域也有基因組被測出來,也可以試一試【注意:在提交基因組文件到IGV之前,要先構(gòu)建索引】
這些工作都可以在本地進(jìn)行,只需要打開你本地的git_bash或者putty/xshell或者terminal,解壓縮基因組文件=》下載samtools(推薦用conda管理)=>構(gòu)建索引samtools faidx genome.fasta=>IGV中 輸入fasta文件路徑=》提供注釋文件(可以是組裝基因組預(yù)測的基因注釋文件,也可以是拼接轉(zhuǎn)錄組用的gtf文件)=〉其他選項(xiàng)可以忽略=》點(diǎn)擊OK推彈出一個(gè)框讓你輸入存儲路徑
自定義基因組
查看注釋文件這里以人類基因組注釋文件為例,下載gtf到電腦
下載完不要急著導(dǎo)入,需要先構(gòu)建索引
導(dǎo)入注釋文件
然后會生成gff3.idx或者gtf.idx文件,說明構(gòu)建了索引,接著導(dǎo)入File -> Load from file,選擇sorted的注釋文件
查找基因
查看bam文件
我這里準(zhǔn)備的bam文件大小是2.8G,是由人類轉(zhuǎn)錄組測序數(shù)據(jù)得到的,準(zhǔn)備的參考基因組是hg19,注釋文件是gencode.v28lift37.annotation.sorted.gff3bam文件在導(dǎo)入前,要先使用samtools進(jìn)行sort和index,samtools sort test.bam test.sort``samtools index test.sort.bam,生成一個(gè)后綴為“.fai”的文件,它根據(jù)文件名自動和.bam關(guān)聯(lián), 另外這兩個(gè)文件要在一個(gè)文件夾下,最后將bam導(dǎo)入IGV中
載入bam后,默認(rèn)會出現(xiàn)兩個(gè)track(翻譯的話,可以理解為不同的軌道,顯示不同的信息)Coverage track和Alignment track。
載入bam后
另外基因組信息也可以有collapsed、expanded、squished三種展示形式
基因組信息查看Coverage track
它的意思是顯示比對文件的覆蓋率和測序深度。橫坐標(biāo)是基因組上的位置,縱坐標(biāo)是該位置的測序深度。【鼠標(biāo)放在每一個(gè)位點(diǎn)都會顯示一個(gè)小方框,其中的的內(nèi)容就是顯示總共有多少reads在這個(gè)位置,每個(gè)堿基各是什么】
點(diǎn)右上角+放大reads可視化窗口后,track會以灰色的條形圖來顯示每個(gè)位點(diǎn)的測序深度。如果某一個(gè)核苷酸與參考序列相比,有超過20%的reads是不同的,條形圖會顯示不同的顏色
Coverage track
顯示特定位點(diǎn)變異
關(guān)于上圖中的右鍵菜單,解釋如下功能含義Rename Track更改track名
Change Track Color更改背景色,比如把Coverage Track灰色變紫色
Change Track Height改變每一個(gè)track的高度
Change Font Size改變IGV最左側(cè)字體大小
Set Data Range覆蓋深度的范圍設(shè)置
Log scale用對數(shù)尺度作圖
AutoScale是否自動縮放比較多個(gè)基因
比較多個(gè)基因
這里看到有許多顏色,這些顏色是根據(jù)定義不同比對類型而不同,
不同比對類型顏色也不同查找結(jié)構(gòu)變異
灰色:與參看基因組可以比對的reads
紫色I(xiàn):插入(鼠標(biāo)查看插入的堿基信息)
黑色橫線:——缺失
歡迎關(guān)注我們的公眾號~_~
我們是兩個(gè)農(nóng)轉(zhuǎn)生信的小碩,打造生信星球,想讓它成為一個(gè)不拽術(shù)語、通俗易懂的生信知識平臺。需要幫助或提出意見請后臺留言或發(fā)送郵件到Bioplanet520@outlook.com
Welcome to our bioinfoplanet!
總結(jié)
以上是生活随笔為你收集整理的打开 igv java_必备可视化Integrative Genomic Viewer(IGV)的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: Mysql:This version o
- 下一篇: Excel使用控件创建动态地图图表