三大开源生信基础教程(bookdown编写,源码可作为模板)和视频课程
開源生信 R 教程
http://www.ehbio.com/Bioinfo_R_course/
1 思考題
2 R基礎
2.1 R安裝
2.2 Rstudio基礎
2.2.1 Rstudio版本
2.2.2 Rstudio安裝
2.2.3 Rstudio 使用
2.3 R基本語法
2.3.1 獲取幫助文檔,查看命令或函數的使用方法、事例或適用范圍
2.3.2 R中的變量及其初始化
2.3.3 變量類型和轉換
2.3.4 R中矩陣運算
2.3.5 R中矩陣篩選合并
2.3.6 str的應用
2.3.7 R的包管理
2.4 ggplot2繪圖
2.4.1 數據格式轉換和字符串處理
2.4.2 配色
2.4.3 pheatmap繪制熱圖
3 R plots
3.1 qplot繪制圖形 (王緒寧)
3.2 熱圖繪制
3.2.1 生成測試數據
3.2.2 轉換數據格式
3.2.3 分解繪圖
3.2.4 圖形存儲
3.3 熱圖美化
3.3.1 對數轉換
3.3.2 Z-score轉換
3.3.3 抹去異常值
3.3.4 非線性顏色
3.3.5 調整行或列的順序
3.4 熱圖繪制 - pheatmap
3.5 聚類熱圖如何按自己的意愿調整分支順序?
3.5.1 數據示例
3.5.2 繪制一個聚類熱圖很簡單
3.5.3 如何自定義分支順序呢
3.5.4 人為指定順序排序樣品
3.5.5 按某個基因的表達由小到大排序
3.5.6 按某個基因的表達由大到小排序
3.5.7 按分支名字(樣品名字)的字母順序排序
3.5.8 梯子形排序:最小的分支在右側
3.5.9 梯子形排序:最小的分支在左側
3.5.10 按特征值排序
3.6 箱線圖
3.6.1 一步步解析箱線圖繪制
3.6.2 繪制單個基因 (A)的箱線圖
3.6.3 長矩陣繪制箱線圖
3.7 線圖
3.7.1 單線圖
3.7.2 多線圖
3.7.3 橫軸文本線圖
3.8 散點圖
3.8.1 橫縱軸都為數字的散點圖解析
3.8.2 橫縱軸都為字符串的散點圖展示
3.9 功能富集泡泡圖
3.9.1 單樣品分開繪制
3.9.2 多樣品合并繪制
3.10 韋恩圖
3.10.1 韋恩圖三個圈
3.10.2 韋恩圖五個圈
3.10.3 UpSetView展示
3.11 柱狀圖繪制
3.11.1 常規矩陣柱狀圖繪制
3.11.2 長矩陣分面繪制
3.12 圖形支持中文字體
3.12.1 修改圖形的字體
3.12.2 ggplot2支持中文字體輸出PDF
3.12.3 系統可用字體
3.12.4 合并字體支持中英文
3.12.5 一個示例
3.13 PCA原理解析和圖形繪制
3.13.1 主成分分析簡介
3.13.2 主成分分析的意義
3.13.3 示例展示原始變量對樣品的分類
3.13.4 PCA的實現原理
3.13.5 簡單的PCA實現
3.13.6 PCA結果解釋
3.13.7 PCA應用于測試數據
3.13.8 PCA注意事項
3.13.9 參考資料
3.14 生存分析
3.14.1 R做生存分析
3.15 一步作圖的優勢
3.16 不改腳本的熱圖繪制
3.16.1 箱線圖 - 一步繪制
3.16.2 線圖 - 一步繪制
3.16.3 一網打進散點圖繪制
4 網絡圖
4.0.4 基本操作
4.0.5 miRNA-mRNA調控網絡
4.0.6 不同的布局的調試和修改
5 圖形排版
6 高通量數據中批次效應的鑒定和處理
6.1 什么是批次效應?
6.2 批次效應會有什么影響?
6.3 怎么確認數據有無受到批次效應影響
6.4 怎么避免批次效應呢?
6.5 如何在差異基因鑒定過程中移除批次效應
6.5.1 不考慮批次因素直接進行差異基因分析
6.5.2 考慮已知的批次因素進行差異基因分析
6.5.3 比較批次校正前后差異基因變化
6.6 批次效應未知時如何判斷和在差異基因鑒定過程中移除批次效應
6.6.1 預測混雜因素(cofounding factors)并在差異基因分析中移除這些因素
6.6.2 預測可能存在的混雜因素
6.6.3 比較批次校正前、已知批次校正后和預測的批次校正后差異基因變化
6.6.4 直接校正表達矩陣
6.6.5 ComBat_seq直接校正Count matrix
6.6.6 怎么從FASTQ數據中獲得測序設備和批次相關信息
6.6.7 如何合并人的表達數據和小鼠的表達數據?
6.6.8 質控中的GC含量和Overrepresented sequences
6.6.9 樣品是否在某種屬性中存在偏好性
6.6.10 為什么聚類結果不可靠
6.6.11 sampleFile文件的生成
7 易生信-數據可視化
7.1 加載需要的包
7.2 讀入數據
7.2.1 Duplicate row names
7.2.2 行名唯一化處理
7.3 熱圖繪制
7.3.1 提取差異基因繪制熱圖
7.4 箱線圖和統計比較
7.4.1 單基因箱線圖
7.4.2 多基因箱線圖 (combine)
7.4.3 多基因箱線圖 (merge)
7.4.4 數據對數轉換后繪制箱線圖
7.4.5 用ggplot2實現ggpubr
7.4.6 配色
7.4.7 箱線圖加統計分析
7.5 通路內基因的比較
7.5.1 密度圖
7.6 ggstatsplot繪圖和統計分析
7.6.1 散點圖
7.6.2 相關性圖
8 高顏值免費在線繪圖(提供繪圖源碼)
8.1 高顏值免費在線繪圖基礎版視頻
8.2 高顏值免費在線繪圖進階版視頻
9 參考
開源生信 Linux Bash教程
http://www.ehbio.com/Bioinfo_Bash_course/
1 Linux初探,打開新世界的大門
1.1 Linux系統簡介和目錄理解
1.1.1 為什么要用Linux系統1.1.2 Linux系統無處不在1.1.3 免費的Linux系統來一套1.1.4 Linux系統登錄-聯系遠方的她1.1.5 初識Linux系統 - 黑夜中的閃爍是你的落腳點1.1.6 我的電腦在哪?1.1.7 系統配置怎樣?來看看256M硬盤的服務器1.1.8 看下目錄下都有什么1.1.9 新建一個目錄1.1.10 訪問文件1.1.11 查看幫助,獲取可用命令行參數1.1.12 小結1.1.13 做個小測試1.2 Linux下文件操作
1.2.1 文件按行翻轉和按列翻轉1.2.2 新建文件的n種方式1.2.3 文件拷貝、移動、重命名、軟鏈1.2.4 Linux下命令的一些突發事故1.2.5 了解和操作你的文件1.2.6 小結和練習1.3 Linux終端常用快捷操作
1.4 Linux下的標準輸入、輸出、重定向、管道
1.5 Linux文件內容操作
1.5.1 命令組合生成文件1.5.2 文件排序原來有暗倉1.6 Linux下的查找命令 - 文件哪里跑
1.6.1 命令/可執行程序查找 - 定位腳本的位置1.6.2 locate普通文件快速定位1.6.3 find讓文件無處可逃 find按時間查找限制查找深度1.6.4 按文件內容查找 grep1.7 一句話加速grep近30倍
1.7.1 獲取單基因表達量1.7.2 那如果獲取多個基因怎么操作呢?1.8 監控程序的運行時間和資源占用
2 Linux下軟件安裝相關
2.1 文件屬性和可執行屬性
2.1.1 文件屬性2.1.2 可執行屬性2.2 PATH和path,傻傻分不清
2.2.1 小事也不能忽略2.3 軟件安裝的幾種傳統方式
2.3.1 系統包管理器安裝2.3.2 下載二進制文件2.3.3 源碼編譯安裝2.3.4 Python包的安裝2.3.5 Anaconda的兩個福利2.3.6 R和R包的安裝2.3.7 Perl包的安裝2.4 Conda安裝配置生物信息軟件
2.4.1 Conda安裝和配置2.4.2 Conda基本使用2.4.3 Conda的channel2.4.4 創建不同的軟件運行環境2.4.5 移除某個conda環境2.4.6 Conda配置R2.4.7 Conda環境簡化運行2.4.8 Conda環境備份2.4.9 Conda環境導出和導入2.4.10 Conda軟件安裝 core dump error/Segment fault/段錯誤 怎么辦2.4.11 Conda為什么越來越慢?2.4.12 Conda是如何工作的2.4.13 Conda哪一步慢?2.4.14 如何提速Conda2.4.15 下載提速2.4.16 使用conda-pack直接從已經安裝好的地方拷貝一份 (同一操作系統)2.5 Docker安裝
2.5.1 Docker能做什么2.5.2 Docker的幾個基本概念2.5.3 安裝和配置2.5.4 Docker用戶權限2.5.5 Docker試用2.5.6 Docker系統基本操作2.5.7 使用Dockerfile自動構建鏡像2.5.8 Docker的特征2.5.9 Docker使用注意2.6 Makefile知識
2.6.1 參考3 Linux神器
3.1 正則表達式替換文本隨心所欲
3.2 awk-生信分析不可缺少
3.2.1 awk基本參數解釋3.2.2 awk基本常見操作3.2.3 awk糅合操作 - 命令組合體現魅力3.3 SED命令 - 文本替換舍我其誰
3.3.1 sed基本參數解釋3.3.2 常見操作3.4 VIM的使用
3.4.1 初識VIM3.4.2 VIM中使用正則表達式3.5 有了這些,文件批量重命名還需要求助其它工具嗎?
3.5.1 簡單重命名rename演示3.5.2 復雜重命名假如已經有對應關系組合文件名,使用mv重命名使用rename會不會稍微簡單一點?從原文件名獲取對應關系基于paste3.6 耗時很長的程序忘加nohup就運行了怎么辦?
4 Bash 字符串處理
4.1 Bash特殊字符
4.2 Bash變量
4.3 Bash操作符
4.4 Shell中條件和test命令
4.5 Shell流控制
4.6 Shell函數
4.7 輸入輸出
4.8 命令行處理 命令行處理命令
4.9 進程和作業控制
4.10 尋找Cas9的同源基因并進行進化分析
4.11 如何獲取目標基因的轉錄因子(上)——biomart下載基因和motif位置信息
4.11.1 文件準備4.11.2 什么是bed文件?4.11.3 BioMart數據下載4.12 如何獲取目標基因的轉錄因子(下)——Linux命令獲取目標基因TF
4.12.1 基礎回顧4.12.2 文件格式處理4.12.3 計算基因的啟動子區4.12.4 取兩文件的交集4.12.5 提取我們關注的基因4.12.6 重點總結4.13 emboss的使用
4.14 使用samtools計算SNP
4.15 Bedtools使用
4.16 SRA toolkit使用
4.17 生信流程開發
4.18 數據同步和備份
4.18.1 原創拷貝scp4.18.2 鏡像備份和增量同步 rsync4.18.3 增量備份,記錄各個版本 rdiff-backup5 生物信息中Linux命令練習
5.1 統計GTF文件中染色體數目?
5.2 統計GTF文件中基因數目?
5.3 計算GTF中外顯子總長度?
5.4 計算GTF文件中基因所擁有的平均轉錄本數目
5.5 生成一個多行Fasta測試序列供后續運算 (也可使用我們前面提供的腳本生成)
5.6 test.fa中的序列全轉成大寫
5.7 計算多行FASTA文件test.fa中每條序列長度
5.8 多行FASTA轉單行FASTA序列
5.9 取出單行FASTA文件中序列長度大于40的序列的名字
5.10 分別用awk和grep從test.fa中提取給定ID對應的序列
5.11 利用AWK對基因表達數據進行標準化
5.12 寫出3種寫法,去掉上一題test.expr矩陣中的第一行?
5.13 分別用awk和sed給test.expr矩陣加上標題行?
5.14 給定一個BAM文件,怎么計算有多少基因組區域被測到了?平均測序深度是多少?
5.15 如何使用bedtools的其它工具或其它Linux命令實現bedtools jaccard子功能?
5.16 如何使用命令生成這次課程的目錄
開源生信 Python教程
生信專用簡明 Python 文字和視頻教程
目錄
背景介紹
編程開篇
為什么學習Python
如何安裝Python
如何運行Python命令和腳本
使用什么編輯器寫Python腳本
Python程序事例
Python基本語法
數值變量操作
字符串變量操作
列表操作
集合操作
Range使用
字典操作
層級縮進
變量、數據結構、流程控制
輸入輸出
交互式輸入輸出
文件讀寫
實戰練習(一)
背景知識
作業(一)
函數操作
函數操作
作業(二)
模塊
命令行參數
命令行參數
作業(三)
更多Python內容
單語句塊
列表綜合,生成新列表的簡化的for循環
lambda, map, filer, reduce (保留節目)
exec, eval (執行字符串python語句, 保留節目)
正則表達式
Python畫圖
Reference
文字版本開源 (鏈接在本文每一部分開頭)
視頻講解優惠
點擊閱讀原文直達視頻 http://bioinfo.ke.qq.com/
源碼在:https://github.com/Tong-Chen
總結
以上是生活随笔為你收集整理的三大开源生信基础教程(bookdown编写,源码可作为模板)和视频课程的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: OpenCV中反向投影
- 下一篇: 机器学习笔记十之聚类