精选| 2020年8月R新包推荐(第45期)
生物信息學習的正確姿勢
NGS系列文章包括NGS基礎、在線繪圖、轉錄組分析?(Nature重磅綜述|關于RNA-seq你想知道的全在這)、ChIP-seq分析?(ChIP-seq基本分析流程)、單細胞測序分析?(重磅綜述:三萬字長文讀懂單細胞RNA測序分析的最佳實踐教程)、DNA甲基化分析、重測序分析、GEO數據挖掘(典型醫學設計實驗GEO數據分析 (step-by-step))、批次效應處理等內容。
作者:Joseph Rickert
翻譯:黃小偉,資深大數據分析從業者。目前就職杭州有贊數據分析團隊!
知乎專欄:中國R語言社區 |10000+關注(Top 1)
2020年8月份,146個R新包收錄于CRAN(2020年7月份收錄161個),累計收錄17,203個R包!由于CRAN會不定時進行R包增刪,所以具體數量會隨時間略有變化。
此次整理了11個類別,分別為計算方法(3)、數據(2)、基因組學(2)、保險業(1)、機器學習(2)、應用數學(5)、醫藥學(3)、統計學(9)、時間序列(4)、效率工具(3)和可視化(6)。
以下是本期(總第45期)R新包的核心功能介紹:
一. 計算方法
1. dpseg: 實現一種通過動態編程算法對有序數據進行線性分段的算法.
2.?qpmadr: 實現Goldfarb&Idnani(1983)中用于求解具有線性不等式、等式和框約束的二次問題的方法.
3.?WoodburyMatrix: 實現一個類和方法的層次結構,用于操作由其他矩陣的逆和隱式形成的矩陣,這是空間統計和相關領域中常見的情況.
二.?數據
1. neonstore: 支持通過API接口訪問國家生態觀測網(NEON)數據.
2.?pdxTrees: 收集了波特蘭公園和娛樂場所的數據集,該數據庫清點了一百七十多個公園中以及沿九十六個社區沿街的每一棵樹.
三. 基因組學
1.?hiphop: 實現一種方法來比較子代與任何潛在父母組合的基因型,并在可用于父子鑒定和生育分配的雙等位基因標記處對這些個體的不匹配數量給予評分.
2. RapidoPGS: 支持從病例對照或定量性狀的GWAS摘要統計信息快速計算多基因得分,而無需LD矩陣計算或參數調整.
四. 保險業
1.?SynthETIC: 實現個人索賠模擬器,該模擬器生成模擬非人壽保險索賠的各種特性的合成數據.
五. 機器學習
1.?sparklyr.flint: 對Sparklyr進行擴展,包含了Flint時間序列功能.
2. torch: 提供定義和訓練神經網絡的功能,類似于Paszke等(2019)的PyTorch,但完全用R編寫.
六.?應用數學
1.?gasper: 提供圖形信號處理的標準操作,包括圖形傅里葉變換、譜圖小波變換、可視化工具等.
2. GeodRegr: 提供梯度下降算法來尋找實值自變量和流形值因變量之間的測地線關系(即測地線回歸).
3.?geos: 為開源幾何引擎GEOS庫提供了一個R API,并提供了一個矢量格式,用于高效地存儲GEOS幾何圖形.
4.?pcSteiner: 提供用于獲得Steiner Tree問題的近似解決方案的功能,該問題尋求一個子圖,該子圖將給定一組頂點與最昂貴的節點和最便宜的邊連接起來.
5.?TCIU: 提供使用分析和數值技術將縱向數據轉換為復雜時間(kime)數據的核心功能、可視化原始時間序列和重建的kime曲面,執行基于模型(例如張量線性回歸)和無模型分類和聚類方法.
七.?醫藥學
1.?epigraphdb: 支持對EpiGraphDB平臺的訪問.
2.?raveio: 實現了一個與RAVE(人類顱內腦電圖數據的R分析和可視化)項目的接口,該項目旨在分析放在皮層表面或插入大腦的電極患者的大腦記錄.
3.?tboot: 支持通過使用傾斜引導重采樣方法模擬具有實際相關性結構和假定療效水平的臨床試驗數據.
八.?統計學
1.?BayesMRA: 使用Markov Chain Monte Carlo擬合稀疏貝葉斯多分辨率空間模型.
2. bsem: 允許使用rstan針對特定情況進行結構方程式建模,其中包括貝葉斯半確認因子分析、確認性因子分析和結構方程模型.
3. cyclomort: 支持使用周期性危險函數進行生存建模.
4.?ebmstate: 實現經驗貝葉斯、多狀態Cox模型以進行生存分析.
5.?fairmodels: 提供測量多個模型公平性的功能,包括測量模型對不同種族、性別、國籍等的偏見.
6. MGMM: 實現具有缺失元素的多元正態隨機向量的聚類,通過擬合高斯混合模型(GMM)實現聚類.
7.?rmsb: rms包的Bayesian輔助,提供貝葉斯模型擬合、后擬合估計,并實現貝葉斯回歸模型,其擬合對象可由rms函數處理.
8.RoBMA?: 實現一個用于估計元分析模型集合的框架(假設存在或不存在影響、異構性和發布偏差),并使用貝葉斯模型平均來進行組合.
9.?tTOlr: 實現一個和兩個樣本t檢驗的似然比統計.
九.?時間序列
1.?fable.prophet: 使prophet模型可用于通過fabletools創建的工作流中.
2. garma: 提供估計長記憶季節性/周期性Gegenbauer單變量時間序列過程的方法.
3. gratis: 支持基于混合自回歸模型生成時間序列.
4.?rhosa: 支持對時間序列進行高階光譜或多光譜分析.
十.?效率工具
1.?DataEditR: 實現一個交互式編輯器,允許在R中交互式地查看、輸入和編輯數據.
2.?equatiomatic: 通過提供函數來簡化LaReX公式的編寫,該函數將擬合的模型對象作為其輸入,并返回模型對應的LaTeX代碼.
3. starschemar: 提供從平面表獲取星型模式的函數.
十一.?數據可視化
1. glow: 提供用于創建具有發光點的圖框架.
2. graph3d:?實現JavaScript庫可視化的包裝,使用戶能夠創建三維交互式可視化.
3.?jsTreeR: 提供實現用于表示可包含在Shiny應用程序和R markdown文檔中層次結構數據交互式樹的功能.
4. KMunicate: 支持按照Morris等人的KMunicate研究推薦的方式生成Kaplan-Meier圖.
5.?rAmCharts4: 提供用于創建JavaScript圖表的函數,這些圖表可以包含在Shiny應用程序和R Markdown文檔中,也可以從R控制臺和rstudioviewer中查看.
6.?tabularmaps: 提供用于創建表格地圖的函數,這是一種可視化方法,用于通過平鋪多個元素來高效地顯示由多個元素組成的數據.
說明:限于個人水平,錯誤之處難免,煩請批評指正,共同交流~
這個為生信學習和生信作圖打造的開源R教程真香!!!
使用R語言的正確姿勢,R包干貨奉獻
往期精品(點擊圖片直達文字對應教程)
后臺回復“生信寶典福利第一波”或點擊閱讀原文獲取教程合集
總結
以上是生活随笔為你收集整理的精选| 2020年8月R新包推荐(第45期)的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: BIC无代码绘制差异基因火山图
- 下一篇: 这个为生信学习打造的开源Bash教程真香