精选| 2021年2月R新包推荐(第51期)
譯:黃小偉,資深大數據分析從業者。目前就職杭州有贊數據分析團隊!
知乎專欄:中國R語言社區、R語言中文社區?|25,000+關注
知乎圈子:數據分析圈|11,000+加入
2021年2月,243個R新包收錄于CRAN(2021年1月份收錄230個),累計收錄18,483個R包!此次選摘了40個R包(12個類別),分布結構如下:
以下是本期(總第51期)R新包的核心功能介紹:
一. 計算方法
1.?blaster: 實現一種高效的(類似于BLAST)序列比較算法,該算法以C ++ 11編寫.
2.?rando: 提供比內置函數更能感知上下文的隨機數生成函數.
二. 數據
1.?AWAPer: 提供來自澳大利亞氣象局水資源可用性項目的全澳大利亞集水區加權氣候數據NetCDF文件.
2. caRecall: 提供對加拿大政府車輛召回數據庫的API訪問,該數據庫由缺陷調查和召回部門用于車輛、輪胎和兒童汽車座椅.
3.?geofi: 提供在R中讀取芬蘭開放地理空間數據的工具.
4. hockeystick: 為非氣候專家提供獲取基本氣候變化數據集的工具。用戶可以從權威渠道下載最新的原始數據,并通過預定義的ggplot2圖表進行查看。數據集包括大氣CO2、儀器和代理溫度記錄、海平面、北極/南極海冰和古氣候數據.
5.?votesmart: 實現對Project VoteSmart API的封裝.
三. 金融
1. PriceIndices: 提供計算雙邊和多邊指數的函數。有關詳細信息請參見:de Haan和Krsinich(2017)以及Diewert和Fox(2020).
2.?treasuryTR: 根據固定期限的債券收益率數據(例如報告的國庫券收益率)生成總收益(TR),這可為商業產品提供替代方案.
四. 游戲
1.?pixelpuzzle: 實現一個益智游戲,可以在R控制臺中玩.
五. 基因組學
1.?CDSeq: 提供同時使用批量測序數據估計細胞類型特異性基因表達譜和樣本特異性細胞類型比例的函數.
2. ClusTorus: 提供各種工具,用于在圓環體上對多變量數據進行聚類,同時包括對常用聚類方法(如k-均值聚類、成對角度距離)的角度調整.
3.?dsb: 提供了一種基于液滴的單細胞實驗中蛋白質表達數據的標準化和去噪方法.
六. 機器學習
1.?besridge: 使用Wen等人(2020)提出的原始-對偶活動集算法,提供在高維數據的復雜情況下執行嶺回歸的函數.
2. ROCket: 提供估計接收器工作特性(ROC)曲線和曲線下面積(AUC)計算的函數,能夠區分兩種類型的ROC曲線表示形式:1)參數曲線-真實正率(TPR)和錯誤正率(FPR)為 得分參數的函數;2)函數曲線-TPR是FPR的函數.
3.?wordpiece: 提供在給定適當詞匯表的情況下,對輸入文本應用詞條標記化的函數.
七. 數學
1.?fractD: 用盒計數法估計二維和三維(切片)圖像中黑色區域的分形維數.
2.?spacefillr: 生成隨機和準隨機的空間填充序列,包括Halton、Sobol和其他錯誤分布為各種類型抖動藍色噪聲的序列.
3.?tensorsign: 提出了一種基于符號序列的非參數張量完備化算法,Lee和Wang(2021)中描述了采用交替優化方法解決加權分類問題的算法.
八. 醫藥領域
1.?bhmbasket: 提供使用貝葉斯層次模型和貝葉斯決策規則評估具有二進制端點試驗設計的函數.
2.?bp: 通過為研究人員提供描述性和可視化工具,提供有助于分析各種形式的血壓數據的函數.
3.?CHOIRBM: 提供用于可視化通過“協作健康結果信息注冊表”(Collaborative Health Outcours Information Registry CHOIR)收集的體圖數據的函數.
4.?QDiabetes: 通過使用ClinRisk得出的風險預測算法,可以計算患2型糖尿病的風險.
5.?SteppedPower: 提供縱向混合模型的功率和樣本量計算、設計診斷工具,重點是使用Hussey和Hughes(2007)中介紹的方法和Li等人(2020)中討論的擴展進行階梯楔設計.
九.?網絡圖形
1.?bnmonitor:?實現了貝葉斯網絡的靈敏度和魯棒性方法,包括通過各種協變方案進行參數變化、計算靈敏度函數以及通過距離和發散量量化兩個貝葉斯網絡的不同性的方法.
2.?iconr: 提供使用網絡和空間分析研究考古圖像數據集(巖畫、陶藝裝飾、石碑等)的方法.
3.?MLVSBM: 提供使用隨機塊模型框架對多級網絡進行模擬、推理和聚類的函數,如Chabert-Liddell等人所述.
4.?motifr: 提供分析多層次網絡(將多個網絡結合在一起的網絡,例如社會生態網絡)基序(節點和邊的小配置)的工具.
十. 統計領域
1.?cfda: 提供將分類數據編碼為功能數據并執行基礎統計分析的功能.
2.?cvCovEst: 實現了一種高效的協方差矩陣估計交叉驗證方法,特別適用于高維環境.
3.?flipr: 對多種數據類型實現置換框架點估計、置信區間或假設檢驗.
4.?ipmr: 使用基于表達式的框架實現積分投影模型,該框架處理密度依賴性和環境隨機性,并提供診斷、繪圖、模擬和分析工具.
5.?metapack: 提供通過馬爾可夫鏈蒙特卡羅算法對元分析和網絡元分析模型執行貝葉斯推理的函數.
6. sassy: 加載一組程序包,這些程序包的共同目標是使SAS?程序員更容易使用R。函數將許多熟悉的SAS?概念帶到R中,包括數據庫、數據字典、格式和格式目錄、數據步驟和可跟蹤日志.
十一. 應用工具
1.?gargoyle: 實現基于事件的框架以構建Shiny應用程序,?該程序包不再依賴于標準的Shiny反應對象,而是依靠更輕量的觸發器.
2.quarto: 提供Quarto markdown發布系統的界面,并允許將R Markdown文檔和Jupyter Notebooks轉換為多種輸出格式.
3.?var: 提供功能以管理,配置和使用為R預先配置的虛擬機,以及在干凈的環境中開發,測試和構建程序包.
十二. 可視化
1.?ggh4x: 通過為每個面板設置單獨的比例、調整面板大小,提供嵌套的構面并允許每個圖使用多種顏色和填充比例來擴展ggplot2圖形.
2.?tastypie: 提供用于制作餅圖的函數和模板.
3.?terrainr: 提供檢索、操作和可視化地理空間數據的功能,目的是在Unity 3D渲染引擎中生成“3D”景觀可視化.
說明:限于個人水平,錯誤之處難免,煩請批評指正,共同交流~
https://rviews.rstudio.com/2021/03/19/february-2021-top-40-new-cran-packages/
往期精品(點擊圖片直達文字對應教程)
機器學習
后臺回復“生信寶典福利第一波”或點擊閱讀原文獲取教程合集
總結
以上是生活随笔為你收集整理的精选| 2021年2月R新包推荐(第51期)的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 送书 | 222Beta多样性限制性排序
- 下一篇: 英雄?好汉?可否有人站出来回应下?