R语言任务视图:机器学习与统计学…
生活随笔
收集整理的這篇文章主要介紹了
R语言任务视图:机器学习与统计学…
小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.
機器學(xué)習(xí)是計算機科學(xué)和統(tǒng)計學(xué)的邊緣交叉領(lǐng)域,R關(guān)于機器學(xué)習(xí)的擴展包大概包括以下幾個方面:
- 神經(jīng)網(wǎng)絡(luò)(Neural Networks)?: 單隱含層神經(jīng)網(wǎng)絡(luò)在nnet?包(與R基礎(chǔ)包一同發(fā)布)中實現(xiàn)。RSNNS?包提供斯圖加特神經(jīng)網(wǎng)絡(luò)仿真軟件(SNNS)的使用接口。
- 遞歸拆分(Recursive Partitioning)?: 根據(jù)CART書中算法完成的用于回歸、分類和生存分析的樹形結(jié)構(gòu)模型在rpart?包(與R基礎(chǔ)包一同發(fā)布) 和tree包中實現(xiàn)。rpart包推薦用于計算與分類回歸樹相類似的樹結(jié)構(gòu)。?Weka?擁有很多拆分算法的工具包,RWeka提供了Weka的C4.5(J4.8變種)和M5實現(xiàn)的使用接口。Cubist包通過在葉端使用線性回歸模型、基于實例修正、boosting擬合基于規(guī)則的模型(與樹類似)。C50包可以擬合C5.0分類樹和基于規(guī)則的模型及其boosting版本。
party包有兩個帶有無偏變量選擇和統(tǒng)計停止準(zhǔn)則的遞歸拆分算法實現(xiàn)。ctree()函數(shù)基于非參數(shù)條件推理過程,用于測試響應(yīng)變量和每個輸入變量的無關(guān)性;而mob()函數(shù)能用于拆分參數(shù)模型。party包也提供了用于可視化二叉樹和響應(yīng)變量節(jié)點分布的可擴展工具。
用于多元響應(yīng)變量的rpart改進(jìn)版本在mvpart包提供。對于二元輸入變量問題,LogicReg包實現(xiàn)了邏輯回歸。maptree包提供了樹的可視化工具。
用于通過隨機效應(yīng)對縱向數(shù)據(jù)進(jìn)行建模的樹由REEMtree包提供。RPMM提供了對混合模型(Beta和高斯混合)的拆分。
用于表達(dá)樹的計算基礎(chǔ)架構(gòu)、預(yù)測和可視化的統(tǒng)一方法在partykit包內(nèi)實現(xiàn)。oblique.tree包提供了用于分類數(shù)據(jù)的斜樹。 - 隨機森林(Random Forests)?: randomForest包提供了用于回歸和分類的隨機森林算法參考實現(xiàn)。ipred包提供了用于回歸、分類和生存分析的bagging(bootstrap aggregating的縮寫)算法及通過集成學(xué)習(xí)對多個模型進(jìn)行組合的bundling算法。此外,基于條件推斷決策樹(conditional inference tree)的隨機森林變體(其響應(yīng)變量可以以任意比例估量)在party包中實現(xiàn)。randomSurvivalForest包提供用于刪失數(shù)據(jù)的隨機生存森林算法。分位數(shù)回歸森林?quantregForest通過隨機森林方式對探索變量的數(shù)值響應(yīng)變量分位數(shù)進(jìn)行回歸。varSelRF和Boruta包專注于通過隨機森林進(jìn)行變量選擇。對于大數(shù)據(jù)集,bigrf包以并行方式計算隨機森林并使用大的內(nèi)存對象存儲數(shù)據(jù)。
- 正規(guī)化和收縮方法(Regularized and Shrinkage Methods)?: 參數(shù)評估受限的回歸模型可以使用lasso2和lars包進(jìn)行擬合。grplasso包提供了群體LASSO(Least Absolute Shrinkage and Selection Operator)懲罰模型; ?grpreg包實現(xiàn)了一些其他群體懲罰模型,例如群體MCP(Minimax Concave Penalty)和群體SCAD(Smoothly Clipped Absolute Deviation Penalty)。用于廣義線性模型和Cox模型的L1正規(guī)化路徑可以通過glmpath包里的函數(shù)獲得,用于線性回歸、邏輯回歸和多項式回歸模型的整個lasso或elastic-net 正規(guī)化路徑(也存在于elasticnet) 可以通過glmnet包獲得。penalized包提供了lasso (L1)和ridge (L2)懲罰回歸模型(支持廣義線性模型和Cox模型)的另一個替代實現(xiàn)。RXshrink包能用于標(biāo)識和顯示特定收縮路徑的跟蹤信息、判斷合適的收縮程度。?使用lasso懲罰的半?yún)?shù)加法風(fēng)險模型由ahaz包提供。一種用于線性回歸的廣義lasso收縮技術(shù),relaxed lasso,由relaxo包提供。penalizedLDA包實現(xiàn)使用(可選的)LASSO懲罰的費舍爾線性判別分析,用于特征值p遠(yuǎn)大于觀測值n的高維數(shù)據(jù)。pamr包實現(xiàn)了用于基因表達(dá)分析的縮小重心分類法和工具。earth包提供了一個多元自適應(yīng)樣條回歸實現(xiàn)。penalizedSVM包提供了使用懲罰功能(SCAD或L1懲罰)的變量選擇支持向量機。?各種懲罰判別分析在hda、rda、sda和SDDA包內(nèi)實現(xiàn)。LiblineaR包提供了LIBLINEAR庫的接口。ncvreg包使用坐標(biāo)下降算法進(jìn)行SCAD和MCP邏輯懲罰來擬合線性和邏輯回歸模型。?bigRR包關(guān)注于高吞吐量嶺回歸(例如,對很多預(yù)測變量進(jìn)行懲罰)和異方差效應(yīng)模型。?bmrm包提供了一個用于正規(guī)化風(fēng)險最小化的束方法實現(xiàn)。
- Boosting?: 各種形式的梯度boosting在gbm包?(基于樹的功能性梯度下降boosting)內(nèi)實現(xiàn)。由boosting優(yōu)化的Hinge-loss實現(xiàn)在bst包內(nèi). ?GAMBoost包可用于通過boosting算法擬合廣義加法模型。mboost包提供一個用于廣義線性、加法和非參數(shù)模型的可擴展boosting框架。?基于似然估計的boosting實現(xiàn),用于Cox模型的在CoxBoost包內(nèi)提供,用于混合模型的在GMMBoost包內(nèi)提供。GAMLSS模型可以使用gamboostLSS提供的boosting進(jìn)行擬合。
- 支持向量機(Support Vector Machines and Kernel Methods)?: e1071包中的svm()函數(shù)提供LIBSVM庫的接口,包kernlab?為核學(xué)習(xí)(包括SVM、RVM和其他核學(xué)習(xí)算法)提供了一個靈活的框架。?klaR?包提供了用于SVMlight實現(xiàn)(僅one-against-all多類分類)的接口。?核特征空間的關(guān)聯(lián)維可以使用rdetools包進(jìn)行估計,rdetools也提供了用于模型選擇和預(yù)測的程序。
- 貝葉斯方法(Bayesian Methods)?:?tgp包提供了貝葉斯非穩(wěn)半?yún)?shù)非線性回歸和基于樹的高斯過程(包括貝葉斯線性模型、分類和回歸樹、基于樹的線性模型)設(shè)計.
- 基于遺傳算法的優(yōu)化(Optimization using Genetic Algorithms)?: rgp和rgenoud包提供基于遺傳算法的最優(yōu)化程序。Rmalschains包實現(xiàn)了基于局部搜索鏈的模因算法(memetic algorithm),該算法為一種特俗的演化算法類型,是穩(wěn)態(tài)基因算法和用于實數(shù)參數(shù)優(yōu)化的局部搜索的結(jié)合體。模因算法,又譯為文化基因算法,全局搜索策略可以采用遺傳算法、進(jìn)化策略、進(jìn)化規(guī)劃等;局部搜索策略可以采用爬山搜索、模擬退火、貪婪算法、禁忌搜索等。
- 關(guān)聯(lián)規(guī)則(Association Rules)? arules包提供了有效處理稀疏二元數(shù)據(jù)的數(shù)據(jù)結(jié)構(gòu),以及為用于挖掘頻繁項集、最大頻繁項集、閉頻繁項集和關(guān)聯(lián)規(guī)則的Apriori和Eclat算法實現(xiàn)提供接口。
- 基于規(guī)則的模糊系統(tǒng)(Fuzzy Rule-based Systems)?: frbs包實現(xiàn)了許多用于回歸和分類、從數(shù)據(jù)中學(xué)習(xí)模糊規(guī)則系統(tǒng)的標(biāo)準(zhǔn)方法。RoughSets包提供了粗糙集理論(RST)和模糊粗糙集理論(FRST)的完整實現(xiàn)。
- 模型選擇和驗證(Model selection and validation)?: e1071包中用于超參數(shù)調(diào)優(yōu)的tune()函數(shù)和ipred包中的errorest()?函數(shù)可被用于錯誤率估計。svmpath?包里的函數(shù)可用來選取支持向量機的代價參數(shù)C。ROCR?包提供了函數(shù)用于ROC分析和其他用于對比候選分類器的可視化技術(shù)。caret?包供了各種建立預(yù)測模型的函數(shù),包括參數(shù)調(diào)優(yōu)和變量重要性量度。這些包可被用于各種并行實現(xiàn)(例如MPI、NWS等)。
- 統(tǒng)計學(xué)習(xí)基礎(chǔ)(Elements of Statistical Learning)?: 《The Elements of Statistical Learning: Data Mining, Inference, and Prediction?》一書中的數(shù)據(jù)集、函數(shù)、例子都被打包放在ElemStatLearn包中。
- rattle?是R中用于數(shù)據(jù)挖掘的圖形用戶界面。
CRAN上的R包:
- ahaz
- arules
- bigrf
- bigRR
- bmrm
- Boruta
- bst
- C50
- caret
- CORElearn
- CoxBoost
- Cubist
- e1071?(core)
- earth
- elasticnet
- ElemStatLearn
- frbs
- GAMBoost
- gamboostLSS
- gbm?(core)
- glmnet
- glmpath
- GMMBoost
- grplasso
- grpreg
- hda
- ipred
- kernlab?(core)
- klaR
- lars
- lasso2
- LiblineaR
- LogicReg
- maptree
- mboost?(core)
- mvpart
- ncvreg
- nnet?(core)
- oblique.tree
- pamr
- party
- partykit
- penalized
- penalizedLDA
- penalizedSVM
- quantregForest
- randomForest?(core)
- randomSurvivalForest
- rattle
- rda
- rdetools
- REEMtree
- relaxo
- rgenoud
- rgp
- Rmalschains
- rminer
- ROCR
- RoughSets
- rpart?(core)
- RPMM
- RSNNS
- RWeka
- RXshrink
- sda
- SDDA
- svmpath
- tgp
- tree
- varSelRF
原文:http://blog.sina.com.cn/s/blog_72ef7bea0101i9zk.html
總結(jié)
以上是生活随笔為你收集整理的R语言任务视图:机器学习与统计学…的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: java序列化框架(protobuf、t
- 下一篇: R语言blotter包及相关工具