Python 随机森林分类
生活随笔
收集整理的這篇文章主要介紹了
Python 随机森林分类
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?Python 隨機森林分類
1 聲明
本文的數據來自網絡,部分代碼也有所參照,這里做了注釋和延伸,旨在技術交流,如有冒犯之處請聯系博主及時處理。
2 決策樹分類簡介
相關概念見下:
決策樹的最大問題是樹在訓練集生成的過于茂密,導致過擬合(即在訓練集上表現卓越但在測試集上效果很差)。這時隨機森林就應運而生了。在隨機森林里會有很多決策樹,而每顆決策樹只接收自舉樣本且每個節點僅圍繞部分特征尋找最好的分割。隨機決策樹的森林最后通過投票的方式選出最后的預測分類。
注:自舉樣本是指從一個較大的樣本中 "自舉 "出來的較小樣本。Bootstrap是一種重新取樣的方法,即從一個原始樣本中反復抽取大量相同大小的小樣本,并進行替換。
隨機森林分類里的幾個參數:
max_features:每個節點選擇的特征的最大數
boostrap:指定是否以自舉采樣
n_estimators: 指定決策樹的個數
n_jobs:并行數量,等于-1是最大化計算資源
?
3 隨機森林分類代碼與注釋示例
# 加載隨機森林分類包 from sklearn.ensemble import RandomForestClassifier from sklearn import datasets # 加載數據與模型創建 iris = datasets.load_iris() features = iris.data target = iris.target randomforest = RandomForestClassifier(random_state=0, n_jobs=-1) # 訓練模型 model = randomforest.fit(features, target) # 預測分類 observation = [[ 5, 4, 3, 2]] # Predict observation's class print(model.predict(observation))4 總結
無
總結
以上是生活随笔為你收集整理的Python 随机森林分类的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 屋顶光伏发电靠谱吗 建议大家还是要慎重
- 下一篇: 天海防务股票是做什么的