生活随笔
收集整理的這篇文章主要介紹了
决策树 - 鸢尾花数据集
小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.
因?yàn)轫?xiàng)目原因要調(diào)研一些人力資源管理系統(tǒng)常用的機(jī)器學(xué)習(xí)算法,就利用鳶尾花數(shù)據(jù)集嘗試了一下決策樹算法。
from sklearn.datasets import load_irisiris = load_iris() #加載鳶尾花數(shù)據(jù)集
iris_feature = iris.data #特征數(shù)據(jù)
iris_target = iris.target #分類數(shù)據(jù)print('訓(xùn)練總數(shù):', len(iris_target))
print('分類數(shù)據(jù):', iris_target)
print('特征數(shù)據(jù):', iris_feature)'''0:Iris Setosa1:Iris Versicolour2:Iris Virginica
'''
from sklearn.model_selection import train_test_splitfeature_train, feature_test, target_train, target_test = train_test_split(iris_feature, iris_target, test_size=0.25, random_state=40)print('訓(xùn)練集總數(shù):', len(target_train), '\n', '訓(xùn)練集目標(biāo)值:', target_train)
print('驗(yàn)證集總數(shù):', len(target_test), '\n', '驗(yàn)證集目標(biāo)值:', target_test)'''
feature_train:訓(xùn)練集特征
feature_test:測試集特征
target_train:訓(xùn)練集目標(biāo)值
target_test:驗(yàn)證集目標(biāo)值
'''
from sklearn import tree
from sklearn.metrics import accuracy_scoredt_model = tree.DecisionTreeClassifier()
clf = dt_model.fit(feature_train, target_train) #使用訓(xùn)練集訓(xùn)練模型
predict_results = dt_model.predict(feature_test) #使用模型對測試集進(jìn)行預(yù)測print('測試結(jié)果:', predict_results)
print('實(shí)際數(shù)據(jù):', target_test)
print('預(yù)測結(jié)果準(zhǔn)確度:', accuracy_score(predict_results, target_test)) #查看預(yù)測結(jié)果準(zhǔn)確度
import os
os.environ["PATH"] += os.pathsep + 'D:\\LU\\Graphviz\\bin'
with open('iris.dot', 'w') as f: #模型clf存入dot文件iris.dotf = tree.export_graphviz(clf, out_file=f)from IPython.display import Image
import pydotplus
dot_data = tree.export_graphviz(clf, out_file=None, feature_names=iris.feature_names, class_names=iris.target_names, filled=True, rounded=True, special_characters=True)
graph = pydotplus.graph_from_dot_data(dot_data)
Image(graph.create_png())
鏈接:https://pan.baidu.com/s/1iBrumtLvC3n8TO4evzwXgQ
提取碼:1k90
總結(jié)
以上是生活随笔為你收集整理的决策树 - 鸢尾花数据集的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
如果覺得生活随笔網(wǎng)站內(nèi)容還不錯,歡迎將生活随笔推薦給好友。