當前位置：首頁 > 编程语言 > python >内容正文

python

python决策树sklearn_python利用sklearn包编写决策树源代码

發布時間：2023/12/10 python 28 豆豆

生活随笔收集整理的這篇文章主要介紹了 python决策树sklearn_python利用sklearn包编写决策树源代码小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

本文實例為大家分享了python編寫決策樹源代碼，供大家參考，具體內容如下

因為最近實習的需要，所以用python里的sklearn包重新寫了一次決策樹。

工具：sklearn，將dot文件轉化為pdf格式（是為了將形成的決策樹可視化）graphviz-2.38，下載解壓之后將其中的bin文件的目錄添加進環境變量

源代碼如下：

from sklearn.feature_extraction import DictVectorizer

import csv

from sklearn import tree

from sklearn import preprocessing

from sklearn.externals.six import StringIO

from xml.sax.handler import feature_external_ges

from numpy.distutils.fcompiler import dummy_fortran_file

# Read in the csv file and put features into list of dict and list of class label

allElectronicsData = open(r'E:/DeepLearning/resources/AllElectronics.csv', 'rt')

reader = csv.reader(allElectronicsData)

headers = next(reader)

featureList = []

lableList = []

for row in reader:

lableList.append(row[len(row)-1])

rowDict = {}

#不包括len(row)-1

for i in range(1,len(row)-1):

rowDict[headers[i]] = row[i]

featureList.append(rowDict)

print(featureList)

vec = DictVectorizer()

dummX = vec.fit_transform(featureList).toarray()

print(str(dummX))

lb = preprocessing.LabelBinarizer()

dummY = lb.fit_transform(lableList)

print(str(dummY))

#entropy=>ID3

clf = tree.DecisionTreeClassifier(criterion='entropy')

clf = clf.fit(dummX, dummY)

print("clf:"+str(clf))

#可視化tree

with open("resultTree.dot",'w')as f:

f = tree.export_graphviz(clf, feature_names=vec.get_feature_names(),out_file = f)

#對于新的數據怎樣來查看它的分類

oneRowX = dummX[0,:]

print("oneRowX: "+str(oneRowX))

newRowX = oneRowX

newRowX[0] = 1

newRowX[2] = 0

predictedY = clf.predict(newRowX)

print("predictedY: "+ str(predictedY))

這里的AllElectronics.csv，形式如下圖所示：

今天早上好不容易將jdk、eclipse以及pydev裝進linux，但是，但是，但是，想裝numpy的時候，總是報錯，發現是沒有gcc，然后又去裝gcc，真是醉了，到現在gcc還是沒有裝成功，再想想方法

總結

以上是生活随笔為你收集整理的python决策树sklearn_python利用sklearn包编写决策树源代码的全部內容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯，歡迎將生活随笔推薦給好友。

上一篇：兴业银行虚拟信用卡柜台开卡流程
下一篇：预期收益型和净值型哪个好？看完就明白了！