python聚类分析sklearn_如何使用sklearn k-mean对数据进行聚类分析?
#?-*-?coding:?utf-8?-*-
from?sklearn.cluster?import?KMeans
from?sklearn.externals?import?joblib
import?numpy
final?=?open('c:/test/final.dat'?,?'r')
data?=?[line.strip().split('\t')?for?line?in?final]
feature?=?[[float(x)?for?x?in?row[3:]]?for?row?in?data]
#調用kmeans類
clf?=?KMeans(n_clusters=9)
s?=?clf.fit(feature)
print?s
#9個中心
print?clf.cluster_centers_
#每個樣本所屬的簇
print?clf.labels_
#用來評估簇的個數是否合適,距離越小說明簇分的越好,選取臨界點的簇個數
print?clf.inertia_
#進行預測
print?clf.predict(feature)
#保存模型
joblib.dump(clf?,?'c:/km.pkl')
#載入保存的模型
clf?=?joblib.load('c:/km.pkl')
'''
#用來評估簇的個數是否合適,距離越小說明簇分的越好,選取臨界點的簇個數
for?i?in?range(5,30,1):
clf?=?KMeans(n_clusters=i)
s?=?clf.fit(feature)
print?i?,?clf.inertia_
'''
總結
以上是生活随笔為你收集整理的python聚类分析sklearn_如何使用sklearn k-mean对数据进行聚类分析?的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 树莓派该文件名_树莓派学习笔记(2):常
- 下一篇: mongodb @aggregation