當前位置：首頁 > 编程资源 > 综合教程 >内容正文

综合教程

python怎么获取最优轮廓系数

發布時間：2023/12/15 综合教程 17 生活家

生活随笔收集整理的這篇文章主要介紹了 python怎么获取最优轮廓系数小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

這篇文章主要介紹了python怎么獲取最優輪廓系數，具有一定借鑒價值，感興趣的朋友可以參考下，希望大家閱讀完這篇文章之后大有收獲，下面讓小編帶著大家一起了解一下。

如果想要最好的點，應該選擇最高的點。

1、通過設置不同的k值來測試和計算輪廓系數，可以獲得最佳k值對應的最佳輪廓系數，

2、也可以繪圖觀察和選擇最高。但為了防止擬合現象，也可以通過手肘選擇最佳k值。

實例

fromsklearn.clusterimportKMeans
fromsklearn.preprocessingimportMaxAbsScaler#小數定標標準化
fromsklearn.preprocessingimportMinMaxScaler#離差標準化
fromsklearn.preprocessingimportStandardScaler#標準差標準化
#評估指標-----輪廓系數
fromsklearn.metricsimportsilhouetee_score

#由于是聚類算法，數據可能存在量綱，需要標準化，在使用算法之前
#實例化
sca=MaxAbsScaler()
sca=MinMaxScaler()
sca=StandardScaler()
#擬合
sca.fit(訓練集特征)
#處理數據
X_train=sca.transform(訓練集特征)


#實例化
km=KMeans()
#參數：
#n_clusters=3，表示k=3，也就是隨機三個聚類中心，最小值是2
#init，聚類中心初始化方法，默認k-means++
#max_iter，最大迭代次數，默認300，如果后期無法收斂可以嘗試增加迭代次數
#random_state=1，隨機種子，默認是None

#擬合
km.fit(訓練集特征)

#查看聚類中心
print('聚類中心：',km.cluster_centers_)

#查看預測結果
#可以直接傳入訓練集，也可以傳入自定義二維數組
y_pred=km.predict(訓練集特征)
print('整個數據的類別：',y_pred)

#查看SSE---誤差平方和
#默認是取反操作，大多數情況得出來的是負值【-inf,0】
#絕對值越小越好
score=km.score(X_train,y_pred)
print('SSE',score)

#評估指標----輪廓系數(-1,1)，越大越好
print('輪廓系數：',silhouetee_score(X_train,y_pred))

總結

以上是生活随笔為你收集整理的python怎么获取最优轮廓系数的全部內容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯，歡迎將生活随笔推薦給好友。

上一篇： Linux图形化中定时任务的工具Zeit
下一篇：小米米家分体露营灯开启众筹：续航时间 1