K-means均值聚类算法寻找质心,Python
生活随笔
收集整理的這篇文章主要介紹了
K-means均值聚类算法寻找质心,Python
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
import numpy as np# 歐氏距離計算
def distEclud(x,y):return np.sqrt(np.sum((x-y)**2)) # 計算歐氏距離# 為給定數據集構建一個包含K個隨機質心的集合
def randCent(dataSet,k):m,n = dataSet.shapecentroids = np.zeros((k,n))for i in range(k):index = int(np.random.uniform(0,m)) centroids[i,:] = dataSet[index,:]return centroids# k均值聚類
def kmeans_open(dataSet,k):m = np.shape(dataSet)[0] #行的數目# 第一列存樣本屬于哪一簇# 第二列存樣本的到簇的中心點的誤差clusterAssment = np.mat(np.zeros((m,2)))clusterChange = True# 第1步 初始化centroidscentroids = randCent(dataSet,k)while clusterChange:clusterChange = False# 遍歷所有的樣本(行數)for i in range(m):minDist = 100000.0minIndex = -1# 遍歷所有的質心#第2步 找出最近的質心for j in range(k):# 計算該樣本到質心的歐式距離distance = distEclud(centroids[j,:],dataSet[i,:])if distance < minDist:minDist = distanceminIndex = j# 第 3 步:更新每一行樣本所屬的簇if clusterAssment[i,0] != minIndex:clusterChange = TrueclusterAssment[i,:] = minIndex,minDist**2#第 4 步:更新質心for j in range(k):pointsInCluster = dataSet[np.nonzero(clusterAssment[:,0].A == j)[0]] # 獲取簇類所有的點centroids[j,:] = np.mean(pointsInCluster,axis=0) # 對矩陣的行求均值return clusterAssment.A[:,0], centroids
?
總結
以上是生活随笔為你收集整理的K-means均值聚类算法寻找质心,Python的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 【C++】寻找数组第k大元素
- 下一篇: 抛硬币仿真实验java_探索HyperL