聚类(上)K-mean算法
生活随笔
收集整理的這篇文章主要介紹了
聚类(上)K-mean算法
小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.
什么是聚類
聚類就是對大量未知標注的數(shù)據(jù)集,按數(shù)據(jù) 的內在相似性將數(shù)據(jù)集劃分為多個類別,使類別內的數(shù)據(jù)相似度較大而類別間的數(shù)據(jù)相 似度較小 。 是無監(jiān)督問題
重點的是歐式距離和余弦相似度
K-mean算法
# coding:utf-8 import numpy as np import sklearn.datasets as ds from sklearn.cluster import KMeans, DBSCAN from sklearn.metrics import homogeneity_score, completeness_score, v_measure_score, adjusted_mutual_info_score, adjusted_rand_score, silhouette_score import matplotlib as mpl import matplotlib.pyplot as pltx, y = ds.make_blobs(400, n_features=2, centers=4, random_state=2018) model = KMeans(n_clusters=4, init='k-means++') model.fit(x) y_pred = model.predict(x)print('y = ', y[:30])總結
以上是生活随笔為你收集整理的聚类(上)K-mean算法的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 什么是信息系统最具活力的角色(什么是信息
- 下一篇: 聚类(中)层次聚类 基于密度的聚类算法