唐宇迪学习笔记19:聚类算法——Kmeans
生活随笔
收集整理的這篇文章主要介紹了
唐宇迪学习笔记19:聚类算法——Kmeans
小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.
目錄
?
一、KMEANS算法概述
聚類概念
k-means算法
二、KMEANS工作流程
工作流程
優(yōu)缺點
優(yōu)點
缺點
三、KMEANS迭代可視化展示
一、KMEANS算法概述
聚類概念
- 無監(jiān)督問題:我們手里沒有標簽了
- 聚類:相似的東西分到一組
- 難點:如何評估,如何調(diào)參
k-means算法
- 基本概念:要得到簇的個數(shù),需要指定K值
- 質(zhì)心:均值,即向量各維取平均即可
- 距離的度量:常用歐氏距離和余弦相似度(先標準化)
- 優(yōu)化目標:
二、KMEANS工作流程
工作流程
優(yōu)缺點
優(yōu)點
- 簡單,快速,適合常規(guī)數(shù)據(jù)集
缺點
- K值難確定
- 復(fù)雜度與樣本呈線性關(guān)系
- 很難發(fā)現(xiàn)任意形狀的簇 ,聚類效果不好。
三、KMEANS迭代可視化展示
可視化展示
????????????????Visualizing K-Means Clustering
對初始值影響大
總結(jié)
以上是生活随笔為你收集整理的唐宇迪学习笔记19:聚类算法——Kmeans的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: xunsearch安装使用
- 下一篇: jQuery_基本选择器