机器学习算法--无监督学习--聚类
生活随笔
收集整理的這篇文章主要介紹了
机器学习算法--无监督学习--聚类
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
機器學習算法–無監督學習–聚類
一、原型聚類
特點:需要預先指定簇的個數K
1、K-Means
Python實現K-Means算法: Python實現K-Means算法
原理:從數據集中選擇K個樣本作為初始的K個簇中心,計算每個樣本與這K個簇中心的距離,把這個樣本劃分到與之距離最小的那個簇,直至每個樣本都被遍歷,計算每個簇的平均值作為新的簇的中心。不段迭代直至簇的中心不再被改變或達到迭代的終止條件。
2、LVQ(learning vector quantization)
3、高斯混合聚類(Mixture of Gaussian)
還沒研究
二、密度聚類(density-based clustering)
特點:不用預先指定簇的個數
DBSCAN: Density-Based Spatial Clustering of Applications with Noise
類似于用隊列實現廣度優先搜索算法
三、層次聚類(hierarchical clustering)
特點:需要預先指定簇的個數作為迭代的終止條件。有兩種策略:自底向上的聚合策略,自頂向下的分拆策略。
自底向上的聚合策略:把每個樣本初始化為一個簇,通過計算距離,對距離最小的兩個簇進行聚合,直到簇的個數減少到所要的K個簇。
類似于尋找最優編碼二叉樹的 Huffman’s Algorithm
總結
以上是生活随笔為你收集整理的机器学习算法--无监督学习--聚类的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 青岛经济职业学校有计算机专业吗,青岛经济
- 下一篇: 软件测试——语句覆盖