推荐算法-聚类-层次聚类法
生活随笔
收集整理的這篇文章主要介紹了
推荐算法-聚类-层次聚类法
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
層次聚類算法實際上分為兩類:自上而下或自下而上。自下而上的算法在一開始就將每個數據點視為一個單一的聚類,然后依次合并(或聚集)類、直到所有類合并成一個包含所有數據點的單一聚類。因此,自下而上的層次聚類稱為合成HAC。聚類的層次結構用一顆樹(或樹狀圖)表示。樹的根是收集所有樣本的唯一聚類,而葉子是只有一個樣本的聚類。
1.首先將每個數據點作為一個單獨的聚類進行處理。如果我們的數據集有X個數據點,那么我們就有了X個聚類。然后我們選擇一個度量兩個聚類之間距離的距離量。作為一個示例,我們將使用平均連接(average?linkage)聚類,它定義了兩個聚類之間的距離,即第一個聚類中數據點和第二個聚類中數據點之間的平均距離。
他的工作方式都很好,而對于其他聚類算法,距離度量的選擇是至關重要的。層次聚類方法的一個特別好的用例是,當底層數據具有層次結構時,你可以回復層次結構。而其他的聚類算法無法做到這一點。層次聚類的優點是以低效率為代價的,因為它具有O(n^3)的時間復雜度,與K-Means的線性復雜度不同。
?
?
總結
以上是生活随笔為你收集整理的推荐算法-聚类-层次聚类法的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 推荐算法-聚类-DBSCAN
- 下一篇: 神经网络与机器学习 笔记—复制器(恒等)