机器学习算法与Python实践之(六)二分k均值聚类
生活随笔
收集整理的這篇文章主要介紹了
机器学习算法与Python实践之(六)二分k均值聚类
小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.
機(jī)器學(xué)習(xí)算法與Python實(shí)踐這個系列主要是參考《機(jī)器學(xué)習(xí)實(shí)戰(zhàn)》這本書。因?yàn)樽约合雽W(xué)習(xí)Python,然后也想對一些機(jī)器學(xué)習(xí)算法加深下了解,所以就想通過Python來實(shí)現(xiàn)幾個比較常用的機(jī)器學(xué)習(xí)算法。恰好遇見這本同樣定位的書籍,所以就參考這本書的過程來學(xué)習(xí)了。
在上一個博文中,我們聊到了k-means算法。但k-means算法有個比較大的缺點(diǎn)就是對初始k個質(zhì)心點(diǎn)的選取比較敏感。有人提出了一個二分k均值(bisecting k-means)算法,它的出現(xiàn)就是為了一定情況下解決這個問題的。也就是說它對初始的k個質(zhì)心的選擇不太敏感。那下面我們就來了解和實(shí)現(xiàn)下這個算法。
一、二分k均值(bisecting k-means)算法
二分k均值(bisecting k-means)算法的主要思想是:首先將所有點(diǎn)作為一個簇,然后將該簇一分為二。之后選擇能最大程度降低聚類代價函數(shù)(也就是誤差平方和)的簇劃分為兩個簇。以此進(jìn)行下去,直到簇的數(shù)目等于用戶給定的數(shù)目k為止。
總結(jié)
以上是生活随笔為你收集整理的机器学习算法与Python实践之(六)二分k均值聚类的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 机器学习算法与Python实践之(五)k
- 下一篇: 机器学习算法源码全解析(三)-范数规则化