期望最大化算法
多次見到,今天特此記錄下!
期望最大化算法是基于質(zhì)心得一個聚類算法,它依賴于距離的某種度量,通常是歐幾里得距離。
如果預先指定了簇數(shù)n,則首先從隨機選擇n個記錄作為n個簇的質(zhì)心開始。數(shù)據(jù)集中的每個記錄都分配給它最近的質(zhì)心,因此分配給它的質(zhì)心代表的簇。在下一輪中,每個質(zhì)心都移動到屬于該群集的所有記錄的均值的位置。同樣,每個記錄都分配給它最近的質(zhì)心,因此也分配給相應(yīng)的簇。重復此過程,直到基于所有點到質(zhì)心的平方距離的某種誤差測量值降至某個閾值以下。
現(xiàn)在,每個記錄已分配給一個群集。 k均值的變化不僅估計每個聚類的平均值,而且將每個聚類建模為高斯核,同時也估計方差。這既是期望最大化算法 的基本思想了。
總結(jié)
- 上一篇: Java基础----对象与类
- 下一篇: 这个热图上面的树是根据系统发育关系画的吗