分级聚类方法
文章目錄
- 1. 算法思想
- 2. 具體步驟
- 3. 兩個(gè)類之間的相似性度量
- 4. 缺點(diǎn)
1. 算法思想
分級(jí)聚類方法(hierachical clustering)。聚類的結(jié)果可能是NNN類也可能是111類。
因此,在歸類的過(guò)程中可以從NNN類到111類逐級(jí)地進(jìn)行類別劃分,求得一系列類別數(shù)從多到少的一個(gè)分類方案,然后根據(jù)一定的指標(biāo)選擇中間某個(gè)適當(dāng)?shù)膭澐址桨缸鳛榫垲惖慕Y(jié)果。
2. 具體步驟
聚類的結(jié)果稱為系統(tǒng)樹(shù)圖(dendrogram),圖中最底層的每個(gè)節(jié)點(diǎn)都是一個(gè)樣本,樹(shù)枝的長(zhǎng)度表達(dá)了類與類之間的距離關(guān)系。
3. 兩個(gè)類之間的相似性度量
Δ(τi,τj)=min?y∈τi,y^∈taujδ(y,y^)\Delta(\tau_i, \tau_j)=\min_{\boldsymbol{y} \in \tau_i, \hat{\boldsymbol{y}}\in tau_j}\delta(\boldsymbol{y}, \boldsymbol{\hat{y}}) Δ(τi?,τj?)=y∈τi?,y^?∈tauj?min?δ(y,y^?)
Δ(τi,τj)=max?y∈τi,y^∈τjδ(y,y^)\Delta(\tau_i, \tau_j)=\max_{\boldsymbol{y} \in \tau_i, \hat{\boldsymbol{y}}\in \tau_j}\delta(\boldsymbol{y}, \boldsymbol{\hat{y}}) Δ(τi?,τj?)=y∈τi?,y^?∈τj?max?δ(y,y^?)
Δ(τi,τj)=δ(mi,mj)\Delta(\tau_i, \tau_j)=\delta(\boldsymbol{m_i}, \boldsymbol{m_j}) Δ(τi?,τj?)=δ(mi?,mj?)
其中,mi\boldsymbol{m_i}mi?表示第iii類的均值。
4. 缺點(diǎn)
總結(jié)
- 上一篇: 山东科技大学计算机试题答案,山东科技大学
- 下一篇: 南邮tip sql.php_南京邮电大学