R语言数据挖掘实践——系谱聚类
生活随笔
收集整理的這篇文章主要介紹了
R语言数据挖掘实践——系谱聚类
小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.
我們將在iris數(shù)據(jù)集上使用hclust()進(jìn)行系譜聚類。
我們首先從iris數(shù)據(jù)集中抽取含有40條記錄的一個樣本呢,避免繪制聚類圖像時太過擁擠,我們先從數(shù)據(jù)集中中剔除Species屬性,然后在該樣本上進(jìn)行層次聚類。代碼如下:
> idx <- sample(1:dim(iris)[1],40)
> irisSample <- iris[idx,]
> irisSample$Species <- NULL
> hc <- hclust(dist(irisSample),method="complete")
> plot(hc, hang=-1, labels=iris$Species[idx])
> rect.hclust(hc,k=3)
>groups <- cutree(hc, k=3)
在hclust()函數(shù)中,method參數(shù)用于選擇聚類的具體算法,可供選擇的有ward、single及complete等7種,默認(rèn)選擇complete方法。從繪制的樹狀圖中可以看出,"setaosa"與其他兩個簇的劃分比較明確,而"versicolor"和"virginica"存在小范圍的重疊。
總結(jié)
以上是生活随笔為你收集整理的R语言数据挖掘实践——系谱聚类的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: jquery获取手机验证码按钮计时插件g
- 下一篇: Arduino UNO WIFI开发板,