文献记录(part3)--Clusterpath An Algorithm for Clustering using Convex Fusion Penalties
學習筆記,僅供參考
有時間讀
Clusterpath: An Algorithm for Clustering using Convex Fusion Penalties
摘要
我們提出了一個新的聚類算法,通過提出一個層次聚類的凸松弛,產生了一個具有自然幾何解釋的目標函數族。我們給出了計算解的連續正則化路徑的有效算法,并討論了參數的相對優勢。我們的方法通過實驗給出了類似于非凸聚類的譜聚類的最新結果,并且具有從數據中學習樹結構的額外好處。
簡介
在多變量數據分析中,聚類分析是一種無監督學習技術,允許識別同質數據子集。諸如k均值、高斯混合模型、層次聚類和譜聚類等算法允許識別各種聚類形狀。然而,所有這些方法都存在不穩定性,要么因為它們被視為非凸優化問題,要么因為它們依賴于距離的硬閾值。已經提出了幾種凸聚類方法,但是一些只關注2類問題[XNLS04],而其他的需要預先任意固定最小聚類大小[BH08]。這項工作的主要貢獻是開發了一種新的凸層次聚類算法,試圖解決這些問題。近年來,稀疏誘導規范已經成為一種靈活的工具,允許在懲罰線性模型中進行變量選擇。套索和組套索現在是眾所周知的模型,在估計系數中加強稀疏性或組稀疏性[Tib96,YL06]。另一個對聚類更有用的例子是融合的套索信號逼近器(FLSA),它已被用于分割和圖像去噪[TS05]。此外,最近的幾篇論文提出了使用L1[CKL+10,SH10]和L2[VB10]融合懲罰的線性模型優化算法。本文通過開發一系列融合懲罰擴展了這方面的工作,產生了“聚類路徑”,
總結
以上是生活随笔為你收集整理的文献记录(part3)--Clusterpath An Algorithm for Clustering using Convex Fusion Penalties的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 迅捷 FW351R 无线路由器上网时间控
- 下一篇: sklearn自学指南(part1)--