K - 近邻算法
K - 近鄰算法(KNN),他的工作原理:存在一個樣本數(shù)據集合,也稱為訓練樣本集,并且樣本集合中每個數(shù)據都存在標簽,即我們知道樣本集合中每一個數(shù)據與所屬分類的對于關系。輸入沒有標簽的新數(shù)據后,將新數(shù)據的每個特征與樣本集中數(shù)據對應的特征值比較,然后算法提取樣本集中 特征最相似數(shù)據(最近鄰(的分類標簽,一般來說,我們只選擇樣本數(shù)據集中前K個最相似的數(shù)據 ,這就是K - 近鄰算法中k的出處。一般說來,我們可以K的值大概在20的整數(shù)。最后,選擇k個最相似數(shù)據中出現(xiàn)次數(shù)最多的分類,作為新數(shù)據的分類。
簡單的說,K - 近鄰算法算法就是采用測量不同特征值之間的距離方法進行分類,可以采用歐式距離或者余弦距離。
優(yōu)點:精度高、對異常值不敏感、無數(shù)據輸入假定
缺點:計算復雜度高、空間負責高。
轉載于:https://www.cnblogs.com/fartherfuture/p/3628837.html
總結
- 上一篇: 祛疤多少钱啊?
- 下一篇: 现在钯金报价多少钱一克?