分类算法支持向量机(SVM) 简介与入门
在二維平面上,把兩類數據分開需要一條直線。到了3微空間,要把兩類數據分開,就需要一個平面。把上述分類機制擴展到基本情形,在高維空間里,把兩類數據分開,則需要一個超平面。直線和平面是超平面在2維和3維空間的表現形式。當我們處理的是100維數據時,超平面就是一個99維的對象。
支持向量:
我們尋找分類函數 y=f(x)= ω^T x+b,超平面上的點代入這個分類函數,得到 f(x)=0,超平面一邊的數據點代入分類函數,得到 f(x)= 1;在超平面另一邊的數據點代入分類函數得到 f(x)= -1。在二維平面上,這個分類函數對應一根直線 y=f(x)=ax+b。
在二維平面上確定一根直線,就是確定上述方程中的 a 和 b。在高維空間上確定一個超平面,則需要確定 ω 向量和 b 向量。我們需要尋找一個超平面,它到兩個類別數據點的距離都盡可能大,這樣的超平面為最優的超平面。
在上圖中,中間的那根直線到兩類數據點的距離是相等的,為了確定這根直線,不需要所有的數據點(向量),只需要圖中顯示為深色的數據點(向量),這些向量唯一確定了數據劃分的直線(超平面),稱為支持向量(Support Vector)。
支持向量機是一個對高維數據進行分類的分類器。數據點被劃分到兩個不相交的半空間(Half Space),從而實現分類,劃分兩個半空間的是一個超平面,SVM 分類的主要任務是尋找到和兩類數據點都具有最大距離的超平面,目的是使得把兩類數據點分開的劃分范圍最大化。
總結
以上是生活随笔為你收集整理的分类算法支持向量机(SVM) 简介与入门的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: Linux的基础知识——mmap父子通信
- 下一篇: 链路状态路由协议与OSPF