SVM 推到期间 遇到的 表背景知识 (间隔最大化)
背景,在看原理的時候,發現很多地方一知半解的,補充如下。
?
?
?
?
?
?
?
?
?其他補充:
注:以下的默認為2分類
1、SVM原理:
(1)輸入空間到特征空間得映射
所謂輸入空間即是輸入樣本集合,有部分情況輸入空間與特征空間是相同得,有一部分情況二者是不同的,而模型定義都是定義到特征空間的,特征空間是指所有的輸入特征向量,特征向量是利用數值來表示的n維向量,輸入空間到特征空間的映射,也就是對所用的特征進行數值量化(本人這么理解),與概率中的隨機變量是一樣的形式,隨機變量是由樣本空間到實數集的映射,例如:拋硬幣的樣本空間是{正面,反面},映射到實數集便為{1,0}
(2)求得間隔最大化最優分離超平面
所謂分離超平面,即是能夠將所有的特征向量劃分為兩類的平面或直線(特征有兩個變為直線,多個變為平面,即幾維的問題),比如二維的情況下,一條線,能夠坐標系中的所有點劃分為兩類,最優意為可以將所有的點盡量進行正確的劃分,間隔最大化意為:在兩類區域中各自距離直線最近的點到直線的距離是最大的,因此可以求得唯一的間隔最大化最優分離超平面w*x+b*=0,由于是距離因此是由法向量和截距決定,w*為法向量,b*為截距,此處對這個方程進行解釋:法向量是從點到平面的垂直方向,在幾何中求平面的方程時,平面方程可以設為一般方程Ax+By+Cz+D=0,這便可以看作為(A,B,C)*(x,y,z)即w*=(A,B,C),特征向量x=(x,y,z),b*=D.同理在求直線直線可設為Ax+By+C=0,因此求超平面時即為求w*,b*.
(3)求分類決策函數
所謂分類決策函數只是一個符號函數f(x)=sign(w*x+b*),sign是一個符號函數,取輸入值的符號(正負),在上邊取得法向量和截距以后與輸入特征向量運算后將結果帶入sign()得到分類
2、基礎概念
(1)函數間隔
上邊已經說了是求到超平面的最近距離的點的距離最大的超平面,因此求距離是很重要的一步,根據點到平面的距離公式分子為|w*x+b|,由于分母是相同的,所以|w*x+b|可以相對的表示出距離的大小。y(向量)在此表示的是每個特征向量的分類,而由上邊已經知道,分類決策是求的符號的,因此可以確定w*x+b與y的符號(相對應元素)是相同的,因此可以利用y(w*x+b)來表示分類的正確性和確信度,這就是函數間隔:
注:超平面關于特征空間的函數間隔是值所有特征向量到超平面的函數間隔中的最小值
(2)幾何間隔
利用函數間隔來具體衡量時,會出現一個問題,當法向量和截距同時擴大兩倍時,超平面不變,但是函數間隔卻便為原來的兩倍,因此引入幾何間隔的概念,其實簡單的來說,幾何間隔便是函數間隔除以法向量的模,具體公式如下:
同時由超平面關于特征空間的幾何間隔是所有特征向量到超平面的幾何間隔中的最小值
(3)支持向量
在線性可分的情況下,特征空間中距離分離超平面的距離最近的特征向量為支持向量
上面一段話來著:https://www.cnblogs.com/fantasy01/p/4633557.html
總結
以上是生活随笔為你收集整理的SVM 推到期间 遇到的 表背景知识 (间隔最大化)的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: Android 7.1.1 去感叹号
- 下一篇: 使用 commander inquir