當前位置：首頁 > 编程资源 > 编程问答 >内容正文

编程问答

5.1 代价函数-机器学习笔记-斯坦福吴恩达教授

發(fā)布時間：2025/4/5 编程问答 11 豆豆

生活随笔收集整理的這篇文章主要介紹了 5.1 代价函数-机器学习笔记-斯坦福吴恩达教授小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.

代價函數(shù)

在邏輯回歸中，我們的預測函數(shù)為：
$hθ(x)=11+e?θTxh_θ(x)=\frac 1 {1+e^{?θ^Tx}}$

代價函數(shù)為：
$cost=?y\ log(h_θ(x))+(1?y)\ log(1?h_θ(x))$

當 $y = 1$ 時，代價函數(shù)就為：
$cost=?log(h_θ(x))$ $=?log11+e?z,z=θTx=?log\frac 1{1+e^{?z}},z=θ^Tx$

此時，代價函數(shù)隨 $z$ 的變化曲線如下圖：

不難看出，當 $y = 1$ 時，隨著 $z$ 取值變大，預測代價變小，因此，邏輯回歸想要在面對正樣本 $y = 1$ 時，獲得足夠高的預測精度，就希望 $z=θ^Tx?0$ 。而 SVM 則將上圖的曲線拉直為下圖中的折線，構(gòu)成了 $y = 1$ 時的代價函數(shù)曲線 $cost_1(z)$ ：

當 $y = 1$ 時，為了預測精度足夠高，SVM 希望 $θ^Tx≥1$ 。

同樣，在 $y = 0$ 時，SVM 定義了代價函數(shù) $cost_0(z)$ ，為了預測精度足夠高，SVM 希望 $θ^Tx≤?1$ ：

最小化預測代價

SVM定義其最小化預測代價的過程為：
$min?θC[∑i=1my(i)cost1(θTx(i))+(1?y(i))cost0(θTx(i))]+12∑j=1nθj2\min_θC[∑_{i=1}^my^{(i)}cost_1(θ^Tx^{(i)})+(1?y^{(i)})cost_0(θ^Tx^{(i)})]+\frac 12∑_{j=1}^nθ^2_j$

而在邏輯回歸中，最小化預測代價的過程為：
$min?θ1m[∑i=1my(i)(?loghθ(x(i)))+(1?y(i))(?log(1?hθ(x(i))))]+λ2m∑j=1nθj2\min_{θ}\frac 1m[∑_{i=1}^my^{(i)}(?log\ h_θ(x^{(i)}))+(1?y^{(i)})(?log\ (1?h_θ(x^{(i)})))]+\frac λ{2m}∑_{j=1}^nθ^2_j$

事實上，我們可以將邏輯回歸的代價函數(shù)簡要描述為：
$c o s t = A + λ B$

而 SVM 的代價函數(shù)描述為：
$c o s t = C A + B$

即，在邏輯回歸中，我們通過正規(guī)化參數(shù) $λ$ 調(diào)節(jié) $A 、 B$ 所占的權(quán)重，且 $A$ 的權(quán)重與 $λ$ 取值成反比。而在 SVM 中，則通過參數(shù) $C$ 調(diào)節(jié) $A 、 B$ 所占的權(quán)重，且 $A$ 的權(quán)重與 $C$ 的取值成反比。亦即，參數(shù) $C$ 可以被認為是扮演了 $1λ\frac1λ$ 的角色。

預測函數(shù)

當我們訓練得到 θ 之后，可以代入下面的 SVM 預測函數(shù)進行預測：
$hθ(x)={1ifθTx≥00otherwiseh_θ(x)= \begin{cases} 1 & if \ θ^Tx≥0\\ 0 & otherwise \end{cases}$

總結(jié)

以上是生活随笔為你收集整理的5.1 代价函数-机器学习笔记-斯坦福吴恩达教授的全部內(nèi)容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯，歡迎將生活随笔推薦給好友。

上一篇： 4.7 程序示例--算法诊断-机器学习笔
下一篇： 5.2 大间距分类器-机器学习笔记-斯坦