8.2 高斯分布模型-机器学习笔记-斯坦福吴恩达教授
高斯分布模型
我們已經(jīng)知道,異常檢測(cè)的核心就在于找到一個(gè)概率模型,幫助我們知道一個(gè)樣本落入正常樣本中的概率,從而幫助我們區(qū)分正常和異常樣本。 高斯分布(Gaussian Distribution) 模型就是異常檢測(cè)算法最常使用的概率分布模型。
定義
我們稱 X~N(μ,δ2)X~N(μ,δ^2)X~N(μ,δ2) 為: XXX 服從均值為 μμμ ,方差為 δ2δ^2δ2 的高斯分布(也稱正態(tài)分布)。高斯分布的概率密度函數(shù)為:
f(x)=12πδe?(x?μ)22f(x)=\frac 1 {\sqrt{2\pi}δ}e^{-\frac{(x-μ)^2}{2}}f(x)=2π?δ1?e?2(x?μ)2?
概率密度函數(shù)的圖像為:
此時(shí),概率模型可以描述為:
p(x;μ,δ2)=12πδe?(x?μ)22p(x;μ,δ^2)=\frac 1 {\sqrt{2\pi}δ}e^{-\frac{(x-μ)^2}{2}}p(x;μ,δ2)=2π?δ1?e?2(x?μ)2?
參數(shù)
均值 μμμ 決定了高斯分布概率密度函數(shù)的對(duì)稱軸位置,方差 δδδ 衡量了各樣本與平均位置的差異,決定了概率密度函數(shù)的寬窄。 δ2δ^2δ2 越大,各個(gè)樣本的差異越大(各個(gè)樣本偏離均值位置很遠(yuǎn)),即樣本取 μμμ 附近位置的概率越低,亦即,概率 P(μ??<x<μ+?)P(μ??<x<μ+?)P(μ??<x<μ+?) 很小,此時(shí),概率密度函數(shù)很寬。下圖展示了幾組不同參數(shù)取值下的高斯分布的概率密度函數(shù):
參數(shù)估計(jì)
假定特征 xjx_jxj? 分布如下:
我們發(fā)現(xiàn),該分布中間稠密,越向兩邊越稀疏,我們就認(rèn)為數(shù)據(jù)服從高斯分布,即:
xj~N(μ,δ2)x_j~N(μ,δ^2)xj?~N(μ,δ2)
但我們不知道該分布的 μjμ_jμj? 和 δjδ_jδj? 參數(shù),但如果學(xué)過(guò)概率論,我們知道,可以根據(jù)這有限個(gè)樣本進(jìn)行參數(shù)估計(jì):
μj=1m∑i=1mxj(i)μ_j=\frac 1m\sum_{i=1}^m x_j^{(i)}μj?=m1?i=1∑m?xj(i)?δj2=1m∑i=1m(xj(i)?μj)2δ_j^2=\frac 1m\sum_{i=1}^m (x_j^{(i)}-μ_j)^2δj2?=m1?i=1∑m?(xj(i)??μj?)2
這里對(duì)參數(shù) μμμ 和參數(shù) δ2δ^2δ2 的估計(jì)就是二者的極大似然估計(jì)。
假定我們有數(shù)據(jù)集:
x(1),x(2),?,x(m),x∈Rnx^{(1)},x^{(2)},?,x^{(m)},x∈\R^nx(1),x(2),?,x(m),x∈Rn
并且,各個(gè)特征服從于高斯分布:
xj~N(μ,δ2)x_j~N(μ,δ^2)xj?~N(μ,δ2)
我們完成了對(duì)于各個(gè)特征服從分布的參數(shù)估計(jì)后,可以得到:
p(x)=p(x1;μ1,δ12)p(x2;μ2,δ22)?p(xn;μn,δn2)p(x)=p(x_1;μ_1,δ^2_1)\ p(x_2;μ_2,δ^2_2)\ ?\ p(x_n;μ_n,δ^2_n)p(x)=p(x1?;μ1?,δ12?)?p(x2?;μ2?,δ22?)???p(xn?;μn?,δn2?)=∏j=1np(xj;μj,δj2)=∏_{j=1}^np(x_j;μ_j,δ^2_j)=j=1∏n?p(xj?;μj?,δj2?)=∏j=1n12πδjexp(?(xj?μj)22δj2)=∏_{j=1}^n\frac 1 {\sqrt{2\pi}δ_j}exp{(-\frac{(x_j-μ_j)^2}{2δ_j^2}})=j=1∏n?2π?δj?1?exp(?2δj2?(xj??μj?)2?)
總結(jié)
以上是生活随笔為你收集整理的8.2 高斯分布模型-机器学习笔记-斯坦福吴恩达教授的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: 8.1 概述-机器学习笔记-斯坦福吴恩达
- 下一篇: 8.3 算法流程与评估-机器学习笔记-斯