朴素贝叶斯分类器(Navie Bayesian Classifier)中的几个要点(一)
生活随笔
收集整理的這篇文章主要介紹了
朴素贝叶斯分类器(Navie Bayesian Classifier)中的几个要点(一)
小編覺(jué)得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.
關(guān)鍵字:
- 拉普拉斯修正(Laplacian correction)
- 懶惰學(xué)習(xí)(lazy leanring)
- 對(duì)數(shù)似然(log-likelihood)
拉普拉斯修正(Laplacian correction)
樸素貝葉斯分類(lèi)器的訓(xùn)練:
- 基于訓(xùn)練集D 來(lái)估計(jì)類(lèi)先驗(yàn)概率P(y)
- 基于訓(xùn)練集D 為每個(gè)屬性估計(jì)條件概率P(x|y)
因此當(dāng)在某個(gè)訓(xùn)練集中,樣本的一條特征值 EV 出現(xiàn)概率為 0 時(shí),則會(huì)使計(jì)算的先驗(yàn)概率與條件概率的連乘結(jié)果為 0
例如 : 在多個(gè)特征值 EVi 中EV2 在訓(xùn)練集 D 中出現(xiàn)的次數(shù),則 P(EVi|yes)=P(EV1 = XX|EV2 = XX|…|EVi = XX|result = yes/no) = ? * 0 * … * ? = 0 / ? = 0
懶惰學(xué)習(xí)(lazy leanring)
在樸素貝葉斯算法的實(shí)際使用中,根據(jù)不同的實(shí)際情況,可以分為三個(gè)情況,懶惰學(xué)習(xí)只是其中之一:
- 如果任務(wù)對(duì)預(yù)測(cè)速度要求較高,則可以先用樸素貝葉斯分類(lèi)器先對(duì)給定訓(xùn)練集進(jìn)行訓(xùn)練,并將最后的計(jì)算結(jié)果計(jì)算好存儲(chǔ)為 “結(jié)果表”,這樣在進(jìn)行預(yù)測(cè)時(shí)只需要查找”結(jié)果表”就可以進(jìn)行預(yù)測(cè)
- 如果任務(wù)數(shù)據(jù)需要頻繁更替,則可以采用”懶惰學(xué)習(xí)”(lazy Learning),即先不進(jìn)行訓(xùn)練,等到收到預(yù)測(cè)請(qǐng)求后再根據(jù)當(dāng)前的數(shù)據(jù)集進(jìn)行計(jì)算
- 如果數(shù)據(jù)不斷增加,則可在已有的估值基礎(chǔ)上,僅對(duì)新增樣本的特征值所涉及的概率估計(jì)進(jìn)行計(jì)數(shù)修正即可實(shí)現(xiàn)增量學(xué)習(xí)
對(duì)數(shù)似然(log-likelihood)
使用數(shù)值運(yùn)算時(shí),為了避免連乘操作造成下溢,通常使用對(duì)數(shù)似然(log-likelihood)
參考書(shū)籍:
1.周志華 <<機(jī)器學(xué)習(xí)>>
2.李航 <<統(tǒng)計(jì)學(xué)習(xí)方法>>
總結(jié)
以上是生活随笔為你收集整理的朴素贝叶斯分类器(Navie Bayesian Classifier)中的几个要点(一)的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: OpenCV的k - means聚类 -
- 下一篇: pynlpir.LicenseError