朴素贝叶斯分类器简单实例
生活随笔
收集整理的這篇文章主要介紹了
朴素贝叶斯分类器简单实例
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
一、病人分類的例子
讓我從一個例子開始講起,你會看到貝葉斯分類器很好懂,一點都不難。
某個醫院早上收了六個門診病人,如下表。
| 打噴嚏 | 護士 | 感冒 |
| 打噴嚏 | 農夫 | 過敏 |
| 頭痛 | 建筑工人 | 腦震蕩 |
| 頭痛 | 建筑工人 | 感冒 |
| 打噴嚏 | 教師 | 感冒 |
| 頭痛 | 教師 | 腦震蕩 |
現在又來了第七個病人,是一個打噴嚏的建筑工人。請問他患上感冒的概率有多大?
根據貝葉斯定理:
P(A|B) = P(B|A) P(A) / P(B)可得
P(感冒|打噴嚏x建筑工人)= P(打噴嚏x建筑工人|感冒) x P(感冒)/ P(打噴嚏x建筑工人)假定"打噴嚏"和"建筑工人"這兩個特征是獨立的,因此,上面的等式就變成了
P(感冒|打噴嚏x建筑工人)= P(打噴嚏|感冒) x P(建筑工人|感冒) x P(感冒)/ P(打噴嚏) x P(建筑工人)這是可以計算的。
P(感冒|打噴嚏x建筑工人)= 0.66 x 0.33 x 0.5 / 0.5 x 0.33= 0.66因此,這個打噴嚏的建筑工人,有66%的概率是得了感冒。同理,可以計算這個病人患上過敏或腦震蕩的概率。比較這幾個概率,就可以知道他最可能得什么病。
這就是貝葉斯分類器的基本方法:在統計資料的基礎上,依據某些特征,計算各個類別的概率,從而實現分類。
二、樸素貝葉斯分類器的公式
假設某個體有n項特征(Feature),分別為F1、F2、…、Fn。現有m個類別(Category),分別為C1、C2、…、Cm。貝葉斯分類器就是計算出概率最大的那個分類,也就是求下面這個算式的最大值:
P(C|F1F2...Fn)= P(F1F2...Fn|C)P(C) / P(F1F2...Fn)由于 P(F1F2…Fn) 對于所有的類別都是相同的,可以省略,問題就變成了求
P(F1F2...Fn|C)P( C)的最大值。
樸素貝葉斯分類器則是更進一步,假設所有特征都彼此獨立,因此
P(F1F2...Fn|C)P( C)= P(F1|C)P(F2|C) ... P(Fn|C)P( C)上式等號右邊的每一項,都可以從統計資料中得到,由此就可以計算出每個類別對應的概率,從而找出最大概率的那個類。
雖然"所有特征彼此獨立"這個假設,在現實中不太可能成立,但是它可以大大簡化計算,而且有研究表明對分類結果的準確性影響不大。
總結
以上是生活随笔為你收集整理的朴素贝叶斯分类器简单实例的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 【阿朱标红】参与感(3):新媒体营销篇
- 下一篇: SPOJ7258