大数据统计学之概率论(三)
4.?概率論
4.1?條件概率
已知某個事件A發生的條件下,另一個事件B發生的概率稱為條件概率,記為P(B|A)。看一下P(B|A)與P(A)、P(B)的關系:P(B|A) = P(AB) / P(A)。
條件概率也是概率的一種,所以也符合概率定義的三個條件:
乘法定理:由條件概率的定義,很容易得到P(AB) = P(B|A)P(A),其中P(A) > 0;這條公式很容易推廣到P(ABC) = P(C|AB)P(B|A)P(A) = P(A|BC)P(B|C)P(C).
?4.2 全概率公式
設試驗E的樣本空間為S,A為E的一個事件,B1、B2......Bn是S的一個劃分,且P(Bi) > 0 (i=1,2......n),則
在某些時候,事件A的概率不好求,但是通過全概率公式卻可以很容易求得。
4.3 貝葉斯公式
設試驗E的樣本空間為S。A為E的一個事件,B1、B2......Bn是S的一個劃分,且P(A) > 0, P(Bi) > 0 (i=1,2,.....,n),則
當對樣本空間的劃分由一對對立事件B與ˉB組成時,全概率公式和貝葉斯公式可以簡化為
貝葉斯公式的應用——訴訟、疾病診斷、垃圾郵件判別
下面來看一則案例:
?
4.4?公式比較
乘法公式、全概率公式與貝葉斯公式
先驗概率與后驗概率
4.5?獨立性與事件
設A、B是兩個事件,如果滿足:P(AB) = P(A)P(B),則稱事件A、B相互獨立。簡稱A、B獨立。
由事件獨立的定義可以推出:
?
? ? ? ? ? ? ?P(B|A) = P(AB)/P(A) = P(A)P(B) /P(A) = P(B)
? ? ? ? ? ? ?P(A) = P(A|B)P(B) + P(A|ˉB)P(ˉB) = P(A)P(B) + P(AˉB)
? ? ? ? ? ? ?故P(AˉB)?= P(A) - P(A)P(B) = P(A)(1-P(B))=P(A)P(ˉB)
設A、B、C是三個事件,若滿足
? ?
則稱A、B、C相互獨立。
4.6?相互獨立事件與互斥事件、對立事件
相互獨立事件:兩個事件沒有一點關系。
互斥事件:要么只有其中一個事件發生,要么兩個事件都不發生。
對立事件:兩個之中,只有一個發生。跟互斥事件相比,對立事件必然會有一個事件發生。
互斥事件與對立事件都不是相互獨立事件!
總結
以上是生活随笔為你收集整理的大数据统计学之概率论(三)的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 数据分析体系构建那点事!
- 下一篇: Linux学习系列之Mount