泊松分布的分布函数_常见概率分布汇总
注:本篇內容均摘自《商務與經濟統計學》,目的是方便個人查閱相關基本概念。
隨機變量是對實驗結果的數值描述,分為離散型隨機變量和連續型隨機變量。下面列舉常見的離散型概率分布和連續型概率分布。
離散型概率分布
1、柏松概率分布
定義
柏松分布是一種常見的離散型概率分布,它主要用來估計在特定時間段或空間中某事件發生的次數。泊松實驗的性質:
第一、在任意兩個相等長度的區間上,事件發生的概率相等;第二、事件在某一區間上是否發生與事件在其他區間上是否發生是獨立的。
泊松分布的另外一個重要性質數學期望和方差相等。
泊松概率函數:
,其中 為事件在一個區間發生x次的概率, 為事件在一個區間發生次數的數學期望或均值,e=2.71828;泊松概率分布的一個案例:
假定感興趣的是工作日早上15分鐘內到達某汽車銀行出納窗口處的汽車數量。如果假設在任意兩個相等的時間段上汽車到達的概率是相等的,并且在任意時間段上是否有汽車到達與其他時間段上是否有汽車到達是相互獨立的,那么泊松概率函數是適用的。假定以上假設都成立,并且對歷史數據的分析顯示,15分鐘的時間段上到達車輛數目的平均值為10.這時,采用以下概率函數:
,其中隨機變量x=15分鐘的時間段上到達的汽車數。一個有趣的題目:已知某app的日活為10000人,那么請判斷是否某一天會有15000人同時訪問該app?
X=np.arange(8000,16000,100) y=poisson.pmf(X,mu=10000) plt.plot(X,y)圖1X=np.arange(9500,11000,100) y=poisson.pmf(X,mu=10000) plt.plot(X,y)圖2由圖1和圖2可知,在[9600,10400]之間柏松分布的概率都不為0外,其余取值的概率基本都為0,所以幾乎日活不會取到15000.
2、二項概率分布
二項概率分布是一種離散型概率分布,具有廣泛的應用。它與一個稱為二項實驗的多步驟實驗有關。
伯努利實驗的性質:
第一、實驗由一系列相同的實驗組成;第二、每次實驗有兩種可能的結果。我們把其中的一個稱為成功,另一個稱為失敗;
第三、每次實驗成功的概率都是相同的,用p來表示;失敗的概率也都相同,用1-p表示;
第四、實驗是相互獨立的。
二項概率函數:
,其中x為成功的次數,p為每次實驗中成功的概率;n為實驗的次數;f(x)為n次實驗中有x次成功的概率;二項分布的期望與方差:
; ;3、超幾何概率分布
超幾何概率分布與二項分布聯系密切。這兩種概率分布主要有兩處不同:在超幾何概率分布中,各次實驗不是獨立的,并且各次實驗中成功的概率不等。對于超幾何概率分布,符號N表示總體容量,r表示總體中具有成功標志的元素個數,N-r表示總體中有失敗標志的元素個數。采用不放回抽樣方法,從總體中抽取n個元素,超幾何概率函數用來計算在這n個元素中恰有x個元素具有成功標志,n-x個元素具有失敗標志的概率。當這種實驗結果出現時,我們是從總體的r個具有成功標志的元素中抽取x個,從總體的N-r個具有失敗標志的元素中抽取n-x個。下面的超幾何概率函數f(x)給出了n次實驗中有x次成功的概率。
考慮拋5次硬幣的實驗,每一次都觀察硬幣著地時正面朝上還是反面朝上。假設我們想要計算5次拋擲中正面出現的次數。這個實驗具備二次實驗的性質嗎?感興趣的隨機變量是什么?注意:
于是,該實驗滿足二項實驗的性質。感興趣的隨機變量為x=拋擲5次硬幣正面朝上的次數,這時x的可能取值為0,1,2,3,4或5.
超幾何概率函數:
,其中,x為成功的次數;n為實驗次數; 為n次實驗中x次成功的概率;N為總體中元素的個數;r為總體中具有成功標志的元素的個數。超幾何概率分布的期望與方差:
; ;當總體容量足夠大的時候,超幾何分布可以用實驗次數為n,成功概率
的二項分布近似。連續型概率分布
離散型隨機變量和連續型隨機變量之間最根本的區別在與,二者在概率計算上是不同的。對于一個離散型隨機變量,概率函數f(x)給出了隨機變量x取某個特定值的概率,而對連續型隨機變量,與概率函數相對應的是概率密度函數,也記作f(x).不同的是,概率密度函數并沒有直接給出概率。但是,給定區間上曲線f(x)下的面積是連續型隨機變量在該區間取值的概率。因此,當計算連續型隨機變量的概率時,我們計算的是隨機變量在某個區間內取值的概率。
均勻分布
一般的,如果隨機變量x服從均勻分布,則它的密度函數的公式如下:
, else ;正態分布
正態密度函數:
; 為均值, 為標準差;標準正態密度函數:
;二項概率的正態近似:
當實驗次數很大時,筆算或者用計算器求解二項概率函數都是很困難的。在 和 的情況下,正態分布是對二項分布的一個簡便易行的近似。當使用正態分布近似二項分布時,正態曲線中取 和 .舉例說明二項分布的正態近似。假定歷史經驗表明,某公司發票出錯的概率為10%?,F選取100張發票組成一個樣本,我們想計算恰好有12張發票有錯的概率,即想計算100次實驗中恰好有12次成功的二項概率。在應用二項分布的正態近似時,另
和 ,下面我們使用 的正態分布計算恰好有12張發票有錯的概率。對連續型概率分布,概率是通過計算密度函數下方的面積得出的。因此,隨機變量取任意單個值的概率是0。為了對恰好有12次成功的二項概率進行近似,我們必須計算1.5和12.5之間正態曲線下的面積。其中11.5和12.5是將12加減0.5得到的,我們稱0.5為連續性正交因子。由于我們是用連續型分布來近似一個離散分布,從而離散型二項分布的概率
可以用連續型正態分布的概率 來近似,從而可以轉換成標準正態分布來求解概率。指數分布
指數概率分布可用于描述諸如到達某洗車處的兩輛車的時間間隔,裝載一輛卡車所需要的事件,高速公路上兩起重大事故發生地之間的距離等隨機變量。
指數概率密度函數:
,其中 為期望值或均值;泊松分布和指數分布的關系:
泊松分布描述了某一區間中事件發生的次數,而指數分布描述了事件發生的時間間隔長度。舉例如下,假定1h中叨叨某一洗車處的汽車的數量可以用泊松分布描述,其均值為每小時10輛。泊松概率函數給出了每小時有x輛汽車到達的概率:
由于車輛到達的平均數是每小時10輛,則兩車到達額度時間間隔的均值為:
,于是描述兩車到達的時間間隔的對應分布是指數分布,其均值為 ,從而指數概率密度函數為: .總結
以上是生活随笔為你收集整理的泊松分布的分布函数_常见概率分布汇总的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 拔除牙齿再镶牙需要去几次
- 下一篇: 鼻子被打歪了矫正手术是怎么做的呀