第二章 随机变量
隨機變量
目標:將實驗結果數量化。實驗結構有數字型和非數字型。數字型:降雨量、上車人數等。非數字型:晴天/陰天/下雨、化驗結果陰性/陽性等。
定義:隨機試驗樣本空間S,如果X=X(e)為定義在S上的實數單值函數,則稱X(e)為隨機變量。簡寫為X。
補充:隨機變量X(e):S->R 的映射關系。隨機變量實質是一個函數。
如果i≠j,那么 {X=i}∩{X=j}=?
一般用大寫字母X、Y、Z 或者希臘字母 ξ,η等表示隨機變量。
事件表示:A={e:X(e)∈I}={X∈I},I∈R
隨機變量的類型:離散型隨機變量、連續(xù)型隨機變量
離散型隨機變量
定義:如果隨機變量X的取值為有限個,或者可數個,則稱X為離散型隨機變量。
補充1:換句話說:如果一個函數自變量是有限個,或者可數個,那這個函數就是離散型隨機變量。隨機變量,是一種映射關系,是函數。
補充2:有限是指知道有多少個,例如一枚硬幣扔在地上,結果是正面或者反面,兩種結果。可數是指能數的。例如正奇數集{1,3,5,7,…}雖然不知道有多少個,但是是可以一個一個的數的。有些情況是可數且有限個。例如人的年齡是可數且有限的,范圍從0,1,2,….200。根據目前的資料,沒有人年齡超過200的。那這個個數就是201。
補充3:不可數是無窮集合的一種。一個無窮集合與自然數集合之間不是一一對應的關系,那么這個無窮集合是不可數的(?)。區(qū)間[0,1],開始數:
0.34956852…
0.58692….
0.24986….
那么 0.490… 一定是你沒有數到的。0.490…是這么來的:該數小數點后的第i位是第i個被數到的數的第i位加1,約定 9+1=0
離散型隨機變量的概率分布式律
概率分布律是指隨機變量取所有可能取值的情況下,每個取值對應的概率。
| X | x1 | x2 | … | xk | … |
| P | p1 | p2 | … | pk | … |
分布律的性質: pk>=0; ∑+∞k=1pk=1
另外一種表示: P(X=xk)=pk,k=1,2,3...
離散型隨機變量的包含
0-1分布、二項分布、泊松分布、幾何分布都屬于離散型隨機變量。
0-1分布
定義:若隨機變量X可能的取值只有0和1,并且X的概率分布律滿足 p0=1?p,p1=p,其中 0<p<1,就稱X服從參數為p的0-1分布記為 X~B(p)或 X~0?1(p)。0-1分布又稱為 貝努力分布。
其分布律還可以寫為 P(X=K)=pk(1?p)(1?k)
應用
1檢查產品質量是否合格
2新生嬰兒的性別
3檢驗種子是否發(fā)芽
4考試是否通過
二項分布
關系:如果試驗E只有兩個可能的結果:A或者 Aˉˉˉ,P(A)=p, 0<p<1,將E獨立的重復進行n次,想了解n重貝努力試驗中A發(fā)生的次數的統(tǒng)計規(guī)律,就是二項分布。
定義:若X的概率分布律為 P(X=k)=Cknpk(1?p)(n?k),k=0,1,2...,n>=1, ,0<p<1,就稱X服從參數n,p的二項分布,記為 X~B(n,p)。
泊松分布
如果X的概率分布為P(X=k)=λke?λk!,k=0,1,2,3...,λ>0,就稱X服從參數為λ的泊松分布,記為X~π(λ)或者X~P(λ)。
根據泰勒展開式eλ=∑∞k=0λkk!
如果某事件以固定強度λ,隨機且獨立的出現(xiàn),該事件在單位事件內出現(xiàn)的次數可以看成是泊松分布。
當二項分布的n>10,p<0.1時,二項分布B(n,p)可以用泊松分布P(np)來近似。換句話說:當n遠遠大于p的時候,泊松分布是二項分布的近似計算公式。
例如:某地區(qū)一個月內(單位時間)每200個成年人中會有1個人患上某種疾病(一定概率),設個人是否患病相互獨立(隨機且獨立)。求如果該地某一社區(qū)內有1000個成年人,求某月內該社區(qū)至少有3人患病的概率。
幾何分布
若X的概率分布律為:P(X=K)=p(1?p)k?1,k=1,2,3… 稱為X服從參數為p的幾何分布,記為X~Geom(p)。表示在多重貝努力試驗中,試驗進行到某一結果第一次出現(xiàn)為止,此時需要的試驗次數的分布律。
概率分布函數
定義:隨機變量X對任意實數x,稱函數F(x)=P(X<=x)為X的概率分布函數,簡稱分布函數。
補充:任何隨機變量都有對應的分布函數
目的:給出隨機變量落在某個范圍的可能性。
性質:1 0<=F(x)<=1;2 F(x)單調不減;3 F(?∞)=0,F(+∞)=1;4 F(x)是右連續(xù)函數,F(x+0) = F(x)。
計算:P(a<X≤b)=P(X≤b)?P(X≤a)=F(b)?F(a)
P(a<X<b)=P(a<X≤b?0)=F(b?0)?F(a)
一般離散型隨機變量的分布函數是分段函數。設隨機變量X的分布律為P{X=x_k}=p_k,k=1,2,3… X的分布函數為F(x)=∑xk<=xpk.F(x)在x=x_k處有跳躍,其跳躍值為p_k=P{X=x_k}。
連續(xù)型隨機變量
定義:隨機變量X的取值范圍不可數,則稱X為連續(xù)型隨機變量。
分類:均勻分布、指數分布、正態(tài)分布。
連續(xù)型隨機變量的概率密度
定義:對于隨機變量X的分布函數F(x),若存在非負的函數f(x),使對于任意實數x有:F(x)=∫+∞?∞f(t)dt。則稱X為連續(xù)型隨機變量,f(x)為X的概率密度函數,簡稱概率密度。有時候也寫為fX(x)。
性質
1 f(x)>=0
2 ∫+∞?∞f(x)dx=1
3 對于任意實數x1,x2,x1<x2,P(x1<x<x2)=∫x2x1f(t)dt
4 X落在點x附近(x,x+Δx)的概率近似等于 f(x)Δx。f(x)可以大于1,f(x)的大小表示了X落在x附近的可能性大小,f(x)與F(x)之間是積分與微分的關系。
均勻分布
若隨機變量X的概率密度函數為f(x)=???1b?a,x∈(a,b)0,其他,a<b,稱X服從(a,b)上的均勻分布。記為 X~U(a,b)
性質:均勻分布具有等可能性。X落入(a,b)區(qū)間中等長度的任意子區(qū)間上是等可能的。
指數分布
若隨機變量X的概率密度函數為f(x)=???λe?xλ,x>00,x≤0 ,稱X服從λ的指數分布。記為 X~E(λ) 或者 X~Exp(λ)
分布函數為F(x)={1?e?λx,x>00,x≤0
性質:指數分布具有無記憶性。P(X>t0+t|X>t0)=e?λt=P(X>t)
應用
指數分布可以用來表示獨立隨機事件發(fā)生的時間間隔,比如旅客進機場的時間間隔,中文維基百科出現(xiàn)一條新詞條的時間間隔。在排隊論中,一個顧客接受服務時間的長短也服從指數分布。
正態(tài)分布
若隨機變量X的概率密度函數為f(x)=12π??√σe?(x?μ)22σ2 ,?∞<μ<+∞,σ>0,稱X服從參數μ,σ的正態(tài)分布。記為:X~N(μ,σ2)。
性質
1f(x)關于x=μ對稱。
2 當x≤μ的時候,f(x)嚴格單調遞增。
3 fmax=f(μ)=12π??√σ
4 lim|x?μ|?>∞f(x)=0
兩個參數的含義
1 固定σ,f(x)形狀不變,移動位置,μ為位置參數。
2 固定μ,f(x)位置不變,σ小,圖形高瘦,σ大,圖形寬胖。稱為尺度參數。
應用
1 測量誤差。3σ
2 人的身高、體重
正態(tài)分布的計算
方法一:用excel、matlab計算
方法二:數值積分
方法三:轉為標準正態(tài)分布,查表。
標準正態(tài)分布
X~N(0,1),X稱為正態(tài)分布。
Φ(?z0)=1?Φ(z0)
轉換公式
隨機變量函數的分布
隨機變量函數的分布=函數的函數的分布。已知隨機變量X的分布,Y=g(X),g(X)已知,求Y的分布。
一般地,如果X~N(μ,σ2),如果Y=ax+b,則Y~N(aμ+b,a2σ2)。
創(chuàng)作挑戰(zhàn)賽新人創(chuàng)作獎勵來咯,堅持創(chuàng)作打卡瓜分現(xiàn)金大獎總結
- 上一篇: 罗伯特·帕丁森Robert Pattin
- 下一篇: [运动][组合]睡前运动