概率论与数理统计(陈希孺)笔记2.1
2.1 一維隨機變量
2.1.1 隨機變量的概念
所謂隨機變量,就是其值隨機會而定的變量.例如骰子的點數X,在試驗前無法確定它將取何值,但一旦試驗結束,點數就確定了.而與之相對的就是確定變量,其取值遵循某種嚴格的規律,在試驗前就能準確預知出來.例如骰子自由落體的距離H,我不需要進行試驗就可根據自由落體定律計算出每個時刻對應的落體高度。
第一章提到的隨機事件,實際上是包含隨機變量這個更廣泛的范圍之內。例如事件:骰子的點數大于等于3可以用{X≥3}\{X\ge 3\}{X≥3}表示。更進一步的,我們可以使用指示變量Y。
隨機變量又可以分為離散型隨機變量與連續型隨機變量。
2.1.2 離散型隨機變量的分布及其重要例子
設XXX為離散型隨機變量, 其全部可能值為{a1\left\{a_{1}\right.{a1?,a2?}\left.a_{2} \cdots\right\}a2??}. 則
pi=P(X=ai),i=1,2,?p_{i}=P\left(X=a_{i}\right), i=1,2, \cdots pi?=P(X=ai?),i=1,2,?
稱為XXX的概率函數.
顯然有
pi?0,p1+p2+?=1p_{i} \geqslant 0, p_{1}+p_{2}+\cdots=1 pi??0,p1?+p2?+?=1
概率函數也稱為XXX的概率分布,其還有如下兩種表現形式.
設XXX為一隨機變量,則函數
P(X?x)=F(x),?∞<x<∞P(X \leqslant x)=F(x),-\infty<x<\infty P(X?x)=F(x),?∞<x<∞
稱為XXX的分布函數
對任何隨機變量XXX, 其分布函數F(x)F(x)F(x)具有下面的一般性質:
1.F(X)F(X)F(X)是單調非降的: 當(x1<x2)\left(x_{1}<x_{2}\right)(x1?<x2?)時, 有F(x1)?F(x2)F\left(x_{1}\right) \leqslant F\left(x_{2}\right)F(x1?)?F(x2?).
2. 當x→∞x \rightarrow \inftyx→∞時,F(x)→1F(x) \rightarrow 1F(x)→1; 當x→?∞x \rightarrow-\inftyx→?∞時,F(x)→0F(x) \rightarrow 0F(x)→0,
下面介紹常見的離散型隨機變量的分布
二項分布
若隨機變量XXX的概率函數為
pk=P(X=k)=Cnkpkqn?k,k=0,1,?,np_{k}=P(X=k)=C_{n}^{k} p^{k} q^{n-k}, k=0,1, \cdots, n pk?=P(X=k)=Cnk?pkqn?k,k=0,1,?,n
其中0<p<1,q=1?p0<p<1, q=1-p0<p<1,q=1?p, 則稱XXX服從參數為n,pn, pn,p的二項分布, 記為X~B(n,p)X \sim B(n, p)X~B(n,p)
這個分布的現實意義為從有放回的抽查nnn個元件,元件次品率為ppp,檢查出次品的個數為XXX。
下面討論當kkk取何值時概率有最大值。
泊松分布
如果隨機變量XXX的概率函數為
pk=P(X=k)=λkk!e?λ,k=0,1,2,?p_{k}=P(X=k)=\frac{\lambda^{k}}{k !} e^{-\lambda}, \quad k=0,1,2, \cdots pk?=P(X=k)=k!λk?e?λ,k=0,1,2,?
其中λ>0\lambda>0λ>0為常數, 則稱XXX服從參數為λ\lambdaλ的泊松分布, 記為X~P(λ)X \sim P(\lambda)X~P(λ)。
這個分布的現實意義為描述大量試驗中稀有事件出現頻數概率模型。
泊松分布可以作為二項分布的極限而得到。一般地說,若X~B(n,p)X \sim B(n, p)X~B(n,p), 其中nnn很大,ppp很小而np=λn p=\lambdanp=λ不太大 時,則XXX的分布接近于泊松分布P(λ).P(\lambda) .P(λ).
為了幫助直觀理解這個結論,陳希孺給出了一個例子:在一定時間內某交通路口所發生的事故個數。
為方便計,設所觀察的這段時間為[0,1)[0,1)[0,1). 取一個很大的自然數nnn, 把時間段[0,1)[0,1)[0,1)分為等長的nnn段:
l1[0,1n),l2=[1n,2n),?,li=[i?1n,in),?ln=[n?1n,1)\begin{aligned} l_{1}\left[0, \frac{1}{n}\right), l_{2} &=\left[\frac{1}{n}, \frac{2}{n}\right), \cdots, l_{i}=\left[\frac{i-1}{n}, \frac{i}{n}\right), \cdots \\ l_{n} &=\left[\frac{n-1}{n}, 1\right) \end{aligned} l1?[0,n1?),l2?ln??=[n1?,n2?),?,li?=[ni?1?,ni?),?=[nn?1?,1)?
作幾個假定:
在每段lil_{i}li?內,恰發生一個事故的概率,近似地與這段時 間之長1n\frac{1}{n}n1?成正比,即可取為λ/n.\lambda / n .λ/n.又假定在nnn很大因而1/n1 / n1/n很小 時,在lil_{i}li?這么短暫的一段時間內,要發生兩次或更多的事故是不 可能的. 因此,在lil_{i}li?時段內不發生事故的概率為1?1/n1-1 / n1?1/n.而這體現了事件的稀有性。
l1,?,lnl_{1}, \cdots, l_{n}l1?,?,ln?各段是否發生事故是獨立的.
根據以上假定,XXX應服從二項分 布B(n,λ/n)B(n, \lambda / n)B(n,λ/n). 于是
P(X=i)=(ni)(λn)i(1?λn)n?iP(X=i)=\left(\begin{array}{l} n \\ i \end{array}\right)\left(\frac{\lambda}{n}\right)^{i}\left(1-\frac{\lambda}{n}\right)^{n-i} P(X=i)=(ni?)(nλ?)i(1?nλ?)n?i
將nnn取極限即可推出泊松分布。
超幾何分布
如果隨機變量XXX的概率函數為
P(X=m)=(Mm)(N?Mn?m)/(Nn)P(X=m)=\left(\begin{array}{l}M \\ m\end{array}\right)\left(\begin{array}{c}N-M \\ n-m\end{array}\right) /\left(\begin{array}{l}N \\ n\end{array}\right)P(X=m)=(Mm?)(N?Mn?m?)/(Nn?)
則稱XXX服從超幾何分布。
該分布的現實意義為無放回的抽樣。若n/Nn / Nn/N很小,則 放回與不放回差別不大. 由此可見,在這種情況下超幾何分布應與 二項分布很接近. 確切地說,若XXX服從超幾何分布 則當nnn固定,M/N=pM / N=pM/N=p固定,N→∞N \rightarrow \inftyN→∞時,XXX近似地服從二項分布B(n,p)B(n, p)B(n,p)
負二項分布
如果隨機變量XXX的概率函數為
P(X=i)=b(r?1;i+r?1,p)p=(i+r?1r?1)pr(1?p)iP(X=i)=b(r-1 ; i+r-1, p) p=\left(\begin{array}{c}i+r-1 \\ r-1\end{array}\right) p^{r}(1-p)^{i}P(X=i)=b(r?1;i+r?1,p)p=(i+r?1r?1?)pr(1?p)i
則稱XXX服從負二項分布。
該分布的現實意義為同樣為抽樣檢查,不過不同的是預先定一個數rrr, 一個一個地元件中抽樣檢查,直到發現第rrr個次品為 止.以XXX記到當時為止已檢出的合格品個數.
當r=1r=1r=1時,P(X=i)=p(1?p)iP(X=i)=p(1-p)^{i}P(X=i)=p(1?p)i。這稱為幾何分布。
2.1.3 連續型隨機變量的分布及重要例子
連續型隨機變量的概率分布與離散型大不相同。例如,如在靶面上指定一個幾何意義下的點(即只有位置而無任何向度),則 “射擊時正好命中該點”的概率,也只能取為 0 .那么參照離散型用P(X=i)P(X=i)P(X=i)刻畫就毫無意義。
為了刻畫連續型隨機變量的概率分布,我們引入了概率密度函數:
設連續性隨機變量XXX有概率分布函數F(x)F(x)F(x), 則F(x)F(x)F(x)的導數f(x)=F′(x)f(x)=F^{\prime}(x)f(x)=F′(x), 稱為XXX的概率密度函數.
連續型隨機變量XXX的密度函數f(x)f(x)f(x)都具有以下三條基本性質:
1.f(x)?0f(x) \geqslant 0f(x)?0
2.∫?∞∞f(x)dx=1\int_{-\infty}^{\infty} f(x) \mathrmze8trgl8bvbq x=1∫?∞∞?f(x)dx=1
P(a?X?b)=F(b)?F(a)=∫ab(x)dxP(a \leqslant X \leqslant b)=F(b)-F(a)=\int_{a}^(x) \mathrmze8trgl8bvbq x P(a?X?b)=F(b)?F(a)=∫ab?(x)dx
有了概率密度函數這個工具后,下面介紹常見的連續性隨機變量分布。
正態分布
若隨機變量XXX的密度函數為
p(x)=12πσe?(x?μ)22σ2,?∞<x<∞p(x)=\frac{1}{\sqrt{2 \pi} \sigma} e^{-\frac{(x-\mu)^{2}}{2 \sigma^{2}}}, \quad-\infty<x<\infty p(x)=2π?σ1?e?2σ2(x?μ)2?,?∞<x<∞
其中μ,σ(>0)\mu, \sigma(>0)μ,σ(>0)為常數, 則稱XXX服從參數為μ,σ2\mu, \sigma^{2}μ,σ2的正態分布, 記為X~N(μ,σ2)X \sim N\left(\mu, \sigma^{2}\right)X~N(μ,σ2)
正態分布的現實意義為一般事物常為中間多兩頭少的分布,例如一群人的身高或體重。
當μ=1,σ2=1\mu=1, \sigma^{2}=1μ=1,σ2=1時, 便成為
f(x)=e?x2/2/2πf(x)=\mathrm{e}^{-x^{2} / 2} / \sqrt{2 \pi} f(x)=e?x2/2/2π?
它是正態分布N(0,1)N(0,1)N(0,1)的密度函數. 其密度函數和分布函數常分別記為φ(x)\varphi(x)φ(x)和Φ(x)\Phi(x)Φ(x),
若X~N(μ,σ2)X \sim N\left(\mu, \sigma^{2}\right)X~N(μ,σ2), 則Y=(X?μ)/σ~N(0,1)Y=(X-\mu) / \sigma \sim N(0,1)Y=(X?μ)/σ~N(0,1)
指數分布
若隨機變量XXX的概率密度函數為
p(x)={λe?λxx?00x<0p(x)=\left\{\begin{array}{ll} \lambda e^{-\lambda x} & x \geqslant 0 \\ 0 & x<0 \end{array}\right. p(x)={λe?λx0?x?0x<0?
其中λ>0\lambda>0λ>0為常數, 則稱XXX服從參數為λ\lambdaλ的指數分布, 記為X~E(λ)X \sim E(\lambda)X~E(λ)。XXX的分布函數為
F(x)={1?e?λxx?00其他?F(x)=\left\{\begin{array}{cc} 1-e^{-\lambda x} & x \geqslant 0 \\ 0 & \text { 其他 } \end{array}\right. F(x)={1?e?λx0?x?0?其他??
該分布的現實意義為一批無老化元件的壽命?!盁o老化”.就是說:“元件在時刻xxx尚 能正常工作的條件下,其失效率總保持為某個常數λ>0\lambda>0λ>0, 與xxx無關”.
威布爾分布
元件無老化在現實中是不可能的。失效率ppp應取為一個xxx的增函數,例如λxm\lambda x^{m}λxm
此時便得到威布爾分布。
其分布函數為
F(x)=1?e?(λ/m+1)xn+1F(x)=1-\mathrm{e}^{-(\lambda / m+1) x^{n+1}} F(x)=1?e?(λ/m+1)xn+1
取α=m+1(α>1)\alpha=m+1(\alpha>1)α=m+1(α>1), 并把λ/(m+1)\lambda /(m+1)λ/(m+1)記為λ\lambdaλ, 得出
F(x)=1?e?λxn,x>0F(x)=1-\mathrm{e}^{-\lambda x^{n}}, x>0 F(x)=1?e?λxn,x>0
而F(x)=0F(x)=0F(x)=0當x?0x \leqslant 0x?0. 此分布之密度函數為
f(x)={λaxa?1e?λxa,x>00,x?0f(x)=\left\{\begin{array}{lr} \lambda a x^{a-1} \mathrm{e}^{-\lambda x^{a}}, & x>0 \\ 0, & x \leqslant 0 \end{array}\right. f(x)={λaxa?1e?λxa,0,?x>0x?0?
總結
以上是生活随笔為你收集整理的概率论与数理统计(陈希孺)笔记2.1的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 谷歌地图离线地图开发教程
- 下一篇: 数字图像处理(dip)