UA MATH563 概率论的数学基础 中心极限定理8 弱大数定律 Bernstein多项式逼近
UA MATH563 概率論的數學基礎 中心極限定理8 弱大數定律 Bernstein多項式逼近
前七講我們已經討論清楚了獨立性以及獨立的隨機變量序列,接下來我們想要建立關于樣本均值的理論。考慮一個獨立的隨機變量序列{X1,X2,?,Xn}\{X_1,X_2,\cdots,X_n\}{X1?,X2?,?,Xn?},定義樣本和為
Sn=∑i=1nXiS_n = \sum_{i=1}^n X_iSn?=i=1∑n?Xi?
定義樣本均值為
Xˉ=Snn\bar X = \frac{S_n}{n}Xˉ=nSn??
我們要試圖回答的問題是Xˉ\bar XXˉ服從什么漸近分布?它在什么條件下會收斂到常數?
弱大數定律(weak law of large number, WLLN)
假設{Xn}n≥1\{X_n\}_{n \ge 1}{Xn?}n≥1?是不相關的隨機變量,EXn=μ,Var(Xn)≤c,?n≥1,?c>0EX_n = \mu,Var(X_n) \le c,\forall n \ge 1,\exists c>0EXn?=μ,Var(Xn?)≤c,?n≥1,?c>0,則
Xˉ→L2μ\bar X \to_{L^2} \muXˉ→L2?μ
說明
另外一個版本的弱大數定律的結論是Xˉ→pμ\bar X \to_p \muXˉ→p?μ,但依概率收斂比均方收斂更弱,所以這里敘述的是均方收斂。
Lp收斂:Xn→LpXX_n \to_{L^p} XXn?→Lp?X等價于
lim?n→∞E∣Xn?X∣p=0\lim_{n \to \infty}E|X_n-X|^p =0n→∞lim?E∣Xn??X∣p=0
這種收斂弱于幾乎必然收斂但強于依概率收斂,當p=2p=2p=2時是L2L^2L2收斂,也叫均方收斂,于是Xˉ→L2μ\bar X \to_{L^2} \muXˉ→L2?μ的含義是
E[Xˉ?μ]2→0E[\bar X-\mu]^2 \to 0E[Xˉ?μ]2→0
因為
EXˉ=E∑i=1nXin=1n∑i=1nμ=μE\bar X = E \sum_{i=1}^n\frac{X_i}{n}=\frac{1}{n}\sum_{i=1}^n \mu=\muEXˉ=Ei=1∑n?nXi??=n1?i=1∑n?μ=μ
所以E[Xˉ?μ]2=Var(Xˉ)E[\bar X-\mu]^2=Var(\bar X)E[Xˉ?μ]2=Var(Xˉ),于是弱大數法則的含義是樣本均值的方差趨近于0。
證明
根據Chebyshev不等式,??>0\forall \epsilon>0??>0,
P(∣Xˉ?μ∣>?)≤E[Xˉ?μ]2?2P(|\bar X - \mu|>\epsilon) \le \frac{E[\bar{X}-\mu]^2}{\epsilon^2}P(∣Xˉ?μ∣>?)≤?2E[Xˉ?μ]2?
其中(在Var(Xˉ)Var(\bar X)Var(Xˉ)的計算中,我們需要不相關的假設)
E[Xˉ?μ]2=Var(Xˉ)=1n2∑i=1nVar(Xi)≤cn→0E[\bar X - \mu]^2 = Var(\bar X) = \frac{1}{n^2}\sum_{i=1}^n Var(X_i) \le \frac{c}{n} \to 0E[Xˉ?μ]2=Var(Xˉ)=n21?i=1∑n?Var(Xi?)≤nc?→0
于是P(∣Xˉ?μ∣>?)→0P(|\bar X - \mu|>\epsilon) \to 0P(∣Xˉ?μ∣>?)→0,所以Xˉ→pμ\bar X \to_p \muXˉ→p?μ。
事實上,這個結果同樣說明E[Xˉ?μ]=0,Var(Xˉ)→0E[\bar X - \mu] = 0,Var(\bar X) \to 0E[Xˉ?μ]=0,Var(Xˉ)→0于是均方收斂成立。
應用:Bernstein多項式近似
假設f:[0,1]→Rf:[0,1] \to \mathbb{R}f:[0,1]→R是一個連續函數,定義
fn(x)=∑k=0nCnkxk(1?x)n?kf(k/n)f_n(x) = \sum_{k=0}^n C_n^k x^k(1-x)^{n-k}f(k/n)fn?(x)=k=0∑n?Cnk?xk(1?x)n?kf(k/n)
稱fnf_nfn?是fff的nnn階Bernstein多項式(Bernstein polynomial of degree n with respect to f),我們可以證明
sup?x∈[0,1]∣fn(x)?f(x)∣→0,n→∞\sup_{x \in [0,1]}|f_n(x)-f(x)| \to 0,n \to \inftyx∈[0,1]sup?∣fn?(x)?f(x)∣→0,n→∞
先簡單觀察一下Bernstein多項式的構造,它非常像二項式定理的展開式,于是在概率論的語境下,我們應該把它聯系到二項分布:
假設X1,?,Xn~iidBer(p)X_1,\cdots,X_n \sim_{iid} Ber(p)X1?,?,Xn?~iid?Ber(p),即
P(Xi=1)=p,P(Xi=0)=1?pP(X_i=1)=p,P(X_i=0)=1-pP(Xi?=1)=p,P(Xi?=0)=1?p
并且
EXi=p,Var(Xi)=p(1?p)EX_i = p,Var(X_i) = p(1-p)EXi?=p,Var(Xi?)=p(1?p)
Bernoulli分布的樣本和就是二項分布,
Sn=∑i=1nXi~Binom(n,p)P(Sn=k)=Cnkpk(1?p)n?kS_n = \sum_{i=1}^n X_i \sim Binom(n,p) \\ P(S_n = k) = C_n^kp^k(1-p)^{n-k}Sn?=i=1∑n?Xi?~Binom(n,p)P(Sn?=k)=Cnk?pk(1?p)n?k
接下來我們嘗試把Bernstein不等式用期望表示出來,先做一下簡單的輔助計算幫助理解,如果x=px=px=p,則
fn(p)=∑k=0nCnkpk(1?p)n?kf(k/n)=∑k=0nP(Sn=k)f(k/n)f_n(p) = \sum_{k=0}^n C_n^k p^k(1-p)^{n-k}f(k/n)=\sum_{k=0}^{n}P(S_n=k)f(k/n)fn?(p)=k=0∑n?Cnk?pk(1?p)n?kf(k/n)=k=0∑n?P(Sn?=k)f(k/n)
kkk就是SnS_nSn?的取值,顯然這個式子就是f(Sn/n)f(S_n/n)f(Sn?/n)的期望。因為p∈[0,1]p \in [0,1]p∈[0,1],于是我們要證明的可以是fn(p)→f(p)f_n(p) \to f(p)fn?(p)→f(p)。
下面我們嘗試用WLLN說明這個結論:
閉區間上的連續函數有界,于是
M=sup?x∈[0,1]∣f(x)∣<∞M = \sup_{x \in [0,1]}|f(x)|<\inftyM=x∈[0,1]sup?∣f(x)∣<∞
閉區間上的連續函數一致連續,于是??>0,?δ>0\forall \epsilon>0,\exists \delta>0??>0,?δ>0, ∣x?y∣<δ|x-y|<\delta∣x?y∣<δ則∣f(x)?f(y)∣<?|f(x)-f(y)|<\epsilon∣f(x)?f(y)∣<?;
計算
∣fn(p)?f(p)∣=∣E[f(Sn/n)]?f(p)∣=∣E[f(Sn/n)?f(p)]∣≤E∣f(Sn/n)?f(p)∣=E[∣f(Sn/n)?f(p)∣,∣Sn/n?p∣≤δ]+E[∣f(Sn/n)?f(p)∣,∣Sn/n?p∣>δ]|f_n(p)-f(p)|=|E[f(S_n/n)]-f(p)| = |E[f(S_n/n)-f(p)]| \\ \le E|f(S_n/n)-f(p)| \\=E[|f(S_n/n)-f(p)|,|S_n/n-p| \le \delta] \\+E[|f(S_n/n)-f(p)|,|S_n/n-p| > \delta]∣fn?(p)?f(p)∣=∣E[f(Sn?/n)]?f(p)∣=∣E[f(Sn?/n)?f(p)]∣≤E∣f(Sn?/n)?f(p)∣=E[∣f(Sn?/n)?f(p)∣,∣Sn?/n?p∣≤δ]+E[∣f(Sn?/n)?f(p)∣,∣Sn?/n?p∣>δ]
其中E[X,A]=E[X1A]E[X,A]=E[X1_A]E[X,A]=E[X1A?],第一項
E[∣f(Sn/n)?f(p)∣,∣Sn/n?p∣≤δ]≤E[?,∣Sn/n?p∣≤δ]≤?E[|f(S_n/n)-f(p)|,|S_n/n-p| \le \delta] \\ \le E[\epsilon,|S_n/n-p| \le \delta] \le \epsilonE[∣f(Sn?/n)?f(p)∣,∣Sn?/n?p∣≤δ]≤E[?,∣Sn?/n?p∣≤δ]≤?
第二項
E[∣f(Sn/n)?f(p)∣,∣Sn/n?p∣>δ]≤E[2M,∣Sn/n?p∣>δ]=2MP(∣Sn/n?p∣>δ)E[|f(S_n/n)-f(p)|,|S_n/n-p| > \delta] \\ \le E[2M,|S_n/n-p| > \delta]=2MP(|S_n/n-p| > \delta)E[∣f(Sn?/n)?f(p)∣,∣Sn?/n?p∣>δ]≤E[2M,∣Sn?/n?p∣>δ]=2MP(∣Sn?/n?p∣>δ)
根據Chebyshev不等式
2MP(∣Sn/n?p∣>δ)≤2MVar(Sn/n)δ22MP(|S_n/n-p| > \delta) \le \frac{2MVar(S_n/n)}{\delta^2}2MP(∣Sn?/n?p∣>δ)≤δ22MVar(Sn?/n)?
根據弱大數定律,不妨取Var(Sn/n)<δ2?2MVar(S_n/n)<\frac{\delta^2 \epsilon}{2M}Var(Sn?/n)<2Mδ2??,
2MVar(Sn/n)δ2<?\frac{2MVar(S_n/n)}{\delta^2}<\epsilonδ22MVar(Sn?/n)?<?
如果不僅僅考慮收斂性,而是考慮近似誤差的話,我們可以通過計算Var(Sn/n)Var(S_n/n)Var(Sn?/n)得到2MP(∣Sn/n?p∣>δ)2MP(|S_n/n-p| > \delta)2MP(∣Sn?/n?p∣>δ)的上界為
2Mn2δ2np(1?p)≤M2nδ2\frac{2M}{n^2\delta^2}np(1-p) \le \frac{M}{2n\delta^2}n2δ22M?np(1?p)≤2nδ2M?
于是
sup?p∈[0,1]∣fn(p)?f(p)∣≤?+M2nδ2\sup_{p \in [0,1]}|f_n(p)-f(p)| \le \epsilon +\frac{M}{2n\delta^2}p∈[0,1]sup?∣fn?(p)?f(p)∣≤?+2nδ2M?
總結
以上是生活随笔為你收集整理的UA MATH563 概率论的数学基础 中心极限定理8 弱大数定律 Bernstein多项式逼近的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: [概统]本科二年级 概率论与数理统计 第
- 下一篇: UA MATH567 高维统计II 随机