UA MATH566 统计理论2 C-R不等式简介
UA MATH566 統(tǒng)計(jì)理論2 C-R不等式
- 單個(gè)參數(shù)的情形
- 多個(gè)參數(shù)的情形
點(diǎn)估計(jì)基礎(chǔ)那一篇討論到UMVUE了,這一講試圖給出無(wú)偏估計(jì)方差的一個(gè)下界。在統(tǒng)計(jì)理論1中推導(dǎo)的Fisher信息其實(shí)就是一個(gè)下界,但這一講會(huì)更詳細(xì)給出相關(guān)結(jié)論。
概念1 Cramer-Rao分布族(正則分布族){f(x,θ),θ∈Θ}\{f(x,\theta),\theta \in \Theta\}{f(x,θ),θ∈Θ}
為了讓C-R不等式成立,需要一些條件,滿足這些條件的分布族被稱為C-R分布族:
常見(jiàn)的非正則分布族的分布有均勻分布、帶位移的指數(shù)分布等。
單個(gè)參數(shù)的情形
假設(shè)Θ?R\Theta \subset \mathbb{R}Θ?R,則此時(shí)的得分函數(shù)是一維的
S(x,θ)=?L(θ)?θ=1f(x,θ)?f(x,θ)?θS(x,\theta) = \frac{\partial L(\theta)}{\partial \theta} = \frac{1}{f(x,\theta)} \frac{\partial f(x,\theta)}{\partial \theta}S(x,θ)=?θ?L(θ)?=f(x,θ)1??θ?f(x,θ)?
且滿足
E[S(X,θ)]=0,E[S(X,θ)]2=I(θ)E[S(X,\theta)]=0,\ \ E[S(X,\theta)]^2 = I(\theta)E[S(X,θ)]=0,??E[S(X,θ)]2=I(θ)
定理1 f(x,θ)f(x,\theta)f(x,θ)是Cramer-Rao分布族,g^(X)\hat{g}(X)g^?(X)與θ^(X)\hat{\theta}(X)θ^(X)分別是g(θ)g(\theta)g(θ)與θ\thetaθ的無(wú)偏估計(jì),其中g(θ)g(\theta)g(θ)可導(dǎo),則
Var(θ^)≥I?1(θ),Var(g^(X))≥[g′(θ)]2I?1(θ)Var(\hat{\theta})\ge I^{-1}(\theta),\ \ Var(\hat{g}(X)) \ge [g'(\theta)]^2I^{-1}(\theta)Var(θ^)≥I?1(θ),??Var(g^?(X))≥[g′(θ)]2I?1(θ)
證明 很明顯取g(θ)=θg(\theta)=\thetag(θ)=θ就是更簡(jiǎn)單那種情況,所以我們來(lái)證明一下第二個(gè)不等式和它的取等條件。根據(jù)Cauchy-Schwarz不等式,Var(X)Var(Y)≥[Cov(X,Y)]2Var(X)Var(Y)\ge [Cov(X,Y)]^2Var(X)Var(Y)≥[Cov(X,Y)]2,令X=g^(X)X = \hat{g}(X)X=g^?(X),Y=S(X,θ)Y = S(X,\theta)Y=S(X,θ),計(jì)算
Cov(g^(X),S(X,θ))=E[g^(X)S(X,θ)]?E[g^(X)]E[S(X,θ)]=E[g^(X)S(X,θ)]=∫g^(x)S(x,θ)f(x,θ)dx=??θ∫g^(x)f(x,θ)dx=g′(θ)Cov(\hat{g}(X),S(X,\theta)) = E[\hat{g}(X)S(X,\theta)]-E[\hat{g}(X)]E[S(X,\theta)]=E[\hat{g}(X)S(X,\theta)] \\ = \int \hat{g}(x)S(x,\theta)f(x,\theta)dx = \frac{\partial }{\partial \theta} \int \hat{g}(x)f(x,\theta)dx = g'(\theta)Cov(g^?(X),S(X,θ))=E[g^?(X)S(X,θ)]?E[g^?(X)]E[S(X,θ)]=E[g^?(X)S(X,θ)]=∫g^?(x)S(x,θ)f(x,θ)dx=?θ??∫g^?(x)f(x,θ)dx=g′(θ)
第三個(gè)等號(hào)先把得分函數(shù)的公式帶入,然后把求導(dǎo)和求積分交換次序得到第四個(gè)等號(hào),然后那個(gè)積分就是g^(X)\hat{g}(X)g^?(X)的期望,因?yàn)樗菬o(wú)偏估計(jì),所以期望就是g(θ)g(\theta)g(θ)。因此
Var(g^(X))Var(S(X,θ))=Var(g^(X))I(θ)≥[Cov(X,Y)]2=[g′(θ)]2?Var(g^(X))≥[g′(θ)]2I?1(θ)Var(\hat{g}(X))Var(S(X,\theta)) = Var(\hat{g}(X)) I(\theta)\ge [Cov(X,Y)]^2 = [g'(\theta)]^2 \\ \Rightarrow Var(\hat{g}(X)) \ge [g'(\theta)]^2I^{-1}(\theta)Var(g^?(X))Var(S(X,θ))=Var(g^?(X))I(θ)≥[Cov(X,Y)]2=[g′(θ)]2?Var(g^?(X))≥[g′(θ)]2I?1(θ)
根據(jù)Cauchy-Schwarz不等式取等的條件,上式取等需要?a(θ)\exists a(\theta)?a(θ),
S(X,θ)=a(θ)g^(X),a.s.S(X,\theta) = a(\theta) \hat{g}(X),a.s.S(X,θ)=a(θ)g^?(X),a.s.
稱[g′(θ)]2I?1(θ)[g'(\theta)]^2I^{-1}(\theta)[g′(θ)]2I?1(θ)為Cramer-Rao下界(CRLB),它與Fisher信息成反比,說(shuō)明樣本中信息越多時(shí),估計(jì)量的方差就越有可能降到更低。對(duì)于簡(jiǎn)單隨機(jī)樣本X1,?,XnX_1,\cdots,X_nX1?,?,Xn?,他們的Fisher信息量是nI(θ)nI(\theta)nI(θ)(因?yàn)?span id="ze8trgl8bvbq" class="katex--inline">S(X,θ)S(X,\theta)S(X,θ)關(guān)于XXX的可加性),因此Cramer-Rao下界為
CRLB=1n[g′(θ)]2I?1(θ)CRLB = \frac{1}{n}[g'(\theta)]^2I^{-1}(\theta)CRLB=n1?[g′(θ)]2I?1(θ)
這個(gè)式子說(shuō)明樣本量提高也能降低估計(jì)量的方差的下界。
基于CRLB還可以定義估計(jì)量的效率,
e(g^)=lim?n→∞CRLBVar(g^(X))e(\hat{g}) = \lim_{n \to \infty} \frac{CRLB}{Var(\hat{g}(X))}e(g^?)=n→∞lim?Var(g^?(X))CRLB?
如果e(g^)=1e(\hat{g})=1e(g^?)=1,稱g^(X)\hat{g}(X)g^?(X)為漸近有效的無(wú)偏估計(jì)。
多個(gè)參數(shù)的情形
在多維的情況下,得分函數(shù)是
S(x,θ)=?L(θ)S(x,\theta) = \nabla L(\theta)S(x,θ)=?L(θ)
且滿足
E[S(X,θ)]=0,E[S(X,θ)ST(X,θ)]=I(θ)E[S(X,\theta)]=0,\ \ E[S(X,\theta)S^T(X,\theta)] = I(\theta)E[S(X,θ)]=0,??E[S(X,θ)ST(X,θ)]=I(θ)
I(θ)I(\theta)I(θ)是Fisher信息矩陣。
定理2 f(x,θ)f(x,\theta)f(x,θ)是Cramer-Rao分布族,g^(X)\hat{g}(X)g^?(X)與θ^(X)\hat{\theta}(X)θ^(X)分別是g(θ)g(\theta)g(θ)與θ\thetaθ的無(wú)偏估計(jì),其中g(θ)g(\theta)g(θ)可導(dǎo),它的Jacobi矩陣記為Dg(θ)Dg(\theta)Dg(θ),則
Var(g^(X))≥Dg(θ)I?1(θ)[Dg(θ)]TVar(\hat{g}(X)) \ge Dg(\theta)I^{-1}(\theta)[Dg(\theta)]^TVar(g^?(X))≥Dg(θ)I?1(θ)[Dg(θ)]T
證明 思路和定理1證明類似,也是需要根據(jù)Cauchy-Schwarz不等式。計(jì)算
Cov(g^(X),S(X,θ))=E[g^(X)ST(X,θ)]?E[g^(X)]E[S(X,θ)]=E[g^(X)ST(X,θ)]=∫g^(x)ST(x,θ)f(x,θ)dx=?∫g^(x)f(x,θ)dx=Dg(θ)Cov(\hat{g}(X),S(X,\theta)) = E[\hat{g}(X)S^T(X,\theta)]-E[\hat{g}(X)]E[S(X,\theta)]=E[\hat{g}(X)S^T(X,\theta)] \\ = \int \hat{g}(x)S^T(x,\theta)f(x,\theta)dx = \nabla \int \hat{g}(x)f(x,\theta)dx = Dg(\theta)Cov(g^?(X),S(X,θ))=E[g^?(X)ST(X,θ)]?E[g^?(X)]E[S(X,θ)]=E[g^?(X)ST(X,θ)]=∫g^?(x)ST(x,θ)f(x,θ)dx=?∫g^?(x)f(x,θ)dx=Dg(θ)
因此
Var(g^(X))≥[Cov(X,Y)]Var(S(X,θ))?1[Cov(X,Y)]T?Var(g^(X))≥Dg(θ)I?1(θ)[Dg(θ)]TVar(\hat{g}(X))\ge [Cov(X,Y)]Var(S(X,\theta))^{-1}[Cov(X,Y)]^T \\ \Rightarrow Var(\hat{g}(X)) \ge Dg(\theta)I^{-1}(\theta)[Dg(\theta)]^TVar(g^?(X))≥[Cov(X,Y)]Var(S(X,θ))?1[Cov(X,Y)]T?Var(g^?(X))≥Dg(θ)I?1(θ)[Dg(θ)]T
根據(jù)Cauchy-Schwarz不等式取等的條件,上式取等需要?a(θ)\exists a(\theta)?a(θ),
S(X,θ)=a(θ)g^(X),a.s.S(X,\theta) = a(\theta) \hat{g}(X),a.s.S(X,θ)=a(θ)g^?(X),a.s.
總結(jié)
以上是生活随笔為你收集整理的UA MATH566 统计理论2 C-R不等式简介的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: UA MATH564 概率论IV 次序统
- 下一篇: UA MATH564 概率分布1 二项分