统计决策理论1 统计问题与统计决策
統計決策理論1 統計問題與統計決策
- Kolmogorov公理化體系
- 統計問題的描述
這個系列的目標是在數理統計的語境下建立統一描述統計問題的統計決策理論,第一講闡述統計問題和統計決策的含義。
Kolmogorov公理化體系
概率論與數理統計簡單地說就是描述隨機現象的數學模型,現代概率論的基礎是Kolmogorov用來描述概率的公理體系。首先定義樣本空間Ω\OmegaΩ,它是所有可以想到的隨機事件的結果www的集合。記S\mathbf{S}S是樣本空間的一個σ\sigmaσ-代數。PPP是(Ω,S)(\Omega,\mathbf{S})(Ω,S)的一個非負測度,滿足P(Ω)=1P(\Omega)=1P(Ω)=1,也稱PPP是一個概率測度或者概率。稱(Ω,S,P)(\Omega,\mathbf{S},P)(Ω,S,P)是概率空間。
如果同一個隨機事件獨立重復了NNN次,每一次的樣本空間記為(Ωi,Si)(\Omega^i,\mathbf{S}^i)(Ωi,Si),則這NNN次的樣本空間可以記為樣本空間的直積,對應的σ\sigmaσ-代數是每一個σ\sigmaσ-代數的張量積
Ω=Ω1×Ω2×?×ΩNS=S1?S2???SN\Omega = \Omega^1 \times \Omega^2 \times \cdots \times \Omega^N \\ \mathbf{S} = \mathbf{S}^1 \otimes \mathbf{S}^2 \otimes \cdots \otimes \mathbf{S}^NΩ=Ω1×Ω2×?×ΩNS=S1?S2???SN
新的這個σ\sigmaσ-代數中的元素的結構可以表示為A1×?×AN={ω∈Ω:ωi∈AN,Ai?Ωi}A^1 \times \cdots \times A^N = \{\omega \in \Omega: \omega^i \in A^N,A^i \subset \Omega^i\}A1×?×AN={ω∈Ω:ωi∈AN,Ai?Ωi},原來的概率測度可以比較自然地推廣到新的樣本空間上:
P(A1×?×AN)=P(A1)P(A2)?P(AN)P(A^1 \times \cdots \times A^N) = P(A^1) P(A^2) \cdots P(A^N)P(A1×?×AN)=P(A1)P(A2)?P(AN)
如果是一個隨機事件的序列,比如Markov鏈,如果最多有NNN步轉移,樣本空間的構造可以與獨立重復事件相同:
(Ω,S)=(×i=1NΩi,?i=1NSi)(\Omega,\mathbf{S}) = (\times_{i=1}^N \Omega^i,\otimes_{i=1}^N \mathbf{S}^i)(Ω,S)=(×i=1N?Ωi,?i=1N?Si)
但概率測度會更復雜。定義Ti(w′,w′′)T^i(w',w'')Ti(w′,w′′)是第iii步從w′w'w′到w′′w''w′′的轉移概率密度,則
P(A1×?×AN)=∫A1?∫AN?1P1(dw1)T2(w1,dw2)?TN?1(wN?1,AN)P(A^1 \times \cdots \times A^N) = \int_{A_1} \cdots \int_{A_{N-1}} P^1(dw^1) T^{2}(w^1,dw^2) \cdots T^{N-1}(w^{N-1},A^N)P(A1×?×AN)=∫A1???∫AN?1??P1(dw1)T2(w1,dw2)?TN?1(wN?1,AN)
假設樣本空間具有有限的元素,Ω={w1,?,wn}\Omega = \{w_1,\cdots,w_n\}Ω={w1?,?,wn?},則概率測度可以一個向量p=(p1,?,pn)Tp=(p_1,\cdots,p_n)^Tp=(p1?,?,pn?)T表示,pj=P(wj),?jp_j = P(w_j),\forall jpj?=P(wj?),?j,此時所有可能的概率測度均是下面的集合的元素:
{p:pj≥0,?j;∑j=1npj=1}\{ p:p_j \ge 0, \forall j; \sum_{j=1}^n p_j =1\}{p:pj?≥0,?j;j=1∑n?pj?=1}
這個集合是一個單純形。
統計問題的描述
概率論解決的問題是如果我們了解一個概率空間所有的信息,即所有可能的結果(Ω,S)(\Omega,\mathbf{S})(Ω,S)以及對應的概率PPP,我們可以做什么。數理統計面臨的問題更加現實,因為真實情況往往是我們只知道所有可能的,或者部分的事件結果,也就是我們掌握(Ω,S)(\Omega,\mathbf{S})(Ω,S)的信息,不知道對應的概率測度PPP。數理統計中最常用的參數統計的思想是假設概率測度屬于某個分布族{Pθ,θ∈Θ}\{P_{\theta},\theta \in \Theta\}{Pθ?,θ∈Θ},Θ\ThetaΘ被稱為參數空間,統計問題就被定義在概率空間(Ω,S,Pθ)(\Omega,\mathbf{S},P_{\theta})(Ω,S,Pθ?)上。
用決策的思路來描述統計問題,這個過程是我們通過對觀察到的一組樣本進行一些分析,然后從決策空間(A,A)(A,\mathbf{A})(A,A)中選擇一個決策a∈Aa \in Aa∈A,A\mathbf{A}A是AAA的一個σ\sigmaσ-代數。可以定義決策函數f:Ω→Af:\Omega \to Af:Ω→A,也就是fff是樣本空間到決策空間的一個映射。
比較常規的操作是用Markov概率轉移函數來定義一個決策過程。我們可以用轉移函數T(w,a)T(w,a)T(w,a)來表示如果觀察到樣本www,那么我們就選擇決策aaa的概率,從而給定樣本時策略的概率為Pw(a)=T(w,a)P_w(a) = T(w,a)Pw?(a)=T(w,a)。按這種理解,決策空間也是一個概率空間,可以定義概率測度QQQ為
Q(a)=(PT)(a)=∫ΩT(w,a)P(dw)Q(a) = (PT)(a) = \int_{\Omega} T(w,a)P(dw)Q(a)=(PT)(a)=∫Ω?T(w,a)P(dw)
所以決策函數其實就是兩個概率空間之間的映射。
有了樣本與決策的對應關系之后,接下來要回答的問題是觀察到一組樣本,怎么做決策才是最優的?我們可以定義損失函數L(a,θ):A×Θ→RL(a,\theta):A \times \Theta \to \mathbb{R}L(a,θ):A×Θ→R,它將參數-決策對映射到一個數,這個數表示真實參數為θ\thetaθ時,選擇決策aaa的損失。因為aaa是概率空間(A,A,Q)(A,\mathbf{A},Q)(A,A,Q)中的元素,所以L(a,θ)L(a,\theta)L(a,θ)的值是隨機數。為了便于比較,可以定義風險函數
R(θ,T)=∫AL(a,θ)Q(da)=∫A∫ΩL(a,θ)T(w,a)Pθ(dw)R(\theta,T) = \int_{A} L(a,\theta) Q(da) = \int_{A} \int_{\Omega} L(a,\theta)T(w,a)P_{\theta}(dw) R(θ,T)=∫A?L(a,θ)Q(da)=∫A?∫Ω?L(a,θ)T(w,a)Pθ?(dw)
稱這樣定義的風險為Wald風險。每一個決策函數TTT都會有一個風險與之對應,最優決策的思路是找到風險最小的那個決策函數,并用它來做決策。但Wald風險還與真實參數θ\thetaθ有關,因此具體怎么操作以后再細談。
統計決策理論是由Wald系統性地建立起來的,在此之前數理統計主要有兩個領域,以Fisher為代表的參數估計理論和以Neyman、Pearson為代表的的假設檢驗理論。統計決策理論的進步性體現在它能把這兩個領域解決的問題用同一套話語體系來描述,并給出了一些共通的方法。這個系列的博客接下來的安排是把統計決策理論需要的基礎先簡單敘述一遍,再開始介紹統計決策的理論。基礎部分需要的主要是條件概率、流形以及范疇論。條件概率是非常基礎但也很重要的的概率論工具,是鞅、Markov族的基礎。流形主要是用來處理一些和連續分布相關的分析問題。范疇是作為算子半群的推廣,用來處理一些Markov族的問題的。
總結
以上是生活随笔為你收集整理的统计决策理论1 统计问题与统计决策的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 矩阵分析与多元统计1 线性空间与线性变换
- 下一篇: UA MATH564 概率论III 期望