UA MATH567 高维统计IV Lipschitz组合10 随机矩阵的Bernstein不等式
UA MATH567 高維統計IV Lipschitz組合10 隨機矩陣的Bernstein不等式
隨機矩陣的Bernstein不等式
假設X1,?,XNX_1,\cdots,X_NX1?,?,XN?是一列獨立對稱零均值的隨機矩陣,sup?i∥Xi∥≤K,a.s.\sup_i \left\| X_i \right\| \le K,a.s.supi?∥Xi?∥≤K,a.s.,則?t>0\forall t > 0?t>0,
P(∥∑i=1NXi∥≥t)≤2ne?t2/2σ2+Kt/3P(\left\| \sum_{i=1}^N X_i \right\| \ge t) \le 2n e^{-\frac{t^2/2}{\sigma^2+Kt/3}}P(∥∥∥∥∥?i=1∑N?Xi?∥∥∥∥∥?≥t)≤2ne?σ2+Kt/3t2/2?
其中σ2=∥∑i=1NEXi2∥\sigma^2 = \left\| \sum_{i=1}^N EX_i^2 \right\|σ2=∥∥∥?∑i=1N?EXi2?∥∥∥?。
引理 矩母函數的半正定序上界 假設XXX是一個nnn階實對稱陣零均值隨機向量,∥X∥≤K,a.s.\left\| X\right\| \le K,a.s.∥X∥≤K,a.s.,則當∣λ∣<3/K|\lambda|<3/K∣λ∣<3/K時,
eg(λ)EX2≥EeλXe^{g(\lambda)EX^2}\ge Ee^{\lambda X} eg(λ)EX2≥EeλX
其中
g(λ)=λ2/21?∣λ∣K/3g(\lambda) = \frac{\lambda^2/2}{1-|\lambda|K/3}g(λ)=1?∣λ∣K/3λ2/2?
證明
主要思路是Taylor展開,對于∣z∣<3|z|<3∣z∣<3,
ez=1+z+z22+?=1+z+z2∑p=2∞zp?2/p!e^z = 1+z+\frac{z^2}{2}+\cdots =1+z+z^2 \sum_{p=2}^{\infty}z^{p-2}/p!ez=1+z+2z2?+?=1+z+z2p=2∑∞?zp?2/p!
可以驗證對于p≥2p \ge 2p≥2,
p!≥2×3p?2p! \ge 2 \times 3^{p-2}p!≥2×3p?2
于是
ez≤1+z+z2∑p=2∞zp?2/(2×3p?2)=1+z+z2211?∣z∣/3e^z \le 1+z+z^2 \sum_{p=2}^{\infty} z^{p-2}/(2 \times 3^{p-2}) = 1+z+\frac{z^2}{2}\frac{1}{1-|z|/3}ez≤1+z+z2p=2∑∞?zp?2/(2×3p?2)=1+z+2z2?1?∣z∣/31?
接下來做換元,z=λxz = \lambda xz=λx,∣x∣≤K|x| \le K∣x∣≤K,∣λ∣<3/K|\lambda|<3/K∣λ∣<3/K,則
eλx≤1+λx+g(λ)x2e^{\lambda x} \le 1+\lambda x+g(\lambda )x^2eλx≤1+λx+g(λ)x2
我們需要的是矩陣形式,上一講介紹過矩陣函數,對于指數函數與多項式函數,我們可以直接用矩陣記號,于是
I+λX+g(λ)X2?eλXI+\lambda X+g(\lambda)X^2 \succcurlyeq e^{\lambda X}I+λX+g(λ)X2?eλX
根據積分的保序性,
I+g(λ)EX2≥EeλXI+g(\lambda)EX^2 \ge Ee^{\lambda X}I+g(λ)EX2≥EeλX
根據Bernoulli不等式
eg(λ)EX2≥I+g(λ)EX2e^{g(\lambda )EX^2} \ge I+g(\lambda)EX^2eg(λ)EX2≥I+g(λ)EX2
于是引理得證。
證明Bernstein不等式
記S=∑i=1NXi,∥S∥=max?i∣λi(S)∣=max?(∣λ1(S)∣,∣λi(S)∣)S=\sum_{i=1}^N X_i ,\left\| S \right\|=\max_i | \lambda_i(S)|=\max(|\lambda_1(S)|,|\lambda_i(S)|)S=i=1∑N?Xi?,∥S∥=imax?∣λi?(S)∣=max(∣λ1?(S)∣,∣λi?(S)∣)
我們用Markov不等式,
P(λ1(S)≥t)=P(eηλ1(S)≥eηt)≤e?ηtEeηλ1(S)=e?ηtEλ1(eηS)≤Etr(eηS)P(\lambda_1(S) \ge t) = P(e^{\eta \lambda_1(S)} \ge e^{\eta t}) \le e^{-\eta t}Ee^{\eta \lambda_1(S)} \\ = e^{-\eta t}E\lambda_1(e^{\eta S}) \le Etr(e^{\eta S})P(λ1?(S)≥t)=P(eηλ1?(S)≥eηt)≤e?ηtEeηλ1?(S)=e?ηtEλ1?(eηS)≤Etr(eηS)
最后一個不等式是因為對任意實對稱矩陣AAA
tr(A)=∑i=1nλi(A)≥λ1(A)tr(A) = \sum_{i=1}^n \lambda_i(A) \ge \lambda_1(A)tr(A)=i=1∑n?λi?(A)≥λ1?(A)
用FN\mathcal{F}_NFN?表示σ(X1,?,XN)\sigma(X_1,\cdots,X_N)σ(X1?,?,XN?),也就是這個隨機矩陣序列的自然濾波,則
Etr(eηS)=EFN?1EXNtr(e∑i=1N?1ηXi+ηXN)Etr(e^{\eta S}) = E_{\mathcal{F}_{N-1}}E_{X_{N}}tr(e^{\sum_{i=1}^{N-1}\eta X_i+\eta X_N})Etr(eηS)=EFN?1??EXN??tr(e∑i=1N?1?ηXi?+ηXN?)
根據Lieb不等式,
EFN?1EXNtr(e∑i=1N?1ηXi+ηXN)≤EFN?1tr(e∑i=1N?1ηXi+log?EXNeηXN)E_{\mathcal{F}_{N-1}}E_{X_{N}}tr(e^{\sum_{i=1}^{N-1}\eta X_i+\eta X_N}) \le E_{\mathcal{F}_{N-1}}tr(e^{\sum_{i=1}^{N-1}\eta X_i+\log E_{X_N} e^{\eta X_N}})EFN?1??EXN??tr(e∑i=1N?1?ηXi?+ηXN?)≤EFN?1??tr(e∑i=1N?1?ηXi?+logEXN??eηXN?)
這樣就得到了關于這個矩陣序列的遞歸式,通過遞歸我們有
Etr(eηS)≤tr(e∑i=1Nlog?EeηXi)Etr(e^{\eta S}) \le tr(e^{\sum_{i=1}^N\log Ee^{\eta X_i}})Etr(eηS)≤tr(e∑i=1N?logEeηXi?)
根據引理,
EeηXi≤eg(η)EXi2Ee^{\eta X_i} \le e^{g(\eta)EX_i^2}EeηXi?≤eg(η)EXi2?
于是
tr(e∑i=1Nlog?EeηXi)≤tr(eg(η)∑i=1NEXi2)=tr(eg(η)z)tr(e^{\sum_{i=1}^N\log Ee^{\eta X_i}}) \le tr(e^{g(\eta)\sum_{i=1}^N EX_i^2}) = tr(e^{g(\eta) z})tr(e∑i=1N?logEeηXi?)≤tr(eg(η)∑i=1N?EXi2?)=tr(eg(η)z)
其中z=∑i=1NEXi2z=\sum_{i=1}^N EX_i^2z=∑i=1N?EXi2?,這是一個n×nn \times nn×n的實對稱矩陣,
tr(eg(η)z)≤nλ1(eg(η)z)=neg(η)λ1(z)=neg(η)∥z∥=neg(η)σ2tr(e^{g(\eta)z}) \le n\lambda_1(e^{g(\eta)z}) = ne^{g(\eta)\lambda_1(z)}=ne^{g(\eta)\left\| z \right\|}=ne^{g(\eta)\sigma^2}tr(eg(η)z)≤nλ1?(eg(η)z)=neg(η)λ1?(z)=neg(η)∥z∥=neg(η)σ2
第一個不等號是因為對任意實對稱矩陣AAA
tr(A)=∑i=1nλi(A)≤nλ1(A)tr(A) = \sum_{i=1}^n \lambda_i(A) \le n\lambda_1(A)tr(A)=i=1∑n?λi?(A)≤nλ1?(A)
綜上,
P(λ1(S)≥t)≤ne?ηteg(η)σ2P(\lambda_1(S) \ge t) \le ne^{-\eta t}e^{g(\eta)\sigma^2}P(λ1?(S)≥t)≤ne?ηteg(η)σ2
選擇使得這個上界最小的η\etaη,比如可以選擇λ=t/(σ2+Kt/3)\lambda=t/(\sigma^2+Kt/3)λ=t/(σ2+Kt/3),則
P(λ1(S)≥t)≤ne?t2/2σ2+Kt3P(\lambda_1(S) \ge t) \le ne^{-\frac{t^2/2}{\sigma^2+\frac{Kt}{3}}}P(λ1?(S)≥t)≤ne?σ2+3Kt?t2/2?
我們可以重復這個過程,分析λn(S)\lambda_n(S)λn?(S),即可得到Bernstein不等式。
總結
以上是生活随笔為你收集整理的UA MATH567 高维统计IV Lipschitz组合10 随机矩阵的Bernstein不等式的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: UA MATH567 高维统计IV Li
- 下一篇: UA MATH567 高维统计IV Li