UA MATH567 高维统计III 随机矩阵6 亚高斯矩阵的范数
UA MATH567 高維統(tǒng)計(jì)III 隨機(jī)矩陣6 亞高斯矩陣的范數(shù)
在前五講的理論基礎(chǔ)上,我們現(xiàn)在開始正式討論隨機(jī)矩陣。假設(shè)AAA是一個(gè)m×nm \times nm×n的隨機(jī)矩陣,它的元素AijA_{ij}Aij?是互相獨(dú)立的零均值的亞高斯隨機(jī)變量,關(guān)于它的范數(shù)有下面的結(jié)論
隨機(jī)矩陣的范數(shù) K=max?i,j∥Aij∥ψ2K=\max_{i,j}\left\| A_{ij} \right\|_{\psi_2}K=maxi,j?∥Aij?∥ψ2??, ?t>0\forall t>0?t>0
P(∥A∥?K(m+n+t))≥1?2e?t2P(\left\| A\right\| \lesssim K(\sqrt{m}+\sqrt{n}+t)) \ge 1-2e^{-t^2}P(∥A∥?K(m?+n?+t))≥1?2e?t2
這個(gè)結(jié)果說(shuō)明矩陣AAA的范數(shù)的尾部概率也具有亞高斯性。如果AAA是n×nn \times nn×n的對(duì)稱陣,則
P(∥A∥?K(n+t))≥1?4e?t2P(\left\| A\right\| \lesssim K(\sqrt{n}+t)) \ge 1-4e^{-t^2}P(∥A∥?K(n?+t))≥1?4e?t2
證明
第一步,我們先考慮一下算子范數(shù),
∥A∥=max?x∈Sn?1y∈Sm?1?Ax,y?\left\| A \right\| = \max_{x \in S^{n-1} \\ y \in S^{m-1}}\langle Ax,y\rangle∥A∥=x∈Sn?1y∈Sm?1max??Ax,y?
存在x∈Sn?1,y∈Sm?1x \in S^{n-1},y \in S^{m-1}x∈Sn?1,y∈Sm?1使得∥A∥=?Ax,y?\left\| A \right\|=\langle Ax,y\rangle∥A∥=?Ax,y?,假設(shè)N\mathcal{N}N是Sn?1S^{n-1}Sn?1的一個(gè)?\epsilon?-net(根據(jù)第四講的討論,我們總是可以用一個(gè)球框住這樣的集網(wǎng),因此不失一般性,我們可以構(gòu)造cardinality滿足∣N∣<9n,∣M∣<9m|\mathcal{N}|<9^n,|\mathcal{M}|<9^m∣N∣<9n,∣M∣<9m的集網(wǎng)),M\mathcal{M}M是Sm?1S^{m-1}Sm?1的一個(gè)?\epsilon?-net,則根據(jù)定義?x0∈N,?y0∈M\exists x_0 \in \mathcal{N},\exists y_0 \in \mathcal{M}?x0?∈N,?y0?∈M,∥x?x0∥2≤?,∥y?y0∥2≤?\left\| x-x_0\right\|_2 \le \epsilon,\left\| y-y_0\right\|_2 \le \epsilon∥x?x0?∥2?≤?,∥y?y0?∥2?≤?,計(jì)算
?Ax0,y0?=?Ax,y?+?A(x?x0),y?+?Ax0,y0?y?\langle Ax_0,y_0\rangle=\langle Ax,y\rangle+\langle A(x-x_0),y\rangle+\langle Ax_0,y_0-y\rangle?Ax0?,y0??=?Ax,y?+?A(x?x0?),y?+?Ax0?,y0??y?
其中第二項(xiàng)滿足
?A(x?x0),y?≥?∥A(x?x0)∥2∥y∥2=?∥A(x?x0)∥2≥??∥A∥\langle A(x-x_0),y\rangle\ge -\left\| A(x-x_0)\right\|_2\left\| y\right\|_2 \\ =-\left\| A(x-x_0)\right\|_2 \ge -\epsilon \left\| A \right\| ?A(x?x0?),y?≥?∥A(x?x0?)∥2?∥y∥2?=?∥A(x?x0?)∥2?≥??∥A∥
類似地,第三項(xiàng)滿足
?Ax0,y0?y?≥??∥A∥\langle Ax_0,y_0-y\rangle \ge -\epsilon \left\| A \right\|?Ax0?,y0??y?≥??∥A∥
因此
∥A∥≤11?2??Ax0,y0?≤11?2?max?x∈Ny∈M?Ax,y?\left\| A \right\| \le \frac{1}{1-2\epsilon}\langle Ax_0,y_0\rangle \le \frac{1}{1-2\epsilon}\max_{x \in \mathcal{N} \\ y \in \mathcal{M}}\langle Ax,y\rangle∥A∥≤1?2?1??Ax0?,y0??≤1?2?1?x∈Ny∈Mmax??Ax,y?
第二步,我們討論隨機(jī)矩陣的二次型,?x∈N,y∈M\forall x \in \mathcal{N}, y \in \mathcal{M}?x∈N,y∈M,
?Ax,y?=∑i=1n∑j=1mAijxixj\langle Ax,y\rangle=\sum_{i=1}^n \sum_{j=1}^m A_{ij}x_ix_j?Ax,y?=i=1∑n?j=1∑m?Aij?xi?xj?
于是根據(jù)推廣Hoeffding不等式的第一個(gè)結(jié)論,?C>0\exists C>0?C>0,
∥?Ax,y?∥ψ2≤C∑i=1n∑j=1m∥Aijxixj∥ψ2=C∑i=1n∑j=1mxi2yj2∥Aij∥ψ2≤C∑i=1n∑j=1mxi2yj2K2=CK2\left\| \langle Ax,y\rangle\right\|_{\psi_2} \le C \sum_{i=1}^n \sum_{j=1}^m \left\| A_{ij}x_ix_j\right\|_{\psi_2} \\ = C \sum_{i=1}^n \sum_{j=1}^mx_i^2y_j^2 \left\| A_{ij}\right\|_{\psi_2} \le C \sum_{i=1}^n \sum_{j=1}^mx_i^2y_j^2 K^2 = CK^2∥?Ax,y?∥ψ2??≤Ci=1∑n?j=1∑m?∥Aij?xi?xj?∥ψ2??=Ci=1∑n?j=1∑m?xi2?yj2?∥Aij?∥ψ2??≤Ci=1∑n?j=1∑m?xi2?yj2?K2=CK2
這說(shuō)明?Ax,y?\langle Ax,y\rangle?Ax,y?是亞高斯的。
第三步,使用亞高斯性,
P(?Ax,y?≥u)≤2e?cu2/K2,?c>0P(\langle Ax,y\rangle \ge u) \le 2 e^{-cu^2/K^2},\exists c>0P(?Ax,y?≥u)≤2e?cu2/K2,?c>0
于是
P(max?x∈Ny∈M?Ax,y?≥u)≤∑x∈Ny∈MP(?Ax,y?≥u)≤9m+n2e?cu2/K2=2e(m+n)log?9?cu2/K2P(\max_{x \in \mathcal{N} \\ y \in \mathcal{M}}\langle Ax,y\rangle \ge u) \le \sum_{x \in \mathcal{N} \\ y \in \mathcal{M}} P(\langle Ax,y\rangle \ge u) \\ \le 9^{m+n}2 e^{-cu^2/K^2}=2e^{(m+n)\log 9-cu^2/K^2}P(x∈Ny∈Mmax??Ax,y?≥u)≤x∈Ny∈M∑?P(?Ax,y?≥u)≤9m+n2e?cu2/K2=2e(m+n)log9?cu2/K2
因?yàn)?span id="ze8trgl8bvbq" class="katex--inline">uuu可以任意選取,為了使這個(gè)尾部概率盡可能小,我們希望通過(guò)選取uuu使得這個(gè)概率的上界在m,nm,nm,n趨于無(wú)窮時(shí)收斂到0,一種可行的選取是
u=C′K(m+n+t)u2≥C′2K2(m+n+t)u = C'K(\sqrt{m}+\sqrt{n}+t) \\ u^2 \ge C'^2K^2(m+n+t)u=C′K(m?+n?+t)u2≥C′2K2(m+n+t)
其中C′>0C'>0C′>0是個(gè)常數(shù),于是
2e(m+n)log?9?cu2/K2≥2e(m+n)log?9?cC′2(m+n)?cC′2t2e^{(m+n)\log 9-cu^2/K^2} \ge 2e^{(m+n)\log 9-cC'^2(m+n)-cC'^2t}2e(m+n)log9?cu2/K2≥2e(m+n)log9?cC′2(m+n)?cC′2t
選取C′C'C′使得
(m+n)log?9?cC′2(m+n)<0,cC′2≥1(m+n)\log 9-cC'^2(m+n)<0,cC'^2 \ge 1(m+n)log9?cC′2(m+n)<0,cC′2≥1
則
2e(m+n)log?9?cC′2(m+n)?cC′2t≥2e?2t22e^{(m+n)\log 9-cC'^2(m+n)-cC'^2t} \ge 2e^{-2t^2}2e(m+n)log9?cC′2(m+n)?cC′2t≥2e?2t2
這樣我們就說(shuō)明了?C>0\exists C>0?C>0
P(∥A∥≤CK(m+n+t))≥1?2e?t2P(\left\| A\right\| \le C K(\sqrt{m}+\sqrt{n}+t)) \ge 1-2e^{-t^2}P(∥A∥≤CK(m?+n?+t))≥1?2e?t2
第四步,說(shuō)明對(duì)稱的情況,如果AT=AA^T=AAT=A,我們是不能直接用第三步的結(jié)果的,因?yàn)榍叭降玫降慕Y(jié)論要求AAA的所有分量都是獨(dú)立的,而對(duì)稱的矩陣自帶約束Aij=AjiA_{ij}=A_{ji}Aij?=Aji?,因此關(guān)于主對(duì)角線對(duì)稱的兩個(gè)元素必定不獨(dú)立。一種拆分方法是我們把對(duì)稱矩陣沿主對(duì)角線拆開:
A=A++A?A=A^+ + A^-A=A++A?
其中A+A^+A+表示下三角部分(包含主對(duì)角線,上三角部分為0),A?A^-A?表示上三角部分(不包含主對(duì)角線,主對(duì)角線及下三角部分為0),于是
∥A∥=∥A+∥+∥A?∥\left\| A\right\| =\left\| A^+\right\|+\left\| A^-\right\| ∥A∥=∥∥?A+∥∥?+∥∥?A?∥∥?
分別對(duì)∥A+∥\left\| A^+\right\|∥A+∥與∥A?∥\left\| A^-\right\|∥A?∥使用前三步的結(jié)論即可。
總結(jié)
以上是生活随笔為你收集整理的UA MATH567 高维统计III 随机矩阵6 亚高斯矩阵的范数的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: UA MATH563 概率论的数学基础
- 下一篇: UA MATH567 高维统计III 随