概率论知识回顾(十八):协方差和相关系数
概率論知識回顧(十八)
重點(diǎn):協(xié)方差和相關(guān)系數(shù)
知識回顧用于鞏固知識和查漏補(bǔ)缺。知識回顧步驟:
知識回顧
知識解答
協(xié)方差的公式定義是什么?協(xié)方差是用來衡量什么的?
- 公式定義 C o v ( X , Y ) = E [ ( X ? E X ) ( Y ? E Y ) ] Cov(X, Y) = E[(X-EX)(Y-EY)] Cov(X,Y)=E[(X?EX)(Y?EY)]
- 協(xié)方差用來衡量隨機(jī)變量之間的相關(guān)關(guān)系的,如果 C o v ( X , Y ) = 0 Cov(X, Y) = 0 Cov(X,Y)=0, 就可以說兩個隨機(jī)變量之間不相關(guān)。
- 由于獨(dú)立的要求比相關(guān)更嚴(yán)格,即:獨(dú)立一定不相關(guān),但不相關(guān)不一定獨(dú)立。那么我們就可以進(jìn)行斷行
- 如果兩個隨機(jī)變量具有某種相關(guān)關(guān)系,那么他們一定不相互獨(dú)立。
- 如果兩個隨機(jī)變量相互獨(dú)立,那么他們就一定相關(guān)。
當(dāng)兩個隨機(jī)變量相互獨(dú)立的時候,協(xié)方差的值是什么?簡要證明并嘗試列舉和方差的關(guān)系。
- 在第一個問題中已經(jīng)得到了解答,當(dāng)兩個隨機(jī)變量相互獨(dú)立的時候,一定是不相關(guān)的,那么 C o v ( X , Y ) = 0 Cov(X, Y) = 0 Cov(X,Y)=0.
證明:首先,我們分解 C o v ( X , Y ) Cov(X, Y) Cov(X,Y) 就有:
C o v ( X , Y ) = E ( X Y ) ? X E ( Y ) ? Y E ( X ) + E ( X ) E ( Y ) = E ( X Y ) ? 2 E ( X ) E ( Y ) + E ( X ) E ( Y ) = E ( X Y ) ? E ( X ) E ( Y ) \begin{aligned} Cov(X, Y) &= E(XY) - XE(Y) - YE(X) + E(X)E(Y) \\&= E(XY) - 2E(X)E(Y) + E(X)E(Y) \\&= E(XY) - E(X)E(Y) \end{aligned} Cov(X,Y)?=E(XY)?XE(Y)?YE(X)+E(X)E(Y)=E(XY)?2E(X)E(Y)+E(X)E(Y)=E(XY)?E(X)E(Y)?
同時,如果 X , Y X,Y X,Y 相互獨(dú)立的話,有 E ( X Y ) = E ( X ) E ( Y ) E(XY) = E(X)E(Y) E(XY)=E(X)E(Y) , 因此就可知 C o v ( X , Y ) = 0 Cov(X, Y) = 0 Cov(X,Y)=0
- 另外,從協(xié)方差的定義中可以看到 , 當(dāng) X = Y X=Y X=Y 的時候, C o v ( X , Y ) = D ( X ) Cov(X, Y) = D(X) Cov(X,Y)=D(X)
- D ( X + Y ) = D ( X ) + D ( Y ) + 2 C o v ( X , Y ) D(X + Y) = D(X) + D(Y) + 2Cov(X, Y) D(X+Y)=D(X)+D(Y)+2Cov(X,Y)
證明: (從一般情況得到兩個隨機(jī)變量的情況)
由于有 D ( X ) = C o v ( X , X ) D(X) = Cov(X, X) D(X)=Cov(X,X) 因此可知 D ( ∑ i = 1 n X i ) = C o v ( ∑ i = 1 n X i , ∑ j = 1 n X j ) D(\sum_{i=1}^nX_i) = Cov(\sum_{i=1}^nX_i, \sum_{j=1}^nX_j) D(∑i=1n?Xi?)=Cov(∑i=1n?Xi?,∑j=1n?Xj?)
上面的公式是把 ∑ i = 1 n X i \sum_{i=1}^nX_i ∑i=1n?Xi? 看做一個隨機(jī)變量,這時候 ∑ i = 1 n X i \sum_{i=1}^nX_i ∑i=1n?Xi? 和 ∑ i = j n X j \sum_{i=j}^nX_j ∑i=jn?Xj? 是相等的。
同時,根據(jù)協(xié)方差的性質(zhì), C o v ( ∑ i = 1 n a i X i , ∑ j = 1 m b j Y j ) = ∑ i = 1 n ∑ j = 1 m a i b j C o v ( X i , Y j ) Cov(\sum_{i=1}^na_iX_i, \sum_{j=1}^mb_jY_j) = \sum_{i=1}^n\sum_{j=1}^ma_ib_jCov(X_i, Y_j) Cov(∑i=1n?ai?Xi?,∑j=1m?bj?Yj?)=∑i=1n?∑j=1m?ai?bj?Cov(Xi?,Yj?)
就有:
C o v ( ∑ i = 1 n X i , ∑ j = 1 n X j ) = ∑ i = 1 n ∑ j = 1 n C o v ( X i , X j ) = ∑ i = 1 n C o v ( X i , X i ) + ∑ ∑ i ≠ j C o v ( X i , X j ) = ∑ i = 1 n D ( X i ) + 2 ∑ ∑ 1 ≤ i < j ≤ n C o v ( X i , X j ) \begin{aligned}Cov(\sum_{i=1}^nX_i, \sum_{j=1}^nX_j) &= \sum_{i=1}^n\sum_{j=1}^nCov(X_i, X_j) \\&=\sum_{i=1}^nCov(X_i, X_i) + {\sum\sum}_{i\neq j}Cov(X_i, X_j) \\&= \sum_{i=1}^nD(X_i) + 2{\sum\sum}_{ 1\le i < j \le n}Cov(X_i, X_j) \end{aligned} Cov(i=1∑n?Xi?,j=1∑n?Xj?)?=i=1∑n?j=1∑n?Cov(Xi?,Xj?)=i=1∑n?Cov(Xi?,Xi?)+∑∑i??=j?Cov(Xi?,Xj?)=i=1∑n?D(Xi?)+2∑∑1≤i<j≤n?Cov(Xi?,Xj?)?
從上面的一般式就可以得出 n = 2 的情況。
簡述柯西–許瓦茲不等式以及不等式等號成立條件的證明。
-
對任意的隨機(jī)變量 X , Y X, Y X,Y, 若 E ( X 2 ) < + ∞ , E ( Y 2 ) < + ∞ E(X^2) < + \infty, E(Y^2) < +\infty E(X2)<+∞,E(Y2)<+∞, 則有 [ E ( X Y ) ] 2 ≤ E ( X 2 ) ? E ( Y 2 ) [E(XY)]^2 \le E(X^2)·E(Y^2) [E(XY)]2≤E(X2)?E(Y2), 當(dāng)且僅當(dāng) P { Y = t 0 X } = 1 P\{Y = t_0X\} = 1 P{Y=t0?X}=1 時等號成立,其中 t 0 t_0 t0? 為某常數(shù)。
證明:令 u ( t ) = E ( t X ? Y ) 2 = t 2 E ( X 2 ) ? 2 t E ( X Y ) + E ( Y 2 ) u(t) = E(tX - Y)^2 = t^2E(X^2) - 2tE(XY) + E(Y^2) u(t)=E(tX?Y)2=t2E(X2)?2tE(XY)+E(Y2) 可以知道 u ( t ) u(t) u(t) 沒有實(shí)根或者只有一個重根。因此就有 Δ = [ 2 E ( X Y ) ] 2 ? 4 E ( X 2 ) E ( Y 2 ) ≤ 0 ? [ E ( X Y ) ] 2 ≤ E ( X 2 ) ? E ( Y 2 ) \Delta = [2E(XY)]^2 - 4E(X^2)E(Y^2) \le 0 \leftrightarrow [E(XY)]^2 \le E(X^2)·E(Y^2) Δ=[2E(XY)]2?4E(X2)E(Y2)≤0?[E(XY)]2≤E(X2)?E(Y2)
如果 Δ = 0 \Delta = 0 Δ=0, 就有 存在一個 t 0 t_0 t0? 使得 E ( t X ? Y ) 2 = 0 E(tX-Y)^2=0 E(tX?Y)2=0
同時,有 0 ≤ D ( t 0 X ? Y ) = E ( t 0 X ? Y ) 2 ? [ E ( t 0 X ? Y ) ] 2 = ? [ E ( t 0 X ? Y ) ] 2 ≤ 0 0 \le D(t_0X-Y) = E(t_0X-Y)^2 - [E(t_0X-Y)]^2 = -[E(t_0X-Y)]^2 \le 0 0≤D(t0?X?Y)=E(t0?X?Y)2?[E(t0?X?Y)]2=?[E(t0?X?Y)]2≤0
因此可知 D ( t 0 X ? Y ) = 0 , E ( t 0 X ? Y ) = 0 D(t_0X-Y) = 0, E(t_0X-Y)=0 D(t0?X?Y)=0,E(t0?X?Y)=0
根據(jù)方差的性質(zhì)有: D ( X ) = 0 D(X)=0 D(X)=0的充要條件是存在常數(shù)C使得 P { X = C } = 1 P\{X=C\}=1 P{X=C}=1, 其中 C = E ( X ) C = E(X) C=E(X)
這里,我們使 Z = t 0 X ? Y Z = t_0X-Y Z=t0?X?Y 有 D ( Z ) = 0 , E ( Z ) = 0 D(Z) = 0, E(Z) = 0 D(Z)=0,E(Z)=0 因此有 P { Z = 0 } = 1 ? P { t 0 X ? Y = 0 } = 1 ? P { t 0 X = Y } = 1 P\{Z=0\}=1 \leftrightarrow P\{t_0X-Y=0\} = 1 \leftrightarrow P\{t_0X=Y\}=1 P{Z=0}=1?P{t0?X?Y=0}=1?P{t0?X=Y}=1
-
將上面的公式里面的 X X X 替換成 X ? E ( X ) X-E(X) X?E(X), Y Y Y 替換成 Y ? E ( Y ) Y - E(Y) Y?E(Y) 就有 [ C o v ( X , Y ) ] 2 ≤ D ( X ) D ( Y ) [Cov(X, Y)]^2 \le D(X)D(Y) [Cov(X,Y)]2≤D(X)D(Y)
相關(guān)系數(shù)的公式定義是什么?它又是用來衡量什么的?為什么要是用相關(guān)系數(shù)?
- ρ X Y = C o v ( X , Y ) D ( X ) D ( Y ) = C o v ( X ? E ( X ) D ( X ) , Y ? E ( Y ) D ( Y ) ) = C o v ( X ? , Y ? ) \rho_{XY} = \frac{Cov(X, Y)}{\sqrt{D(X)}\sqrt{D(Y)}} = Cov(\frac{X-E(X)}{\sqrt{D(X)}},\frac{Y-E(Y)}{\sqrt{D(Y)}}) = Cov(X^*, Y^*) ρXY?=D(X)?D(Y)?Cov(X,Y)?=Cov(D(X)?X?E(X)?,D(Y)?Y?E(Y)?)=Cov(X?,Y?)
- 相關(guān)系數(shù)和協(xié)方差的關(guān)系就類似于變異系數(shù)和方差的關(guān)系一樣,它是協(xié)方差的標(biāo)準(zhǔn)化表示,也是表示隨機(jī)變量之間相關(guān)關(guān)系的表示,于協(xié)方差不同的是,協(xié)方差容易受隨機(jī)變量本身數(shù)值大小的影響,由于相關(guān)系數(shù)是進(jìn)行標(biāo)準(zhǔn)化后的度量,因此可以更好的度量相關(guān)關(guān)系。
給出隨機(jī)變量 X , Y X,Y X,Y 不相關(guān)的幾條等價表示。
- C o v ( X , Y ) = 0 Cov(X, Y) = 0 Cov(X,Y)=0
- ρ X Y = 0 \rho_{XY} = 0 ρXY?=0
- D ( X ± Y ) = D ( X ) + D ( Y ) D(X \pm Y) = D(X) + D(Y) D(X±Y)=D(X)+D(Y)
- E ( X Y ) = E ( X ) E ( Y ) E(XY) = E(X)E(Y) E(XY)=E(X)E(Y)
給出相關(guān)系數(shù) ρ X Y \rho_{XY} ρXY? 兩條性質(zhì)的證明。
-
∣ ρ X Y ∣ ≤ 1 |\rho_{XY}| \le 1 ∣ρXY?∣≤1
證明:令 X ? = X ? E ( X ) D ( X ) , Y ? = Y ? E ( Y ) D ( Y ) X^* = \frac{X-E(X)}{\sqrt{D(X)}},Y^* = \frac{Y-E(Y)}{\sqrt{D(Y)}} X?=D(X)?X?E(X)?,Y?=D(Y)?Y?E(Y)?。 有 D ( X ? ) = 1 , D ( Y ? ) = 1 D(X^*) = 1, D(Y^*)=1 D(X?)=1,D(Y?)=1
同時,根據(jù)第三問中的結(jié)論 [ C o v ( X , Y ) ] 2 ≤ D ( X ) D ( Y ) [Cov(X, Y)]^2 \le D(X)D(Y) [Cov(X,Y)]2≤D(X)D(Y) 可知 ρ X Y 2 ≤ D ( X ? ) D ( Y ? ) = 1 \rho_{XY}^2 \le D(X^*)D(Y^*) = 1 ρXY2?≤D(X?)D(Y?)=1
因此可知 ∣ ρ X Y ∣ ≤ 1 |\rho_{XY}| \le 1 ∣ρXY?∣≤1
-
∣ ρ X Y ∣ = 1 |\rho_{XY}| = 1 ∣ρXY?∣=1 的充要條件是 X 與 Y 以概率 1 線性相關(guān),即存在常數(shù) a 和 b 使得 P { Y = a X + b } = 1 P\{Y = aX + b\} = 1 P{Y=aX+b}=1。即
- ρ X Y = 1 \rho_{XY} = 1 ρXY?=1 當(dāng)且僅當(dāng) P { Y ? E ( Y ) D ( Y ) = X ? E ( X ) D ( X ) } = 1 P\{\frac{Y-E(Y)}{\sqrt{D(Y)}} = \frac{X-E(X)}{\sqrt{D(X)}}\} = 1 P{D(Y)?Y?E(Y)?=D(X)?X?E(X)?}=1
- ρ X Y = ? 1 \rho_{XY} = -1 ρXY?=?1 當(dāng)且僅當(dāng) P { Y ? E ( Y ) D ( Y ) = ? X ? E ( X ) D ( X ) } = 1 P\{\frac{Y-E(Y)}{\sqrt{D(Y)}} = -\frac{X-E(X)}{\sqrt{D(X)}}\} = 1 P{D(Y)?Y?E(Y)?=?D(X)?X?E(X)?}=1
證明:
∣ ρ X Y ∣ = 1 ? ρ X Y 2 = 1 ? [ E ( X ? Y ? ) ? E ( X ? ) E ( Y ? ) ] 2 = 1 |\rho_{XY}| = 1 \leftrightarrow \rho_{XY}^2 = 1 \leftrightarrow [E(X^*Y^*) - E(X^*)E(Y^*)]^2=1 ∣ρXY?∣=1?ρXY2?=1?[E(X?Y?)?E(X?)E(Y?)]2=1
同時,由于 E ( X ? ) = E ( Y ? ) = 0 , E ( X ? ) 2 = E ( Y ? ) 2 = 1 E(X^*) = E(Y^*)=0, E(X^*)^2 = E(Y^*)^2=1 E(X?)=E(Y?)=0,E(X?)2=E(Y?)2=1
可以知道
[ E ( X ? Y ? ) ? E ( X ? ) E ( Y ? ) ] 2 = [ E ( X ? Y ? ) ] 2 = 1 = E ( X ? ) 2 E ( Y ? ) 2 [E(X^*Y^*) - E(X^*)E(Y^*)]^2 = [E(X^*Y^*)]^2 = 1 = E(X^*)^2E(Y^*)^2 [E(X?Y?)?E(X?)E(Y?)]2=[E(X?Y?)]2=1=E(X?)2E(Y?)2
根據(jù) 柯西–許瓦茲不等式我們知道,滿足上面等式的當(dāng)且僅當(dāng)存在 t 0 t_0 t0? 使得 P { Y ? = C X ? } = 1 P\{Y^* = CX^*\} =1 P{Y?=CX?}=1
因此有
P { Y ? E ( Y ) D ( Y ) = C X ? E ( X ) D ( X ) } ? P { Y = C D ( Y ) D ( X ) X + ( E ( Y ) ? C E ( X ) D ( Y ) D ( X ) ) } P\{\frac{Y-E(Y)}{\sqrt{D(Y)}} = C\frac{X-E(X)}{\sqrt{D(X)}}\} \leftrightarrow P\{Y = C\frac{\sqrt{D(Y)}}{\sqrt{D(X)}}X + (E(Y) - CE(X)\frac{\sqrt{D(Y)}}{\sqrt{D(X)}})\} P{D(Y)?Y?E(Y)?=CD(X)?X?E(X)?}?P{Y=CD(X)?D(Y)??X+(E(Y)?CE(X)D(X)?D(Y)??)}
根據(jù)上面的公式,很明顯,令 a = C D ( Y ) D ( X ) , b = E ( Y ) ? C E ( X ) D ( Y ) D ( X ) a = C\frac{\sqrt{D(Y)}}{\sqrt{D(X)}}, b= E(Y) - CE(X)\frac{\sqrt{D(Y)}}{\sqrt{D(X)}} a=CD(X)?D(Y)??,b=E(Y)?CE(X)D(X)?D(Y)?? 就能得到 Y = a X + b Y = aX+b Y=aX+b
同理,根據(jù) ρ X Y = 1 \rho_{XY} = 1 ρXY?=1 有 Y ? = C X ? Y^* = CX^* Y?=CX?
就有 C o v ( X ? , Y ? ) = C o v ( X ? , C X ? ) = C D ( X ? ) = C = 1 Cov(X^*, Y^*) = Cov(X^*, CX^*) = CD(X*) = C = 1 Cov(X?,Y?)=Cov(X?,CX?)=CD(X?)=C=1, 證畢。
同理當(dāng) ρ X Y = ? 1 \rho_{XY} = -1 ρXY?=?1 也可證明。
總結(jié)
以上是生活随笔為你收集整理的概率论知识回顾(十八):协方差和相关系数的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 数据结构C语言实现顺序表——增删查改操作
- 下一篇: 解决 Mac 插上耳机输出(也适用于外接