奇异值的几何意义
?把m*n矩陣看作從m維空間到n維空間的一個線性映射,是否:各奇異向量就是坐標軸,奇異值就是對應坐標的系數?”我猜測,題主更想知道的是奇異值在數學上的幾何含義,而非應用中的物理意義。下面簡單介紹一下奇異值的幾何含義,主要參考文獻是美國數學協會網站上的文章[1]。
下面的討論需要一點點線性代數的知識。線性代數中最讓人印象深刻的一點是,要將矩陣和空間中的線性變換視為同樣的事物。比如對角矩陣MMM作用在任何一個向量上
[3001][xy]=[3xy]\begin{bmatrix}3 & 0 \\ 0& 1\\ \end{bmatrix}\begin{bmatrix}x\\ y\\ \end{bmatrix}=\begin{bmatrix}3x\\ y\\ \end{bmatrix}[30?01?][xy?]=[3xy?]
其幾何意義為在水平方向上拉伸3倍,方向保持不變的線性變換。換言之對角矩陣起到作用是將水平垂直網格作水平拉伸(或者反射后水平拉伸)的線性變換。

如果MMM不是對角矩陣,而是一個對稱矩陣
M=[2,11,2]M=\begin{bmatrix}2,1\\ 1,2\\ \end{bmatrix}M=[2,11,2?]
那么,我們也總可以找到一組網格線,使得矩陣作用在該網格上僅僅表現為(反射)拉伸變換,而沒有旋轉變換
考慮更一般的非對稱矩陣
M=[1,10,1]M=\begin{bmatrix}1,1\\ 0,1\\ \end{bmatrix}M=[1,10,1?]
很遺憾,此時我們再也找不到一組網格,使得矩陣作用在該網格上之后只有拉伸變換(找不到背后的數學原因是對一般非對稱矩陣無法保證在實數域上可對角化,不明白也不要在意)。我們退求其次,找一組網格,使得矩陣作用在該網格上之后允許有拉伸變換和旋轉變換,但要保證變換后的網格依舊互相垂直。這是可以做到的
下面我們就可以自然過渡到奇異值分解的引入。奇異值分解的幾何含義為:對于任何的一個矩陣,我們要找到一組兩兩正交單位向量序列,使得矩陣作用在此向量序列上后得到新的向量序列保持兩兩正交。下面我們要說明的是,奇異值的幾何含義為:這組變換后的新的向量序列的長度。
v1?v2=0v_1·v_2=0v1??v2?=0
?Mv1?Mv2=0?Mv_1·Mv_2=0?Mv1??Mv2?=0
令u1u_1u1?和u2u_2u2?分別是Mv1Mv_1Mv1?和Mv2Mv_2Mv2?方向上的單位向量,
即:
Mv1=σ1u1Mv_1=\sigma_1u_1Mv1?=σ1?u1?
Mv2=σ2u2Mv_2=\sigma_2u_2Mv2?=σ2?u2?
寫在一起就是
M[v1,v2]=[σ1u1,σ2u2]M[v_1,v_2]=[\sigma_1u_1,\sigma_2u_2]M[v1?,v2?]=[σ1?u1?,σ2?u2?],整理得:
這樣就得到矩陣MMM的奇異值分解。奇異值σ1\sigma_1σ1?和σ2\sigma_2σ2?分別是Mv1Mv_1Mv1?和Mv2Mv_2Mv2?的長度。很容易可以把結論推廣到一般n維情形。
下面給出一個更簡潔更直觀的奇異值的幾何意義[2]。先來一段線性代數的推導,不想看也可以略過,直接看黑體字幾何意義部分:
假設矩陣AAA的奇異值分解為:
其中u1,u2,v1,v2u_1,u_2,v_1,v_2u1?,u2?,v1?,v2?是二維平面的向量。根據奇異值分解的性質,u1,u2u_1,u_2u1?,u2?線性無關,v1,v2v_1,v_2v1?,v2?線性無關。
那么對二維平面上任意的向量xxx,都可以表示為:
x=ξ1v1+ξ2v2x=\xi_1 v_1+\xi_2 v_2x=ξ1?v1?+ξ2?v2?
當AAA作用在xxx上時,
令η1=3ξ1,η2=ξ2\eta_1=3\xi_1,\eta_2=\xi_2η1?=3ξ1?,η2?=ξ2?,
我們可以得出結論:
如果xxx是在單位圓ξ12+ξ22=1\xi_1^2+\xi_2^2=1ξ12?+ξ22?=1上,
那么yyy正好在橢圓η1232+η2212=1\frac{\eta_1^2}{3^2}+\frac{\eta_2^2}{1^2}=132η12??+12η22??=1.
這表明:
矩陣AAA將二維平面中單位圓變換成橢圓,而兩個奇異值正好是橢圓的兩個半軸長,
長軸所在的直線是span{u1}span\{u_1\}span{u1?},
短軸所在的直線是span{u2}span\{u_2\}span{u2?},
推廣到一般情形:一般矩陣AAA將單位球∣∣x2∣∣=1||x_2||=1∣∣x2?∣∣=1變換為超橢球面
,那么矩陣AAA的每個奇異值恰好就是超橢球的每條半軸長度。
參考文獻:
[1] We Recommend a Singular Value Decomposition(Feature Column from the AMS)
[2] 徐樹方,《矩陣計算的理論與方法》,北京大學出版社。
總結
- 上一篇: theano中的Rop和Lop的详细解释
- 下一篇: 矩阵与矢量求导