矩阵的物理意义
轉(zhuǎn)載自:http://blog.csdn.net/NightkidLi_911/article/category/2428737
(一)
如果不熟悉線性代數(shù)的概念,要去學(xué)習(xí)自然科學(xué),現(xiàn)在看來就和文盲差不多。”,然而“按照現(xiàn)行的國際標(biāo)準(zhǔn),線性代數(shù)是通過公理化來表述的,它是第二代數(shù)學(xué)模型,這就帶來了教學(xué)上的困難。”
*?矩陣究竟是什么東西?
向量可以被認(rèn)為是具有n個(gè)相互獨(dú)立的性質(zhì)(維度)的對象的表示,矩陣又是什么呢?我們?nèi)绻J(rèn)為矩陣是一組列(行)向量組成的新的復(fù)合向量的展開式,那么為什么這種展開式具有如此廣泛的應(yīng)用?特別是,為什么偏偏二維的展開式如此有用?如果矩陣中每一個(gè)元素又是一個(gè)向量,那么我們再展開一次,變成三維的立方陣,是不是更有用?
*?矩陣的乘法規(guī)則究竟為什么這樣規(guī)定?
為什么這樣一種怪異的乘法規(guī)則卻能夠在實(shí)踐中發(fā)揮如此巨大的功效?很多看上去似乎是完全不相關(guān)的問題,最后竟然都?xì)w結(jié)到矩陣的乘法,這難道不是很奇妙的事情?難道在矩陣乘法那看上去莫名其妙的規(guī)則下面,包含著世界的某些本質(zhì)規(guī)律?如果是的話,這些本質(zhì)規(guī)律是什么?
*?行列式究竟是一個(gè)什么東西?
為什么會有如此怪異的計(jì)算規(guī)則?行列式與其對應(yīng)方陣本質(zhì)上是什么關(guān)系?為什么只有方陣才有對應(yīng)的行列式,而一般矩陣就沒有(不要覺得這個(gè)問題很蠢,如果必要,針對m x n矩陣定義行列式不是做不到的,之所以不做,是因?yàn)闆]有這個(gè)必要,但是為什么沒有這個(gè)必要)?而且,行列式的計(jì)算規(guī)則,看上去跟矩陣的任何計(jì)算規(guī)則都沒有直觀的聯(lián)系,為什么又在很多方面決定了矩陣的性質(zhì)?難道這一切僅是巧合?
*?矩陣為什么可以分塊計(jì)算?
分塊計(jì)算這件事情看上去是那么隨意,為什么竟是可行的?
*?對于矩陣轉(zhuǎn)置運(yùn)算AT,有(AB)T = (B)T(A)T,對于矩陣求逆運(yùn)算A-1,有(AB)-1 = (B)-1(A)-1。兩個(gè)看上去完全沒有什么關(guān)系的運(yùn)算,為什么有著類似的性質(zhì)?這僅僅是巧合嗎?
*?為什么說P-1AP得到的矩陣與A矩陣“相似”?這里的“相似”是什么意思?
*?特征值和特征向量的本質(zhì)是什么?
它們定義就讓人很驚訝,因?yàn)锳x =λx,一個(gè)諾大的矩陣的效應(yīng),竟然不過相當(dāng)于一個(gè)小小的數(shù)λ,確實(shí)有點(diǎn)奇妙。但何至于用“特征”甚至“本征”來界定?它們刻劃的究竟是什么?
?
今天先談?wù)剬€形空間和矩陣的幾個(gè)核心概念的理解。首先說說空間(space),這個(gè)概念是現(xiàn)代數(shù)學(xué)的命根子之一,從拓?fù)淇臻g開始,一步步往上加定義,可以形成很多空間。線形空間其實(shí)還是比較初級的,如果在里面定義了范數(shù),就成了賦范線性空間。賦范線性空間滿足完備性,就成了巴那赫空間;賦范線性空間中定義角度,就有了內(nèi)積空間,內(nèi)積空間再滿足完備性,就得到希爾伯特空間。
總之,空間有很多種。你要是去看某種空間的數(shù)學(xué)定義,大致都是“存在一個(gè)集合,在這個(gè)集合上定義某某概念,然后滿足某些性質(zhì)”,就可以被稱為空間。這未免有點(diǎn)奇怪,為什么要用“空間”來稱呼一些這樣的集合呢?大家將會看到,其實(shí)這是很有道理的。
我們一般人最熟悉的空間,毫無疑問就是我們生活在其中的(按照牛頓的絕對時(shí)空觀)的三維空間,從數(shù)學(xué)上說,這是一個(gè)三維的歐幾里德空間,我們先不管那么多,先看看我們熟悉的這樣一個(gè)空間有些什么最基本的特點(diǎn)。仔細(xì)想想我們就會知道,這個(gè)三維的空間:1.?由很多(實(shí)際上是無窮多個(gè))位置點(diǎn)組成;2.?這些點(diǎn)之間存在相對的關(guān)系;3.?可以在空間中定義長度、角度;4.?這個(gè)空間可以容納運(yùn)動,這里我們所說的運(yùn)動是從一個(gè)點(diǎn)到另一個(gè)點(diǎn)的移動(變換),而不是微積分意義上的“連續(xù)”性的運(yùn)動,事實(shí)上,不管是什么空間,都必須容納和支持在其中發(fā)生的符合規(guī)則的運(yùn)動(變換)。你會發(fā)現(xiàn),在某種空間中往往會存在一種相對應(yīng)的變換,比如拓?fù)淇臻g中有拓?fù)渥儞Q,線性空間中有線性變換,仿射空間中有仿射變換,其實(shí)這些變換都只不過是對應(yīng)空間中允許的運(yùn)動形式而已。
因此只要知道,“空間”是容納運(yùn)動的一個(gè)對象集合,而變換則規(guī)定了對應(yīng)空間的運(yùn)動。
?
下面我們來看看線性空間。線性空間的定義任何一本書上都有(線性空間是這樣一種集合,其中任意兩元素相加可構(gòu)成此集合內(nèi)的另一元素,任意元素與任意數(shù)(可以是實(shí)數(shù)也可以是復(fù)數(shù),也可以是任意給定域中的元素)相乘后得到此集合內(nèi)的另一元素。),但是既然我們承認(rèn)線性空間是個(gè)空間,那么有兩個(gè)最基本的問題必須首先得到解決,那就是:
1.?空間是一個(gè)對象集合,線性空間也是空間,所以也是一個(gè)對象集合。那么線性空間是什么樣的對象的集合?或者說,線性空間中的對象有什么共同點(diǎn)嗎?
2.?線性空間中的運(yùn)動如何表述的?也就是,線性變換是如何表示的?
我們先來回答第一個(gè)問題,回答這個(gè)問題的時(shí)候其實(shí)是不用拐彎抹角的,可以直截了當(dāng)?shù)慕o出答案。線性空間中的任何一個(gè)對象,通過選取基和坐標(biāo)的辦法,都可以表達(dá)為向量的形式。通常的向量空間我就不說了,舉兩個(gè)不那么平凡的例子:
L1.?最高次項(xiàng)不大于n次的多項(xiàng)式的全體構(gòu)成一個(gè)線性空間,也就是說,這個(gè)線性空間中的每一個(gè)對象是一個(gè)多項(xiàng)式。如果我們以x0, x1, ...,xn為基,那么任何一個(gè)這樣的多項(xiàng)式都可以表達(dá)為一組n+1維向量,其中的每一個(gè)分量ai其實(shí)就是多項(xiàng)式中x(i-1)項(xiàng)的系數(shù)。值得說明的是,基的選取有多種辦法,只要所選取的那一組基線性無關(guān)就可以。這要用到后面提到的概念了,所以這里先不說,提一下而已。
L2.?閉區(qū)間[a, b]上的n階連續(xù)可微函數(shù)的全體,構(gòu)成一個(gè)線性空間。也就是說,這個(gè)線性空間的每一個(gè)對象是一個(gè)連續(xù)函數(shù)。對于其中任何一個(gè)連續(xù)函數(shù),根據(jù)魏爾斯特拉斯定理,一定可以找到最高次項(xiàng)不大于n的多項(xiàng)式函數(shù),使之與該連續(xù)函數(shù)的差為0,也就是說,完全相等。這樣就把問題歸結(jié)為L1了。后面就不用再重復(fù)了。
所以說,向量是很厲害的,只要你找到合適的基,用向量可以表示線性空間里任何一個(gè)對象。這里頭大有文章,因?yàn)橄蛄勘砻嫔现皇且涣袛?shù),但是其實(shí)由于它的有序性,所以除了這些數(shù)本身攜帶的信息之外,還可以在每個(gè)數(shù)的對應(yīng)位置上攜帶信息。為什么在程序設(shè)計(jì)中數(shù)組最簡單,卻又威力無窮呢?根本原因就在于此。這是另一個(gè)問題了,這里就不說了。
下面來回答第二個(gè)問題,這個(gè)問題的回答會涉及到線性代數(shù)的一個(gè)最根本的問題。
線性空間中的運(yùn)動,被稱為線性變換。也就是說,你從線性空間中的一個(gè)點(diǎn)運(yùn)動到任意的另外一個(gè)點(diǎn),都可以通過一個(gè)線性變化來完成。那么,線性變換如何表示呢?很有意思,在線性空間中,當(dāng)你選定一組基之后,不僅可以用一個(gè)向量來描述空間中的任何一個(gè)對象,而且可以用矩陣來描述該空間中的任何一個(gè)運(yùn)動(變換)。而使某個(gè)對象發(fā)生對應(yīng)運(yùn)動的方法,就是用代表那個(gè)運(yùn)動的矩陣,乘以代表那個(gè)對象的向量。
簡而言之,在線性空間中選定基之后,向量刻畫對象,矩陣刻畫對象的運(yùn)動,用矩陣與向量的乘法施加運(yùn)動。
是的,矩陣的本質(zhì)是運(yùn)動的描述。如果以后有人問你矩陣是什么,那么你就可以響亮地告訴他,矩陣的本質(zhì)是運(yùn)動的描述。
可是多么有意思啊,向量本身不是也可以看成是n x 1矩陣嗎?這實(shí)在是很奇妙,一個(gè)空間中的對象和運(yùn)動竟然可以用相類同的方式表示。能說這是巧合嗎?如果是巧合的話,那可真是幸運(yùn)的巧合!可以說,線性代數(shù)中大多數(shù)奇妙的性質(zhì),均與這個(gè)巧合有直接的關(guān)系。
“矩陣是運(yùn)動的描述”,到現(xiàn)在為止,好像大家都還沒什么意見。但是我相信早晚會有數(shù)學(xué)系出身的網(wǎng)友來拍板轉(zhuǎn)。因?yàn)檫\(yùn)動這個(gè)概念,在數(shù)學(xué)和物理里是跟微積分聯(lián)系在一起的。我們學(xué)習(xí)微積分的時(shí)候,總會有人照本宣科地告訴你,初等數(shù)學(xué)是研究常量的數(shù)學(xué),是研究靜態(tài)的數(shù)學(xué),高等數(shù)學(xué)是變量的數(shù)學(xué),是研究運(yùn)動的數(shù)學(xué)。大家口口相傳,差不多人人都知道這句話。但是真知道這句話說的是什么意思的人,好像也不多。簡而言之,在我們?nèi)祟惖慕?jīng)驗(yàn)里,運(yùn)動是一個(gè)連續(xù)過程,從A點(diǎn)到B點(diǎn),就算走得最快的光,也是需要一個(gè)時(shí)間來逐點(diǎn)地經(jīng)過AB之間的路徑,這就帶來了連續(xù)性的概念。而連續(xù)這個(gè)事情,如果不定義極限的概念,根本就解釋不了。古希臘人的數(shù)學(xué)非常強(qiáng),但就是缺乏極限觀念,所以解釋不了運(yùn)動,被芝諾的那些著名悖論(飛箭不動、飛毛腿阿喀琉斯跑不過烏龜?shù)人膫€(gè)悖論)搞得死去活來。因?yàn)檫@篇文章不是講微積分的,所以我就不多說了。有興趣的讀者可以去看看齊民友教授寫的《重溫微積分》。我就是讀了這本書開頭的部分,才明白“高等數(shù)學(xué)是研究運(yùn)動的數(shù)學(xué)”這句話的道理。
不過在我這個(gè)《理解矩陣》的文章里,“運(yùn)動”的概念不是微積分中的連續(xù)性的運(yùn)動,而是瞬間發(fā)生的變化。比如這個(gè)時(shí)刻在A點(diǎn),經(jīng)過一個(gè)“運(yùn)動”,一下子就“躍遷”到了B點(diǎn),其中不需要經(jīng)過A點(diǎn)與B點(diǎn)之間的任何一個(gè)點(diǎn)。這樣的“運(yùn)動”,或者說“躍遷”,是違反我們?nèi)粘5慕?jīng)驗(yàn)的。不過了解一點(diǎn)量子物理常識的人,就會立刻指出,量子(例如電子)在不同的能量級軌道上跳躍,就是瞬間發(fā)生的,具有這樣一種躍遷行為。所以說,自然界中并不是沒有這種運(yùn)動現(xiàn)象,只不過宏觀上我們觀察不到。但是不管怎么說,“運(yùn)動”這個(gè)詞用在這里,還是容易產(chǎn)生歧義的,說得更確切些,應(yīng)該是“躍遷”。因此這句話可以改成:
“矩陣是線性空間里躍遷的描述”。
可是這樣說又太物理,也就是說太具體,而不夠數(shù)學(xué),也就是說不夠抽象。因此我們最后換用一個(gè)正牌的數(shù)學(xué)術(shù)語——變換,來描述這個(gè)事情。這樣一說,大家就應(yīng)該明白了,所謂變換,其實(shí)就是空間里從一個(gè)點(diǎn)(元素/對象)到另一個(gè)點(diǎn)(元素/對象)的躍遷。比如說,拓?fù)渥儞Q,就是在拓?fù)淇臻g里從一個(gè)點(diǎn)到另一個(gè)點(diǎn)的躍遷。再比如說,仿射變換,就是在仿射空間里從一個(gè)點(diǎn)到另一個(gè)點(diǎn)的躍遷。附帶說一下,這個(gè)仿射空間跟向量空間是親兄弟。做計(jì)算機(jī)圖形學(xué)的朋友都知道,盡管描述一個(gè)三維對象只需要三維向量,但所有的計(jì)算機(jī)圖形學(xué)變換矩陣都是4 x 4的。說其原因,很多書上都寫著“為了使用中方便”,這在我看來簡直就是企圖蒙混過關(guān)。真正的原因,是因?yàn)樵谟?jì)算機(jī)圖形學(xué)里應(yīng)用的圖形變換,實(shí)際上是在仿射空間而不是向量空間中進(jìn)行的。想想看,在向量空間里相一個(gè)向量平行移動以后仍是相同的那個(gè)向量,而現(xiàn)實(shí)世界等長的兩個(gè)平行線段當(dāng)然不能被認(rèn)為同一個(gè)東西,所以計(jì)算機(jī)圖形學(xué)的生存空間實(shí)際上是仿射空間。而仿射變換的矩陣表示根本就是4 x 4的。又扯遠(yuǎn)了,有興趣的讀者可以去看《計(jì)算機(jī)圖形學(xué)——幾何工具算法詳解》。
一旦我們理解了“變換”這個(gè)概念,矩陣的定義就變成:
“矩陣是線性空間里的變換的描述?!?/span>
到這里為止,我們終于得到了一個(gè)看上去比較數(shù)學(xué)的定義。不過還要多說幾句。教材上一般是這么說的,在一個(gè)線性空間V里的一個(gè)線性變換T,當(dāng)選定一組基之后,就可以表示為矩陣。因此我們還要說清楚到底什么是線性變換,什么是基,什么叫選定一組基。線性變換的定義是很簡單的,設(shè)有一種變換T,使得對于線性空間V中間任何兩個(gè)不相同的對象x和y,以及任意實(shí)數(shù)a和b,有:T(ax + by)=aT(x) + bT(y),那么就稱T為線性變換。
定義都是這么寫的,但是光看定義還得不到直覺的理解。線性變換究竟是一種什么樣的變換?我們剛才說了,變換是從空間的一個(gè)點(diǎn)躍遷到另一個(gè)點(diǎn),而線性變換,就是從一個(gè)線性空間V的某一個(gè)點(diǎn)躍遷到另一個(gè)線性空間W的另一個(gè)點(diǎn)的運(yùn)動。這句話里蘊(yùn)含著一層意思,就是說一個(gè)點(diǎn)不僅可以變換到同一個(gè)線性空間中的另一個(gè)點(diǎn),而且可以變換到另一個(gè)線性空間中的另一個(gè)點(diǎn)去。不管你怎么變,只要變換前后都是線性空間中的對象,這個(gè)變換就一定是線性變換,也就一定可以用一個(gè)非奇異矩陣來描述。而你用一個(gè)非奇異矩陣去描述的一個(gè)變換,一定是一個(gè)線性變換。有的人可能要問,這里為什么要強(qiáng)調(diào)非奇異矩陣?所謂非奇異,只對方陣有意義,(定義:若n階矩陣A的行列式不為零,即?|A|≠0,則稱A為非奇異矩陣或滿秩矩陣,否則稱A為奇異矩陣或降秩矩陣。n?階方陣?A?是非奇異方陣的充要條件是?A?為可逆矩陣,也即A的行列式不為零。即矩陣(方陣)A可逆與矩陣A非奇異是等價(jià)的概念。)那么非方陣的情況怎么樣?這個(gè)說起來就會比較冗長了,最后要把線性變換作為一種映射,并且討論其映射性質(zhì),以及線性變換的核與像等概念才能徹底講清楚。我覺得這個(gè)不算是重點(diǎn),如果確實(shí)有時(shí)間的話,以后寫一點(diǎn)。以下我們只探討最常用、最有用的一種變換,就是在同一個(gè)線性空間之內(nèi)的線性變換。也就是說,下面所說的矩陣,不作說明的話,就是方陣,而且是非奇異方陣。學(xué)習(xí)一門學(xué)問,最重要的是把握主干內(nèi)容,迅速建立對于這門學(xué)問的整體概念,不必一開始就考慮所有的細(xì)枝末節(jié)和特殊情況,自亂陣腳。
接著往下說,什么是基呢?這個(gè)問題在后面還要大講一番,這里只要把基看成是線性空間里的坐標(biāo)系就可以了。注意是坐標(biāo)系,不是坐標(biāo)值,這兩者可是一個(gè)“對立矛盾統(tǒng)一體”。這樣一來,“選定一組基”就是說在線性空間里選定一個(gè)坐標(biāo)系。就這意思。
好,最后我們把矩陣的定義完善如下:
“矩陣是線性空間中的線性變換的一個(gè)描述。在一個(gè)線性空間中,只要我們選定一組基,那么對于任何一個(gè)線性變換,都能夠用一個(gè)確定的矩陣來加以描述?!?/span>
理解這句話的關(guān)鍵,在于把“線性變換”與“線性變換的一個(gè)描述”區(qū)別開。一個(gè)是那個(gè)對象,一個(gè)是對那個(gè)對象的表述。就好像我們熟悉的面向?qū)ο缶幊讨?#xff0c;一個(gè)對象可以有多個(gè)引用,每個(gè)引用可以叫不同的名字,但都是指的同一個(gè)對象。如果還不形象,那就干脆來個(gè)很俗的類比。
比如有一頭豬,你打算給它拍照片,只要你給照相機(jī)選定了一個(gè)鏡頭位置,那么就可以給這頭豬拍一張照片。這個(gè)照片可以看成是這頭豬的一個(gè)描述,但只是一個(gè)片面的的描述,因?yàn)閾Q一個(gè)鏡頭位置給這頭豬拍照,能得到一張不同的照片,也是這頭豬的另一個(gè)片面的描述。所有這樣照出來的照片都是這同一頭豬的描述,但是又都不是這頭豬本身。
同樣的,對于一個(gè)線性變換,只要你選定一組基,那么就可以找到一個(gè)矩陣來描述這個(gè)線性變換。換一組基,就得到一個(gè)不同的矩陣。所有這些矩陣都是這同一個(gè)線性變換的描述,但又都不是線性變換本身。
但是這樣的話,問題就來了如果你給我兩張豬的照片,我怎么知道這兩張照片上的是同一頭豬呢?同樣的,你給我兩個(gè)矩陣,我怎么知道這兩個(gè)矩陣是描述的同一個(gè)線性變換呢?如果是同一個(gè)線性變換的不同的矩陣描述,那就是本家兄弟了,見面不認(rèn)識,豈不成了笑話。
好在,我們可以找到同一個(gè)線性變換的矩陣兄弟們的一個(gè)性質(zhì),那就是:
若矩陣A與B是同一個(gè)線性變換的兩個(gè)不同的描述(之所以會不同,是因?yàn)檫x定了不同的基,也就是選定了不同的坐標(biāo)系),則一定能找到一個(gè)非奇異矩陣P,使得A、B之間滿足這樣的關(guān)系:
A = P^(-1) *B *P
線性代數(shù)稍微熟一點(diǎn)的讀者一下就看出來,這就是相似矩陣的定義。沒錯(cuò),所謂相似矩陣,就是同一個(gè)線性變換的不同的描述矩陣。按照這個(gè)定義,同一頭豬的不同角度的照片也可以成為相似照片。俗了一點(diǎn),不過能讓人明白。
而在上面式子里那個(gè)矩陣P,其實(shí)就是A矩陣所基于的基與B矩陣所基于的基這兩組基之間的一個(gè)變換關(guān)系。
這個(gè)發(fā)現(xiàn)太重要了。原來一族相似矩陣都是同一個(gè)線性變換的描述啊!難怪這么重要!工科研究生課程中有矩陣論、矩陣分析等課程,其中講了各種各樣的相似變換,比如什么相似標(biāo)準(zhǔn)型,對角化之類的內(nèi)容,都要求變換以后得到的那個(gè)矩陣與先前的那個(gè)矩陣式相似的,為什么這么要求?因?yàn)橹挥羞@樣要求,才能保證變換前后的兩個(gè)矩陣是描述同一個(gè)線性變換的。當(dāng)然,同一個(gè)線性變換的不同矩陣描述,從實(shí)際運(yùn)算性質(zhì)來看并不是不分好環(huán)的。有些描述矩陣就比其他的矩陣性質(zhì)好得多。這很容易理解,同一頭豬的照片也有美丑之分嘛。所以矩陣的相似變換可以把一個(gè)比較丑的矩陣變成一個(gè)比較美的矩陣,而保證這兩個(gè)矩陣都是描述了同一個(gè)線性變換。
這樣一來,矩陣作為線性變換描述的一面,基本上說清楚了。但是,事情沒有那么簡單,或者說,線性代數(shù)還有比這更奇妙的性質(zhì),那就是,矩陣不僅可以作為線性變換的描述,而且可以作為一組基的描述。而作為變換的矩陣,不但可以把線性空間中的一個(gè)點(diǎn)給變換到另一個(gè)點(diǎn)去,而且也能夠把線性空間中的一個(gè)坐標(biāo)系(基)變換到另一個(gè)坐標(biāo)系(基)去。而且,變換點(diǎn)與變換坐標(biāo)系,具有異曲同工的效果。線性代數(shù)里最有趣的奧妙,就蘊(yùn)含在其中。理解了這些內(nèi)容,線性代數(shù)里很多定理和規(guī)則會變得更加清晰、直覺。
首先來總結(jié)一下前面兩部分的一些主要結(jié)論:
1.?首先有空間,空間可以容納對象運(yùn)動的。一種空間對應(yīng)一類對象。
2.?有一種空間叫線性空間,線性空間是容納向量對象運(yùn)動的。
3.?運(yùn)動是瞬時(shí)的,因此也被稱為變換。
4.?矩陣是線性空間中運(yùn)動(變換)的描述。
5.?矩陣與向量相乘,就是實(shí)施運(yùn)動(變換)的過程。
6.?同一個(gè)變換,在不同的坐標(biāo)系下表現(xiàn)為不同的矩陣,但是它們的本質(zhì)是一樣的,所以本征值相同。
?
(后面的沒有轉(zhuǎn)載)
創(chuàng)作挑戰(zhàn)賽新人創(chuàng)作獎勵來咯,堅(jiān)持創(chuàng)作打卡瓜分現(xiàn)金大獎
總結(jié)
- 上一篇: pytorch利用rnn通过sin预测c
- 下一篇: postman测试 上传下载文件