《基于张量网络的机器学习入门》学习笔记4
《基于張量網絡的機器學習入門》學習筆記4
- 量子概率
- 將概率復數化
- 分布與向量的表示
- 事件與Hilbert空間
- 不兼容屬性及其復數概率表示
- 為什么一定要復數概率
量子概率
將概率復數化
在經典概率中論中,我們將事件的概率視為一個可觀測的量。例如,拋硬幣時,會以p(1)p(1)p(1)出現正面,p(0)p(0)p(0)出現反面,并且p(0)+p(1)=1p(0)+p(1)=1p(0)+p(1)=1,這是可以通過NNN次重復實驗來進行解釋的,我們可以將p(1)p(1)p(1)解釋為現實事件中出現正面的次數占總的拋硬幣次數的比例。
但是,在通常情況下,事件的概率并不是一個可觀測的量,在每次拋硬幣的過程中,我們實際上只能觀測到正面或者反面,而無法觀測概率p(1)p(1)p(1)。經典概率論告訴我們,只有在進行了大量的重復獨立實驗的前提下,我們才能漸進地觀測到某一個事件出現的概率。然而,在更多的無法進行重復實驗的場合下(例如,明天是否會下雨),我們任可以定義概率,但是,這里的概率就是一個不可觀測的量。
正是因為概率的這種不可觀測性,我們“有機可乘”,將概率變為復數。當然,我們并不是簡單的將概率p(1)p(1)p(1)變成復數,而是定義了一種叫做概率幅(復數概率)的新量,即:ψ=a+bi\psi=a+biψ=a+bi,并且,我們規定這個復數概率ψ\psiψ可以按照下面的規則轉變為經典概率:
p=∣ψ∣2=ψ?ψ=(a?bi)(a+bi)=a2+b2p=|\psi|^2=\psi^*\psi=(a-bi)(a+bi)=a^2+b^2p=∣ψ∣2=ψ?ψ=(a?bi)(a+bi)=a2+b2
∣ψ∣|\psi|∣ψ∣表示求復數的模,ψ?\psi^*ψ?表示ψ\psiψ的共軛復數。當然,如果要求經典概率,那么必須要求a2+b2∈[0,1]a^2+b^2\in[0,1]a2+b2∈[0,1]
現在,我們假設每一次觀測會發生333件事:
首先,在觀測前,假設硬幣向上可以用一個復數概率表示,例如:
∣ψ?=12+12i\mathinner{|\psi\rangle}=\frac{1}{2}+\frac{1}{2}i∣ψ?=21?+21?i
然后,在測量的瞬間,我們定義復數概率會自動轉變成概率,即按照如下原則得到正面朝上的概率:
p(1)=∣ψ(1)∣2=(12)2+(12)2=12p(1)=|\psi(1)|^2=(\frac{1}{2})^2+(\frac{1}{2})^2=\frac{1}{2}p(1)=∣ψ(1)∣2=(21?)2+(21?)2=21?
最后,硬幣會按照這個概率p(1)p(1)p(1)隨機地出現正面或反面,而且還可以用復數概率ψ(1)\psi(1)ψ(1)進行描述,并且對任意一次隨機試驗的觀測實際上是先從復數概率轉變為經典概率,再由經典概率支配出現某一個觀測值的比例。
因此,我們可以假設,再概率背后,還有一個更基本的復數概率制約著概率本身,正是因為概率本身是不能被直接觀測到的量,所以我們再做一層復數概率的假設不會引起實質的困難。
現在,我們知道,某一個事件XXX的經典概率與該事件的復數概率存在著對應關系:P(X)=∣ψ(X)∣2P(X)=|\psi(X)|^2P(X)=∣ψ(X)∣2。但是,這個關系不是對稱的。從復數概率到經典概率的映射是一個多對一的映射,即一個具體的概率值P(X)P(X)P(X),存在著無窮多個復數概率與其對應,并且可以證明這群復數概率滿足:
ψ(X)=P(X)(cos?θ+isin?θ)=P(X)exp(iθ)\psi(X)=\sqrt{P(X)}(\cos\theta+i\sin\theta)=\sqrt{P(X)}exp(i\theta)ψ(X)=P(X)?(cosθ+isinθ)=P(X)?exp(iθ)(其中θ\thetaθ為任意實數)
這群復數落到了以圓點為圓心,以P(X)\sqrt{P(X)}P(X)?為半徑的圓上。一方面,這種多對一的關系使得復數概率完全可以涵蓋經典概率的內容,甚至可以包含更豐富的信息;另一方面,復數概率具有更深的不可觀測性,因為即使你對事件XXX進行了大量的測量,也只能得到復數概率的模的信息,而不可能確定它的相角θ\thetaθ,同時,也因為這個相角的存在,復數概率和經典概率表現出了本質上的區別!
分布與向量的表示
經典概率中,一個隨機變量可以取多個不同的值,這些取值構成了兩兩互斥的隨機事件。我們假設隨機變量XXX的可能取值為:{x1,x2,?,xn}\{x_1,x_2,\cdots,x_n\}{x1?,x2?,?,xn?},那么我們可以定義nnn個概率:
p(xi)=P{X=xi},i=1,2,?,np(x_i)=P\{X=x_i\},i=1,2,\cdots,np(xi?)=P{X=xi?},i=1,2,?,n
并且這些概率滿足歸一化條件:∑i=1np(xi)=1\sum\limits_{i = 1}^n {p({x_i}) = 1}i=1∑n?p(xi?)=1
那么,這一組概率p(xi)p(x_i)p(xi?)就構成了XXX的一個概率分布,為了方便討論,我們不妨將這一組概率寫成一個向量的形式:F(X)=p1∣x1?+p2∣x2?+?+pn∣xn?F(X)=p_1\mathinner{|x_1\rangle}+p_2\mathinner{|x_2\rangle}+\cdots+p_n\mathinner{|x_n\rangle}F(X)=p1?∣x1??+p2?∣x2??+?+pn?∣xn??
其中,pi=p(xi),pi∣xi?p_i=p(x_i),p_i\mathinner{|x_i\rangle}pi?=p(xi?),pi?∣xi??表示對應的XXX在取值為xix_ixi?的時候概率為p(xi)p(x_i)p(xi?)。我們知道,F(X)F(X)F(X)這個向量相當于nnn維空間中的向量(p1,p2,?,pn)(p_1,p_2,\cdots,p_n)(p1?,p2?,?,pn?),其中pip_ipi?就是該向量在第iii個維度上的坐標。這樣,∣xi?\mathinner{|x_i\rangle}∣xi??就相當于是這nnn維空間中的第iii個基向量。所以F(X)F(X)F(X)又可以寫成坐標乘以相應的基向量再求和的形式。
按照復數概率的思想,我們也可以將每個隨機事件X=xiX=x_iX=xi?定義復數概率,當復數概率為nnn時:
Ψ(X)=ψ1∣x1?+ψ2∣x2?+?+ψn∣xn?\Psi(X)=\psi_1\mathinner{|x_1\rangle}+\psi_2\mathinner{|x_2\rangle}+\cdots+\psi_n\mathinner{|x_n\rangle}Ψ(X)=ψ1?∣x1??+ψ2?∣x2??+?+ψn?∣xn??
變量XXX取值xix_ixi?的經典概率就是:P{X=xi}=∣ψi∣2P\{X=x_i\}=|\psi_i|^2P{X=xi?}=∣ψi?∣2
并且要求:∑i=1n∣ψi∣2=1\sum\limits_{i=1}^n|\psi_i|^2=1i=1∑n?∣ψi?∣2=1
在經典概率論中,系統的任何性質都可以從概率分布中得到,同理,在復數概率中,給定了向量Ψ(X)\Psi(X)Ψ(X),也就給定了系統的狀態,因為系統的一切性質都蘊含在這個向量中。
在經典概率論中,如果一個系統的概率分布是F(X)F(X)F(X),我們可以說變量XXX以p1p_1p1?的概率取x1x_1x1?,以p2p_2p2?的概率取x2?x_2\cdotsx2??,但是在狀態為Ψ(X)\Psi(X)Ψ(X)的量子系統中,我們不能說系統以∣Ψ2∣2|\Psi_2|^2∣Ψ2?∣2的概率處于∣x2?\mathinner{|x_2\rangle}∣x2??狀態,這是因為這些狀態之間會發生相互干涉。
由于概率是不可直接測量的量,因此,我們完全可以用復數概率來描述系統從而達到與經典概率描述同等的效果。例如,我們可以用經典概率分布:
F(X)=12∣0?+12∣1?F(X)=\frac{1}{2}\mathinner{|0\rangle}+\frac{1}{2}\mathinner{|1\rangle}F(X)=21?∣0?+21?∣1?
來表示一枚硬幣處于正面(狀態∣1?\mathinner{|1\rangle}∣1?)和反面(狀態∣0?\mathinner{|0\rangle}∣0?)的概率格是0.50.50.5.同樣,我們也可以假設這枚硬幣處于一個可以用復數概率描述的量子疊加態:
Ψ(X)=(12+12i)∣0?+(12+12i)∣1?\Psi(X)=(\frac{1}{2}+\frac{1}{2}i)\mathinner{|0\rangle}+(\frac{1}{2}+\frac{1}{2}i)\mathinner{|1\rangle}Ψ(X)=(21?+21?i)∣0?+(21?+21?i)∣1?
或者:
Ψ(X)=12∣0?+12∣1?\Psi(X)=\frac{1}{\sqrt{2}}\mathinner{|0\rangle}+\frac{1}{\sqrt{2}}\mathinner{|1\rangle}Ψ(X)=2?1?∣0?+2?1?∣1?
事件與Hilbert空間
在量子概率體系中,事件不再對應經典的集合,而是對應于線性空間,這個空間又稱為Hilbert(希爾伯特)空間。
我們知道一個硬幣在具體的測量之前可以處于一種用復數概率描述的量子力學疊加態:
Ψ(X)=12∣0?+12∣1?\Psi(X)=\frac{1}{\sqrt{2}}\mathinner{|0\rangle}+\frac{1}{\sqrt{2}}\mathinner{|1\rangle}Ψ(X)=2?1?∣0?+2?1?∣1?
這個狀態恰好能用一個二維的線性空間表達:
在經典的概率實驗中,000表示的是拋硬幣得到反面,111表示得到正面,出現正面或者反面實際上都是基本的事件,而在復數概率的向量表示中,這兩個基本事件則變成了兩個相互垂直,交于一點OOO的單位向量∣0?\mathinner{|0\rangle}∣0?和∣1?\mathinner{|1\rangle}∣1?。這是一個非常關鍵的區別,只有這樣擴展量子概率,我們才能表達不兼容性。
不兼容屬性及其復數概率表示
不兼容性是量子概率,將概率論擴充到復數域中最特別的概念,也是區別復數概率和經典概率的本質所在。所謂的一對不兼容屬性,就是指一個客觀事物所具備的兩種屬性,這兩種屬性不能同時得到確切的測量值。
下面,我們舉一個例子來進行說明:
假設某一個系統具有屬性AAA,屬性AAA的取值可以有{U,D}\{U,D\}{U,D}(即上、下)兩種可能。另外,該系統還具有屬性BBB,BBB的取值可以由{L,R}\{L,R\}{L,R}(即左、右)兩種可能。這樣,我們就可以構成444組不同的原子事件{A屬性為U,A屬性為D,B屬性為L和B屬性為R\{A屬性為U,A屬性為D,B屬性為L和B屬性為R{A屬性為U,A屬性為D,B屬性為L和B屬性為R。我們知道,每個事件都可以用線性空間中的向量來表示。由于AAA屬性要么取UUU要么取DDD,所以,前兩個事件就可以用兩個相互垂直的向量來表示。同理,BBB屬性也可以用兩個相互垂直的向量表示。顯然,這里形成了兩個平面,當這兩個平面重合在一起時,如下圖:
如圖所示:前兩個事件(屬性AAA取UUU或者DDD)的兩個基向量是黑色的坐標系(∣U?(\mathinner{|U\rangle}(∣U?和∣D?)\mathinner{|D\rangle})∣D?)。而后兩個事件(屬性BBB取LLL或者RRR)對應的基向量則是用藍色的坐標系(∣L?(\mathinner{|L\rangle}(∣L?和∣R?)\mathinner{|R\rangle})∣R?)表示。這兩個坐標系重合在了 同一個平面上,只不過它們之間存在一個夾角θ\thetaθ(在更一般的情況下該夾角可以取復數)。對于同一個向量,例如對圖中的粗箭頭來說,他在第一個坐標系下可以表示為:
ψA=x∣U?+y∣D?\psi_A=x\mathinner{|U\rangle}+y\mathinner{|D\rangle}ψA?=x∣U?+y∣D?
那么,在第二個坐標系下(∣L?\mathinner{|L\rangle}∣L?和∣R?\mathinner{|R\rangle}∣R?構成的坐標系)構成的坐標就是:
因此,同樣的向量可以表示為:
ψB=x′∣L?+y′∣R?\psi_B=x^{'}\mathinner{|L\rangle}+y^{'}\mathinner{|R\rangle}ψB?=x′∣L?+y′∣R?
ΨA\Psi_AΨA?和ΨB\Psi_BΨB?是同一個向量分別在不同坐標系下的表示。由于x′,y′x^{'},y^{'}x′,y′與x,yx,yx,y存在著如上式的聯系,所以AAA屬性上的概率分布會對BBB屬性造成影響,反之亦然。因此,AAA和BBB兩個屬性之間存在著一種強烈的聯系,也就是不兼容性。
比如,假設我們確定的知道AAA屬性的取值為UUU,即發生UUU事件的概率為111,則:
ψA=1∣U?+0∣D?\psi_A=1\mathinner{|U\rangle}+0\mathinner{|D\rangle}ψA?=1∣U?+0∣D?
這樣,根據坐標變換式,同樣的狀態反應在BBB屬性上就成了:
這樣,只要θ\thetaθ不是000或者909090度的整數倍,則我們必然得到BBB屬性值是不確定的,它會以cos?2θ\cos^2\thetacos2θ的概率取值LLL,而以sin?2θ\sin^2\thetasin2θ的概率取值RRR。因此,我們說AAA和BBB是一對不兼容的屬性,因為它們不能同時被測準。
總之,只要確定了兩個不兼容屬性,它們之間的夾角θ\thetaθ就確定了下來,因此給定屬性AAA上的復數概率分布,就必然會確定一組BBB上的復數概率分布。
為什么一定要復數概率
只有當考慮復數概率的時候,才能引入坐標轉換的概念,因為,坐標轉換本質上來講是一種旋轉操作,而旋轉操作會保持向量的模不改變,。所以對于任何一個復數概率分布所對應的狀態向量ψA=x∣U?+y∣D?\psi_A=x\mathinner{|U\rangle}+y\mathinner{|D\rangle}ψA?=x∣U?+y∣D?來說,由于它的模必須是111,所以無論轉換到哪一個坐標系,它都保持長度的不變,也就能保證新的向量所對應的經典概率分布是一個定義的概率分布,即各個分量上面的概率求和為111。正是因為概率幅而非概率具有這種旋轉模不變的性質,所以我們只能對復數概率進行坐標變換的定義。
總結
以上是生活随笔為你收集整理的《基于张量网络的机器学习入门》学习笔记4的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 《基于张量网络的学习入门》学习笔记3
- 下一篇: 《基于张量网络的机器学习入门》学习笔记5