马尔可夫链基本定义
基本定義
(馬爾可夫鏈)考慮一個隨機變量的序列X={Xo,X1,...,Xt,...}X = {\{X_o,X_1,... ,X_t,...\}}X={Xo?,X1?,...,Xt?,...}這里XtX_tXt?表示時刻t的隨機變量,t=0,1,2… 每個隨機變量Xt(t=0,12...)X_t(t=0,12... )Xt?(t=0,12...)的取值集合相同,稱為狀態空間,表示為S。隨機變量可以是離散的,也可以是連續的。以上隨機變量的序列構成隨機過程( stochastic process)。
假設在時刻0的隨機變量X0X_0X0?遵循概率分布P(Xo)=ToP(X_o)= T_oP(Xo?)=To?, 稱為初始狀態分布。在某個時刻t≥1的隨機變量XtX_tXt?,與前一個時刻的隨機變量Xt?1X_{t-1}Xt?1?之間有條件分布P(Xt∣Xt?1)P(X_t | X_{t-1})P(Xt?∣Xt?1?), 如果XtX_tXt?,只依賴于Xt?1X_{t-1}Xt?1?而不依賴子過去的隨機變量X={Xo,X1,...,Xt,...}X = {\{X_o,X_1,... ,X_t,...\}}X={Xo?,X1?,...,Xt?,...},這一性質稱為馬爾可夫性,即
P(Xt∣X0,X1,...,Xt?1)=P(Xt∣Xt?1),t=1,2,...P(X_t | X_0,X_1,...,X_{t-1})= P(X_t|X_{t-1}), t=1,2,...P(Xt?∣X0?,X1?,...,Xt?1?)=P(Xt?∣Xt?1?),t=1,2,...
具有馬爾可夫性的隨機序列X={Xo,X1,...,Xt,...}X = {\{X_o,X_1,... ,X_t,...\}}X={Xo?,X1?,...,Xt?,...}稱為馬爾可夫鏈(Markovchain),或馬爾可夫過程( Markov process). 條件概率分布P(Xt∣Xt?1)P(X_t | X_{t-1})P(Xt?∣Xt?1?)稱為馬爾可夫鏈的轉移概率分布。轉移概率分布決定了馬爾可夫鏈的特性。
馬爾可夫性的直觀解釋是“未來只依賴于現在(假設現在已知),而與過去無關”。這個假設在許多應用中是合理的。
若轉移概率分布P(Xt∣Xt?1)P(X_t | X_{t-1})P(Xt?∣Xt?1?)與t無關,即
P(Xt+s∣Xt?1+s)=P(Xt∣Xt?1),t=1,2,...;s=1,2,...P(X_{t+s}|X_{t-1+s})=P(X_t|X_{t-1}), t=1,2,...; s=1,2,...P(Xt+s?∣Xt?1+s?)=P(Xt?∣Xt?1?),t=1,2,...;s=1,2,...
則稱該馬爾可夫鏈為時間齊次的馬爾可夫鏈(timehomogenousMarkovchain)。本文中提到的馬爾可夫鏈都是時間齊次的。
以上定義的是一階馬爾可夫鏈,可以擴展到n階馬爾可夫鏈,滿足n階馬爾可夫性
P(Xt∣XoX1...Xt?2Xt?1)=P(Xt∣Xt?n...Xt?2Xt?1)P(X_t|X_oX_1...X_{t- 2}X_{t-1})= P(X_t|X_{t- n}...X_{t-2}X_{t-1})P(Xt?∣Xo?X1?...Xt?2?Xt?1?)=P(Xt?∣Xt?n?...Xt?2?Xt?1?)
本文主要考慮一階馬爾可夫鏈。容易驗證n階馬爾可夫鏈可以轉換為一階馬爾可夫鏈。
舉例:
取一個隨機序列X={1,3,2,3,2,3,3,1,2,3,1,3,...}X={\{1,3,2,3,2,3,3,1,2,3,1,3,...\}}X={1,3,2,3,2,3,3,1,2,3,1,3,...}
由于序列中只出現了1,2,3三個數字,所以狀態空間為S=1,2,3S={1,2,3}S=1,2,3
假設馬爾可夫鏈如下
則它的轉移概率P(Xt∣Xt?1)P(X_t | X_{t-1})P(Xt?∣Xt?1?)表示如下
注:以上舉例是為了更好的理解 序列、狀態空間、馬爾可夫鏈、轉移概率 等概念的涵義,沒有實際計算意義。
總結
- 上一篇: [转]MNIST机器学习入门
- 下一篇: Delphi 操作EXCEL折线图