【计量经济学导论】08. 平稳时间序列
文章目錄
- 平穩時間序列
- 平穩時間序列
- 偽回歸現象
- 白噪聲序列
- 隨機游走過程
- 自相關函數 ACF
- 偏相關函數 PACF
- 平穩性的單位根檢驗
- AR(1){\rm AR}(1)AR(1) 序列
- Dickey-Fuller 檢驗
- Augmented Dickey-Fuller 檢驗
- 單整時間序列
平穩時間序列
平穩時間序列
在時間序列分析中,平穩時間序列是一類重要的特殊的隨機序列。時間序列分析的基本用途是根據過去的信息預測未來,而平穩時間序列的歷史記錄 X1,X2,?,XnX_1,X_2,\cdots,X_nX1?,X2?,?,Xn? 中往往含有 Xn+1X_{n+1}Xn+1? 的信息,這就使得利用歷史樣本預測將來成為可能。
首先介紹一下平穩時間序列的概念,分為兩種:寬平穩序列和嚴平穩序列。
嚴平穩過程
對于時間序列 {Xt:t=1,2,?}\{ X_t: t=1,2,\cdots\}{Xt?:t=1,2,?} ,如果對于每一個時間指標集 1≤t1≤t2≤...≤tm1\leq t_1\leq t_2\leq...\leq t_m1≤t1?≤t2?≤...≤tm? 和任意的正整數 hhh,滿足 {Xt1,Xt2,?,Xtm}\{X_{t_1},X_{t_2},\cdots,X_{t_m}\}{Xt1??,Xt2??,?,Xtm??} 的聯合概率分布與 {Xt1+h,Xt2+h,?,Xtm+h}\{X_{t_1+h},X_{t_2+h},\cdots,X_{t_m+h}\}{Xt1?+h?,Xt2?+h?,?,Xtm?+h?} 的聯合概率分布相同,則稱 XtX_tXt? 是嚴平穩的。
寬平穩過程
對于時間序列 {Xt:t=1,2,?}\{ X_t: t=1,2,\cdots\}{Xt?:t=1,2,?} ,如果其均值和方差不隨著時間而變化,協方差只依賴于兩個觀測值之間的距離 kkk ,而與所處的時間點 ttt 的位置無關,則稱 XtX_tXt? 是寬平穩的。
- E(Xt)=μ{\rm E}(X_t)=\muE(Xt?)=μ ;
- Var(Xt)=σ2{\rm Var}(X_t)=\sigma^2Var(Xt?)=σ2 ;
- Cov(Xt,Xt+k)=γk{\rm Cov}(X_t,\,X_{t+k})=\gamma_kCov(Xt?,Xt+k?)=γk? 。
我們通常所說時間序列的平穩性是指寬平穩性。
偽回歸現象
采用平穩時間序列建立計量經濟學模型的其中一個優點在于可以有效地避免偽回歸現象。Granger 曾通過模擬試驗發現,完全無關的非平穩時間序列之間可以得到擬合很好但毫無道理的回歸結果。這說明非平穩時間序列由于具有共同的變化趨勢,即使它們之間在經濟行為上并不存在因果關系,但也能夠顯示較強的統計上的因果關系。
這就是偽回歸現象,例如下面的兩個模型:
Yt=Yt?1+ut,ut~N(0,σ2),Y_t=Y_{t-1}+u_{t} \ , \ \ \ \ u_t \sim N(0,\sigma^2) \ , Yt?=Yt?1?+ut??,????ut?~N(0,σ2)?,
Xt=Xt?1+vt,vt~N(0,σ2),X_t=X_{t-1}+v_t \ , \ \ \ \ v_t \sim N(0,\sigma^2) \ , Xt?=Xt?1?+vt??,????vt?~N(0,σ2)?,
顯然 YtY_tYt? 和 XtX_tXt? 無關,但由于這兩個時間序列由同分布的正態白噪聲生成,如果做 YtY_tYt? 對 XtX_tXt? 的簡單回歸,結果的 ttt 檢驗會十分顯著。
我們需要注意的是,并不是平穩時間序列之間不會出現偽回歸現象,只是非平穩時間序列之間出現偽回歸的可能性更大,因此對時間序列進行平穩性檢驗可以有效地減少偽回歸現象。當然,杜絕偽回歸的根本方法是正確的設定模型。
白噪聲序列
白噪聲是用來描述簡單隨機干擾的平穩序列,是最簡單的平穩序列。定義如下:
設 {εt}\{\varepsilon_t\}{εt?} 是一個平穩序列,如果對任何 s,t∈Ns,\,t\in\mathbb{N}s,t∈N ,
E(εt)=μ,Cov(εt,εs)={σ2,t=s,0,t≠s,{\rm E}(\varepsilon_t)=\mu \ , \ \ \ \ {\rm Cov}(\varepsilon_t,\,\varepsilon_s)=\left\{ \begin{array}{ll} \sigma^2\ , & t=s\ ,\\ 0\ , & t\neq s\ , \end{array} \right. E(εt?)=μ?,????Cov(εt?,εs?)={σ2?,0?,?t=s?,t?=s?,?
就稱 {εt}\{\varepsilon_t\}{εt?} 是一個白噪聲,記作 WN(μ,σ2){\rm WN}(\mu,\,\sigma^2)WN(μ,σ2) 。
一般地,我們研究的都是零均值白噪聲情況,即
E(εt)=0,Var(εt)=σ2,Cov(εt,εt+h)=0.{\rm E}(\varepsilon_t)=0\ , \ \ \ \ {\rm Var}(\varepsilon_t)=\sigma^2\ , \ \ \ \ {\rm Cov}(\varepsilon_t,\,\varepsilon_{t+h})=0 \ . E(εt?)=0?,????Var(εt?)=σ2?,????Cov(εt?,εt+h?)=0?.
此外,我們還會遇到獨立白噪聲和正態白噪聲的情況:
-
獨立白噪聲:εt~i.i.d.WN(0,σ2)\varepsilon_t\sim\ {\rm i.i.d.}\ \ {\rm WN}(0,\,\sigma^2)εt?~?i.i.d.??WN(0,σ2) ;
-
正態白噪聲:εt~N(0,σ2)\varepsilon_t \sim N(0,\sigma^2)εt?~N(0,σ2) ;
其中正態白噪聲一定滿足獨立同分布性質。
隨機游走過程
隨機游走是一種常見的非平穩時間序列,主要包括無漂移項的隨機游走和加漂移項的隨機游走。
隨機游走
yt=yt?1+εt,y_t = y_{t-1} + \varepsilon_t \ , yt?=yt?1?+εt??,
其中, εt\varepsilon_tεt? 是均值為 000 和方差為 σ2\sigma^2σ2 的白噪聲,εt~WN(0,σ2)\varepsilon_t\sim {\rm WN}(0,\sigma^2)εt?~WN(0,σ2) 。
隨機游走也被稱為自相關系數為 111 的 AR(1){\rm AR}(1)AR(1) 過程,通常被作為股票價格的一個統計學模擬,用來檢驗股票市場是否有效率。
我們可以把隨機游走寫成移動平均的表達式。設 yty_tyt? 的初值為常數 y0y_0y0? 且獨立于 εt,t≥1\varepsilon_t,\,t\geq1εt?,t≥1,則有
yt=y0+ε1+ε2+?+εt,y_t=y_0+\varepsilon_1+\varepsilon_2+\cdots+\varepsilon_t \ , yt?=y0?+ε1?+ε2?+?+εt??,
實際應用的時候常假定為 y0=0y_0=0y0?=0 。通過計算其均值和方差:
E(yt)=E(yt?1)=E(y0+ε1+ε2+?+εt)=y0,{\rm E}(y_t)={\rm E}(y_{t-1})={\rm E}(y_0+\varepsilon_1+\varepsilon_2+\cdots+\varepsilon_t)=y_0 \ , E(yt?)=E(yt?1?)=E(y0?+ε1?+ε2?+?+εt?)=y0??,
Var(yt)=Var(y0+ε1+ε2+?+εt)=tσ2,{\rm Var}(y_t)={\rm Var}(y_0+\varepsilon_1+\varepsilon_2+\cdots+\varepsilon_t)=t\sigma^2 \ , Var(yt?)=Var(y0?+ε1?+ε2?+?+εt?)=tσ2?,
其方差與 ttt 有關,因此隨機游走是非平穩的。
加漂移的隨機游走
yt=δ+yt?1+εt.y_t=\delta+y_{t-1}+\varepsilon_t \ . yt?=δ+yt?1?+εt??.
其中 δ\deltaδ 為隨機游走的漂移項,可以代表價格的時間趨勢。這是因為如果我們代入 yty_tyt? 的初值 y0y_0y0? ,通過迭代即可寫成價格序列的構成:
yt=δt+y0+∑i=1tεi,y_t=\delta t+y_0+\sum_{i=1}^t\varepsilon_i \ , yt?=δt+y0?+i=1∑t?εi??,
在這樣的模型設定下,其經濟意義為:正(負)的 δ\deltaδ ,表示價格序列最終走向正(負)無窮。
自相關函數 ACF
對于平穩時間序列,我們可以用自相關函數來刻畫其平穩性。首先定義總體自相關函數:
ρk=Cov(yt,yt+k)Var(yt)=γkγ0,\rho_k=\frac{{\rm Cov}(y_t,\,y_{t+k})}{{\rm Var}(y_t)}=\frac{\gamma_k}{\gamma_0} \ , ρk?=Var(yt?)Cov(yt?,yt+k?)?=γ0?γk???,
自相關函數只有對于平穩序列才有意義,它表明一個過程記憶長度以及強度。根據上述定義可以看到 ρk\rho_kρk? 是關于滯后期 kkk 的遞減函數,滿足 ρ0=1\rho_0=1ρ0?=1,ρk=ρ?k\rho_k=\rho_{-k}ρk?=ρ?k?,?1≤ρk≤1-1\leq \rho_k \leq 1?1≤ρk?≤1 ,并趨近于 000 。
但實際上,對于一個時間序列只能有一個樣本實現,因此我們只能計算樣本自相關函數:
rk=∑t=1n?k(yt?y ̄)(yt+k?y ̄)∑t=1n(yt?y ̄)2.r_k=\frac{\displaystyle\sum_{t=1}^{n-k}(y_t-\overline{y})(y_{t+k}-\overline{y})}{\displaystyle\sum_{t=1}^n(y_t-\overline{y})^2} \ . rk?=t=1∑n?(yt??y?)2t=1∑n?k?(yt??y?)(yt+k??y?)??.
和總體自相關函數一樣,隨著 kkk 的增加,樣本自相關函數 rkr_krk? 下降且趨近于 000 ,但從下降速度來看,平穩序列比非平穩序列快得多。
關于自相關函數還有一個定理,這是我們之前提到的 Ljung-Box 檢驗的理論基礎。
Bartlett 定理:如果時間序列由白噪聲過程生成,則對所有的 k>0k>0k>0 ,樣本自相關函數近似地服從以 000 為均值,1n\displaystyle\frac{1}{n}n1? 為方差的正態分布,其中 nnn 為樣本數。
偏相關函數 PACF
對于平穩序列我們還有偏相關函數的概念,在這里我們只引入樣本偏相關函數 PACF 的概念,總體偏相關函數需要引入專業課《時間序列分析》中的知識才可以討論。
用 yty_tyt? 對連續的 kkk 階滯后項 yt?1,yt?2,...,yt?ky_{t-1},y_{t-2},...,y_{t-k}yt?1?,yt?2?,...,yt?k? 進行回歸:
yt=β0+β1yt?1+...+βkyt?k+εt,y_t=\beta_0+\beta_1y_{t-1}+...+\beta_ky_{t-k}+\varepsilon_t \ , yt?=β0?+β1?yt?1?+...+βk?yt?k?+εt??,
定義 kkk 階偏相關函數 p(k)=β^kp(k)=\hat\beta_kp(k)=β^?k? 。同樣地,隨著 kkk 的增加,偏相關函數下降且趨近于 000 。但我們需要注意的是,此時的 β^1≠p(1),β^2≠p(2),?,β^k?1≠p(k?1)\hat\beta_1\neq p(1),\,\hat\beta_2\neq p(2),\cdots,\hat\beta_{k-1}\neq p(k-1)β^?1??=p(1),β^?2??=p(2),?,β^?k?1??=p(k?1) 。
事實上,計算 p(1)p(1)p(1) 的時候需要做 yty_tyt? 對 yt?1y_{t-1}yt?1? 回歸并求出 yt?1y_{t-1}yt?1? 的估計系數;計算 p(2)p(2)p(2) 的時候需要做 yty_tyt? 對 yt?1,yt?2y_{t-1},\,y_{t-2}yt?1?,yt?2? 回歸并求出 yt?2y_{t-2}yt?2? 的估計系數;以此類推。
PACF 和 ACF 的聯系:
- ACF 衡量的是僅 yty_tyt? 和 yt?ky_{t-k}yt?k? 之間的相關性;
- PACF 衡量的是排除了 yt?1,...,yt?k+1y_{t-1},...,y_{t-k+1}yt?1?,...,yt?k+1? 對 yty_tyt? 的影響之后的 yty_tyt? 和 yt?ky_{t-k}yt?k? 之間的相關性。
平穩性的單位根檢驗
AR(1){\rm AR}(1)AR(1) 序列
為了引入平穩性的檢驗方法,我們首先介紹一階自回歸模型,即 AR(1){\rm AR}(1)AR(1) 模型。模型設定如下:
yt=?yt?1+ut,y_t=\phi y_{t-1}+u_t \ , yt?=?yt?1?+ut??,
其中,ut~WN(0,σ2)u_t\sim{\rm WN}(0,\,\sigma^2)ut?~WN(0,σ2) 。我們可以根據系數 ?\phi? 和 111 的關系判斷時間序列 {yt}\{y_t\}{yt?} 的平穩性。
當 ∣?∣>1|\phi|>1∣?∣>1 時,該隨機過程生成的時間序列是發散的,表現為持續上升或持續下降,因此是非平穩的。當 ?=1\phi=1?=1 時,是一個隨機游走過程,也是非平穩的。只有當 ∣?∣<1|\phi|<1∣?∣<1 時,該隨機過程才是平穩的。
Dickey-Fuller 檢驗
簡記為 DF 檢驗,只能用于檢驗一階自回歸模型是否具有平穩性,并且要求隨機誤差項必須是白噪聲序列。對如下 AR(1){\rm AR}(1)AR(1) 序列進行回歸,
yt=?yt?1+εt,y_t=\phi \, y_{t-1}+\varepsilon_t \ , yt?=?yt?1?+εt??,
如果 ?=1\phi=1?=1,則非平穩,此時稱 yty_tyt? 有一個單位根;如果 ∣?∣<1|\phi|<1∣?∣<1,則平穩。
可以將模型寫成差分形式:
Δyt=(??1)yt?1+εt?δyt?1+εt.\Delta \, y_t=(\phi-1)y_{t-1}+\varepsilon_t \triangleq \delta y_{t-1}+\varepsilon_t \ . Δyt?=(??1)yt?1?+εt??δyt?1?+εt??.
檢驗是否存在單位根,我們需要進行左側單尾檢驗,即 H0:δ=0?H1:δ<0H_0:\delta=0\longleftrightarrow H_1:\delta<0H0?:δ=0?H1?:δ<0 。
若拒絕零假設,則 yty_tyt? 是平穩的,否則為非平穩的。
需要注意的是,在零假設(非平穩)情況下,即使在大樣本下 ttt 統計量也是有偏誤的(向下偏倚),通常的 ttt 檢驗無法使用。Dickey-Fuller 提出了這一情形下 ttt 統計量服從的分布,此時我們將這個統計量稱為 τ\tauτ 統計量,服從的分布稱為 DF 分布。
簡單概括 DF 檢驗的步驟:通過 OLS 估計 δ^\hat\deltaδ^ ,計算 τ\tauτ 統計量的值,與 DF 分布表中給定顯著性水平下的臨界值比較。 τ\tauτ 統計量的計算公式如下所示:
τ=δ^se(δ^).\tau=\frac{\hat\delta}{{\rm se}(\hat\delta)} \ . τ=se(δ^)δ^??.
在左側單尾檢驗中,如果 τ\tauτ 統計量小于臨界值,則 δ\deltaδ 足夠小以致于拒絕原假設,認為時間序列 yty_tyt? 不存在單位根,即 yty_tyt? 為平穩序列。
Augmented Dickey-Fuller 檢驗
在實際的平穩性檢驗中,時間序列可能由更高階的自回歸過程生成,或是存在隨機誤差項并非是白噪聲的情況,這樣用 OLS 估計會表現出自相關問題,導致 DF 檢驗失效。另外,如果時間序列包含有明顯的隨時間變化的趨勢項,則也容易導致隨機誤差項的自相關問題。因此,我們對 DF 檢驗進行了擴充,提出了 ADF 檢驗。
我們可以用 ADF 檢驗形如 AR(p+1){\rm AR}(p+1)AR(p+1) 過程的平穩性,通過下面三個模型完成:
Δyt=δyt?1+∑i=1p?iΔyt?i+εt,\Delta \, y_t=\delta \, y_{t-1}+\sum_{i=1}^p\phi_i\Delta \,y_{t-i}+\varepsilon_t \ , Δyt?=δyt?1?+i=1∑p??i?Δyt?i?+εt??,
Δyt=α+δyt?1+∑i=1p?iΔyt?i+εt,\Delta \, y_t=\alpha+\delta \, y_{t-1}+\sum_{i=1}^p\phi_i\Delta \,y_{t-i}+\varepsilon_t \ , Δyt?=α+δyt?1?+i=1∑p??i?Δyt?i?+εt??,
Δyt=α+βt+δyt?1+∑i=1p?iΔyt?i+εt.\Delta \, y_t=\alpha+\beta t+\delta \, y_{t-1}+\sum_{i=1}^p\phi_i\Delta \,y_{t-i}+\varepsilon_t \ . Δyt?=α+βt+δyt?1?+i=1∑p??i?Δyt?i?+εt??.
檢驗的原假設仍然為存在單位根,即 H0:δ=0?H1:δ<0H_0:\delta=0\longleftrightarrow H_1:\delta<0H0?:δ=0?H1?:δ<0 。
實際檢驗時從模型3開始,然后模型2,最后是模型1。
當其中有一個模型的檢驗結果拒絕原假設時,即不存在單位根時,則停止檢驗,認為時間序列是平穩的。
當三個模型的檢驗結果都不能拒絕原假設時,則認為時間序列是非平穩的。
檢驗原理與 DF 檢驗相同,只是對模型 1、2、3 進行檢驗時,有各自相應的臨界值。
α\alphaα 和 β\betaβ 仍為雙側檢驗,δ\deltaδ 為單側檢驗。
單整時間序列
隨機游走序列經差分后等價地變形為
Δyt=yt?yt?1=εt,\Delta \, y_t=y_t-y_{t-1}=\varepsilon_t \ , Δyt?=yt??yt?1?=εt??,
由于 εt\varepsilon_tεt? 是一個白噪聲,因此差分后的序列 {Δyt}\{\Delta \, y_t \}{Δyt?} 是平穩的,稱為一階單整序列,記為 I(1){\rm I}(1)I(1)。
如果一個時間序列經過 ddd 次差分后變成平穩時間序列,則稱原序列為 ddd 階單整序列,記為 I(d){\rm I}(d)I(d) 。
I(0){\rm I}(0)I(0) 為平穩時間序列。
無論經過多少次差分都不能變為平穩的,稱為非單整的。
大多數非平穩的時間序列一般都可以通過一次或多次差分的形式變為平穩時間序列。
總結
以上是生活随笔為你收集整理的【计量经济学导论】08. 平稳时间序列的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: Qt安装及简单配置
- 下一篇: 利用DDS IP实现线性调频信号(二)