長面板數(shù)據(jù)模型的估計方法
第一種:使用OLS估計這個特殊的雙向固定效應模型,并對誤差項的自相關、異方差和截面相關的問題只提供面板校正的標準誤(使用命令xtscc或xtpcse命令實現(xiàn)),這種估計方法最為穩(wěn)健。 第二種:如果存在自相關、異方差和截面相關的問題,則使用FGLS估計這個特殊的雙向固定效應模型,這種方法只是解決了誤差項自相關的問題,而并未考慮異方差或截面相關的問題,對于誤差項的異方差和截面相關的問題仍然只是提供面板校正的標準誤(使用命令xtpcse實現(xiàn)),這種估計方法介于穩(wěn)健和效率之間。 第三種:使用FGLS估計這個特殊的雙向固定效應模型,對誤差項的自相關、異方差和截面相關的問題一并加以處理(使用命令xtgls實現(xiàn)),這種估計方法最有效率 。
長面板數(shù)據(jù)類型的STATA估計命令
stpcse 命令格式:
xtpcse depvar indepvars,options
該命令的關鍵在于選項
A. 自相關的設定(一階自相關) a.corr(ar1) ,使用的估計方法為FGLS【誤差項存在自相關時使用該選項;當T不比n大很多時 使用該選項,因為此時T可能無法提供足夠多的信息去估計每個個體的自相關系數(shù),所以約束了每個個體的自相關系數(shù)都相等】 b.corr(psar1) ,使用的估計方法為FGLS【誤差項存在自相關時使用該選項;當T比n大很多時使用該選擇項,當T比n大很多時 每個個體的自相關系數(shù)可以不同,就可以使用選項】 c.corr(independent)或corr(ind),使用的估計方法為OLS【誤差項 不存在自相關 】
B.異方差與截面的設定 a.independent 【誤差項不存在異方差和截面相關問題,使用該選項】 b.hetonly (提供考慮異方差的面板校正標準誤)【誤差項存在異方差但不存在截面相關問題,則使用該選項】 c.不加選項即可 (提供既考慮異方差又考慮截面相關的面板校正標準誤)【誤差項存在異方差和截面相關問題時,不加任何選項】 選項:corr(ind)+independent等價于LSDV
xtgls 命令格式
xtgls depvar indepvars,options
如果對誤差項的處理正確,那么xtgls比xtpcse估計效果更好
A.對異方差和截面相關的設定
a.panels(iid)****【誤差項不存在異方差和截面相關】 b.panles(heteroskedastic)****【誤差項存在異方差+截面不相關】 c.panels(correlated)只適用于長面板數(shù)據(jù) 【誤差項存在異方差+截面相關】 選項:corr(ind)+panels(iid)等價于LSDV
B.自相關的設定 a.corr(ar1) ,使用的估計方法為FGLS #誤差項存在自相關時使用該選項;當T不比n大很多時使用該選項,因為此時T可能無法提供足夠多的信息去估計每個個體的自相關系數(shù),所以約束了每個個體的自相關系數(shù)都相等 b.corr(psar1) ,使用的估計方法為FGLS。 #誤差項存在自相關時使用該選項;當T比n大很多時使用該選擇項,當T比n大很多時每個個體的自相關系數(shù)可以不同,就可以使用選項 c.corr(independent)或corr(ind) ,使用的估計方法為OLS。 #誤差項不存在自相關時,使用該選項
xtscc
實戰(zhàn)操作
以香煙需求估計與三大檢驗為例,即數(shù)據(jù)集“mus08cigar.dta”,包括了美國10個州1963-1992年有關香煙消費量的相關變量。
第一步 模型設定
雙向固定效應模型——(審稿人一般認為雙向固定效應為邏輯起點) 其中,被解釋變量lnclnc l n c 為人均香煙消費量的對數(shù),解釋變量:lnplnp l n p 為實際香煙價格的對數(shù),lnpminlnpmin l n p m i n 為相鄰州最低香煙價格的對數(shù),lnylny l n y 為人均可支配收入的對數(shù)。
use"D:\mus08cigar.dta"
des##結果
Contains data from D:\mus08cigar.dtaobs: 300 vars: 6 26 Nov 2008 17:14
----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------storage display value
variable name type format label variable label
----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
state float %9.0g U.S. state
year float %9.0g Year 1963 to 1992
lnp float %9.0g Log state real price of pack of cigarettes
lnpmin float %9.0g Log of min real price in adjoining states
lnc float %9.0g Log state cigarette sales in packs per capita
lny float %9.0g Log state per capita disposable income
----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
xtset state year## 結果panel variable: state (strongly balanced)time variable: year, 63 to 92delta: 1 unit
告訴Stata軟件,這是一個以截面變量state為州,時間變量為year的面板數(shù)據(jù)。由“strongly balance”可知,這是一個平衡面板數(shù)據(jù)。
第二步 描述性統(tǒng)計及作圖
sum lnc lnp lnpmin lny## 結果Variable | Obs Mean Std. Dev. Min Max
-------------+---------------------------------------------------------lnc | 300 4.792591 .2071792 4.212128 5.690022lnp | 300 4.518424 .1406979 4.176332 4.96916lnpmin | 300 4.4308 .1379243 4.0428 4.831303lny | 300 8.731014 .6942426 7.300023 10.0385
twoway (scatter lnc lnp)(lfit lnc lnp)
lnp與lnc之間是負相關系的,與理論預期一致。
xtline lnc
第三步 模型估計
tab state,gen(state)##結果U.S. state | Freq. Percent Cum.
------------+-----------------------------------1 | 30 10.00 10.002 | 30 10.00 20.003 | 30 10.00 30.004 | 30 10.00 40.005 | 30 10.00 50.006 | 30 10.00 60.007 | 30 10.00 70.008 | 30 10.00 80.009 | 30 10.00 90.0010 | 30 10.00 100.00
------------+-----------------------------------Total | 300 100.00
gen t=year-62
reg lnc lnp lnpmin lny state2-state10 t##結果Source | SS df MS Number of obs = 300
-------------+---------------------------------- F(13, 286) = 56.65Model | 9.24427482 13 .711098063 Prob > F = 0.0000Residual | 3.58977229 286 .012551651 R-squared = 0.7203
-------------+---------------------------------- Adj R-squared = 0.7076Total | 12.8340471 299 .042923234 Root MSE = .11203------------------------------------------------------------------------------lnc | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+----------------------------------------------------------------lnp | -1.027 0.104 -9.92 0.000 -1.231 -0.823lnpmin | 0.510 0.102 5.01 0.000 0.309 0.711lny | 0.498 0.153 3.26 0.001 0.197 0.798state2 | -0.077 0.038 -2.01 0.045 -0.153 -0.002state3 | 0.089 0.029 3.01 0.003 0.031 0.146state4 | -0.181 0.071 -2.54 0.012 -0.321 -0.041state5 | -0.107 0.089 -1.20 0.231 -0.281 0.068state6 | 0.218 0.048 4.57 0.000 0.124 0.312state7 | 0.116 0.075 1.54 0.125 -0.032 0.263state8 | 0.107 0.049 2.17 0.031 0.010 0.204state9 | 0.043 0.033 1.32 0.189 -0.021 0.108state10 | -0.134 0.033 -4.07 0.000 -0.198 -0.069t | -0.043 0.012 -3.57 0.000 -0.067 -0.019_cons | 3.489 1.377 2.53 0.012 0.777 6.200
------------------------------------------------------------------------------
est store ols
avplot lnp
第四步 三大檢驗
自相關檢驗
檢驗誤差項的自相關問題
xtserial lnc lnp lnpmin lny state2-state10 t## 結果Wooldridge test for autocorrelation in panel data
H0: no first order autocorrelationF( 1, 9) = 89.304Prob > F = 0.0000
P值為0,所以拒絕一階自相關不存在的原假設,表明存在自相關問題。
異方差檢驗 需要注意的是: 【xttest3】只能在【xtreg,fe】和【xtgls】命令之后使用 ssc install xttest3(第一次使用需要安裝)
quietly xtreg lnc lnp lnpmin lny t,fe
xttest3##結果
Modified Wald test for groupwise heteroskedasticity
in fixed effect regression modelH0: sigma(i)^2 = sigma^2 for all ichi2 (10) = 378.90
Prob>chi2 = 0.0000
P值為0,所以拒絕原假設,認為誤差項存在異方差問題。
截面相關的檢驗 需要注意的是 : 使用命令【xttest2】對誤差項的截面相關問題進行檢驗。 【xttest2】只能在【xtreg,fe】、【xtgls】或【ivreg2】之后使用,只適用于長面板數(shù)據(jù); 第一次使用【xttest2】的同學,需要使用命令【ssc install xttest2】進行安裝
. quietly xtreg lnc lnp lnpmin lny t,fe
. xttest2## 結果Correlation matrix of residuals is singular.
not possible with test
r(131);
我在這里遇到的問題是矩陣是奇異的,不能使用xttest2,但老師實例中得到結果是P值是0,拒絕了原假設,所以存在截面相關。
第五步 報告結果
通過三大檢驗,我們知道模型的誤差項存在自相關、異方差和截面相關的問題,所以,我們需要對誤差項的自相關、異方差和截面相關問題進行處理并報告計量結果。
xtpcse lnc lnp lnpmin lny state2-state10 t,corr(psar1)
est store xtpcse
xtgls lnc lnp lnpmin lny state2-state10 t,corr(psar1) panels(correlated)
est store xtgls
xtscc lnc lnp lnpmin lny state2-state10 t
est store xtscc
通過esttab命令將所有的存儲結果放在一起進行比較。
esttab ols xtpcse xtgls xtscc,b(%9.2f)p mtitle(ols xtpcse xtgls xtscc)obslast star(* 0.1 ** 0.05 *** 0.01)compress nogap k(lnp lnpmin lny t)
總結
以上是生活随笔 為你收集整理的浙江大学【面板数据分析与STATA应用】——第二讲长面板数据分析与机制识别方法 的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
如果覺得生活随笔 網(wǎng)站內(nèi)容還不錯,歡迎將生活随笔 推薦給好友。