双重差分法之空间DID
簡單談一下我本人對空間雙重差分模型(Spatial Difference in Difference Model,SDID)幾點或許不太成熟的理解。
(本文首發于個人微信公眾號DMETP,歡迎關注!)
一、從聚類標準誤到空間相關性
當使用面板數據進行固定效應模型估計時,考慮到組間異方差和組內自相關,我們必然需要將標準誤進行聚類調整。一般來說,聚類調整后的標準誤大于異方差穩健標準誤,而異方差穩健標準誤大于普通標準誤,因此,根據聚類標準誤做出來的結果是相對最穩健的,這里所說的穩健,指的是系數顯著性穩健,因為標準誤影響t值,而對系數的本身影響不大。
然而,將標準誤聚類調整到什么層次是一個問題。當將個體(id)作為聚類依據時,即假定每個個體不同年份的干擾項存在相關性(組內自相關),而不同個體的干擾項不存在相關性(組間不相關)。但是,這樣的假定可能不符合現實情況,比如,對于微觀企業來說,同一行業的企業之間必然存在競合關系,此時同一行業不同企業之間就存在相關性,在這種情況下,將標準誤聚類調整到行業層面可能更合理。因此,為了得出更穩健的結果,也為了說服苛刻的讀者(或審稿人)接受我們根據實證結果得出的結論,將標準誤聚類到更高層級是一種更安全的做法,當然,聚類層級越高系數越不顯著。
然而,有時候我們沒有甚至不能將標準誤聚類到更高層級。除了顯著性與穩健性之間的權衡,更多的原因在于聚類層級越高聚類數目越少,而大樣本理論要求聚類數目足夠大,這樣才能保證所估計的標準誤收斂到真實值(Petersen,2009),根據拇指法則,聚類數少于30可能就不太合適了。
退而求其次,為了同時兼顧聚類層級與聚類數目,有些文獻將標準誤聚類到行業-年份層面(在Stata中可以利用分組函數group生成聚類變量再在回歸中進行聚類調整,即:先egen ind_year = group(industry year),然后reghdfe y xlist, absorb(id year) cluster(ind_year)),如李青原和章尹賽楠(2021)、邵朝對等(2021),即假定同一年同一行業之間存在自相關,而不同年或不同行業之間不存在自相關。
參考文獻:
[1] Petersen M A. Estimating Standard Errors in Finance Panel Data Sets: Comparing Approaches[J]. Review of Financial Studies, 2009, 22(01): 435-480.
[2] 李青原, 章尹賽楠. 金融開放與資源配置效率——來自外資銀行進入中國的證據[J]. 中國工業經濟, 2021(05): 95-113.
[3] 邵朝對, 蘇丹妮, 楊琦. 外資進入對東道國本土企業的環境效應: 來自中國的證據[J]. 世界經濟, 2021, 44(03): 32-60.
根據常識與理論將標準誤聚類調整到行業-年份層面,即先驗式地承認同一年份同一行業的企業存在相關性,同理,當聚類到省份-年份層面或區域-年份層面時,也可以認為同一年同一地區(省份或區域)不同個體之間存在相關性,這與構建空間計量模型(Spatial Econometric Model)的思想不謀而合。
空間計量模型最大的特征是放松了空間單位之間相互獨立的假設,即認為本地區與鄰近地區存在相互關系,本地區變量的變動不僅直接影響本地區,也會影響鄰近地區,而且通過影響鄰近地區最后反作用于本地區。本地區對本地區的影響稱為直接效應(Direct Effect),本地區對鄰近地區的平均影響稱作間接影響或空間溢出效應(Indirect Effect or Spatial Spillover Effect)。對具體空間相關形式的判斷,是在OLS模型的基礎上對其殘差進行拉格朗日乘子檢驗(LM test)和穩健的拉格朗日乘子檢驗(robust LM test),以檢驗OLS回歸殘差中是否存在某種形式的空間關聯,即檢驗OLS回歸殘差中是否包含被解釋變量的空間滯后項(wywywy)抑或擾動項的空間滯后項(wεw\varepsilonwε)(Burridge,1980;Anselin,1988;Anselin at al.,1996;Elhorst,2014)。
參考文獻:
[4] Burridge P. On the Cliff‐Ord Test for Spatial Correlation[J]. Journal of the Royal Statistical Society: Series B (Methodological), 1980, 42(01): 107-108.
[5] Anselin L: Spatial Dependence in Regression Error Terms, Anselin L, editor, Spatial Econometrics: Methods and Models, Dordrecht: Springer Netherlands, 1988: 100-118.
[6] Anselin L, Bera A K, Florax R, et al. Simple Diagnostic Tests for Spatial Dependence[J]. Regional Science & Urban Economics, 1996, 26(01): 77-104.
[7] Elhorst J P. Matlab Software for Spatial Panels[J]. International Regional Science Review, 2014, 37(03): 389-405.
因此,從這種意義上來說,當標準誤聚類調整到地區-年份層面時,此時假定中的同一年份同一地區不同個體之間存在的相關性(組內自相關)本質上是一種空間相關性。也就是說,當我們將標準誤聚類調整到地區-年份層面時,實質上就已經變相說明模型中存在一定的空間相關性。
二、個體處理效應穩定性假設
在DID中,一個經典的假設是個體處理效應穩定性假設(Stable Unit Treatment Value Assumption,SUTVA)。SUTVA最重要的一點是“處理組個體不會影響控制組個體”(Rubin,1974)。換言之,在SUTVA框架下,總體中的任何個體并不會受到其他個體接受處理與否的影響(王金杰和盛玉雪,2020)。然而,這個假設在考慮到空間相關性時被打破了,或者說,當不同空間單元之間存在相關性即存在空間溢出效應時,SUTVA不再成立(Kolak & Anselin,2019)。
參考文獻:
[8] Rubin D B. Estimating Causal Effects of Treatments in Randomized and Nonrandomized Studies[J]. Journal of Educational Psychology, 1974, 66(05): 688-701.
[9] 王金杰, 盛玉雪. 社會治理與地方公共研發支出——基于空間倍差法的實證研究[J]. 南開經濟研究, 2020, 1(01): 199-219.
[10] Kolak M, Anselin L. A Spatial Perspective on the Econometrics of Program Evaluation[J]. International Regional Science Review, 2019, 43(02): 128-153.
事實上,SUTVA在大多數情況下可能都不成立,而現有的DID類實證文章很少會考慮到這一點,并且Ferman(2020)指出忽略空間相關性將導致標準誤被低估,從而夸大系數的顯著性。
參考文獻:
[11] Ferman B. Inference in Differences-in-Differences: How Much Should We Trust in Independent Clusters? [R]. MPRA Paper 93746, University Library of Munich, Germany, 2020.
一個簡單的道理,處理組在期初實施了某項政策,控制組沒有實施,但不是說政策實施之后只會對處理組產生影響,通過示范、學習、要素流動等渠道也會作用于控制組,因此,政策的施行在長期將會在一個較廣的區域范圍內產生普遍(但不一致)的影響。
這里有兩個問題,一個是政策實施對控制組作用的力度,另一個是作用的方向。
首先,在處理組實施的某項政策不會對全域內所有地區產生相同的影響,可能兩地間經濟聯系越密切,政策的空間溢出效應越強;可能兩地共享同一地理邊界(鄰接),空間溢出效應越明顯;可能兩地核心城市之間的地理距離或路程距離越短,空間溢出效應就越強。總之,政策的施行不會對其他地區產生一致的影響,而會隨著某種空間相互關系的趨弱存在衰減效應,而我們論文中的SDID就是圍繞這種空間相互關系進行研究設計的(空間權重矩陣的設置)。
其次,處理組實施的某項政策對鄰近地區的影響有正有負。一方面,政策施行導致資源向先行區傾斜集聚,這不僅意味著先行地區內部資源的重新配置,而且也將導致鄰近地區的資源(如勞動力、資金等)向該地區流動富集,這樣的結果是抑制了鄰近控制組的經濟發展,形成了“虹吸效應”。另一方面,先行發展的示范區一般都是經濟發展較好的地區(這同時說明DID可能存在嚴重的樣本自選擇問題!),政策實施后這些地區將已有的、相對落后的產能向周圍轉移,連帶著將相關人才、技術與資金轉移,通過這樣的一種方式促進了鄰近地區的發展,形成了所謂的“涓滴效應”??傊?#xff0c;政策的施行對鄰近地區產生正反兩方面的影響,而我們的工作就是要精準穩健地測度出這種影響,并進一步分析出這種異質性影響背后的形成機制或者說機理。
三、政策實施的空間溢出效應
下面結合幾個實例給出SDID模型設計的參考。
空間計量模型中和DID結合最多的是自變量空間滯后模型(The Spatial Lag of X Model,SLX),而SLX是在普通線性模型等式右端引入(所有)自變量的空間滯后項,形如式(1)(1)(1):
Y=αιN+Xβ+WXθ+ε(1)Y=\alpha \iota _N+X\beta +WX\theta +\varepsilon \tag{1} Y=αιN?+Xβ+WXθ+ε(1)
式(1)(1)(1)中的WXWXWX即為所有自變量的空間滯后項,由于等式右端不包括被解釋變量的空間滯后項,該模型可以視為普通的線性模型,并使用OLS方法進行估計。因此,式(1)(1)(1)中的β\betaβ衡量的是直接效應的大小,θ\thetaθ測度的是間接效應的大小(Vega & Elhorst,2015)。
參考文獻:
[12] Vega S H, Elhorst J P. The SLX Model[J]. Journal of Regional Science, 2015, 55(03): 339-363.
SDID基于式(1)(1)(1),但等式右邊只有DID交互項的空間滯后項,其余自變量均以其初始形式作為控制變量,形如式(2)(2)(2):
Y=αιN+Xβ+φdid+θWdid+ε(2)Y=\alpha \iota _N+X\beta +\varphi did+\theta Wdid+\varepsilon \tag{2} Y=αιN?+Xβ+φdid+θWdid+ε(2)
其中,φ\varphiφ代表政策的直接效應,即絕大多數論文中所要考察的處理效應(Treatment Effect),而θ\thetaθ代表政策的間接效應或空間溢出效應。
王金杰和盛玉雪(2020)在研究社會治理與地方公共研發支出的關系時,將十八屆三中全會以來的社會治理作為準自然實驗,設計了如下式(3)(3)(3)的實證模型。
Y=?+θ+(α+βW)D+Xγ′+WXδ′+ε(3)Y=\phi +\theta +\left(\alpha +\beta W\right)D+X\gamma ^{'}+WX\delta ^{'} + \varepsilon \tag{3} Y=?+θ+(α+βW)D+Xγ′+WXδ′+ε(3)
其中,DID交互項(DDD)空間滯后項系數β\betaβ衡量的是平均的溢出效應。
可以看出,形如式(2)(2)(2)和式(3)(3)(3)的SDID只能測度平均的空間溢出效應,空間滯后項系數的大小代表在所有處理組實施的政策對鄰近地區的影響。從這個意義上來說,以上的研究設計本質上討論的是空間依賴性,而非空間異質性,而對空間異質性的討論或許是我們應該關注的重點,即:在處理組實施的某項政策,在多大范圍內存在空間溢出效應?
沈坤榮和金剛(2018)在評估河長制的水污染治理效果時,設計了如下式(4)(4)(4)的實證模型。
Pollutantit=βHezhangzhiit+α∑δ∑jwijδδ+100Hezhangzhijt+λXit+αi+γt+εit(4)Pollutant_{it}=\beta Hezhangzhi_{it}+\alpha \sum_{\delta}{\sum_jw_{ij}^{\delta \text{~}\delta +100}Hezhangzhi_{jt}+\lambda X_{it}+\alpha _i+\gamma _t+\varepsilon _{it}} \tag{4} Pollutantit?=βHezhangzhiit?+αδ∑?j∑?wijδ?δ+100?Hezhangzhijt?+λXit?+αi?+γt?+εit?(4)
其中,wijδδ+100w_{ij}^{\delta \text{~}\delta +100}wijδ?δ+100?表示閾值為[δ,δ+100][\delta,\delta +100][δ,δ+100]的地理距離倒數矩陣元素,當iii地和jjj地之間的距離在閾值范圍內,該元素取值為距離倒數,否則為0。
可以看出,形如式(4)(4)(4)的SDID模型以100kmkmkm為步進距離,考察在不同地理閾值范圍內空間溢出效應的大小。圖 1是不同地理閾值范圍內系數α\alphaα的大小與顯著性。
參考文獻:
[13] 沈坤榮, 金剛. 中國地方政府環境治理的政策效應——基于“河長制”演進的研究[J]. 中國社會科學, 2018(05): 92-115+206.
然而,也有部分文獻通過巧妙的模型設計,在不使用SDID的情況下,測度了不同閾值范圍內政策實施的空間溢出效應。
曹清峰(2020)在評估國家級新區的經濟效應時,認為國家級新區通過空間溢出效應促進了區域協調發展。該文的實證模型設計如下式(5)(5)(5):
gdprit=β0+β1didit+∑s=50400δsNits+λZit+νi+μt+εit(5)gdpr_{it}=\beta _0+\beta _1did_{it}+\sum_{s=50}^{400}\delta _sN_{it}^s+\lambda Z_{it}+\nu _i+\mu _t+\varepsilon _{it} \tag{5} gdprit?=β0?+β1?didit?+s=50∑400?δs?Nits?+λZit?+νi?+μt?+εit?(5)
其中,sss表示不同城市間的球面距離;如果在ttt年距離城市iii(s?50,s](s-50,s](s?50,s]的空間范圍內存在國家級新區,Nits=1N_{it}^s=1Nits?=1,否則Nits=0N_{it}^s=0Nits?=0;系數δs\delta_sδs?衡量了國家級新區設立后對鄰近城市經濟增長率的影響。圖 2是不同地理閾值范圍內系數δs\delta_sδs?的大小與顯著性。
參考文獻:
[14] 曹清峰. 國家級新區對區域經濟增長的帶動效應——基于70大中城市的經驗證據[J]. 中國工業經濟, 2020(07): 43-60.
總結
以上是生活随笔為你收集整理的双重差分法之空间DID的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: sqlserver2005 sa密码忘记
- 下一篇: PVE安装画面灰白只显示鼠标解决方案