雙重差分法,英文名Differences-in-Differences,別名「倍差法」,小名「差中差」。作為政策效應評估方法中的一大利器,雙重差分法受到越來越多人的青睞,概括起來有如下幾個方面的原因:(1)可以很大程度上避免內生性問題的困擾:政策相對於微觀經濟主體而言一般是外生的,因而不存在逆向因果問題。此外,使用固定效應估計一定程度上也緩解了遺漏變數偏誤問題。(2)傳統方法下評估政策效應,主要是通過設置一個政策發生與否的虛擬變數然後進行回歸,相較而言,雙重差分法的模型設置更加科學,能更加準確地估計出政策效應。(3)雙重差分法的原理和模型設置很簡單,容易理解和運用,並不像空間計量等方法一樣讓人望而生畏。(4)儘管雙重差分法估計的本質就是面板數據固定效應估計,但是DID聽上去或多或少也要比OLS、FE之流更加「時尚高端」,因而DID的使用一定程度上可以滿足「虛榮心」。

在細緻介紹DID之前首先強調一點,一般而言,DID僅適用於面板數據,因此在只有截面數據時,還是不要浪費心思在DID上了。不過,事無絕對,在某些特殊的情景下,截面數據通過巧妙的構造也是可以運用DID的,大神Duflo曾經就使用截面數據和DID研究了南非的養老金計劃項目對學前兒童健康的影響,感興趣的可以去搜搜大神的文章。

具體來說,基準的DID模型設置如下:

其中,du為分組虛擬變數,若個體i受政策實施的影響,則個體i屬於處理組,對應的du取值為1,若個體i不受政策實施的影響,則個體i屬於對照組,對應的du取值為0。dt為政策實施虛擬變數,政策實施之前dt取值為0,政策實施之後dt取值為1。du·dt為分組虛擬變數與政策實施虛擬變數的交互項,其係數

就反映了政策實施的凈效應。

從DID的模型設置來看,要想使用DID必須滿足以下兩個關鍵條件:一是必須存在一個具有試點性質的政策衝擊,這樣才能找到處理組和對照組,那種一次性全鋪開的政策並不適用於DID分析;二是必須具有一個相應的至少兩年(政策實施前後各一年)的面板數據集。

為什麼交互項du·dt的係數

就能夠體現出政策的凈效應呢?這一點可以通過下表來體現(下表也反映了雙重差分法五個字的真正含義):

雙重差分法的基本思想就是通過對政策實施前後對照組和處理組之間差異的比較構造出反映政策效果的雙重差分統計量,將該思想與上表的內容轉化為簡單的模型(1),這個時候只需要關注模型(1)中交互項的係數,就得到了想要的DID下的政策凈效應。

更進一步地,DID的思想與上表的內容可以通過下圖來體現:

圖中紅色虛線表示的是假設政策並未實施時處理組的發展趨勢。事實上,該圖也反映出了DID最為重要和關鍵的前提條件:共同趨勢(Common Trends),也就是說,處理組和對照組在政策實施之前必須具有相同的發展趨勢。DID的使用不需要什麼政策隨機以及分組隨機,只要求CT假設,因此用DID做論文時必須對該假設進行驗證,至於具體怎麼驗證,後面再說。

很多時候,大家在看使用DID的文獻時,會發現別人的基準模型和模型(1)並不完全一致,別人的模型如下:

別人的模型里只有交互項du·dt,而缺失了du和dt,是哪裡出問題了么?並沒有,模型(1)和(2)本質還是一樣的,且模型(2)在多年面板數據集里更為常見。模型(2)中,

為個體固定效應,更為精確地反映了個體特徵,替代了原來粗糙的分組變數du;

為時間固定效應,更為精確地反映了時間特徵,替代了原來粗糙的政策實施變數dt。因而,du和dt並未真正從模型中消失,只是換了個馬甲。模型(2)事實上就是一個雙向固定效應模型,這也是為什麼DID方法一定程度上可以減輕遺漏變數偏誤的原因(主要是消除那些不可觀測的非時變因素,為了使估計結果儘可能準確,模型中還是要加入控制變數)。

在介紹完DID的基本思想和模型設定後,現在要開始強調同等重要的內容,那就是穩健性檢驗——必須證實所有效應確實是由政策實施所導致的。很多人對這一點並不重視,認為DID很簡單,隨便跑幾個回歸就可以寫出一篇大作了。關於DID的穩健性檢驗,主要表現在兩個方面:

(1)共同趨勢的檢驗。這個假設是比較難驗證的,看文獻時會發現別人經常沒有做該檢驗,比如,很多人做DID時只有政策實施前後各一年的數據,這樣的的話根本無法驗證政策實施前的趨勢問題。不過,如果是多年的面板數據,可以通過畫圖來檢驗CT假設,之前推薦的那篇AER文章就畫了大量的圖形對此進行了說明。

(2)即便處理組和對照組在政策實施之前的趨勢相同,仍要擔心是否同時發生了其他可能影響趨勢變化的政策,也就是說,政策干預時點之後處理組和對照組趨勢的變化,可能並不真正是由該政策導致的,而是同時期其他的政策導致的。這一問題可以概括為處理變數對產出變數作用機制的排他性,對此,可以進行如下的檢驗:

A. 安慰劑檢驗,即通過虛構處理組進行回歸,具體可以:a)選取政策實施之前的年份進行處理,比如原來的政策發生在2008年,研究區間為2007-2009年,這時可以將研究區間前移至2005-2007年,並假定政策實施年份為2006年,然後進行回歸;b)選取已知的並不受政策實施影響的群組作為處理組進行回歸。如果不同虛構方式下的DID估計量的回歸結果依然顯著,說明原來的估計結果很有可能出現了偏誤。

B. 可以利用不同的對照組進行回歸,看研究結論是否依然一致。

C. 可以選取一個完全不受政策干預影響的因素作為被解釋變數進行回歸,如果DID估計量的回歸結果依然顯著,說明原來的估計結果很有可能出現了偏誤。等等。

儘管DID的基本原理很簡單,但其實際運用十分靈活,並不是上面一點內容可以介紹完的,大家應當多去看相關的文獻,然後多做總結。關於DID的一些擴展內容,比如DDD、PSM-DID等,以後再跟大家細說。

閱讀原文


推薦閱讀:
相关文章