动态面板模型估计方法简介以及stata应用
动态面板模型最主要的特征是在控制变数中加入了y的滞后项
,
其中 代表控制变数,
代表固定效应,
代表残差项
由于加入了y的滞后项导致了采用常用固定效应估计方法会导致参数估计的不一致性,因此需要采用其他的估计方法。
本文主要分为4个部分:
1为什么不能采用固定效应以及ols等估计方法
2.动态面板模型的估计方法
3.动态面板模型的假设检验
4.stata应用
part 1 为什么不能采用固定效应的估计方法以及普通的ols
如果采用普通的ols,我们可以看出 和
存在相关性,因此不能采用ols进行估计,
那如果我们采用固定效应估计,把 减去呢,实际上,即使通过减去均值的估计方法,我们依然发现其存在内生性。
,但
和
仍然存在相关性,具体过程可以将上述式子展开,即可发现,常用的估计方法都无法使用,因此我们必须要想办法解决这个问题,
part 2 动态面板模型估计方法
2.1 difference gmm
常用的动态面板估计方法有2种,分别为difference gmm估计和system gmm估计方法,
difference gmm采用的方法是首先将固定效应去掉,原因是因为固定效应和y的滞后项相关
,
但 和
依然相关,怎么办,最常用的解决内生性的方法是什么,答:工具变数法,工具变数方法乃是解决内生性的良药,
存在内生性,但
以及
及往后的滞后项都可以作为他的工具变数,因为这些变数既和
相关,有保证和
无关,哈哈,还算可以的工具变数,
这么多工具变数,我们该如何选择呢,首先 及其滞后项并不是很好的工具变数,原因在于减少了样本量,因此我们选择
以及其滞后变数作为工具变数,哈哈,完美了,接下来,我们就可以采用工具变数的方法进行估计了,
但工具变数方法并不完美,因为我们随机抽样的样本方差很大概率是不同的,有的样本方差大,有的样本方差小,很自然,方差小的样本应该给与较大的权重,而方差大的样本应该给与相对较小的权重,因为本文不以讲解GMM为目的,因此只是简要介绍了一下GMM的好处,因此我们采用diiference gmm的方法来估计。
2.2 system gmm
那既然difference已经解决了内生性,为什么还有发明system gmm估计呢?原因在于diiference gmm选择的工具变数很有可能是弱工具变数,即相关性比较小,这样会导致方差较大,结果不显著。比如如果y接近于随机游走的话,那么difference gmm选择的工具变数为弱工具变数,那怎么办呢
,
又回到了最初的起点,我们选择 及其滞后项作为其工具变数,并假设其
和
,
都不相关,因此得出估计量。
由于这块自我感觉解释的比较少,而有很多文献都说system gmm估计量优于diiference gmm,因此下面详述一下system gmm的假设,当然system gmm由于其解决内生性的方法,能估计出随著时间没有改变的变数的值,如虚拟变数等。
正由于我们上文所说,difference gmm选择工具变数很有可能是弱工具变数,原因就在于y和y的滞后项并不存在较强的相关性,那么弱工具变数会导致方差太大,估计结果不显著,相信大多数人都把显著性看作自己的命根子吧,因此有些人发明了system gmm估计方法,
其方法的主要逻辑就是选择更好的工具变数,既能去除内生性,又能保证工具变数与解释变数较强的相关性。
system gmm估计方法选择直接选择 的工具变数,选择即
以及其滞后项作为其工具变数,但我们必须要假设
其一 和
无关,注(此处表述略有不对,仅为方便理解),
其二 和
无关,要保证此项需要保证
不存在序列相关,
在这两个假设下,system gmm才是一致的。
因此system gmm需要在此上述两个假设以及y的滞后项并没有包含很多y的信息的情况下,才应该用system gmm
part 3 动态面板模型常用的假设检验
part3.1 对自相关的检验
其主要目的就是为了检验 是否存在自相关,如果存在自相关的话,会导致内生性,那么difference gmm就需要选择更滞后的y作为其工具变数,system gmm就不成立了。
但我们并不能直接得到 的值,无法直接检验,一般情况下我们通过差分的形式来检验,通过差分的形式我们可以去掉固定效应,但如果检验
和
,我们发现其存在内生性,因此我们选择检验
和
的相关性,这也就是AR(1)和ar(2)检验,
也就是是必须通过AR(2)检验,才能保证工具变数的有效性。
part 3.2 过度识别检验(hasen 和sargon检验)
其检验的目的是为了识别工具变数是否为完全外生,如果工具变数的个数与所需估计参数的个数相等,那么我们无法检验出工具变数的有效性,但如果工具个数如果大于所需要估计参数的个数,那么我们具有多余的工具变数进行检验。
相对好理解这种检验的方式是通过不同的工具变数估计出来的参数结果应该是接近的,不应该有很大的不同。
假设检验的形式为
在原假设工具变数均为有效工具变数的情况下,其应该服从均值为0的正太分布,也就是说原假设为真的情况下,p值应该大于0.10。
那么sargon检验和hasen检验有什么区别呢
sargon检验在假设残差项具有同方差的情况下估计出来的结果,但在工具变数较多的情况下稳健
而hasen检验假设在异方差的情况下,对各样本的权重进行了估计,但在工具变数较多的情况下稳健。
part 4 stata应用
其基本的语法为
xtabond2 y l.y x1 x2 ...xn ,gmm(l.y,lag(1 任意数字) iv(x1 x2 ...xn) ort small robust
很明显xtabond2 后面先接所有的变数,然后GMM里面接y的滞后项,后面的lag表示你选择的工具便令,iv后面接所有的变数除了y和y的滞后项
ort代表的是去除固定效应的一种变换,相对差分GMM可以增大样本量
small表示针对小样本也有效
robust表示计算的是稳健性标准误
two表示是gmm估计的针对二阶段的一种估计方法,默认为one step
xtabond2 默认执行difference gmm,
针对xtabond2的option请见stata help种关于其的讲解,本部分只做简单介绍
推荐阅读: