菲律宾申慱sunbet平台
菲律宾申慱sunbet平台
设为首页 | 收藏此站
关于我们 工业新闻中心 工业动态中心 工业新闻案例 联系我们
您的位置: sunbet主页 > 工业动态中心 >
工业新闻中心
第四次工业革命来临
清洁能源麒坪贡献丨
中国钢铁工业协会六
使用GMM的方法分析动态面板数据pdf
发布人: 菲律宾申慱sunbet平台 来源: 菲律宾申慱sunbet网址 发布时间: 2020-08-04 08:09

  对外经济贸易大学金融学院 洋 GMM 方法与动态面板数据——一个简介 2015 年8 月 在阅读文献中经常看到有使用GMM方法分析动态面板数据,但没有深入研究。最近开 始自己用此方法时,感觉很困惑,因为使用此方法的文献中,对方法的原理大多语焉不详。 对该方法的适用性,为什么用此方法,以及方法优缺点介绍聊聊几句。因此,通过读文献很 难对该方法有全面的把握。 由于时常有学生过来问我怎么用GMM方法处理动态面板数据,不能总是含糊地回答, 同时自己也在写这方面的文章,因此找来几本参考书,搜集了大量的文献,详细阅读之后, 撰写本文。文中主要内容摘要并整理自Roodman (2009 ),这是STATA命令xtabond2命令的 作者所写的介绍性文章,应该有权威性,如果该文不准确,那么所有使用此命令做的研究将 全部失效。同时参考了Cameron and Trivedi (2009 )和 (Angrist and Pischke ,2009 )等书籍。 本文仅为作者对该方法的理解,如有不妥、疑问或请联系: 。 (一)为什么要用GMM 方法 本文所谓动态面板数据(Dynamic Panel data, DPD)分析,指的是分析中采用如下的回归 方程: Y Y  X  u  (1) i,t i,t1 it i it i 1,...,N ,t 1,...,T Y i 其中, 是因变量的滞后项, 是个体 的固定效应。因变量的滞后项和固定效应 u i ,t1 i 同时存在,是动态面板数据分析特殊性的关键。如果固定效应不存在,那么回归方程变为: Y Y  X  (2 ) i,t i,t1 it it 这时,用OLS或者随机效应模型回归分析即可。如果因变量的滞后项Y 不存在,那 i ,t1 么回归方程变为: Y  X  u  (3 ) i,t it i it 1 对外经济贸易大学金融学院 洋 对于该模型,用固定效应模型分析即可。如果因变量的滞后项和固定效应都存在,那 么对于(1)式这样的回归方程,如果采用差分方法去掉固定效应,会得到如下的结果 Y Y X  (4 ) i,t i,t1 it it 其中Y =Y -Y ,Y =Y -Y ,X =X -X , = - 。如果(1) i,t i,t i,t -1 i,t -1 i,t -1 i,t -2 i,t i,t i,t -1 i,t i,t i,t -1 式代表了真实的变量之间关系,那么Y 和it 之间必有相关性,因为: i ,t1 Y =Y -Y =( 1)Y  X  , i,t -1 i,t -1 i,t -2 i,t2 i,t1 i,t1 cov(Y ,  ) 显然不会等于0,因为两者都有 这一项。 i,t -1 i,t i ,t1 通常所用的固定效应模型实际上就是对(1)式差分,得到类似于(4 )式的差分回归 方程,然后做OLS 。对于现在的情况,由于Y 和it 之间的相关性,再用OLS只会得到 i ,t1 有偏误的回归系数。所以传统的统计方法无法实现对此类方程的估计,需要用GMM方法。 需要注意的是 (2)的模型(包含滞后项的OLS)和(3)的模型(不包含滞后项的FE, 固定效应)尽管都有偏误,但好处是一个偏大,一个偏小(具体哪个大,哪个小要看变量之间 的关系),所以这两个估计系数应该界定了真实参数的范围 (Angrist and Pischke ,2009:246 页;Roodman ,2009 )。也就是说,你最后用GMM方法估计出来的参数应该落到这个区间。 (二)什么是GMM 方法 通常所用的OLS等方法,基本逻辑是从计量模型对数据拟合的角度分析,得出最好的 估计参数。GMM方法,又称为广义矩方法(Generalized Moment Method ),该方法所用的思 与传统思完全不同。任何计量模型都有一定的适用性,即数据要满足一定的要求。GMM 方法的思是,从计量模型对数据的要求出发,得出一系列矩条件,再根据这些矩条件,求 解满足条件的系数。对于大多数计量模型,GMM方法和传统的方法“殊途同归”,得出的回 归系数相差不会太远。 1、线性回归中的GMM 方法 以OLS为例,对于回归方程: 2 对外经济贸易大学金融学院 洋 Y Xβε 1 ˆ β 传统OLS模型中, 的估计量β =(X X) (X Y) 。注意到,如果使用OLS模型,数 OLS ε 据有要求,就是自变量 和误差项 要,也就是说: X E (X ε) 0 这个就是所谓的“矩条件”。把ε Y βX 带入,得到E (X (Y Xβ)) 0 ,即: E (X Y) E (X X)β 1 β [E (X X )] E (X Y) β E (X X) E (X Y) 为了得到 的估计量,可以把 和 的估计量分别带入,即 ˆ 1 ˆ 1 E (X X) X X ,E (X Y) X Y N N 1 ˆ 得到βGMM (X X) X Y ,这是和传统的OLS一样的估计量。 2、工具变量的GMM 方法 工具变量方法也可以用矩估计的思实现。由于过程略复杂,此处仅给出简要步骤, 详细的推导可以参考 (Roodman ,2009 )。需要回归的方程为: Y Xβε 其中, 是工具变量,E (ε Z ) 0。 ,是 个自变量向量, Z X (x ,x ...x ) k 1 2 k Z (z , z ...z ) β 是 个工具变量向量。相应的,待估计的系数 是k 维向量。定义 1 2 j j ˆ ˆ ˆ E Y Xβ β E Y Xβ 为误差向量,对于任意估计出来的参数 ,残差项为 。 ε E (Z ε) 0 根据工具变量的含义,它应该和误差项 : ,这就是我们需要的矩条 1 ˆ 件。计算的时候,理论上应该利用E (Z ε)  ZE 0 求解,注意到,我们有 个工具 N j N 3 对外经济贸易大学金融学院 洋 变量,也就是 个矩条件 ( 个方程)。理论上,需要根据这 个方程求解 个待估计的参 j j j k 数。但是不幸的是,如果工具变量的数量 小于待估计的参数数量 ,方程是不可识别的— j k —通常不可能通过2个方程解出3个未知数。如果工具变量等于待估计的参数,是恰好可识别 的,但这种情况在GMM 中很难碰到。最常见的是工具变量多于待估计的参数,即j k , 这意味着要找 个参数,让 个方程同时等于零。这难度相当大,实际上大多数时候找不到, k j 1 ˆ 怎么办呢?在矩估计里面,采用的办法是,找 个参数,让E (Z ε)  ZE 和零之间的 k N N A 距离最小。实际计算的时候,需要借助一个半正定的矩阵 ,计算向量EN (Z ε) 的模: 1 ˆ 1 ˆ 1 ˆ 1 ˆ ˆ EN (Z ε) A  ZE N ( ZE) A( ZE) EZAZE N N N N A ˆ 目标变成,寻找参数向量β =argmin E (Z ε) ,这就要用到一阶条件等于零: A N A d EN (Z ε) A 2 ˆ ˆ = …= EZAZ(-X) 0 d N ˆ ˆ 计算的过程利用到了连锁规则和向量求导的公式。继续推导,把E Y Xβ带入,得 到: ˆ ˆ ˆ 0 EZAZX (Y Xβ)ZAZX YZAZX βX ZAZX 1 ˆ β =(X ZAZX) XZAZY A β β 这就是 的GMM估计量,这个估计量是有偏的,它的期望值不等于真实的 ;然而它 β 是一致的,当样本量足够大的时候,它会接近真实的 。这个估计量和A有关,但是A 只影 ˆ 响参数估计的有效性——不同的A对应的参数 的速度不同。这里的A其实是对不同的 βA 矩条件加以不同的权重,可以找到一个最快的A ,称为AE G M M ,可以证明: A Var(zε)1 。 EGMM 4 对外经济贸易大学金融学院 洋 对于工具变量法常用的两阶段最小二乘法(2SLS ),如果假定误差项是同分布,那 么AEGMM Var(zε)1=(ZZ)1 ,此时 1 1 1 ˆ β =(X Z(ZZ) ZX) XZ(ZZ) ZY GMM 这实际上就是传统通过两阶段最小二乘法(2SLS )估计出来的参数,殊途同归。 3、GMM 方法的有效性(Hansen 检验和Sargan 检验) 1 ˆ 前文已经介绍,使用GMM方法的目标是选择参数,最小化EN (Z ε)  ZE 和零之 N 间的距离 EN (Z ε) A 。那么问题来了,多小算小呢?会不会是最小值也显著大于零?如果 这样的话,方法的适用性就成问题。也就是说,根据你估计出来的参数,算出的残差项实际 上和工具变量不是。Hansen检验和Sargan检验的逻辑就是,以 EN (Z ε) A 最小化为目 标,估计出参数,然后把参数带入,看看它是否真的等于零。如果统计上不能它等于零, 则所用工具变量可靠;如果统计上它等于零,则不可靠。 1 ˆ 如果零假设成立(即 :工具变量是联合有效的),那么E (Z ε)  ZE 应随机分 H 0 N N 2 布于零附近,它和零的距离应服从 分布:  1 ˆ 1 ˆ ˆ 2 EN (Z ε) A  ZE EZAEGMM ZE  j k EGMM N N A EGMM j k 2 这就是Hansen统计量,它服从度为 的 分布,这里度其实就是过度识  别的维度。在实际使用中,不应该显著(p值小于0.1);如果显著,则表明了零假设, 工具变量不是联合有效的。然而,需要注意的是,如果使用的工具变量太多,那么Hansen j k 2 统计量会非常不显著,常常等于1。这是因为, 越大,意味着 分布显著的门槛越高  2 (请查阅 分布的表格)。也就是说,工具变量太多,会让Hansen检验的效果变弱,这是需  要注意的。通常Hansen检验的p值大于0.25就要小心了,这时需要考虑减少工具变量的数量。 Sargan 检验的统计量类似,只不过把Hansen统计量中的AEGMM 替换成了(ZZ)-1 ,即 5 对外经济贸易大学金融学院 洋 1 ˆ 1 ˆ 2 S EN (Z ε) (z z )1 N EZ(ZZ) ZE  j k 然而,该统计量有时候是不一致的,如果在命令中要求报告稳健的Sargan统计量,软件 1 ˆ 会做两阶段GMM估计 (先找任意合理的H ,令A=(ZHZ) ,估计出第一步参数 ;再根 β1 1 ˆ ˆ ˆ ˆ 据 ,计算出残差项的方差-协方差矩阵 ,令 ,估计出第二部参数 ), β  A=(Z Z) β 1 βˆ1 βˆ1 2 根据第二步的参数结果,默默报告出Hansen统计量。整体上说,Hansen统计量好像更靠谱一 点,所以报告的时候,更多关注Hansen统计量。 (三)动态面板数据 现在回到我们的动态面板数据,对数据和模型有如下假定: 1) 动态。模型中包含了因变量的滞后项; 2) 有个体的固定效应; 3) 可以有一些自变量是内生的; 4) 除了固定效应之外的误差项 可以异方差,可以序列相关;  it  5) 不同个体之间的误差项 和 不会相关。  it jt 6) 可以有前定的(Predetermined )但不是完全外生的变量。 7) “大N,小T”,即个体数量要足够多,但时间不用太长。如果时间足够长的话,动 态面板误差不会太大,用固定效应即可。 从上述要求可以看出,GMM方法特别适合宏观的面板数据分析,因为宏观变量中,很 难找出绝对外生的变量,变量之间多少会互相影响。而GMM方法可以“有一些自变量是内 生的”,这可能也是GMM方法在文献中这么常用的原因。 此前已经说过,不能用传统的OLS方法或者固定效应模型进行动态面板数据的分析, 那样会得到有偏的估计量。先要对数据进行一定的变换,然后根据不同的矩条件设定开展矩 估计。其中数据变换有两种方法,矩条件的设定也有两种方法。 6 对外经济贸易大学金融学院 洋 1、数据的变换方法:一阶差分还是垂直离差 为了消除动态面板数据中的固定效应,通常用的有两种方法:一阶差分(first difference)和垂直离差(orthogonal deviations)。一阶差分之前已经介绍过了,这种方法 是difference GMM 中默认的方法。缺点是如果数据中有缺失值,那么最终的估计会缺失很 多样本,原始数据缺一行往往会导致差分后的数据缺两行。一种替代的方案是用垂直离差 (xtabond2 命令中用 orthogonal 选项实现),每个变量减去该变量未来所有观测值的平均 值,即:  1 w  c (w  w ) i ,t1 it i ,t is T it st 式子中, 为调整权重变量, 是从t期开始以后观测值的数量。对 c T / (T 1) T it it it it 于非平衡面板,和数据有缺失的面板,这种方法避免了因缺失数据带来的样本损失,因为调 整的时候只是把未来的平均值减去,样本数不会因缺失未来个别观测值而受损。然而,对于 平衡面板数据,一阶差分和垂直离差估计出来的结果会完全一样。 2、Different GMM 还是 System GMM 令数据变换之后的回归方程变为 Y * Y * X * (5 ) i,t i,t1 it it 这种变换可以是一阶差分,也可以是垂直离差。Different GMM 的逻辑是,如果是垂直 离差变换,用Y 作为Y * 的工具变量;如果是一阶差分变换,用Y 作为Y * 的工 i ,t2 i ,t1 i ,t2 i ,t1 具变量,此时Y *=Y 。X *对应的工具变量也类似,如果是垂直离差,就用滞后一 i,t1 i,t1 it 阶的,如果是差分就用滞后一阶的差分作为工具变量。在实现的时候,为了提高估计的有效 性,通常还会加入更高阶的滞后项(滞后差分)作为工具变量。这些变量的加入利用了更多 的信息,然而也会带来麻烦,让工具变量的数量随T平方成比例增加。为了控制工具变量的 数量,一个选择就是采用collapse选项把这些工具变量变成一列。 如果因变量的变化过程接近随机游走,那么Difference GMM 的估计量会有较大偏差。 7 对外经济贸易大学金融学院 洋 System GMM 的方法和Different GMM完全不同,它不需要对自变量和因变量进行数据 变换。它假定工具变量的差分,即w =w w ,应该外生于固定效应:E (w u )=0 。 it it i ,t1 it i 如果 是内生的, 就可以作为工具变量,更高阶的差分也可以做工具变量。如果 是 w w w i ,t -1 前定的但不是完全外生的,w 可以作为工具变量,更高阶的差分也可以做工具变量。当 i ,t 然,更高阶差分加入后,还是会增加工具变量数量,需要在具体计算时想办法控制。 (四)使用GMM 方法的注意事项  可以尝试先做(2 )式的 OLS,再做(3 )式的固定效应。当然这两个估计都是有偏误 的,然而这两个估计的系数应该是真实系数的上限和下限,可以给最后的GMM 估计限 定参考范围。  “大N ,小T ”,如果N 太小了,则估计出来的标准差可能不太靠谱。实际上如果用 省际面板去做的话,不满足“大N ”这个条件,但中文文献中着这样的研究。如果 样本的N 较小,但还可以接受(比如N=70 ),然而又想用此方法,那么加上small 选项。  解释变量中,放入时间虚拟变量。比如,数据有 10 年,则放入9 个虚拟变量。加入后, 可以让“误差项 和 不会相关”这个条件更容易满足。   it jt  如果数据中间有间隙,尽量利用垂直离差(对于每个变量,包括自变量和因变量, 减 w it 去它未来值的平均值,就是加上 orthogonal 选项,见Roodman (2009 )),这会减 少样本量的损失。因为数据中间缺一行,一阶差分 ( )后就会缺两行数据。 w w it i ,t1 但对平衡面板数据,两种数据变换方法结果一样。  通常,每个自变量都要出现两次 (除了系统外的工具变量)。先作为自变量出现在在 xtabond2 命令中逗号的左边,再以某种形式作为工具变量出现在逗号右边。如果变量 w w 是完全外生的,那么放到 ivstyle(w) (表示直接作为工具变量);如果 是前定 的,但不是完全外生的,则放到gmmstyle(w)(表示从滞后一期开始都作为工具变量); w 如果 是内生的,则放到gmmstyle(L.w) (表示从滞后两期开始都作为工具变量)。  报告工具变量的数量。如果按照上一条的做法,工具变量的数量会很多。这样会导致 overidentification test 不准确,【一个标志就是Hansen 统计量的p 值变为1,Hansen test 的p 值在(0.1,0.25)之外都要小心,太小表明工具变量有效的假设,太大表明选 的工具变量太多,hansen检验变弱了】。通常,需要工具变量数量,可以用collapse 选项,也可以用laglimits()选项。习惯做法是,选择不同数量的工具变量以显示估 计系数的稳健性。工具变量数量的上限就是模型中个体的数量 (也就是N),超出此上 限,xtabond2 命令会报警。  使用system GMM 的时候要注意,能使用该模型的前提是,工具变量的变化wit wi ,t1 8 对外经济贸易大学金融学院 洋 要和固定效应垂直。因此数据应该在稳态附近,否则这些变量的变化就会和固定效应关 系比较大,从而不满足system GMM适用的条件。  由于GMM 方法有很多设定选项,在报告结果时,报告你的选项。System GMM 还是 Difference GMM;是用垂直离差还是一阶差分;选用什么工具变量,滞后几期;选 择什么样的robust 标准差,等等。 参考文献 [1] Angrist, J. D. and J. Pischke , Mostly Harmless Econometrics. Princeton, New Jersey: Princeton University Press, 2009. [2] Roodman, D. , How to Do Xtabond2: An Introduction to Difference and System GMM in Stata, The Stata Journal, 2009, 1( 9), 86-136. 9

sunbet,菲律宾申慱sunbet网址,菲律宾申慱sunbet平台
@2015 上海 菲律宾申慱sunbet平台 工业用品有限公司 首页 | 关于我们 | 工业新闻中心 | 工业动态中心 | 工业新闻案例 | 联系我们
sunbet,菲律宾申慱sunbet网址,菲律宾申慱sunbet平台 网站地图 电话:+86 21-62120656/62128546 传真:+86 21-62123708