计量经济学第四次笔记(工具变量)
工具变量,刚刚开始学起来感觉是一个比较抽象的概念,好吧,可能计量整个学起来就是属于比较抽象的,因此试图以自己的方式来把工具变量说的尽量清楚一些。
什么是工具变量
首先,要明确工具变量本质上是来解决 内生性问题 的,比如:研究一个人的工资水平wage由什么决定,我们提出由:性别male,年龄age,智商IQ三个因素决定,因此,我们有:
wage=\beta_0 +\beta_1age+\beta_2male+\beta_3IQ+u
但是这里有一个问题,即:IQ由于存在测量误差,因此和u相关,这会导致IQ的估计系数 \beta_3 有偏,如下图所示(估计出来的 \hat{\beta_3} 一部分是 IQ 变化对 wage 的影响,另一部分则是u导致的 IQ 变化进而导致的 wage 变化):
因此我们需要来解决这个问题。如何解决呢?可以使用工具变量来解决。假设工具变量是父母的受教育程度z,那么我们首先以图解的形式来看看z的作用到底是什么?
z的作用本质上就是z变化引起x变化进而引起y变化(z和x相关,父母的受教育程度和孩子的IQ相关,这个设定是合理的),这个作用纯粹是x对y的影响(受教育程度z和孩子工资不直接相关,因此z不会对y产生直接影响, z 对 y 产生的影响都是通过 x 产生的),没有包含 u ,因为 z 和 u 不相关(这也是工具变量的一个要求),所以这样就可以把 IQ 的系数 \beta_3 无偏地估计出来。
内生性问题产生的原因:
1、遗漏和解释变量相关的重要变量
2、测量误差
3、互为因果(x影响y,y也影响x)
如果产生了内生性问题,却不去解决,继续使用OLS估计,就是使得解释变量的系数估计值有偏且不一致。
工具变量如何使用
关于工具变量的使用可以分为以下几种情况:
1、简单回归,一个内生解释变量,一个工具变量,无其他解释变量:直接计算协方差即可
2、多元回归,一个内生解释变量,一个工具变量,多个外生解释变量:结构方程联立求解,其实也就是联立方程组求解
3、模型中只有一个内生解释变量,但是该内生变量有两个或者多个工具变量,无法取舍,并且也想充分利用两个工具变量包含的信息:2SLS, 两阶段最小二乘法
4、模型中有很多内生解释变量:判断阶条件,即:工具变量个数一定要大于内生变量个数(对于每一个内生变量来说),然后和3一样,使用两阶段最小二乘法即可。
两阶段最小二乘法:
第一阶段: 判断工具变量是否有效,因为你不能随便找一个变量就说他是工具变量,这里主要是判断是否是好的工具变量(即工具变量和内生解释变量之间的相关性,得强相关才行,如果弱相关就会出现问题),所以第一步就是用 内生解释变量 对 工具变量和模型中的其他变量 做回归,其实也就是把原来的wage换成了IQ。
IQ=\beta_0 +\beta_1age+\beta_2male+\alpha z+\epsilon
第二阶段: 用第一步中拟合的 \hat{IQ} 代入到原来的模型中,因为此时的 \hat{IQ} 是纯净的,和 u 不相关,(想想为什么? \hat{IQ} 是由工具变量和其他外生变量决定的,工具变量和其他外生变量和u都不相关,所以 \hat{IQ} 和 u 也不相关 ),这个时候再进行回归,得出的 IQ 的估计值 \hat\beta_3 的估计值就无偏的。
一些需要注意的问题:
是否有内生性问题:
如果没有内生性问题,那么OLS更加合适(因为OLS估计量的方差更小),通过一元线性回归查看基本直觉。
根据工具变量的性质,有:
E(u)=0;Cov(z,u)=0;Cov(z,x)\neq 0
易得:
Cov(z,y)=\beta_1Cov(z,x)+Cov(z,u)
即:
\hat{\beta}_1^{IV}=\frac{Cov(z,y)}{Cov(z,x)}=\frac{\sum (z_i-\bar{z})(y_i-\bar{y})}{ \sum (z_i-\bar{z})(x_i-\bar{x}) }
展开可知:
plim\hat{\beta}_1^{IV}=\beta_1+\frac{\sum (z_i-\bar{z})(u_i-\bar{u})/n}{ \sum (z_i-\bar{z})(x_i-\bar{x}) /n }=\beta_1 ,IV估计量是一致估计量
而传统的OLS估计为:
\hat{\beta}_1^{OLS}=\frac{Cov(x,y)}{Cov(x,x)}=\frac{\sum (x_i-\bar{x})(y_i-\bar{y})}{ \sum (x_i-\bar{x})(x_i-\bar{x}) }
展开可知:
plim\hat{\beta}_1^{IV}=\beta_1+\frac{\sum (x_i-\bar{x})(u_i-\bar{u})/n}{ \sum (x_i-\bar{x})(x_i-\bar{x}) /n } ,由于此时 x 存在内生性,因此 Cov(x,u)\neq 0 。因此OLS估计量不是一致估计量
容易得到,两种估计量的方差分别为:
Var(\hat{\beta}_1^{OLS})=\frac{\sigma^2}{\sum (x_i-\bar{x})^2}=\frac{\sigma^2}{n\sigma_x^2}
Var(\hat{\beta}_1^{IV})=\frac{\sum (z_i-\bar{z})^2\sigma^2}{ [ \sum (x_i-\bar{x})(x_i-\bar{x}) ]^2 }=\frac{\sigma^2}{n\sigma_x^2\rho_{x,z}^2}
由于 0<\rho_{x,z}^2<1 ,因此工具变量的方差会更大,特别是如果 x 和 z 几乎不相关的时候,其方差会大的离谱。因此,弱工具变量问题可能会使得估计量有效性非常低!
如何检验是否存在内生性问题:
由上述两种估计方式的表达式可见,如果没有内生性问题,那么两种估计方式系数一直,但OLS估计量更为有效——方差更小。反之,如果有内生性问题,那么IV估计量是一致的。可以通过下面的检验判断是否需要工具变量:
检验方法1:
使用Hausman test,Hausman test的原假设是:所有解释变量均为外生变量,然后比较iv估计值和ols估计值和的差异,如果很大,说明存在内生性问题,如果比较小,则不存在。
但是不能够过度依赖Hausman test,也就是说即使Hausman test结果表明内生性问题不显著,一般情况下也还是需要讨论内生性问题,或者从理论机制、经济学常识说明为什么不会产生内生性问题。
并且,传统的Hausman test不适用于异方差情形,因此可以做如下形式的检验——注意,这里的标准误都需要使用 异方差稳健 的标准误:
检验方法2:
1、首先把疑似内生变量 y_2 对所有外生变量和工具变量做回归,得到残差 \hat{v_2} ,即:
y_2=\beta_0+\beta_1z_1+\beta_2z_2+\beta_3z_3+\beta_2z_4+v_2
2、在原始方程(可能存在内生性问题的方程)中加入 \hat{v_2} ,因为我们假设 Cov(y_2,u)\neq 0 ,但是显然外生变量和工具变量都不和 u 相关,只能是 Cov(u_2,v)\neq 0 ,假设 u=\beta_6v_2+e ,带入原始回归方程:
y_1=\beta_0+\beta_1z_1+\beta_2z_2+\beta_3z_3+\beta_2z_4+\beta_5y_2+\beta_6\hat{v_2}+e
3、检验 H_0:\beta_6=0 ,如果拒绝原假设则 y_2 是内生变量——因为它和 u 相关
_______________________________________________________________________________________
弱工具变量 ,如果工具变量和内生变量相关性很小,根据我们上述估计量方差的表达式,可以发现此时方差会很大,这就会出问题。
解决方式:1、寻找更好的工具变量 2、使用LIML,有限信息极大似然估计法。
过度识别检验:
工具变量也可能和u相关,导致工具变量法会产生误差,所以需要检验工具变量是否严格外生,但是这在恰好识别的时候无法做到,只有工具变量个数大于内生变量个数时才能使用过度识别检验。
工具变量和代理变量的区别: 一个必须直接影响因变量wage,另一个则不能直接影响因变量wage。比如:IQ是能力的一个很好的代理变量,但是它却不是能力的一个很好的工具变量。
处理测量误差:
由于解释变量测量误差问题引起的内生性问题,如果我们有两次测量,那么就可以解决这个内生性问题,但是如果我们只有一次测量,则无法解决内生性问题。
工具变量结果外推性 :工具变量是LATE(局部平均处理效应,研究结论是否可以外推需要依赖于具体问题)