这里以2011年至2018年我国30个地区的面板数据为例,采用分位数回归方法来研究地区GDP的影响因素。
1.2 录入数据
打开数据编辑窗口,将数据从Excel中复制到Stata,注意粘贴时选择“将第一行作为变量名”
1.3 面板分位数回归
安装面板分位数回归的命令:
ssc install qregpd
ssc install moremata
ssc install amcmc
面板数据50%分位数回归:
qregpd pgdp open eduyear pfdi, id(id) fix(id) q(0.5)
在qregpd命令中,id()中指定面板数据的个体变量。fix()中需要指定固定效应变量,这里选择id进行个体固定效应估计;当然,也可以输入year
来进行时间固定效应估计。q()中输入分位数的值。
在估计结果中,可以看出,open、eduyear和pfdi三个变量的系数均显著为正数。
面板数据50%分位数回归的工具变量方法:
qregpd pgdp open eduyear pfdi, id(id) fix(id) q(0.5) instruments(pfdi open educost college)
在qregpd命令中,instruments()中输入外生变量和工具变量。其中,这里将pfdi和open作为外生变量,而educost和college作为eduyear的工具变量。
在估计结果中,可以看出,采用工具变量估计后,eduyear变量的系数仍然显著为正数,表明劳动者受教育年限提高有助于促进地区GDP提升。
1.4 面板分位数回归的mcmc估计
如果采用mcmc来估计面板数据的分位数回归,则需要加入在qregpd命令中加入参数:optimize(mcmc),同时加入参数:noisy draws(1000) burn(100) arate(.5)
面板数据50%分位数回归的mcmc估计:
qregpd pgdp open eduyear pfdi, id(id) fix(id) q(0.5) instruments(pfdi open educost college) optimize(mcmc) noisy draws(1000) burn(100) arate(.5)
在mcmc估计结果中,可以看出open、eduyear和pfdi三个变量的系数显著为正数,表明结果的稳健性较好!
1.5 面板分位数回归的grid估计
如果采用grid方法来估计面板数据的分位数回归,则需要加入在qregpd命令中加入参数:optimize(grid),同时加入参数:grid1(1000(50)3500),grid2(1000(50)3500)。其中,grid1和grid2分别对应第一个和第二个解释变量的网格,并且最多只能加入两个解释变量。
另外,grid估计中,系数的估计值及显著性收到grid设置的搜索网格的精度和数量限制,导致估计结果不准确!总之,grid估计仍有一些不完善的地方,在实际应用中可以有选择地来使用该方法。
面板数据50%分位数回归的grid估计方法:一个解释变量eduyear
qregpd pgdp eduyear, id(id) fix(id) q(0.5) instruments(educost college) optimize(grid) grid1(1000(50)3500)
在估计结果中eduyear变量的系数不显著!
面板数据50%分位数回归的grid估计方法:两个解释变量eduyear和open
qregpd pgdp eduyear open, id(id) fix(id) q(0.5) instruments(open educost college) optimize(grid) grid1(1000(50)3500) grid2(1000(50)3500)
在估计结果中eduyear和open变量的系数不显著!
1.6 进一步研究
上面仅演示了面板数据50%分位数的回归,为了确保估计系数的稳健性,需要进一步估计其他分位数下系数的估计值,由于stata中的操作与前面一致,所以不再演示!
获取案例数据,请关注微信公众号并回复:Stata_dt9