本节学习最为常用的两个面板数据模型:固定效应模型 (Fixed Effects model,简称:FE) 和随机效应模型 (Random Effects model,简称:RE)。
07/30
Stata教程
当工具变量的影响和内生变量的测量之间存在时间差距时,传统的 IV 回归并不能得到参数的一致估计。为此,Gregory Casey 和 Marc Klemp 提出了一个简单框架来估计内生变量的长期影响。
06/08
IV-GMM
数据框 DataFrames 是 Stata16 版本新增的一项很实用的功能,它允许我们在 Stata 内存中同时存储、操作多份数据集。本文主要介绍纵向追加数据框的两个命令 append 和 fframeappend。
05/27
Stata命令
年报文本语气数据库 (Annual Report’s Tone Database,ARTD) 是基于上市公司 2007 年以来的年报文本信息,并根据已有中文语调研究成果,采用多种方法计算上市公司年报文本的语气建立而成的数据库。
05/23
参数校准作为宏观经济学实证研究的重要环节,其结果对后续研究中的基准拟合结果分析、反事实模拟与稳健性检验具有重要影响。相关的 Stata 命令为 nl 和 nlsur。
05/15
Stata命令
本文将从基本模型介绍、前期数据准备、基准回归、平行趋势检验、安慰剂检验以及 PSM-DID 等整体流程入手,采用模型分析与实例结合的形式对多时点 DID 模型进行讲解。
04/12
倍分法DID
控制函数法 (Control Function,CF) 是处理内生性问题的一个常用方法。本文主要对CF方法在不同模型中的几种代表性用法进行简析。
04/10
Stata命令
本文基于 2013 年加利福尼亚实施的「限额与交易计划」的背景,通过使用三重 DID,探究环保政策通过资金约束所产生的溢出效应,即政策能否有效影响企业行为。
03/31
cleanplots 是一个 Stata 图形方案,可以改变 Stata 图形的默认外观,在预测和边际效应的图形绘制上具有更好的效果。
03/11
Stata绘图
Stata 默认的配色方案并不是很完美,这也意味着我们需要为图形选择合适的配色方案。color_style 可以快速帮您更换图形配色,让您的研究绽放光彩!
02/21
Stata绘图
CiteSpace 软件是 Citation Space 的简称,译为“引文空间”,可呈现科学知识的结构、规律和分布情况,是一款定量分析的实用型文献分析软件。
02/19
文本分析目前是经济金融领域炙手可热的研究工具。本文针对文本“数值化”的方法之一 Word2Vec 进行简要介绍和简单的案例操作。
12/27
Python-R-Matlab
Gobillon 和 Magnac (2016) 研究了交互效应与线性因子模型在地区政策评估中的应用。本文聚焦于 Gobillon 和 Magnac (2016) 的实证部分。
12/23
双层优化匹配 (BLOP Matching) 通过将匹配和权重的选择与匹配后协变量平衡的改进联系起来,能够内生决定最佳近邻数量,且在协变量平衡方面表现出色。
12/19
PSM-Matching
Wooldridge 证明了双向固定效应 (TWFE) 与包括单位时间均值和时间段特定横截面平均值的混合 OLS (他称之为双向 Mundlak (TWM) 回归) 的结果具有等价性。Stata 的命令 jwdid 提供了基于 TWM 法的估计结果。
12/07
倍分法DID
Pre-trend test 是检验处理组和控制组是否“相像”的一个检验。Roth (2022) 这篇文章告诉我们,pre-trend test 有两个问题。
11/23
倍分法DID
本文旨在学习如何从 Our World in Data 网站中获取公开的新冠肺炎数据,并在 Stata 中绘制“山脊图” (也叫“峰峦图”或“堆叠图”)。
11/19
Stata绘图
Cohn 等 (2022) 认为,log(y+1) 作为因变量的回归系数缺乏有意义的解释,并可能导致符号错误,更好的做法是使用泊松回归。
11/05
聚类稳健标准误放松了误差项满足独立同分布的假定,允许聚类内部个体间误差项存在相关性,但是聚类之间个体误差项不存在相关性。MacKinnon 等 (2022) 为聚类推断的有效性提供了检验方法。
10/18
内生性有 3 个主要来源:遗漏变量、互为因果和衡量偏误。其中第三种衡量偏误受到的关注相对较少,但若存在这一问题,会导致研究者无法一致地估计解释变量的系数。
10/16
内生性-因果推断
传统的 Heckman 两步法可以解决样本选择造成的内生性问题,但仍忽视了由样本个体异质性造成的内生性问题。为了克服这一缺陷,Carlson 和 Joshi (2022) 提出了广义 Heckman 两步法 (又称作 gtsheckman)。
10/14
Stata命令
断点回归 (RDD) 和拐点回归 (RKD) 是实证经济学中重要的工具。本文提出了一种用于 RDD、RKD 和相关 IV 估计模型选择的新方法。该方法允许产生带宽、多项式和任何其他选择参数的最佳组合。
10/08
断点回归RDD
R&R (revise and resubmit: 修订后重新提交)阶段应如何回复审稿人意见,以最大限度地提高将该 R&R 转换为出版物的可能性,并最大限度地减少修订轮次?
09/28
控制固定效应满足的是同期外生性假设,严格外生性假设往往不成立。当严格外生性得不到满足时,解决办法是使用 GMM 或者 IV 估计量。然而,即便是使用工具变量,也应当测试其是否满足严格外生性假设。
09/13
空间计量经济学与传统计量经济学的最大区别是引入空间权重矩阵。常用空间权重矩阵包括:邻接矩阵、距离矩阵和嵌套矩阵。本文旨在识别不同的空间权重矩阵,掌握其生成原理,以便更好地进行经济学研究。
09/11
空间计量-网络分析
在实证研究中「坏的控制」时常出现,当一个变量的加入使得回归结果与预期产生明显差异时,该变量可能是坏的控制。如何避免这一差异已经成为实证研究中的重要挑战。在本文中,我们试图使用图形工具来解决这一问题
09/08
内生性-因果推断
Stata模拟:控制变量!控制变量!Good-Controls-Bad-Controls
09/08
内生性-因果推断
povcalnet 命令允许 Stata 用户计算世界银行家庭调查数据库中 160 多个国家和地区的贫困及不平等指标,该命令具有与 PovcalNet 网站相同的功能。
09/01
Stata命令
两步回归法是实证会计与金融研究中的常用手段。研究人员通常使用普通最小二乘法将一个因变量分解为预测和残差两部分,并将残差部分作为第二次回归的因变量。然而这一方法计算的系数和标准误是有偏的,并且偏差的大小是模型中回归变量相关性的函数。
08/04
python 在数据处理方面效率非常高,使用 Stata + python 联合将大大提高数据读入导出的效率。
07/21
Python-R-Matlab
中断时间序列 (ITS) 是公共卫生、公共政策和卫生服务领域的一种常见研究方法。该方法通过控制结果变量干预前的上升或下降趋势,来检验干预措施的效果,包括中断前后的水平变化和趋势变化。
07/15
内生性-因果推断
Overleaf 作为线上开源的LaTex编辑器,提供了海量模板,使用者只需要对 Overleaf 中预先设定的模板进行简单修改,即可获得自己想要的排版效果。
06/27
Markdown-LaTeX
10391
Stata-Python交互:PyStata 是 Stata17 中引入的一个新概念,它涵盖了所有 Stata 和 Python 的交互方式。
06/25
Python-R-Matlab
在实证分析中,我们通常需要控制某些变量来缓解遗漏变量问题,例如公司年龄 (age) 和公司规模 (size)。不过,当我们同时控制了公司固定效应和时间固定效应后,公司年龄与固定效应会存在共线性问题。为缓解上述问题,学者往往会对公司年龄取对数。那么这一方法是否可以发挥作用呢?
06/19
由于平衡增长是 Kaldor 事实的典型特征,具有平衡增长路径的增长模型已成为宏观经济学的基础。然而,具有平衡增长路径性质的模型与增长过程中的一个典型规律不一致,即大量劳动力从农业流向制造业和服务业。为此,本文构建了一个同时具有 Kaldor 事实与结构变化的简单模型。
06/13
本文将介绍 joy_plot 命令,该命令由 Fernando (2022) 开发,主要用于绘制 joyplot。joyplot 是一种看起来犹如山水画一般的层峦叠嶂图形,由于外形与山峦类似,其中文名为山峦图、峰峦图或叠嶂图。
06/05
Stata绘图
Atanasov 和 Black (2021) 汇总整理了 2006 年—2015 年利用外生冲击作为工具变量的 32 篇文章,这些文章涵盖 24 种不同冲击类型。本文将对这 32 篇文章涉及的各类冲击事件、工具变量和测量变量进行汇总。
06/03
IV-GMM
在国内外学术会议上,汇报者经常使用专业的 PPT 排版软件,后来才知道这种演示文稿是使用 LaTeX 中的 Beamer 制作而成。Beamer 是 LaTeX 软件中用于制作演示文稿的拓展包,排版精美,默认行距自动对齐,所以 Beamer 相较于微软的 PPT 应用也更加广泛。本文详细介绍如何使用 Beamer 制作演示文稿。
06/01
Markdown-LaTeX
指数族随机图模型 (ERGM) 越来越多地应用于社会网络的研究。ERGM 是为了解释网络的全局结构,同时允许在微观层面上对联系预测进行推断。例如为什么一些点之间会有链接?为什么某些点在网络中处于中心地位,其他点处于外围?为什么一些网络紧密相连,而另一些则稀疏?
05/24
Python-R-Matlab
中国A股市场上如何择股?有一类投资者偏好投资创历史新高的股票。其逻辑是股价创新高有创新高的道理,可能有很好的业绩支撑或者公司业务有突破性发展,只是当前消息还没有公布,所以有的资本市场的弄潮儿偏好这类股票。本文尝试利用 Stata 爬取同花顺数据中心提供的创历史新高股票数据,实现自动爬取每个交易日的数据,不过需要 Stata 中配置 Python 环境才可运行。
05/20
文本分析-爬虫
本文介绍了基于 Bootstrap (自抽样 / 自举法) 的组间系数检验方法及其 Stata 实现。具体思路如下:
第一种思路:首先通过有放回的自抽样方法获得一系列经验样本 (Empirical Sample);然后在经验样本中根据其实际分组情况进行分组回归,从而获得分组回归系数差异统计量 d 的经验分布;最后通过检验 0 在 d 分布中的相对位置来检验 H0: d = 0。
第二种思路:首先通过有放回的自抽样方法获得一系列经验样本;然后按照真实分组的比例,但随机的为每个样本分配组别,并进行分组回归,从而构造出随机分组情况下,组间系数差异统计量的 d 经验分布。其背后的逻辑是,如果不存在组间系数差异,那么无论样本属于哪个组别,x 对 y 的边际影响都是相同的;最后检验实际观察到的组间系数差异在 d 分布中的相对位置来判断我们实际观察到组间系数差异的概率,若小于给定置信水平,则拒绝 H0: d = 0。
05/18
Stata教程
本文主要介绍由苏黎世联邦理工学院教授 Matteo Pinna 开发的,用于时间维度横截面分析的可视化操作命令 multicoefplot。该命令最大的优势是在横截面比较的同时,允许不同控制变量集下得到的点估计系数以及置信区间进行直接比较。
05/17
Stata命令
在论文写作中,图形在呈现研究数据方面起着关键的作用,并有助于验证数据分析的结果。然而,图形可能有时绘制不当,无法准确表达作者的观点,因此需要在发表之前进行反复修改。为此,本文将通过对 Rice 等 (2015) 的介绍,来帮助大家更好理解 Stata 绘图以及实证写作。
05/16
Stata绘图
本课程主要介绍正则表达式相关语法规则及非结构化数据处理;讲解 Python 的基础知识,并使用 Python 进行数据处理、数值计算、网络爬虫、文本分析等不同任务的处理;介绍机器学习常用算法,如决策树、随机森林、支持向量机等的基本原理,并使用 Python 实现各类算法。
04/11
12985
本课程介绍实证研究中常见的事件史/生存分析方法和模型,包括:描述性统计 (K-M 估计)、离散时间 Logit 模型、参数模型、分段恒定对数比率模型、比率风险模型等。
03/30
作为宏观经济研究的主流框架,伴随着以 Dynare 为代表的软件包不断的开发和优化,DSGE 模型不再是少数研究者的专属方法,而逐渐成为所有宏观经济学习者和专业研究人员的日常工具之一。
11/05
Mata 语言是 Stata 9 以来新增的重要模块,高级的车供需基本上都是使用 Mata 来写的,不断速度快,扩展性也很强。
03/12
Stata程序
包括:「基本无害的计量经济学」一书的 Stata, Python, R 实现代码;连玉君老师录制的公开课——「直击面板数据模型」的所有课件和范例数据。
02/27
Stata资源
在实证分析中,我们经常需要在模型中加入行业虚拟变量、年度虚拟变量等,以便控制不可观测的行业个体效应或年度个体效应。然而,在正式报告结果时,我们无需报告这些虚拟变量的系数,否则结果表格会变得非常冗长。
简言之,在估计模型时,我们需要加入这些虚拟变量,而在最终呈现结果时,只在表格中进行标注,说明我们已经控制了这些虚拟变量,而受限于篇幅,没有呈现这些变量的估计系数。
11/20