连享会 · 推文导航 |
连享会课程 ·
温馨提示: 文中链接在微信中无法生效。请点击底部「阅读原文」。或直接长按/扫描如下二维码,直达原文:
目录
3. Stata 实操
4. 相关推文
1. 简介
在经济学研究中,内生性问题一直是一个重要的挑战。越来越多的研究使用历史工具变量来解决内生性问题。在连享会推文 IV在哪里?奇思妙想的工具变量 中也列举了通过历史因素寻找工具变量的例子。
但是,当工具变量的影响和内生变量的测量之间存在时间差距时,传统的 IV 回归并不能得到参数的一致估计。为此, Casey 和 Marc Klemp 提出了一个简单框架来估计内生变量的长期影响,并且以 et al. (2001,PDF) 的研究为例检验这种偏差校正方法的效果。
下面,本文将详细介绍 Casey and Klemp (2021) 提出的方法,以及对应的 Stata 实操。
2. 理论基础2.1 问题缘起
下图中展示了作者的基本思路。其中,代表内生解释变量chi2,并且是时变的。 代表因变量。作者用下标 代表历史时期,即工具变量最开始对 产生影响的时期。用下标 代表当前时期,即 被测算的时期。假设 是 的有效工具变量,但是 未被观测。
作者认为,这张图的第一行 (忽略 ) 在大多数情况下提供了一幅不完整的潜在动态图。原因如下:
如果有充足的理由认为在当前时期 会影响 ,那么,通常在历史时期 也会影响 。如果 存在持久性,或者 影响 的因素具有持久性,那么 对 的因果影响将不是由 介导的。这一动态过程是复杂的,在图中用 来表示。在大部分应用中,不太可能观测到 的所有成分,因此,假设 是未被观测的。
2.2 工具变量回归的解释
为了说明问题,作者以 et al. (2001) 为例进行实验。在 et al. (2001) 的研究中, 是殖民者死亡率, 是人均 GDP, 是制度。 可以是物质资本、人力资本、技术或文化。数据生成过程如下:
在标准微观经济学设置中使用工具变量来估计 的同期因果效应,。假设使用 作为 的工具变量,需要估计的模型如下:
考虑前文提出的框架,则 。由于反向因果关系或遗漏变量,,因此需要使用工具变量。在这里需要特别注意 ,这是一种特殊的遗漏变量。很显然,当前的模型不能一致地估计 ,原因如下:
虽然这显然是一个计量经济学问题,但尚不清楚 是否始终是我们感兴趣的真实参数。在研究中,学者们通常认为公式 (5) 提供了有关历史因素对当代结果的长期影响的信息。因此, 的长期因果效应 () 往往是一个关键参数,可以写出以下方程:
其中,,所以 。我们关注的另一个重要参数是 ,该参数衡量 的历史变化的持久性。如果 >1,意味着内生变量在受到冲击后偏离其原始路径。如果 ,意味着内生变量收敛回到原来的路径,冲击消失。
在讨论工具 的有效性时,文献集中在它外生地改变 这一事实上。因此,我们提出第一个假设:
在假设下,以 为工具变量对公式 (5) 进行估计,得到:
2.3 长期效应估计
在本节中,我们将展示当未观察到 时如何估计 。为了估计 ,我们在两个中间时间点使用 的度量。因此,作者对 2.2 部分的框架进行扩展,使它允许两个以上的时期:
同时,作者提出第二个假设:
这种方法要求在两个不同的时间点观测 。作者将这些时间段标记为 和 。根据假设,我们没有观察到 ,这意味着 。现在,我们解决了 和 的值之间的关系,我们将使用它来估计持久性的程度,。要做到这一点,我们在 (9) 的基础上得到:
其中, 是一个常数, 是一个特定于观测的误差项。
现在考虑 IV 回归方程:
是 的工具变量。根据 (14),估计得出:
这是在 个时期内的持久性的总程度。接下来,我们转向 和 之间的关系。得到方程如下:
其中, , 。 。接下来考虑传统的IV回归,
与我们在第 2.1 节中的结果类似,我们可以得到:
为了计算 ,简单地将 (17) 和 (20) 结合,得到:
3. Stata 实操3.1 命令介绍
命令安装:
ssc install esteta, replace
命令语法:
esteta y x2 x1 [if exp]
instruments(varlist)
t_y(real) t_x2(real) t_x1(real)
t_eta(real) [, controls(varlist)]
其中,
3.2 命令实操
在此以 et al. (2001) 为例,展示 命令的使用,本部分所用的代码和数据由 Marc Klemp 提供。 et al. (2001) 研究的是制度对经济发展的影响。其中chi2,
首先,使用 进行传统 2SLS 估计:
. lxhget replication_ck_2021.zip, replace
. unzipfile replication_ck_2021.zip, replace
. use ./replication_ck_2021/sample, clear
. ivreg2 loggdp1990s (avgexconst1960s=logem4_capped) wb_* labslat, r
Warning - collinearities detected
Vars dropped: wb_eca wb_ssa
IV (2SLS) estimation
--------------------
Estimates efficient for homoskedasticity only
Statistics robust to heteroskedasticity
Number of obs = 56
F( 7, 48) = 46.80
Prob > F = 0.0000
Total (centered) SS = 57.36099115 Centered R2 = 0.4027
Total (uncentered) SS = 4161.478487 Uncentered R2 = 0.9918
Residual SS = 34.25940976 Root MSE = .7822
--------------------------------------------------------------
| Robust
loggdp1990s | Coeff S.E. z P>|z| [95% CI]
----------------+---------------------------------------------
avgexconst1960s | 0.433 0.135 3.20 0.001 0.167 0.698
wb_eap | 1.269 0.354 3.59 0.000 0.576 1.962
wb_eca | 0.000 (omitted)
wb_lac | 1.069 0.207 5.17 0.000 0.664 1.474
wb_mena | 1.751 0.405 4.32 0.000 0.957 2.546
wb_nam | 1.354 0.441 3.07 0.002 0.490 2.218
wb_sas | -0.492 0.554 -0.89 0.375 -1.578 0.594
wb_ssa | 0.000 (omitted)
labslat | -0.109 0.172 -0.64 0.525 -0.446 0.228
_cons | 6.579 0.582 11.30 0.000 5.438 7.721
--------------------------------------------------------------
接下来考虑内生变量持久性:
. ivreg2 avgexconst1960s (cons00=logem4_capped) wb_* labslat, r
Warning - collinearities detected
Vars dropped: wb_eca wb_ssa
IV (2SLS) estimation
--------------------
Estimates efficient for homoskedasticity only
Statistics robust to heteroskedasticity
Number of obs = 56
F( 7, 48) = 51.99
Prob > F = 0.0000
Total (centered) SS = 207.4161495 Centered R2 = 0.1909
Total (uncentered) SS = 937.6831268 Uncentered R2 = 0.8210
Residual SS = 167.8298014 Root MSE = 1.731
-------------------------------------------------------------
| Robust
avgexc~1960s | Coeff S.E. z P>|z| [95% CI]
-------------+-----------------------------------------------
cons00a | 0.693 0.452 1.53 0.125 -0.193 1.579
wb_eap | 0.265 1.074 0.25 0.805 -1.840 2.370
wb_eca | 0.000 (omitted)
wb_lac | -0.147 0.936 -0.16 0.875 -1.981 1.688
wb_mena | -1.777 0.913 -1.95 0.052 -3.566 0.013
wb_nam | 0.503 2.570 0.20 0.845 -4.534 5.541
wb_sas | 2.620 1.155 2.27 0.023 0.356 4.884
wb_ssa | 0.000 (omitted)
labslat | -0.251 0.277 -0.90 0.366 -0.794 0.292
_cons | 2.618 0.492 5.33 0.000 1.654 3.581
-------------------------------------------------------------
接着,利用 test 对持久度进行 Wald Test:
. test cons00 == 1
(1) cons00a = 1
chi2( 1) = 0.46
Prob > chi2 = 0.4964
最后,通过 计算长期效应:
. esteta loggdp1990s avgexconst1960s cons00, ///
t_y(1995) t_x2(1965) t_x1(1900) t_eta(1800) ///
instruments(logem4_capped) ///
controls(wb_* labslat)
-----------------------------------------------
| Coeff S.E. z P>|z| [95% CI]
----+------------------------------------------
eta | 0.144 0.279 0.51 0.607 -0.403 0.691
-----------------------------------------------
结果展示在表 1 的第三列。我们可以发现估计的长期系数 (0.144) 仅为传统 IV 估计 (0.433) 的三分之一,结果表明传统的 IV 回归高估了长期效应。之所以会出现这种情况,是因为制度不够持久 ()。因此,考虑内生解释变量的持久性对于估计长期效应很重要。
4. 相关推文
Note:产生如下推文列表的 Stata 命令为:
工具变量, m
安装最新版 命令:
ssc ,
专题:Stata命令
专题:IV-GMM
专题:内生性-因果推断
课程推荐:深度因果推断(2023年8月2-5日)
主讲老师:江艇
课程地点:西安·西北工业大学
课程主页:
New! Stata 搜索神器: 和
搜: 推文、数据分享、期刊论文、重现代码 ……
安装:
. ssc
. ssc
使用:
. DID 倍分法
. all
关于我们