欢迎光临散文网 会员登陆 & 注册

断点回归方法 (RDD) 全网最全操作指南,保姆级教学

2023-02-09 17:53 作者:小毛咕噜  | 我要投稿
  • 1. 因果推断,恰逢其时

  • 2. 断点回归 (RDD),上帝之手

  • 3. 断点回归基本步骤,明晰操作

    • 3.1 精确断点 (SRD) 还是模糊断点 (FRD)

    • 3.2 有效性检验 (主要是3个方面)

    • 3.3 参数还是非 (半) 参数估计

    • 3.4 带宽的敏感性测试

    • 3.5 安慰剂检验

    • 3.6 样本选择的敏感性检验

    • 3.7 其他的稳健性检验

  • 4. 断点回归 Stata 操作,立刻上手

  • 5. 断点回归经典案例,寻找思路

    • 5.1 税收分成  (税收征管) 改革

    • 5.2 退休制度

    • 5.3 地理断点 (空气污染等)

    • 5.4 转移支付 (国家级贫困县人均收入为界)

    • 5.5 义务教育法 (9年义务教育)

    • 5.6 股权结构 (50%持股权)

    • 5.7 其他请查阅相关综述文章。

  • 6. 断点回归视频推荐,继续巩固

  • 7. 断点回归资料合集,重在积累

  • 8. 结语


陆陆续续搞了几天,终成此文。收集写作此文的目的是希望全面的梳理断点回归相关的操作,以帮助大家更好更快入手,减少不必要的时间成本和搜寻成本。当然,限于个人能力,文中难免有不当之处,恳请大家批评指正。

1. 因果推断,恰逢其时

因果推断 (casual inference) 是社会科学研究的核心,社会科学研究的一个最主要的目的在于通过已有的实证信息进行因果关系的推论,以此解释经济社会现象背后的规律,或者评估特定事件冲击及经济社会政策带来的影响。但从复杂的现实世界中获得真实的因果推断往往十分困难。研究者面临的一个重要挑战便在于通过适当的研究设计克服困难,获得其所希望探讨的因果关系的可信推断。

对于因果推断最为可信和有影响力的研究设计当属随机分配 (randomized assignment),而对这一设计最常应用的场景是实验室实验 (laboratory experiment),其通过随机的分配处理组 (treatment group) 和控制组 (control group) 来排除其他干扰因素的影响。

但由于成本过高或者伦理约束,社会科学研究者往往无法进行随机实验,取而代之的是利用不同的研究设计和方法获得近似于随机实验的效果。即寻找自然状态下产生的近似于随机实验的自然实验 (natural experiment) ,或以创新的方式对研究对象进行“控制”的田野实验(field experiment) 。

基于实验路径的研究能够在一定程度上克服这一缺陷,因而在社会科学、尤其是经济学领域受到了学者们越来越多的重视。

因此,基于反事实的准实验 (Quasi-experimental) 方法在社会科学研究中越来越受到重视 (Gangl,2010;Morgan and Winship,2015),工具变量法 (Instrumental Variable,IV)、双重差分(Difference-in-Difference,DID)、断点回归设计 (Regression Discontinuity Design,RDD) 等因果识别方法 (Angrist and Pischke,2010) 在实证研究中的应用越来越广泛。

2. 断点回归 (RDD),上帝之手

在众多准实验方法中, 断点回归设计 (Regression Discontinuity Design, RDD) 是一种非常重要的因果识别方法,具有一些独特的优势。

首先,断点回归设计比其他方法更接近于随机实验,可以得到与 RCT 类似的估计结果 (Shadish et al.,2002;Lee and Lemieux,2010;罗胜,2016;Athey and Imbens,2017;刘生龙,2021),它能够从实验基准中还原因果效应 (Recovering Experimental Benchmarks,Green et al.,2009;Hyytinen et al.,2018),具有更强的因果推断力,能够避免因果估计的内生性问题,反映变量之间真实的因果关系 (Lee,2008),**因而在进行因果推断和政策评估时,RDD是最可信的准实验方法之一 (Cattaneo and Titiunik,2022)**。

此外,RDD能够在较弱的假设下识别因果效应,且假设易于被检验 (Cattaneo et al.,2020d;Valentim et al.,2021),还可以灵活地通过使用参数和非参数等不同估计方法、调整带宽等方式对局部平均处理效应进行估计、推断和稳健性检验,从而增强RDD估计结果的可信度(Cattaneo et al., 2020a,2022)。

根据个体在临界点两侧接受干预概率的差异,可以将断点回归分为精确断点回归 (sharp regression discontinuity,SRD) 和模糊断点回归 (fuzzy regression discontinuity,FRD) 两类。前者是个体在临界点附近接受干预的概率从0到1的变化,后者是个体接受干预的概率从一个概率到另一个概率的变化。

断点回归的直观体验:图形展示(部分,变化很多)

3. 断点回归基本步骤,明晰操作

3.1 精确断点 (SRD) 还是模糊断点 (FRD)

开展研究前,我们需要根据特定的场景判断使用精确断点还是模糊断点。一般来说,精确断点是特殊情况,在现实的研究设计中使用较少,主要还是以更具一般性的模糊断点回归为主。当然,也并不绝对,需要根据研究的问题来进行选择。

3.2 有效性检验 (主要是3个方面)

我们在使用断点回归进行因果识别时,必须满足一系列的前提条件 (Imbens and Lemieux,2008)。如局部随机化假设和连续性假设等。

第一,检验被解释变量在断点处是否跳跃。这里的目的是要证明存在跳跃,也即被解释变量在断点前后存在明确的不同。这个其实就是文章中主要报告的那个图。如He et al.(2020)顺流而下的环境规制里面的图。

  • He, Guojun, Shaoda Wang, and Bing Zhang. "Watering down environmental regulation in China." The Quarterly Journal of Economics 135.4 (2020): 2135-2185.

第二,检查驱动变量或叫配置变量 (assignment variable,又叫 running variable、forcing variable) 是否被操纵。这里的驱动变量,其实就是RD中决定是否进入实验的分数 (Score),是否被操纵的意思就是,是否存在某种跳跃性的变化。也就是说驱动变量应该是随机变动的,而不能被人为的操纵,只有这样才能保证设定是正确的。

在实际操作中主要有三种方式来检验:

  1. 画出驱动或配置变量的分布图

最直接的方法,是使用一定数量的箱体 (bin),画出配置变量的历史直方图 (histogrm)。为了观察出分布的总体形状,箱体的宽度要尽量小。频数 (frequencies) 在箱体间的跳跃式变化,能就断点处的跳跃是否正常给我们一些启发。从这个角度来说,最好利用核密度估计做出一个光滑的函数曲线。如李连友等 (2022) 在税收征管体制改革与社保基金收入文章中绘制的直方图。

  • 李连友,黄保聪,席鹏辉.税收征管体制改革与社保基金征缴收入[J].经济学动态,2022(06):80-96.

  1. 利用McCrary(2008)的核密度函数检验。

命令是 DCdensity,介绍见陈强编著的《高级计量经济学及Stata应用》(第二版)第569页)。如李连友等 (2022) 文中的驱动变量操控图,再如李芳华等 (2020) 精准扶贫效果评估文章里面的检验。

  • McCrary J.Manipulation of the running variable in the regression discontinuity design: A density test[J].Journal of econometrics, 2008, 142(2): 698-714.

  • 李芳华,张阳阳,郑新业.精准扶贫政策效果评估——基于贫困人口微观追踪数据[J].经济研究,2020,55(08):171-187.

  1. 利用 rddensity 这个命令进行检验

该命令可以观察驱动或配置变量的变化情况。当然 rddensity 这个命令不仅可以画图,还可以报告检验的结果。如 Chen et al.(2019) 评估户口价值的文章就使用了这一命令。

  • Chen, Yu, Shaobin Shi, and Yugang Tang. "Valuing the urban hukou in China: Evidence from a regression discontinuity design for housing prices." Journal of development Economics 141 (2019): 102381.

第三,检验前定变量在断点处是否跳跃。这一步骤的目的是说明其他前定变量在断点处不能跳跃,只有这样才能保证政策的效应是由于文章关心的核心变量所导致。这里也有两种表现形式,有的文章通过回归的方式展现,有的文章则通过画图 (rdplot) 的方式展示,但效果都是一样。不同之处在于,画图的话需要比较多的篇幅但比较直观,而使用回归的方式则节省篇幅,具体可根据情况来选择。如李芳华等 (2020) 精准扶贫效果评估文章里面的检验使用图表的方式。刘生龙等 (2016) 义务教育法与中国城镇教育回报率中就使用图形的方式进行检验。

  • 刘生龙,周绍杰,胡鞍钢.义务教育法与中国城镇教育回报率:基于断点回归设计[J].经济研究,2016,51(02):154-167.

3.3 参数还是非 (半) 参数估计

没有统一的标准,需要结合研究的场景来选择。可以参数和非参数都汇报以保证文章估计结果的稳健。一般来说,RDD 模型中的估计方法一般存在非参数估计与参数估计两种。其中,非参数估计方法的优势在于可以不依赖于任何函数形式对变量之间的关系进行分析,但其前提条件是在断点处存在着大量的可观测值并能确定每个观测值的具体地理位置 (Imbens and Lemieux,2007)。参数估计则可以选择具体的回归模型,处理起来相对容易,但又可能存在拟合偏差问题。因此,又出现了半参数的估计方法。

具体地,在 Sharp RD 的情形中,参数法将 Y 在每个箱体内的均值作为因变量,用处理变量、配置变量的多次项作为自变量,在断点两边分别跑回归,得到断点左右两边因变量的拟合值,两个拟合值的差值便是我们想估计的实验对因变量的因果效应。但 Gelman and Imbens(2019) 发现,参数方法存在多项式阶数选择的敏感问题以及其他不受欢迎的统计特性。因此,在选择的时候需要多加注意。非参数估计的做法是,利用核密度函数局部线性回归来代替 2SLS 里面一般线性回归,rdrobust 命令可以直接实现这种估计。当然,这里存在估计权重的选择,需要考虑不同的核函数 (Triangle、Epanech、Uniform) 类别。同时,也要考虑不同的带宽 (CCT等)。半参数方法则介于两者之间,半数估计考虑到了样本量损失问题,同时也限制了拟合区间,可以得到更为一致的回归结果 (Ito and Zhang,2020;李卫兵和张凯霞,2021)

参数估计和非参数估计:

  • Chen, Yu, Shaobin Shi, and Yugang Tang. "Valuing the urban hukou in China: Evidence from a regression discontinuity design for housing prices." Journal of development Economics 141 (2019): 102381.

  • He, Guojun, Shaoda Wang, and Bing Zhang. "Watering down environmental regulation in China." The Quarterly Journal of Economics 135.4 (2020): 2135-2185.

半参数估计:

  • Ito, Koichiro, and Shuang Zhang. "Willingness to pay for clean air: Evidence from air purifier markets in China." Journal of Political Economy 128.5 (2020): 1627-1672.

  • 李卫兵,张凯霞.空气污染是否会影响犯罪率:基于断点回归方法的估计[J].世界经济,2021,44(06):151-177.

3.4 带宽的敏感性测试

断点估计结果的有效性易受带宽选择的影响。带宽越小,断点两侧的影响因素越相近,遗漏变量对因变量的影响越小,因而可以更准确地估计断点处的处理效应,减轻内生性带来的估计偏误。但过小的带宽也会带来样本量的过度损失从而导致结果的有偏性。具体检验如李卫兵和张凯霞 (2021) 空气污染与犯罪文章中的操作。

如李芳华等 (2020) 使用回归的方式对不同的带宽进行稳健性检验。

3.5 安慰剂检验

如果变量不仅在临界值处存在跳跃, 而且也在其他值处存在跳跃, 那么变量的跳跃是处置效应造成的这一推断就值得怀疑, 可能还存在其他因素决定了变量在临界值处的跳跃。选择一个不同于断点的值作为安慰剂断点 (placcebo cutoff points) 。如果断点回归结果变得不显著,则表明断点的真实性。

为了避免样本选择的非随机性所致的估计偏误,确保本文捕捉到的确实因果效应,我们可以参考 Baker(2015) 的处理方式进行安慰剂检验。如李卫兵和张凯霞 (2021) 空气污染与犯罪文章中就使用了这一方法。即随机分配每一个样本到秦岭-淮河分界线的距离(由 Stata 软件在一定带宽范围内随机赋值),据此确定执行变量的取值并重新进行 RD 估计,然后使这个随机过程重复 1000 次。如果这1000 次估计的核心系数和 0 无显著差异,则表明本文的估计结果并非由样本选择的非随机性所致。详细的步骤请自行查看相关文献学习。

3.6 样本选择的敏感性检验

由于越接近断点的样本,越有动机去人为操控,我们删除最接近断点的样本,来观察回归是否显著(甜甜圈效应,donut hole approach)。如果仍旧存在,说明即使存在人为操控,断点效应仍旧存在。下图删除了断点附近5%,10%,15%,25% 和 30% 的样本,进行了 6 组稳健性检验。图形给出了回归系数和 95% 的置信区间。可知,在删除 20% 及以下时,回归结果都保持显著。具体检验可以参考连享会中的推文来学习。当然也可以采用回归的方式来进行检验,如李连友等 (2022) 税收征管体制改革与社保基金收入文中就采用这一方式,将断点附近的样本进行删除。

3.7 其他的稳健性检验

除了上述稳健性检验外,还需要根据研究的场景进行其他相应的稳健性检验。如替换被解释变量,排除其他替代性假说,扩充和缩减样本,改变固定效应的控制层级等等。

4. 断点回归 Stata 操作,立刻上手

以下的操作仅仅是一个简单的例子,更加详细的内容大家可以自己去学习。下面我们推荐 3 篇文献,大家可以去学习和复制,这 3 篇文献的代码都是公开的,请自己去寻找,倘若这点搜索水平都没有,那需要反思下适不适合做研究了。其实,大家把下面几篇文献读懂了在结合适当的场景进行练习,基本就可以掌握 RDD 方法。但是,需要说明的是,RDD 模型运用的难点在于如何去找到一个合适的场景(断点),并不是具体的操作细则。因此,去锻炼自己寻找断点的能力是更为重要的。这也是断点回归的难点所在,大家一起努力。希望大家可以找到一个比较不错的断点。

最全面的断点回归学习网址:https://sites.google.com/site/rdpackages/rdrobust

  1. Chen Y, Shi S, Tang Y. Valuing the urban hukou in China: Evidence from a regression discontinuity design for housing prices[J].Journal of development Economics, 2019, 141: 102381.

  2. He G, Wang S, Zhang B. Watering down environmental regulation in China[J].The Quarterly Journal of Economics, 2020, 135(4): 2135-2185.

  3. Jia J, Liang X, Ma G. Political hierarchy and regional economic development: Evidence from a spatial discontinuity in China[J].Journal of Public Economics, 2021, 194: 104352.

简单的示例(do文档见文末的分享链接中):

********************************************************************************
** RDROBUST Stata Package
** Do-file for Empirical Illustration
** Authors: Sebastian Calonico, Matias D. Cattaneo, Max H. Farrell and Rocio Titiunik
********************************************************************************
** hlp2winpdf, cdn(rdrobust) replace
** hlp2winpdf, cdn(rdbwselect) replace
** hlp2winpdf, cdn(rdplot) replace  
********************************************************************************
** net install rdrobust, from(https://sites.google.com/site/rdpackages/rdrobust/stata) replace
********************************************************************************
clear all
set more off
set linesize 80
mata: mata mlib index

********************************************************************************
** Summary Stats
********************************************************************************
use rdrobust_senate.dta, clear
sum vote margin class termshouse termssenate population, sep(2)

********************************************************************************
** rdplot with confidence intervals
********************************************************************************
rdplot vote margin, binselect(es) ci(95) ///
      graph_options(title("RD Plot: U.S. Senate Election Data") ///
                    ytitle(Vote Share in Election at time t+2) ///
                    xtitle(Vote Share in Election at time t) ///
                    graphregion(color(white)))

**************************************************************************
** rdplot with MSE-optimal choice
**************************************************************************
rdplot vote margin, binselect(es) ///
      graph_options(title(RD Plot - Senate Elections Data) ///
                          ytitle(Vote Share in Election at time t+1) ///
                          xtitle(Vote Share in Election at time t))

**************************************************************************
** rdplot with QS partitioning and mimicking variance choice
**************************************************************************
rdplot vote margin, binselect(qsmv)  ///
graph_options(title(RD Plot - Senate Elections Data) ///
                     ytitle(Vote Share in Election at time t+1) ///
                     xtitle(Vote Share in Election at time t))

**************************************************************************
** rdrobust
**************************************************************************
rdrobust vote margin

**************************************************************************
** rdrobust with all estimates
**************************************************************************
rdrobust vote margin, all

**************************************************************************
** rdbwselect with all estimates
**************************************************************************
rdbwselect vote margin, all

********************************************************************************
** rdrobust backward compatibility
********************************************************************************
rdrobust vote margin, h(16.79369) b(27.43745)

********************************************************************************
** rdplot to show rdrobust estimate
********************************************************************************
qui rdrobust vote margin
rdplot vote margin if -e(h_l)<= margin & margin <= e(h_r), ///
      binselect(esmv) kernel(triangular) h(`e(h_l)' `e(h_r)') p(1) ///
      graph_options(title("RD Plot: U.S. Senate Election Data") ///
                    ytitle(Vote Share in Election at time t+2) ///
                    xtitle(Vote Share in Election at time t) ///
                    graphregion(color(white)))

********************************************************************************
** rdrobust with covariates within the same window (i.e., using same bandwidths)
********************************************************************************
qui rdrobust vote margin
local len = `e(ci_r_rb)' - `e(ci_l_rb)'
rdrobust vote margin, covs(class termshouse termssenate) ///
        h(`e(h_l)' `e(h_r)') b(`e(b_l)' `e(b_r)')
display "CI length change: " round(((`e(ci_r_rb)'-`e(ci_l_rb)')/`len'-1)*100,.01) "%"

********************************************************************************
** rdrobust with covariates with data-driven optimal bandwidths
********************************************************************************
qui rdrobust vote margin
local len = `e(ci_r_rb)' - `e(ci_l_rb)'
rdrobust vote margin, covs(class termshouse termssenate)
display "CI length change: " round(((`e(ci_r_rb)'-`e(ci_l_rb)')/`len'-1)*100,.01) "%"

********************************************************************************
** rdrobust with useless covariate
********************************************************************************
qui rdrobust vote margin
local len = `e(ci_r_rb)' - `e(ci_l_rb)'
rdrobust vote margin, covs(population)
display "CI length change: " round(((`e(ci_r_rb)'-`e(ci_l_rb)')/`len'-1)*100,.01) "%"

********************************************************************************
** rdrobust check covariate "balanced"
********************************************************************************
local covs "class termshouse termssenate population"
local num: list sizeof covs
mat balance = J(`num',2,.)
local row = 1
foreach z in `covs' {
   qui rdrobust `z' margin
mat balance[`row',1] = round(e(tau_cl),.001)
mat balance[`row',2] = round(e(pv_rb),.001)
local ++row
}
mat rownames balance = `covs'
mat colnames balance = "RD Effect" "Robust p-val"
mat lis balance

********************************************************************************
** rdrobust with clustering
********************************************************************************
rdrobust vote margin, vce(nncluster state)

********************************************************************************
** rdrobust with clustering and covariates, and different bandwidth
********************************************************************************
rdrobust vote margin, covs(class termshouse termssenate) ///
                     bwselect(msetwo) vce(nncluster state)

********************************************************************************
** rdbwselect with all estimates
********************************************************************************
rdbwselect vote margin, all

********************************************************************************
** Other examples
********************************************************************************
rdrobust vote margin, kernel(uniform) vce(cluster state)

rdrobust vote margin, bwselect(certwo) vce(hc3)

rdrobust vote margin, h(12 15) b(18 20)

rdrobust vote margin, covs(class) bwselect(cerrd) scaleregul(0) rho(1)

rdbwselect vote margin, kernel(uniform) vce(cluster state) all

rdbwselect vote margin, covs(class) bwselect(msetwo) vce(hc2) all

其他学习途径:连享会、微信公众号等等。

5. 断点回归经典案例,寻找思路

5.1 税收分成  (税收征管) 改革

利用所得税征管范围在2002年前后的变化来构建断点回归模型进行因果识别。代表性文献:

  1. 范子英,田彬彬.税收竞争、税收执法与企业避税[J].经济研究,2013,48(09):99-111.

  2. 李明,李德刚,冯强.中国减税的经济效应评估——基于所得税分享改革“准自然试验”[J].经济研究,2018,53(07):121-135.

  3. 杜鹏程,王姝勋,徐舒.税收征管、企业避税与劳动收入份额——来自所得税征管范围改革的证据[J].管理世界,2021,37(07):105-118+8.

  4. 李连友,黄保聪,席鹏辉.税收征管体制改革与社保基金征缴收入[J].经济学动态,2022(06):80-96.

5.2 退休制度

中国的退休制度规定,男性60岁可以退休,女性工作人员55周岁,女性工人50岁退休,因此中国的制度使得男女退休的概率在退休年龄前后有急剧的变化。代表性文献:

  1. 雷晓燕,谭力,赵耀辉.退休会影响健康吗? [J].经济学(季刊),2010,(04):1539-1558.

  2. 李宏彬,施新政,吴斌珍.中国居民退休前后的消费行为研究[J].经济学(季刊),2015,14(01):117-134.

  3. 张川川,陈斌开.“社会养老”能否替代“家庭养老”?——来自中国新型农村社会养老保险的证据[J].经济研究,2014,49(11):102-115.

  4. 张川川,John Giles,赵耀辉.新型农村社会养老保险政策效果评估——收入、贫困、消费、主观福利和劳动供给[J].经济学(季刊),2015,14(01):203-230.

  5. 邹红,喻开志.退休与城镇家庭消费:基于断点回归设计的经验证据[J].经济研究,2015,50(01):124-139.

5.3 地理断点 (空气污染等)

在跨越秦岭-淮河分界线时,北方集中供暖政策所致的空气污染在分界线处呈离散变化,因此,可以利用地理断点进行因果识别。当然,也有其他的地理断点。如 Melissa Dell 的系列文献几乎都是地理断点(被称为“断点女王”)。

  1. Chen Y, Ebenstein A, Greenstone M, et al. Evidence on the impact of sustained exposure to air pollution on life expectancy from China’s Huai River policy[J].Proceedings of the National Academy of Sciences, 2013, 110(32): 12936-12941.

  2. Ebenstein A, Fan M, Greenstone M, et al. New evidence on the impact of sustained exposure to air pollution on life expectancy from China’s Huai River Policy[J].Proceedings of the National Academy of Sciences, 2017, 114(39): 10384-10389.

  3. Jia J, Liang X, Ma G. Political hierarchy and regional economic development: Evidence from a spatial discontinuity in China[J]. Journal of Public Economics, 2021, 194: 104352.

  4. 席鹏辉,梁若冰.空气污染对地方环保投入的影响——基于多断点回归设计[J].统计研究,2015,32(09):76-83.

  5. 李卫兵,张凯霞.空气污染对企业生产率的影响——来自中国工业企业的证据[J].管理世界,2019,35(10):95-112+119.

  6. 李卫兵,张凯霞.空气污染是否会影响犯罪率:基于断点回归方法的估计[J].世界经济,2021,44(06):151-177.

  7. 吴超鹏,李奥,张琦.空气污染是否影响公司管理层人力资本质量[J].世界经济,2021,44(02):151-178.

5.4 转移支付 (国家级贫困县人均收入为界)

  1. 马光荣,郭庆旺,刘畅.财政转移支付结构与地区经济增长[J].中国社会科学,2016(09):105-125+207-208.

5.5 义务教育法 (9年义务教育)

  1. 刘生龙,周绍杰,胡鞍钢.义务教育法与中国城镇教育回报率:基于断点回归设计[J].经济研究,2016,51(02):154-167.

5.6 股权结构 (50%持股权)

  1. 陈林,万攀兵,许莹盈.混合所有制企业的股权结构与创新行为——基于自然实验与断点回归的实证检验[J].管理世界,2019,35(10):186-205.

5.7 其他请查阅相关综述文章。

如:刘生龙.社会科学研究中的断点回归设计:最新代表性研究及其展望[J].公共管理评论,2021,3(02):140-159.

6. 断点回归视频推荐,继续巩固

  1. 断点回归模型:https://meeting.tencent.com/v2/cloud-record/share?id=2bc52180-f670-4967-b183-a0f97498bb29&from=3。密码:QGCW

主流因果推断方法系列讲座回放!

  1. https://www.bilibili.com/video/BV1Rq4y1v7SM/?spm_id_from=333.999.0.0&;vd_source=8b95c0c850634a870d80dbe960c3254d

  2. https://www.bilibili.com/video/BV1CU4y1i7tk/?spm_id_from=333.999.0.0&;vd_source=8b95c0c850634a870d80dbe960c3254d

  3. B站等相关途径。

7. 断点回归资料合集,重在积累

  1. Cattaneo M D, Idrobo N, Titiunik R. A practical introduction to regression discontinuity designs:Foundations[M].Cambridge University Press, 2019.

  2. A Practical Introduction to Regression Discontinuity Designs: Volume II.

  3. 赵西亮老师的《基本有用的计量经济学》书籍。

  4. 陈强老师的《高级计量经济学及Stata应用》,这个应该是人手一本的吧。

  5. 连玉君-连享会教程-https://www.lianxh.cn/news/789f031b0c110.html。学计量实操的应该都关注了。

  6. Lemieux I T. Regression discontinuity designs: A guide to practice[J].Journal of Econometrics, 2008.

  7. Lemieux T, Imbens G. The Regression Discontinuity Design — Theory and Applications[J]. Scholarly Articles, 2008.

  8. Lee D S, Lemieux T. Regression discontinuity designs in economics[J].Journal of economic literature, 2010, 48(2): 281-355.

  9. Gelman A, Imbens G. Why high-order polynomials should not be used in regression discontinuity designs[J].Journal of Business & Economic Statistics, 2019, 37(3): 447-456.

  10. Hausman C, David S. Rapson. Regression discontinuity in time: Considerations for empirical applications[J]Annual Review of Resource Economics, 2018, 10 (1): 533–552.

  11. Nyhan B, Skovron C, Titiunik R. Differential registration bias invoter file data: A sensitivity analysis approach[J].American Journal of Political Science, 2017, (61): 744-760.

  12. Depew B, Eren O. Born on the wrong day? School entry age and juvenile crime[J].Journal of Urban Economics, 2016, 96: 73-90.

  13. He G, Wang S, Zhang B. Watering Down Environmental Regulation in China [J].Quarterly Journal of Economics, 2020, 135(4):2135-2185.

  14. Asher S, Novosad P. Rural roads and local economic development[J].American economic review, 2020, 110(3): 797-823.

  15. 谢谦, 薛仙玲, 付明卫. 断点回归设计方法应用的研究综述[J]. 经济与管理评论, 2019, 35(2):11.

  16. 刘冲,诸宇灵,李皓宇.断点回归设计:理论前沿进展与新应用场景[J].经济学报,2022,9(03):325-366.

  17. 刘生龙.社会科学研究中的断点回归设计:最新代表性研究及其展望[J].公共管理评论,2021,3(02):140-159.

  18. 陈少威,王文芹,施养正.公共管理研究中的实验设计——自然实验与田野实验[J].国外理论动态,2016(05):76-84.

  19. 余静文,王春超.新“拟随机实验”方法的兴起——断点回归及其在经济学中的应用[J].经济学动态,2011(02):125-131.

8. 结语

文章的素材主要来自相关的文献、网站、公众号等等,在此表示感谢。创作不易,恳请大家帮忙点赞和点亮再看,如果可以的话,还请帮忙转发,让更多的人看到。感谢您的查阅,如果有缘,下次再会。最后,祝大家研途坦荡,成果丰硕!

文中断点操作及部分资料:

链接:https://pan.baidu.com/s/1wJ5s6290jdjmDwJsrDfbWQ

提取码:wl79

欢迎关注微信公众号:经管科讯,查看更多内容。



断点回归方法 (RDD) 全网最全操作指南,保姆级教学的评论 (共 条)

分享到微博请遵守国家法律