互助问答第364期:关于断点回归设计的问题


关于“断点回归”(RDD)的实证设计,其中断点数值c(如出生年份)和被解释变量Y(如消费)在主要数据中可得,但是处理结果D (虚拟变量,如是否退休)的变量在主数据库中无法获得。但是c和D在另外一个微观数据中可以活动,两个数据库中均为代表性抽样调查,但微观个体无法精确匹配。请问我是否能够吧两个数据结合起来实现RDD的实证?如果文献中有类似的处理方法,能否推荐一下,谢谢。

两个数据结合并不能实现个体层面的匹配,所以在个体层面无法使用断点回归设计。两个建议:第一,第一个数据既然有消费数据,那么有没有收入数据,特别是有没有养老金收入信息?根据收入细目可以推断个体退休状态。第二,如果两数据样本足够大,可以在群体层面分析。例如按照年龄、性别、地域、教育等特征将样本划分为不同群体,可求出每一个群体的平均消费支出,作为因变量。断点回归设计可以在群体层面展开。原始样本越大,群体就可以划分得越细,群体数量就越多,就越适合断点回归。
往期回顾:
互助问答第363期:关于双重差分法的问题
如果您在计量学习和实证研究中遇到问题,有三条途径可以到达我们手里:一是请及时发到邮箱szlw58@126.com;二是加入论文导向计量群(现有10个群);三是直接在微信公众号平台后台留言。专业委员会有40多名编辑都会看,您的问题会得到及时关注!请您将问题描述清楚,任何有助于把问题描述清楚的细节都能使我们更方便地回答您的问题,提问细则参见:实证研究互助平台最新通知(点击文末阅读原文查看详情)
如果您想成为问题解答者,在帮助他人过程中巩固自己的知识,请发邮件至szlw58@126.com(优先)或给本公众号留言或加微信793481976给群主留言,我们诚挚欢迎热心的学者和学生。具体招募信息请参见:实证研究互助平台志愿者团队招募公告
鲜活的事例更有助于提高您的研究水平,呆板的教科书让人生厌。如果您喜欢,请提出您的问题,也请转发推广!
(欢迎转发,欢迎分享;转载请注明出处,引用和合作请留言。本文作者拥有所有版权,原创文章最早发表于“学术苑”。任何侵权行为将面临追责!)
学术指导:张晓峒老师 Ben Lambert
本期解答人:中关村大街
编辑:张咪
统筹:左川 易仰楠
技术:刘子瑗
全文完,感谢您的耐心阅读
请顺手点个“在看”吧~
阅读原文
