欢迎光临散文网 会员登陆 & 注册

互助问答第285期:关于数据匹配的问题

2020-06-17 17:38 作者:学术苑  | 我要投稿

关于数据匹配的问题


各位老师好!

我最近在做一篇小论文,我的数据是14年开始陆续受到政策冲击,每年都有新增试点的企业;10-13年没有受到政策影响。我之前是做的PSM是这样子:10-13年作为control group,14年试点的作为treat group,去匹配;15年试点的作为treat group再去匹配一次10-13年的control group,以此类推。 但是在看了LU J(2015)的文献后,我碰到一点问题,LU是每一年都重新匹配了,他的DID model 用的是07-09的数据,whole data是04-09。然后政策冲击之前04-09年每年都有covariate means 和T test。

Q1、请问一下各位老师:是【用14年的treat去匹配14年的control】比较好,还是【至少要用13年的数据,为14年匹配】。

Q2、另外,如果用A企业14年的数据匹配B企业10年的数据,会出现什么问题吗?

Q3、受到政策冲击以前的样本需要进行匹配吗?该如何匹配呢?

谢谢各位老师!

Q1答:每一年都重新匹配了,PSM的前提条件是Conditional Independent Assumption(CIA) 条件独立假设,treat group和control group只要控制X就没有未观察因素差别。基本属于静态匹配,换了年份,时间差异有进来了,你把它看成X还是未观察因素?如果是X,显然不一样。

Q2答:同上

Q3答:如果要做PSM-DID,那么就先PSM,再根据倾向值进行分组再做DID。PSM假设不存在未观察因素差别,否则就不能进行PSM。DID属于动态增量匹配,它相当于根据X进行匹配,而不是根据倾向值进行匹配,尽管二者的作用一样。用DID就是承认有μ残差差别,即未观察因素差别,这是不可能由PSM来解决的。如果你用PSM,就承认不存在未观察因素差别,也就没必要再根据政策分组做DID了。如果你用PSM-DID,根据倾向值进行分组再做DID。参见 Heckman, J., Ichimura, H. and Todd, P. (1997) Matching as an Econometric Evaluation Estimator: Evidence from Evaluating a Job Training Programme. The Review of Economic Studies, 64, 605-654. https://doi.org/10.2307/2971733


往期回顾:

互助问答第287期:关于时序模型预测的问题



如果您在计量学习和实证研究中遇到问题,请及时发到邮箱szlw58@126.com,专业委员会有30多名编辑都会看,您的问题会得到及时关注!请您将问题描述清楚,任何有助于把问题描述清楚的细节都能使我们更方便地回答您的问题,提问细则参见:实证研究互助平台最新通知(点击文末阅读原文查看详情)

鲜活的事例更有助于提高您的研究水平,呆板的教科书让人生厌。如果您喜欢,请提出您的问题,也请转发推广!


(欢迎转发,欢迎分享转载请注明出处引用和合作请留言。本文作者拥有所有版权,原创文章最早发表于“学术苑”任何侵权行为将面临追责!)


学术指导:张晓峒老师 Ben Lambert

本期解答人:谢杰老师

编辑:陈波

统筹:李丹丹

技术:刘子瑗


互助问答第285期:关于数据匹配的问题的评论 (共 条)

分享到微博请遵守国家法律