互助问答第99期:关于PSM-DID的问题
老师好,今天想请教关于PSM-DID的问题,首先已经按照psmatch2的命令逐年将横截面数据匹配完成,并得到一组新的变量,通过百度得知了id, _id, _n的意义,但是我不知道如何进行下一步DID了,是将各年得到的处理组和匹配得到的对照组保留下来,然后再将几年的横截面数据append成面板数据么?然后再进行普通回归,加入交叉项dt*du么?我看到陈强老师的教材中提到用diff 命令,可是不是很清楚这个命令使用时所要求的数据结构,也是PSM之后拼成的面板数据么?
还有一个疑问是PSM得到的新的_id 和 _n要怎样和原本的股票代码stkcd相对应呢?也就是我想搞清楚这些之间的关系从而在合并成面板之后能够更好的定义dt(企业在发生并购前的时间dt=0,之后为1).谢谢老师解答!

▲滑动查看
如果我理解正确的话,你的数据是企业层面的面板数据,有一部分企业(控制组)没有发生过并购,另一部分企业(干预组)在某个时间点之后发生了并购,你研究的是并购对某个因变量的影响(不论我理解是否正确,请以后提问时先准确描述研究问题、数据结构等必要信息,并在使用 dt、du 等符号前先告知它们的含义,便于解答人准确理解问题)。如果是这样,在使用PSM-DID时,是不需要对每一期的样本都进行匹配的:混合截面数据需要对每一期进行匹配,而面板数据只需要在干预发生前的时期进行匹配。因此,建议直接使用 diff 命令,以避免手动操作造成的错误步骤。diff 命令的运行基于未匹配过的原始数据(可以是面板,也可以是混合截面),命令本身负责匹配和 DID 的全流程操作,不需要研究者事先对数据进行相关处理。更多细节请参考 diff 的帮助文件以及该命令的原论文( Villa, J. M. (2016). Diff: Simplifying the Estimation of Difference-in-differences Treatment Effects. The Stata Journal, 16(1), 52–71. https://doi.org/10.1177/1536867X1601600108 ),特别请练习一下帮助文件中的例子(例子的数据可从 http://fmwww.bc.edu/repec/bocode/c/CardKrueger1994.dta 处获得)。
往期回顾:
互助问答第97期:非平衡面板数据的模型选择问题
互助问答第96期:PSM相关问题
互助问答第95期:工具变量二问
互助问答第94期:关于随机前沿引力模型的问题
如果您在计量学习和实证研究中遇到问题,请及时发到邮箱szlw58@126.com,专业委员会有30多名编辑都会看,您的问题会得到及时关注!请您将问题描述清楚,任何有助于把问题描述清楚的细节都能使我们更方便地回答您的问题,提问细则参见:实证研究互助平台最新通知(点击文末阅读原文查看详情)
如果您想成为问题解答者,在帮助他人过程中巩固自己的知识,请发邮件至szlw58@126.com(优先)或给本公众号留言或加微信793481976给群主留言,我们诚挚欢迎热心的学者和学生。具体招募信息请参见:实证研究互助平台志愿者团队招募公告
鲜活的事例更有助于提高您的研究水平,呆板的教科书让人生厌。如果您喜欢,请提出您的问题,也请转发推广!
(欢迎转发,欢迎分享;转载请注明出处,引用和合作请留言。本文作者拥有所有版权,原创文章最早发表于“论文导向计量实证社区”。任何侵权行为将面临追责!)
学术指导:张晓峒老师
本期解答人:中关村大街
统筹:易仰楠 李丹丹
编辑:孙婷婷
技术:林毅 赵雅轩

