互助问答第530期:关于PSM-DID的问题
关于PSM-DID问题
老师,您好,我最近在看关于 “政府研发补助金对企业创新的影响”的论文,多数的论文用PSM-DID,但是政策实施(政府研发补助金)是在所有年份(如2010~2016)中都有存在的,而所有论文中对于此种情况下的PSM的匹配方法没有具体描述,请问此种情况如何进行PSM?
在互助问题中有看到类似解答例如(请问可以作为依据的论文题目是?)(仍有不明白的地方):
1,面板数据中的企业如果在全年份(2010~2016)中有接受过研发补助金,则计作试验组,如一次研发补助都没有接受过。则计作控制组。将开始时间(2010)的数据作为横截面数据进行PSM,之后将(2011~2016)年份的数据与(2010)年份的数据相结合。
2,逐年匹配
可问题是这两种匹配方式,在匹配之后如何使用DID?在Lach(2002)的论文(用DID的方法来研究研发补助对企业创新的影响)中采用:将所有时间的数据集中起来,只使用在t-1期没有收到补助的数据,例如,对于1991年,使用1990年没有收到补贴的企业的数据,对于1992年,选择1991年没有收到补贴的企业。这种方法不知是否可以与PSM相结合,但是没有找到结合的论文依据。
我理解你的样本是企业层面的面板数据,某企业在某些年接受了研发补助,还有的企业可能从未接受过补助。如果你想使用全样本进行PSM-DID操作,首先需要剔除在每年都接受补助的企业——因为他们没有政策干预前的数据,无法用于匹配(如果你不想匹配而直接使用DID,则这部分企业不用剔除)。剔除了这部分企业后,找出所有企业中最早补助的年份(比如2010年),然后利用该年份之前(比如2009年及以前的数据)的数据,在处理组(某年接收了补助的企业)和控制组(从未接受补助的企业)之间进行匹配(如果所有企业都曾接受过补助,则一般无法匹配,可以直接使用DID或事件分析方法)。匹配后进行DID分析:定义一个补贴的二元0-1变量,1表示某企业在某年接受了补贴,0表示某企业在某年没有接受补贴;将此二元变量作为关键自变量,同时控制个体和时间层面固定效应。
至于你提到的逐年匹配,对于1991年,使用1990年没有补贴的企业;在这些企业中,有的1991年受到补贴(处理组),有的1991年没受到补贴(控制组)。可以基于1990年数据对处理组和控制组进行匹配,再结合1991年数据进行两期DID分析。不过需要注意:这种做法实际上对样本进行了内生筛选,上述例子实际上估计了“在1990年没受到补贴的条件下”,1991年接受补贴的影响——这个子样本所代表的总体不见得是研究者最初关心的总体,需要小心诠释分析结果。
如果您在计量学习和实证研究中遇到问题,有三条途径可以到达我们手里:一是请及时发到邮箱szlw58@126.com;二是加入论文导向计量群(现有10个群);三是直接在微信公众号平台后台留言。专业委员会有40多名编辑都会看,您的问题会得到及时关注!请您将问题描述清楚,任何有助于把问题描述清楚的细节都能使我们更方便地回答您的问题,提问细则参见:实证研究互助平台最新通知(点击文末阅读原文查看详情)
如果您想成为问题解答者,在帮助他人过程中巩固自己的知识,请发邮件至szlw58@126.com(优先)或给本公众号留言或加微信793481976给群主留言,我们诚挚欢迎热心的学者和学生。具体招募信息请参见:实证研究互助平台志愿者团队招募公告
鲜活的事例更有助于提高您的研究水平,呆板的教科书让人生厌。如果您喜欢,请提出您的问题,也请转发推广!
(欢迎转发,欢迎分享;转载请注明出处,引用和合作请留言。本文作者拥有所有版权,原创文章最早发表于“学术苑”。任何侵权行为将面临追责!)
学术指导:张晓峒老师 Ben Lambert
本期解答人:中关村大街
编辑:景瑞
统筹: 易仰楠
技术:李静娅老师
全文完,感谢您的耐心阅读
请顺手点个“在看”吧~
阅读原文