互助问答第289期:关于面板数据的PSM问题
老师:
您好!我想请教一下关于面板数据的PSM问题。请问用面板数据做psm就是在做PSM-DID吗?举个例子吧(或许不恰当),如果有10个学期的学生数据,不同学生的处理变量在不同年份取值可能不同,比如考虑学生兼职打工对学生成绩的影响,处理变量为是否兼职打工,有的学生可能在第3个学期开始打工,但是从6个学期开始又不打工了;有的学生可能从第2个学期开始打工,到第7个学期又不打工了。
(1)像这种情况,用面板数据做psm就是在做PSM-DID吗?
(2)如果不是的话,那么需要分年度匹配,然后再合起来做回归吗?
(3)如果都不是以上情况,正确的做法以及操作命令是什么呢?
谢谢老师!祝您身体健康,工作顺利!
学生是否兼职打工是一个取值灵活的0-1变量,该研究中没有明确的处理组和控制组,也没有清晰的干预起始点,所以不是传统的 DID 问题,无需在传统 DID 框架下进行分析。抛开分析框架的束缚,回到问题和数据的本来面貌:数据是学生的面板数据,每个学生都被追踪多期。因变量是学习成绩,关键自变量就是学生有没有兼职打工。
先从最基础的 OLS 开始,思考 OLS 有无内生性问题(显然有),内生性的来源是什么,然后有针对性地采取处理措施。例如,至少可以利用面板数据的特性进行固定效应模型分析,剔除不随时间变化的遗漏变量问题。在此基础上,还可添加其他处理内生性的方法。例如,能否找到一个工具变量,影响学生兼职打工的概率但是不直接影响学习成绩(例如劳动需求方的一些因素)。
总之,先明确研究问题和数据形态,再思考基础方法(例如OLS)的问题是什么,进而再寻找解决相应问题的分析方法,切莫一开始就拿程式化的分析方法套在问题上。方法服务研究,而非指导研究。
往期回顾:
互助问答第288期:关于数据匹配的问题
如果您在计量学习和实证研究中遇到问题,请及时发到邮箱szlw58@126.com,专业委员会有30多名编辑都会看,您的问题会得到及时关注!请您将问题描述清楚,任何有助于把问题描述清楚的细节都能使我们更方便地回答您的问题,提问细则参见:实证研究互助平台最新通知(点击文末阅读原文查看详情)
鲜活的事例更有助于提高您的研究水平,呆板的教科书让人生厌。如果您喜欢,请提出您的问题,也请转发推广!
(欢迎转发,欢迎分享;转载请注明出处,引用和合作请留言。本文作者拥有所有版权,原创文章最早发表于“学术苑”。任何侵权行为将面临追责!)
学术指导:张晓峒老师 Ben Lambert
本期解答人:中关村大街
编辑:孙婷婷
统筹:易仰楠
技术:刘子瑗
