互助问答第256期:关于混合截面数据省份和年份变量的控制问题
老师您好,我有一个关于混合截面数据省份和年份变量的控制问题。假如我有三年不同省份抽样调查数据(由于三次调研数据并未追踪数据,是否将其称为混合截面数据?),比如2016年随机调查了安徽、湖北2个省一些县市的620户农户的数据。2017年随机调查了广西、湖北、河南、河北、山东、江苏、浙江20余省一些县市的480户农户的数据。2018年随机调查了湖北2个县市280户农户的数据。三次调查共获得1380余份数据。
希望老师能回复我这些问题:
1、三次调研数据是否能当作截面数据处理?
2、要不要控制省份和年份变量?
3、不加省份和年份虚拟变量是否影响研究的结果,审稿人是否觉得这个问题很重要?
我阅读了一些类似的文章(这些文章和我一样同样由不同年份和省份数据构成的混合截面数据),自己试图找到答案,但是发现有些作者选择了控制省份变量和年份变量,有些则没有控制任何省份和年份变量,所以我在研究自己的问题时不知如何选择?
1. 可以当作截面数据处理
2. 如果你的核心解释变量和被解释变量不是省份层面的,而是个体、家庭、社区或者县市区层面的,可以控制省份固定效应,而且最好是控制省份固定效应,这样可以避免一些省份层面的混淆因素对因果推断的威胁;可以而且最好是控制年份固定效应,道理同上。
3. 通常情况下都会影响估计结果,除非核心解释变量非常外生,与其他任何因素都没有统计上显著的关系;即使非常外生,加入之后也会提高估计效率。我个人建议控制省份和年份固定效应;审稿人是否会觉得这个问题重要,完全取决于审稿人,如果我是审稿人,我会觉得这个问题很重要。
往期回顾:
互助问答第246期:关于受限因变量的模型选择问题(回答更正)
互助问答第245期:关于混合横截面的问题
互助问答第244期:关于Tobit模型和逻辑回归的问题
互助问答第243期:关于面板数据固定效应模型的问题
如果您在计量学习和实证研究中遇到问题,请及时发到邮箱szlw58@126.com,专业委员会有30多名编辑都会看,您的问题会得到及时关注!请您将问题描述清楚,任何有助于把问题描述清楚的细节都能使我们更方便地回答您的问题,提问细则参见:实证研究互助平台最新通知(点击文末阅读原文查看详情)
如果您想成为问题解答者,在帮助他人过程中巩固自己的知识,请发邮件至szlw58@126.com(优先)或给本公众号留言或加微信793481976给群主留言,我们诚挚欢迎热心的学者和学生。具体招募信息请参见:实证研究互助平台志愿者团队招募公告
鲜活的事例更有助于提高您的研究水平,呆板的教科书让人生厌。如果您喜欢,请提出您的问题,也请转发推广!
(欢迎转发,欢迎分享;转载请注明出处,引用和合作请留言。本文作者拥有所有版权,原创文章最早发表于“学术苑”。任何侵权行为将面临追责!)
学术苑是以“互助问答”为特色的学术研究公共品提供平台,汇聚国际国内顶尖经管学术大咖、聚焦于实证论文写作与发表,另有文献荐读、一周一荐和相关学术培训等辅助板块,致力于为订阅者提供更为全面的服务。
平台现拟推出全新模块,该模块旨在征集经典外文实证文章的原创翻译,诚挚邀请您为平台赐稿,与我们一同提升学术服务能力,提高平台公众号推文质量。稿件主题主要为与实证研究相关的计量方法和应用,其他相关经济学主题的原创翻译稿件也十分欢迎。
学术指导:张晓峒老师
本期解答人:张川川老师
编辑:李宁宁
统筹:易仰楠
技术:刘子瑗
