互助问答第359期:logit模型在stata操作中出现的问题
logit模型在stata操作中出现的问题
在进行logit模型回归,在stata中输入的命令是logit y x i.year i.industry, cluster(id),然而发现控制行业后出现下图的情况,回归时部分样本被删除。在已经剔除缺失值后的样本中,描述性统计的样本量为10726,但是在实际回归时样本量变为10611。查了一些资料发生这种现象的原因是被解释变量在所控制的行业中取值全部为0或全部为1造成的,经检查发现被解释变量在某些行业确实取值全部为0。请问这种情况下我应该怎么做,才能让样本量与实际进入回归的样本量保持一致呢?



遗漏了1%的样本,并不是什么大问题,可以不用理会。如果确实不能删除观测值,那就考虑把行业分类整合得粗一些。
往期回顾:
互助问答第358期:关于断点回归设计的问题
如果您在计量学习和实证研究中遇到问题,有三条途径可以到达我们手里:一是请及时发到邮箱szlw58@126.com;二是加入论文导向计量群(现有10个群);三是直接在微信公众号平台后台留言。专业委员会有40多名编辑都会看,您的问题会得到及时关注!请您将问题描述清楚,任何有助于把问题描述清楚的细节都能使我们更方便地回答您的问题,提问细则参见:实证研究互助平台最新通知(点击文末阅读原文查看详情)
如果您想成为问题解答者,在帮助他人过程中巩固自己的知识,请发邮件至szlw58@126.com(优先)或给本公众号留言或加微信793481976给群主留言,我们诚挚欢迎热心的学者和学生。具体招募信息请参见:实证研究互助平台志愿者团队招募公告
鲜活的事例更有助于提高您的研究水平,呆板的教科书让人生厌。如果您喜欢,请提出您的问题,也请转发推广!
(欢迎转发,欢迎分享;转载请注明出处,引用和合作请留言。本文作者拥有所有版权,原创文章最早发表于“学术苑”。任何侵权行为将面临追责!)
学术指导:张晓峒老师 Ben Lambert
本期解答人:中关村大街
编辑:张咪
统筹:左川 易仰楠
技术:刘子瑗
