互助问答第404期:对第401期问答的补充


老师,您好!请教一下关于自变量和因变量中有大量0值,该如何处理呢。自变量是企业的R&D投入,有大量0值,和正值的投入金额占销量比例。因变量是企业的销量变化百分比,有大量0值(保持不变),负值(降低)和正值(增加)。想请教老师这种情况下该用什么模型比较合适呢?以及如果把其中一个转化为名义变量(eg 有无R&D的虚拟变量销量变动转化为增平减三值名义变量),只有自变量或者因变量有大量0值又该如何处理呢?

对于自变量含有大量零值的情况,其实并没有处理的必要。直接代入计算即可。但是潜在的问题可能是,有效的信息太少,缺乏variation,影响估计效果。变成增平减三值变量的策略也不好,会影响对结果的解释并且增加计算难度。因变量有较多零值可考虑托宾模型,在stata里面有tobit命令可以实现,这个以前在第10期问答中有回答,挺详细。
往期回顾:
互助问答第10-11期:观测数据频次、受限因变量模型等问题
互助问答第401期 变量中有大量0值的问题
如果您在计量学习和实证研究中遇到问题,有三条途径可以到达我们手里:一是请及时发到邮箱szlw58@126.com;二是加入论文导向计量群(现有10个群);三是直接在微信公众号平台后台留言。专业委员会有40多名编辑都会看,您的问题会得到及时关注!请您将问题描述清楚,任何有助于把问题描述清楚的细节都能使我们更方便地回答您的问题,提问细则参见:实证研究互助平台最新通知(点击文末阅读原文查看详情)
如果您想成为问题解答者,在帮助他人过程中巩固自己的知识,请发邮件至szlw58@126.com(优先)或给本公众号留言或加微信793481976给群主留言,我们诚挚欢迎热心的学者和学生。具体招募信息请参见:实证研究互助平台志愿者团队招募公告
鲜活的事例更有助于提高您的研究水平,呆板的教科书让人生厌。如果您喜欢,请提出您的问题,也请转发推广!
(欢迎转发,欢迎分享;转载请注明出处,引用和合作请留言。本文作者拥有所有版权,原创文章最早发表于“学术苑”。任何侵权行为将面临追责!)
学术指导:张晓峒老师 Ben Lambert
本期解答人:涂盟老师
编辑:易仰楠
统筹:左川 易仰楠
技术:刘子瑗
