互助问答第92期:虚拟变量问题
今日问题:
使用tobit模型回归时,将被解释变量为连续变量,解释变量为分类变量(子女数量),因研究重点是看每增加一个子女对y影响的具体效应,因此将子女数量作分类,回归时命令为tobit y i.x control ,ll(0),回归结果相当于分类变量具体分析:x1,x2,x3

涉及到解释变量分为三类分析,使用工具变量为第一胎子女性别,请问使用工具变量在stata应如何处理?
这种处理方式不适当。如果生成三类虚拟变量,那么工具变量将少于内生变量,得不到期望的估计结果。并且,生成虚拟变量的做法相当于分别用二孩、三孩和基准情形(一孩)进行比较,不能代表边际影响。
如果一定要用虚拟变量,一个办法是分组进行估计。在第一个回归里只保留一孩和二孩样本,然后用“第一胎的性别”作为“是否有二孩”的IV,然后再做一孩和三孩的比较。但是存在弱工具变量的风险。
或者直接用“第一胎的性别”作为“子女数量”的IV进行估计会更好。
往期回顾:
互助问答第91期:中介效应检验问题
互助问答第90期:论文疑问,DID的控制组是谁?
互助问答第89期:面板数据固定效应模型能消除内生性吗?
如果您在计量学习和实证研究中遇到问题,请及时发到邮箱szlw58@126.com,专业委员会有30多名编辑都会看,您的问题会得到及时关注!请您将问题描述清楚,任何有助于把问题描述清楚的细节都能使我们更方便地回答您的问题,提问细则参见:实证研究互助平台最新通知(点击文末阅读原文查看详情)
如果您想成为问题解答者,在帮助他人过程中巩固自己的知识,请发邮件至szlw58@126.com(优先)或给本公众号留言或加微信793481976给群主留言,我们诚挚欢迎热心的学者和学生。具体招募信息请参见:实证研究互助平台志愿者团队招募公告
鲜活的事例更有助于提高您的研究水平,呆板的教科书让人生厌。如果您喜欢,请提出您的问题,也请转发推广!
(欢迎转发,欢迎分享;转载请注明出处,引用和合作请留言。本文作者拥有所有版权,原创文章最早发表于“论文导向计量实证社区”。任何侵权行为将面临追责!)
学术指导:张晓峒老师
本期解答人:游万海老师
统筹:易仰楠 李丹丹
编辑:涂盟
技术:林毅 赵雅轩

