互助问答第151期:面板负二项回归和Stata数据处理问题
问题一:
尊敬的老师:您好。现想咨询老师,面板负二项的极大似然估计在stata里面怎么实现?是直接把所有因变量和自变量取对数然后带入xtnbreg命令还是另外需要手写命令?看到一篇文章这么写:We took the logarithm for the dependent variable and all key independent variables to facilitate the interpretation of our results. We estimated the Negative Binomial regression model using the Maximum Likelihood method. 期待老师您在百忙中的回复。谢谢!
问题二:
老师好!在数据处理整合中遇到一些问题想请教:(1)从统计年鉴导出的地区数据,不同年份的表在导入Stata中时,省份不能匹配起来,例如北京市在不同的年份里可能是“北京” “北京市” “北 京”,请问应该如何处理能把不同年份的省份变量处理成一致的?(2)生成新变量时需要用到变量的最大值和最小值,在Stata中要怎么调用某一变量的最大值和最小值?期待回复。谢谢!
回答一:
面板负二项回归在Stata中直接使用xtnbreg命令实现,被解释变量应该为计数变量,例如,个体看医生的次数,解释变量的类别不做要求。xtnbreg命令使用极大似然估计法估计系数,无需再对变量进行操作。引用的文章中说的对数处理应该是方便解释系数的时候用的。
回答二:
(1)对于省份的调整,建议使用最简表达:“北京”“内蒙古”等,可以使用subinstr()函数将“市”“省”“自治区”和空格等字符替换掉,例如replace prov=subinstr(prov,"省","",.)命令即为将变量prov的观测值中的“省”字去掉。
(2)两种方法:一是通过egen命令生成新变量,如egen a = max(x);二是通过scalar实现,在对变量进行描述性分析(summarize)后,相关指标储存在r()中,如果要使用变量最大值和最小值进行计算,可以通过scalar储存,之后调用即可。例如:
sum x
scalar a = r(max)
scalar b = r(min)
往期回顾:
互助问答第150期:学员提问汇总(3)
互助问答第149期:有关中介效应的Stata操作问题
互助问答第148期:交互效应的变量处理问题
互助问答第147期:暑期论文班提问精华汇总(2)
如果您在计量学习和实证研究中遇到问题,请及时发到邮箱szlw58@126.com,专业委员会有30多名编辑都会看,您的问题会得到及时关注!请您将问题描述清楚,任何有助于把问题描述清楚的细节都能使我们更方便地回答您的问题,提问细则参见:实证研究互助平台最新通知(点击文末阅读原文查看详情)
如果您想成为问题解答者,在帮助他人过程中巩固自己的知识,请发邮件至szlw58@126.com(优先)或给本公众号留言或加微信793481976给群主留言,我们诚挚欢迎热心的学者和学生。具体招募信息请参见:实证研究互助平台志愿者团队招募公告
鲜活的事例更有助于提高您的研究水平,呆板的教科书让人生厌。如果您喜欢,请提出您的问题,也请转发推广!
(欢迎转发,欢迎分享;转载请注明出处,引用和合作请留言。本文作者拥有所有版权,原创文章最早发表于“学术苑”。任何侵权行为将面临追责!)
学术指导:张晓峒老师
本期解答人:曹晖老师、统计小妹
统筹:易仰楠
编辑:统计小妹
技术:林毅

