互助问答第19期：probit模型、tobit模型

2020-04-08 08:59 作者:学术苑 0人读过 | 我要投稿

问题：前辈们好！我想请教一下

（1）probit模型的完整命令是probit y x1 x2 i.year i.citycode i.industry, r nolog 这样吗？tobit模型的完整命令是tobit y x1 x2 i.year i.citycode i.industry, r nolog 这样吗？

（2）probit模型、tobit模型在没有控制年份、行业、地区的时候做的结果是显著的，在控制了之后是不显著的，原因何在呢？然后就是，如果我选择没有控制年份、行业、地区的结果（用这个命令probit y x1 x2, r nolog）呈现，可以吗？

（3）在一些大论文里面，有些数据进行了处理，例如删除主营业务收入小于等于0，从业人数小于10等等，做了这些处理之后，并没有删除有些变量的缺漏值，按照这种做法最后做回归呈现出来的观测值可能不一样，但是为什么大家发的论文里面观测值都是一样的呢？

答案：

（1）不大明白你所描述的问题想要表达的意思。每一个命令都有它固定的语法结构，其中有一些部分是必不可少的，对于任意一个命令，例如，probit在Stata里面help probit，会显示该命令对应的语法结构：probit depvar[indepvars][if][in][weight] [,options] 。如果要在运行中不报错，其中probit depvar indepvars就是必不可少的，其余则是可有可无的。

（2）在加入某些控制变量之后原有解释变量系数估计的显著性水平发生变化有太多可能的原因。如果仅仅是从统计关系上考虑，系数大小或显著性发生变化意味着原解释变量和新加入的变量之间在统计上存在显著关系。应不应该加入年份、行业、地区固定效应取决于理论和计量模型因果推断的要求。如果有明确的理论告诉我们应该控制年份、行业、地区固定效应，或者如果我们有理由认为遗漏这些变量会导致内生性偏误，那么就应该控制。

（3）这个问题需要把具体提到的论文的数据处理过程做详细说明后才能判断。仅从现有的问题描述来看，可能是处理极值问题。有些论文做了极值处理，有些没有。如果一个面板数据极值较多，则应该用winsor命令处理一下。

学术指导：张晓峒老师

本期解答人：张川川老师

编辑：粥粥小精灵一个聪慧的人

统筹：芋头易仰楠

技术：知我者

标签：

互助问答第19期：probit模型、tobit模型

互助问答第19期：probit模型、tobit模型的评论 (共条)

你可能也喜欢这些文章

最新发布的文章

互助问答第19期：probit模型、tobit模型

本文作者的其他文章

互助问答第19期：probit模型、tobit模型的评论 (共 条)

你可能也喜欢这些文章

最新发布的文章

互助问答第19期：probit模型、tobit模型的评论 (共条)