欢迎光临散文网 会员登陆 & 注册

stata 学习笔记 yhy

2022-09-14 19:03 作者:Sophia_yhy5018  | 我要投稿

sgmediation的ado和help文件

stata 的sgmediation命令安装包 - Stata专版 - 经管之家(原人大经济论坛) (pinggu.org)

2022年9月14日09:36:40

语法:ttable3 varlist , by(groupvar) [ format(%fmt) unequal welch median rowname notitle nostar tvalue pvalue ]

ttable2(由中南财经大学李春涛老师和张璇老师编写)其中ttable2不能显示t值和p值,

ttable3(由中山大学连玉君老师编写) 


语法:oneway response_var=Y factor_var=X [if] [in] [weight] [, options]

单因素方差分析


语法:areg depvar [indepvars] [if] [in] [weight], absorb(varname) [options]

·笔记:关于固定效应模型的四个Stata命令 - 知乎 (zhihu.com)

混合OLS、固定效应(FE)、随机效应(RE)、最小二乘虚拟变量(LSDV)

LSDV方法的Stata命令是reg i.id i.year

areg命令是对reg命令的改进和优化,其对数据结构也没有要求。

有些时候我们想在回归中控制很多虚拟变量(i.id这种),但又不想生成虚拟变量,不想报告虚拟变量的回归结果,

那么就可以使用areg命令,只需在选项absorb()的括号里加入你想要控制的类别变量就好。

不过absorb()的括号里只能加一个变量,如果想要估计双向固定效应或是更高维度固定效应,

那么就还是要使用使用i.var的方式引入虚拟变量。


reghdfe 主要用于实现多维固定效应线性回归。有些时候,我们需要控制多个维度(如城市-行业-年度)的固定效应,xtreg等命令也OK,但运行速度会很慢,reghdfe解决的就是这一痛点,其在运行速度方面远远优于xtreg等命令。

reghdfe命令可以包含多维固定效应,只需 absorb (var1,var2,var3,...),不需要使用i.var的方式引入虚拟变量,相比xtreg等命令方便许多,并且不会汇报一大长串虚拟变量回归结果。


logout可用于输出所有命令结果;esttab一般用于输出回归表格,也可以输出描述统计。


 xi:reg是什么意思啊?

xi 命令是一个比较好的生成的虚拟变量的方法,

其含义表示增添互动项“interaction expansion”
eg:  xi:reg y x1 x2 i.id
id表示确定个体变量   i.id表示根据变量id生成虚拟变量。
xi:命令可以 把字符串 直接转化为dummy



 psmatch2 depvar [indepvars]  [, outcome(varlist) pscore(varname) neighbor(integer) 

 common logit ties ate]


PSM倾向得分匹配法学习指南

协变量的选择

treat是干预变量,X是协变量,Y是结果变量。

  • 1对1匹配:为每个干预组个体在控制组中寻找距离最近的个体来匹配。如果出现距离相同的个体,可以随机选择一个匹配,或按照排序后第一个出现的个体进行匹配。

方法1是比较匹配前后的核密度图,

最好的结果是匹配之后两条线很相近,这便代表“共同支撑集”范围比较大。

方法2是:画条形图,显示倾向得分的共同取值范围。

下图显示了大多数观测值都在共同取值范围内,因此在匹配时仅会损失少量样本。

首先,平衡性检验的目的,是为了看看匹配后各个变量的均值,有没有明显差异。

第一个数据:匹配前后各个变量的均值,是否有明显差异(看Mean)。

第二个数据:或者看平衡后均值的偏差(看%bias),平衡后偏差小于10%,基本上是可以接受的。

第三个数据:看p值(或t值)。

原假设是控制组与处理组,没有系统性的差异,只要p>0.05(或|t|<1.96),

就无法拒绝原假设,即可视为通过了平衡性检验。

psmatch2 D x1 x2 x3,outcome(y) logit ties ate common odds pscore(varname) qutetly

D为处理变量(treatment variable);

logit是选项,说明指定logit来估计倾向得分,默认方法是probit;

quietly表示不汇报对倾向得分的估计过程。

最后是pamatch2的两个估计后命令。有:

(1)pstest x1 x2 x3,both graph。该命令用来估计是否平衡。both表示,同时显示匹配前的数据平衡情况,默认,只显示匹配后的情形。graph图示各变量匹配前后,的平衡情况

(2)psgraph,bin(#)。该命令是要画直方图,来显示倾向得分的共同取值范围,选项bin(#)用来指定直方图的,分组数,默认为20组。

·倾向得分匹配、双重差分倾向得分匹配(PSM、PSM-DID)-原理及stata实操(第一弹):https://www.bilibili.com/read/cv2545056/

·双重差分倾向得分匹配(PSM-DID)-stata实操(第二弹):https://www.bilibili.com/read/cv4360682?from=articleDetail

作者:mhhhpl

链接:https://www.jianshu.com/p/1a71fdff40d7
来源:简书

logit Dfee CL_D Size Lev Roa Cfo Soe Rec Punish Dirs Age Op Top10 Big4 i.year i.industry, vce(cluster ind)

党员为1,非党员为0:

logit pol Q1 Q2 Q8, r nolog

probit pol Q1 Q2 Q8, nolog

不显示对数似然值,no log likelihood


 分组回归系数差异检验 bdiff

bdiff, group(groupvar) model(string) [options]

两个回归同一个变量的系数是否存在显著差异?

bdiff, group(union) model(reg wage $xx) reps(100) detail

通过组间差异我们可以得到经验P值,若经验P值显著的话,那么就说明两组的影响是有显著差异的,就可以进行系数比较啦!






stata 学习笔记 yhy的评论 (共 条)

分享到微博请遵守国家法律