stata 学习笔记 yhy

2022-09-14 19:03 作者:Sophia_yhy5018 0人读过 | 我要投稿

sgmediation的ado和help文件

stata 的sgmediation命令安装包 - Stata专版 - 经管之家(原人大经济论坛) (pinggu.org)

2022年9月14日09:36:40

语法：ttable3 varlist , by(groupvar) [ format(%fmt) unequal welch median rowname notitle nostar tvalue pvalue ]

ttable2（由中南财经大学李春涛老师和张璇老师编写）其中ttable2不能显示t值和p值，

ttable3（由中山大学连玉君老师编写）

语法：oneway response_var=Y factor_var=X [if] [in] [weight] [, options]

单因素方差分析

语法：areg depvar [indepvars] [if] [in] [weight], absorb(varname) [options]

·笔记：关于固定效应模型的四个Stata命令 - 知乎 (zhihu.com)

混合OLS、固定效应（FE）、随机效应（RE）、最小二乘虚拟变量（LSDV）

LSDV方法的Stata命令是reg i.id i.year

areg命令是对reg命令的改进和优化，其对数据结构也没有要求。

有些时候我们想在回归中控制很多虚拟变量（i.id这种)，但又不想生成虚拟变量，不想报告虚拟变量的回归结果，

那么就可以使用areg命令，只需在选项absorb()的括号里加入你想要控制的类别变量就好。

不过absorb()的括号里只能加一个变量，如果想要估计双向固定效应或是更高维度固定效应，

那么就还是要使用使用i.var的方式引入虚拟变量。

reghdfe 主要用于实现多维固定效应线性回归。有些时候，我们需要控制多个维度（如城市-行业-年度）的固定效应，xtreg等命令也OK，但运行速度会很慢，reghdfe解决的就是这一痛点，其在运行速度方面远远优于xtreg等命令。

reghdfe命令可以包含多维固定效应，只需 absorb (var1,var2,var3,...)，不需要使用i.var的方式引入虚拟变量，相比xtreg等命令方便许多，并且不会汇报一大长串虚拟变量回归结果。

logout可用于输出所有命令结果；esttab一般用于输出回归表格，也可以输出描述统计。

xi:reg是什么意思啊？

xi 命令是一个比较好的生成的虚拟变量的方法，

其含义表示增添互动项“interaction expansion”
eg: xi:reg y x1 x2 i.id
id表示确定个体变量 i.id表示根据变量id生成虚拟变量。
xi：命令可以把字符串直接转化为dummy

psmatch2 depvar [indepvars] [, outcome(varlist) pscore(varname) neighbor(integer)

common logit ties ate]

PSM倾向得分匹配法学习指南

协变量的选择

treat是干预变量，X是协变量，Y是结果变量。

1对1匹配：为每个干预组个体在控制组中寻找距离最近的个体来匹配。如果出现距离相同的个体，可以随机选择一个匹配，或按照排序后第一个出现的个体进行匹配。

方法1是比较匹配前后的核密度图，

最好的结果是匹配之后两条线很相近，这便代表“共同支撑集”范围比较大。

方法2是：画条形图，显示倾向得分的共同取值范围。

下图显示了大多数观测值都在共同取值范围内，因此在匹配时仅会损失少量样本。

首先，平衡性检验的目的，是为了看看匹配后各个变量的均值，有没有明显差异。

第一个数据：匹配前后各个变量的均值，是否有明显差异（看Mean）。

第二个数据：或者看平衡后均值的偏差（看%bias），平衡后偏差小于10%，基本上是可以接受的。

第三个数据：看p值（或t值）。

原假设是控制组与处理组，没有系统性的差异，只要p＞0.05（或|t|＜1.96），

就无法拒绝原假设，即可视为通过了平衡性检验。

psmatch2 D x1 x2 x3,outcome(y) logit ties ate common odds pscore(varname) qutetly

D为处理变量（treatment variable）；

logit是选项，说明指定logit来估计倾向得分，默认方法是probit；

quietly表示不汇报对倾向得分的估计过程。

最后是pamatch2的两个估计后命令。有：

（1）pstest x1 x2 x3，both graph。该命令用来估计是否平衡。both表示,同时显示匹配前的数据平衡情况，默认,只显示匹配后的情形。graph图示各变量匹配前后,的平衡情况

（2）psgraph,bin（#）。该命令是要画直方图,来显示倾向得分的共同取值范围，选项bin（#）用来指定直方图的,分组数，默认为20组。

·倾向得分匹配、双重差分倾向得分匹配(PSM、PSM-DID)-原理及stata实操（第一弹）：https://www.bilibili.com/read/cv2545056/

·双重差分倾向得分匹配(PSM-DID)-stata实操（第二弹）：https://www.bilibili.com/read/cv4360682?from=articleDetail

作者：mhhhpl

链接：https://www.jianshu.com/p/1a71fdff40d7
来源：简书

logit Dfee CL_D Size Lev Roa Cfo Soe Rec Punish Dirs Age Op Top10 Big4 i.year i.industry, vce(cluster ind)

党员为1，非党员为0：

logit pol Q1 Q2 Q8, r nolog

probit pol Q1 Q2 Q8, nolog

不显示对数似然值，no log likelihood

分组回归系数差异检验 bdiff

bdiff, group(groupvar) model(string) [options]

两个回归同一个变量的系数是否存在显著差异？

bdiff, group(union) model(reg wage $xx) reps(100) detail

通过组间差异我们可以得到经验P值，若经验P值显著的话，那么就说明两组的影响是有显著差异的，就可以进行系数比较啦！

标签：

stata 学习笔记 yhy

xi:reg是什么意思啊？

PSM倾向得分匹配法学习指南

协变量的选择