stata 学习笔记 yhy
sgmediation的ado和help文件
stata 的sgmediation命令安装包 - Stata专版 - 经管之家(原人大经济论坛) (pinggu.org)
2022年9月14日09:36:40
语法:ttable3 varlist , by(groupvar) [ format(%fmt) unequal welch median rowname notitle nostar tvalue pvalue ]
ttable2(由中南财经大学李春涛老师和张璇老师编写)其中ttable2不能显示t值和p值,
ttable3(由中山大学连玉君老师编写)
语法:oneway response_var=Y factor_var=X [if] [in] [weight] [, options]
单因素方差分析
语法:areg depvar [indepvars] [if] [in] [weight], absorb(varname) [options]
·笔记:关于固定效应模型的四个Stata命令 - 知乎 (zhihu.com)
混合OLS、固定效应(FE)、随机效应(RE)、最小二乘虚拟变量(LSDV)
LSDV方法的Stata命令是reg i.id i.year
areg
命令是对reg
命令的改进和优化,其对数据结构也没有要求。
有些时候我们想在回归中控制很多虚拟变量(i.id
这种),但又不想生成虚拟变量,不想报告虚拟变量的回归结果,
那么就可以使用areg
命令,只需在选项absorb()
的括号里加入你想要控制的类别变量就好。
不过absorb()
的括号里只能加一个变量,如果想要估计双向固定效应或是更高维度固定效应,
那么就还是要使用使用i.var
的方式引入虚拟变量。
reghdfe
主要用于实现多维固定效应线性回归。有些时候,我们需要控制多个维度(如城市-行业-年度)的固定效应,xtreg
等命令也OK,但运行速度会很慢,reghdfe
解决的就是这一痛点,其在运行速度方面远远优于xtreg
等命令。
reghdfe
命令可以包含多维固定效应,只需 absorb (var1,var2,var3,...)
,不需要使用i.var
的方式引入虚拟变量,相比xtreg
等命令方便许多,并且不会汇报一大长串虚拟变量回归结果。
logout
可用于输出所有命令结果;esttab
一般用于输出回归表格,也可以输出描述统计。
xi:reg是什么意思啊?
xi 命令是一个比较好的生成的虚拟变量的方法,
其含义表示增添互动项“interaction expansion”
eg: xi:reg y x1 x2 i.id
id表示确定个体变量 i.id表示根据变量id生成虚拟变量。
xi:命令可以 把字符串 直接转化为dummy
psmatch2 depvar [indepvars] [, outcome(varlist) pscore(varname) neighbor(integer)
common logit ties ate]
PSM倾向得分匹配法学习指南
协变量的选择
treat是干预变量,X是协变量,Y是结果变量。
1对1匹配:为每个干预组个体在控制组中寻找距离最近的个体来匹配。如果出现距离相同的个体,可以随机选择一个匹配,或按照排序后第一个出现的个体进行匹配。
方法1是比较匹配前后的核密度图,
最好的结果是匹配之后两条线很相近,这便代表“共同支撑集”范围比较大。
方法2是:画条形图,显示倾向得分的共同取值范围。
下图显示了大多数观测值都在共同取值范围内,因此在匹配时仅会损失少量样本。
首先,平衡性检验的目的,是为了看看匹配后各个变量的均值,有没有明显差异。
第一个数据:匹配前后各个变量的均值,是否有明显差异(看Mean)。
第二个数据:或者看平衡后均值的偏差(看%bias),平衡后偏差小于10%,基本上是可以接受的。
第三个数据:看p值(或t值)。
原假设是控制组与处理组,没有系统性的差异,只要p>0.05(或|t|<1.96),
就无法拒绝原假设,即可视为通过了平衡性检验。
psmatch2 D x1 x2 x3,outcome(y) logit ties ate common odds pscore(varname) qutetly
D为处理变量(treatment variable);
logit是选项,说明指定logit来估计倾向得分,默认方法是probit;
quietly表示不汇报对倾向得分的估计过程。
最后是pamatch2的两个估计后命令。有:
(1)pstest x1 x2 x3,both graph。该命令用来估计是否平衡。both表示,同时显示匹配前的数据平衡情况,默认,只显示匹配后的情形。graph图示各变量匹配前后,的平衡情况
(2)psgraph,bin(#)。该命令是要画直方图,来显示倾向得分的共同取值范围,选项bin(#)用来指定直方图的,分组数,默认为20组。
·倾向得分匹配、双重差分倾向得分匹配(PSM、PSM-DID)-原理及stata实操(第一弹):https://www.bilibili.com/read/cv2545056/
·双重差分倾向得分匹配(PSM-DID)-stata实操(第二弹):https://www.bilibili.com/read/cv4360682?from=articleDetail
作者:mhhhpl
链接:https://www.jianshu.com/p/1a71fdff40d7
来源:简书
logit Dfee CL_D Size Lev Roa Cfo Soe Rec Punish Dirs Age Op Top10 Big4 i.year i.industry, vce(cluster ind)
党员为1,非党员为0:
logit pol Q1 Q2 Q8, r nolog
probit pol Q1 Q2 Q8, nolog
不显示对数似然值,no log likelihood
分组回归系数差异检验 bdiff
bdiff, group(groupvar) model(string) [options]
两个回归同一个变量的系数是否存在显著差异?
bdiff, group(union) model(reg wage $xx) reps(100) detail
通过组间差异我们可以得到经验P值,若经验P值显著的话,那么就说明两组的影响是有显著差异的,就可以进行系数比较啦!