欢迎光临散文网 会员登陆 & 注册

连玉君老师Stata33讲学习笔记(中)

2020-12-28 21:42 作者:小志小视界  | 我要投稿

- Stata33 讲地址:https://space.bilibili.com/546535876

> Stata33 讲是连玉君老师 2014 年录制的一套 Stata 公开课,包括 34 个小视频 (每个 15 分钟左右),从最基本的 Stata 入门到数据处理、绘图、编程,以及线性回归分析和固定效应模型。

> 欢迎大家关注微信公众号“Stata 连享会”和连享会网页(http://www.lianxh.cn),四百篇推文等你探索,解决你的燃眉之急,提升你的实证功底;更多优质课程尽在连享会直播间(https://lianxh.duanshu.com),名师和你面对面,学习提升更快速。


#Stata33讲# 第12天 egen函数简介

- egen 是对 gen 的扩展;借用函数功能

- median 中位数;sd 标准差;group 编码

- 实例运用:total 加总;

- help egen 了解更多函数

- 拓展:[如何产生一个新变量-gen & egen](BV1V64y1F78k)


#Stata33讲# 第13天 类别变量和分组统计

- tab 一维列表;二维列表

- 连续变量转为类别变量:group分组

- 应用:分组回归

- 百分位分组:quantiles

- local 暂元;[暂元-暂时性的存储单元](BV1Si4y1g7uX)

- 拓展:[如何对截面数据分组](BV1wV411Y7NW);[如何对面板数据分组](BV1gz4y1C79f)


#Stata33讲# 第14天 赫芬达尔指数

- 行业集中度,竞争程度

- HHI简介

- pc 计算组内占比

- total 求和

- HHI5?组内公司较少怎么办?

- hhi5:help hhi5


#Stata33讲# 第15天 Stata绘图概览

- Stata提供的绘图种类

- help graph_intro

- 二维图基本结构 twoway 

- line曲线,scatter散点,connect连线图

- histogram 直方图;kdensity 密度函数图

- 图层的概念,图层呈现不同元素

- 更为完整的例子:标题title,横轴xtitle,纵轴ytitle,标签xlabel ylabel,legend,note

- 保存的方法 graph export 

- 常用帮助文档 help 


#Stata33讲# 第16天 折线图和连线图

- twoway line 折线图

- 详细命令的选项解读

- twoway connect 连线图

- 线性拟合图 twoway lfit

- 非线性拟合图 twoway qfit


#Stata33讲# 第17天 直方图

- histogram 直方图

- 连续变量的直方图

- 理解直方图

- 直方图美化

  - normal

  - kdensity

  - 长条的显示

  - 附加标签

- 分组直方图:byhist

- 对称直方图:bihist


#Stata33讲# 第18天 函数图

- help twoway function

- 多幅函数图:括号分割与叠加

- 添加特殊字符和文字:help graph text

#Stata33讲# 第19-1天 单值

- 定义单值(scalar):存放数字,存放字符串

- 执行命令后的单值 return list,ereturn list 

- 一些特殊的单值

- 参考:[解读Stata内存中的返回值/留存值](BV1gV41127TM)


#Stata33讲# 第19-2天 暂元

- 局域暂元 local;全局暂元 global

- 基本功能:存放数字,存放变量名,变量系数估计值

- dofile:一次环境中局域暂元发挥作用,选中代码部分执行

- Comman 窗口:Stata运行期间,局域暂元都可以调用

- 对于如何引用局域暂元和全局暂元需要注意

- 参考:[暂元-暂时性的存储单元(local&global)](BV1Si4y1g7uX)


#Stata33讲# 第20-1天 循环语句

- while语句:条件循环

- forvalues语句:对数字的循环

- foreach语句:对暂元,文件,变量的循环

- help winsor2 [如何处理数据中的极端值或异常值]BV1yt4y1U73m)

- 参考及应用:[循环-完成重复性任务(forvalues&foreach)](BV1aC4y1t7Jg);[如何批量导入数据(以Excel数据为例)](BV1Ha4y1H7XM);[如何批量导入Excel的多张表单(Sheet)](BV1st4y1k7VW)


#Stata33讲# 第21天 ado文档:定义自己的程序

- 定义程序 program define 

- 程序保存 .ado文件

- 程序执行 Ctrl + R

- 程序管理 adoedit 

- 避免列印出过多的结果 quietly ;qui{}

- 避免数据在程序执行后有所变动 preserve restore


#Stata33讲# 第21-1天 随机抽样

- 无放回抽样 sample

  - 分组抽样 sample 50, by(id)

  - 分块抽样 gsample 3,cluster(id) wor // 随机抽取公司

- 有放回抽样

  - bsample:观察值可能被重复抽中,有的未抽到

  - panel:bsample,cluster(id) idcluter(idnew) // 抽公司

  - 重复抽中的公司视为非常相似的公司

  - 应用:bootstrap 标准误 【经验样本】


连玉君老师Stata33讲学习笔记(中)的评论 (共 条)

分享到微博请遵守国家法律