Stata入门——样本的保留与删除

“剔除金融类、ST类和PT类上市公司”
“删除变量缺失的样本”
sysuse census,clear
*replace 替换样本的变量取值
replace pop =. if pop > 5000000
创造缺失值,方便后续对于缺失值的处理
*drop 去除满足条件的样本或变量
drop if pop == .
删除样本:某一变量为缺失值的样本
drop a
删除变量:所有样本的a这一变量的数据
*keep 保留满足条件的样本或变量
keep if pop != .
!=是不等于; 保留pop变量不等于缺失值的所有样本
drop if Debt > 1
keep if Debt <= 1
*行业通常用 INDCODE 来表示,并非数字,而是一个字符串,如 I06, I06, I07…
必须要加“”,将其由变量格式转换为字符串格式
drop if state2 == "AL"
keep if state2 != "AL"