互助问答第324期:样本按照变量划分的问题
样本按照变量划分的问题
请教各位老师,我在一篇论文里看到,在跑回归的时候,说把总样本按照一个变量划分为“bottom tercile,top tercile”,请问这分别指百分之几啊?
应该是样本三等分的意思,上三分之一为 top tercile,中间的三分之一为 middle tercile,下三分之一 bottom tercile。
具体参见:https://blog.csdn.net/liyanzhong/java/article/details/103060541
按顺序排列的一组数据,其值将数据分成三组,每组包含总数据的三分之一。 为了定义这些 terciles,历史数据按照从最低到最高的顺序排列,然后将数据划分为三个相等的组。最低的三分之一的数据值定义为最低的 tercile,中间的三分之一是中间的 tercile,上面的三分之一是上面的 tercile。Tercile 是分位数的特定形式。
例如,如果您有100个数据值,最低 tercile 将包含第1-33个数据值,中间 tercile 包含第34-67个数据值,上面 tercile 包含第68-100个数据值。
往期回顾:
互助问答第323期:关于PSM+DID的问题
如果您在计量学习和实证研究中遇到问题,有三条途径可以到达我们手里:一是请及时发到邮箱szlw58@126.com;二是加入论文导向计量群(现有10个群);三是直接在微信公众号平台后台留言。专业委员会有40多名编辑都会看,您的问题会得到及时关注!请您将问题描述清楚,任何有助于把问题描述清楚的细节都能使我们更方便地回答您的问题,提问细则参见:实证研究互助平台最新通知(点击文末阅读原文查看详情)
如果您想成为问题解答者,在帮助他人过程中巩固自己的知识,请发邮件至szlw58@126.com(优先)或给本公众号留言或加微信793481976给群主留言,我们诚挚欢迎热心的学者和学生。具体招募信息请参见:实证研究互助平台志愿者团队招募公告
鲜活的事例更有助于提高您的研究水平,呆板的教科书让人生厌。如果您喜欢,请提出您的问题,也请转发推广!
(欢迎转发,欢迎分享;转载请注明出处,引用和合作请留言。本文作者拥有所有版权,原创文章最早发表于“学术苑”。任何侵权行为将面临追责!)
学术指导:张晓峒老师 Ben Lambert
本期解答人:匿名
编辑:易仰楠
统筹:左川 易仰楠
技术:刘子瑗
全文完,感谢您的耐心阅读
请顺手点个“在看”吧~
阅读原文
