互助问答第46期:二值变量及倾向得分匹配PSM问题

尊敬的老师,我有两个问题想请教:
问题1:想咨询一下关于采用二值变量作为被解释变量研究中国企业的投资问题,我的基本想法如下:中国企业对外投资行为,当 i 企业 t 年份投资于 j 国,则因变量取1,否则取0,同时我的解释变量既包括企业微观层面的因素,也包括国家宏观层面的因素,所以按道理说数据应该这样摆,见下(我以两个企业三年内投资3个国家为例,1企业在2000-2002年期间之进行了两次投资,一次是2000年投资A国,一次是2001年投资B国,2企业是2000和2001年都投资C国),这是我理解的数据结构,不知道对不对,但是如果果真是这样的话,总的数据量直观来看就是企业数*年份*国家数,我有130个企业11年投资到105个东道国,即130*11*105条数据,而其中的取值为1的样本只有1000个左右,这样应该回归不出来结果吧,而且如果是这样的话面板的识别变量是什么呢?
id year country OFDI
1 2000 A 1
1 2000 B 0
1 2000 C 0
1 2001 A 0
1 2001 B 1
1 2001 C 0
1 2002 A 0
1 2002 B 0
1 2002 C 0
2 2000 A 0
2 2000 B 0
2 2000 C 1
2 2001 A 0
2 2001 B 0
2 2001 C 1
2 2002 A 0
2 2002 B 0
2 2002 C 0
答:数据结构没有问题。这是国际贸易研究中的常见数据结构——国家1与国家2在某一年的贸易行为;只不过在这个数据中,一方为企业,一方为国家。企业和国家的一个配对可以作为一个对象,这样有130*105个“个体”,再与年份一起构成面板识别变量。
问题2:关于倾向得分匹配PSM,操作时可不可以不定义结果变量?我的因变量是二值选择变量(也即企业在t年是否进行投资)。谢谢!
答:可以。Stata中psmatch2命令就不要求定义结果变量。
本期解答人:中关村大街
编辑:田人合老师 杨芳博士 Hollian博士
统筹:易仰楠
技术:知我者
往期回顾
互助问答第45期:VAR模型及面板泊松回归系数差异检验问题
互助问答第44期:交互项系数和调节效应存在问题
关于我们
如果您在计量学习和实证研究中遇到问题,请及时发到邮箱szlw58@126.com,专业委员会有30名编辑都会看,您的问题会得到及时关注!请您将问题描述清楚,任何有助于把问题描述清楚的细节都能使我们更方便地回答您的问题,提问细则参见:实证研究互助平台最新通知
如果您想成为问题解答者,在帮助他人过程中巩固自己的知识,请发邮件至szlw58@126.com(优先)或给本公众号留言或加微信793481976给群主留言,我们诚挚欢迎热心的学者和学生。具体招募信息请参见:实证研究互助平台志愿者团队招募公告
鲜活的事例更有助于提高您的研究水平,呆板的教科书让人生厌。如果您喜欢,请提出您的问题,也请转发推广!
(欢迎转发,欢迎分享;转载请注明出处,引用和合作请留言。本文作者拥有所有版权,原创文章最早发表于“论文导向计量实证社区”。任何侵权行为将面临追责!)
