欢迎光临散文网 会员登陆 & 注册

互助问答第161期:相关分析和回归分析的符号以及协变量问题

2020-05-20 21:25 作者:学术苑  | 我要投稿

1.尊敬的各位老师,我的问题如下:多元回归分析中相关性分析和回归分析变量的符号不一致。回归分析的结果与论文预期一致,但相关分析结果相反。这样的结果正常吗?这是为什么?相关分析的符号与预期不一致,是不是说就没有必要做多元回归分析了?还是说相关分析的结果只是一个大致的检测,具体的关系还是要以回归分析为准。相关分析的符号与预期不一致,会影响后续进行多元回归分析吗?


2.老师您好。我想将家庭背景作为协变量,分析家庭背景Z(连续变量/分类变量)是如何影响阅读时间X(分类变量)和语文成绩Y(连续变量)的关系的。想得到在控制家庭背景变量之后不同阅读时间的语文均值,然后和控制家庭背景变量之前的不同阅读时间的语文均值进行比较。请问:我应该怎么操作才能得到这个结果呢?非常感谢。

1.相关系数和回归系数符号相反是可能发生的。因为相关分析关注的是两个变量之间的相关方向和相关程度,而没有考虑其他变量的影响。多元线性回归得到的系数是偏回归系数,考虑了其他控制变量的影响。如果确认数据不存在问题(没有离群值,进行了缩尾处理),那么可以考虑是否存在多重共线性,多重共线性的一个重要后果就是得到的系数符号相反。此外,由于控制变量中的某些变量遮掩(多元回归中的抑制现象(Suppression))主要变量,也可能发生符号相反的情况。两者符号不一致并不影响你进行分析,结果当然还是以回归分析为主。


2.分析家庭背景Z(连续变量/分类变量)是如何影响阅读时间X(分类变量)和语文成绩Y(连续变量)的关系可以通过交乘项来实现,通过交互项的系数来分析家庭背景的作用就行了,没必要根据你说的这样取均值。Stata的回归命令为:

reg Y Z##i.X   // Z为分类变量时

reg Y c.Z##i.X   //Z为连续变量时


往期回顾:

互助问答第160期:对于159期问题的补充

互助问答第159期:逻辑回归、用虚拟变量做分组回归

互助问答第158期:滚动回归之stata 实现

互助问答第157期:有关probit 模型的边际系数问题

如果您在计量学习和实证研究中遇到问题,请及时发到邮箱szlw58@126.com,专业委员会有30多名编辑都会看,您的问题会得到及时关注!请您将问题描述清楚,任何有助于把问题描述清楚的细节都能使我们更方便地回答您的问题,提问细则参见:实证研究互助平台最新通知(点击文末阅读原文查看详情)


如果您想成为问题解答者,在帮助他人过程中巩固自己的知识,请发邮件至szlw58@126.com(优先)或给本公众号留言加微信793481976给群主留言,我们诚挚欢迎热心的学者和学生。具体招募信息请参见:实证研究互助平台志愿者团队招募公告


鲜活的事例更有助于提高您的研究水平,呆板的教科书让人生厌。如果您喜欢,请提出您的问题,也请转发推广!


(欢迎转发,欢迎分享转载请注明出处引用和合作请留言。本文作者拥有所有版权,原创文章最早发表于“学术苑”任何侵权行为将面临追责!)


学术指导:张晓峒老师

本期解答人:曹晖老师 统计小妹

编辑:统计小妹

统筹:易仰楠

技术:林毅


互助问答第161期:相关分析和回归分析的符号以及协变量问题的评论 (共 条)

分享到微博请遵守国家法律