欢迎光临散文网 会员登陆 & 注册

回归分析时,单因素P<0.05,而多因素却没有意义,我该如何是好?

2023-02-15 09:35 作者:郑老师妙趣横生统计学  | 我要投稿

昨天有有个朋友问我,回归分析单因素P好多 <0.05,而多因素只有1-2个小于0.05,如何是好。所以我翻箱倒柜找找我两年前写得材料,给大家看看。

先单后多,最令人沮丧的,莫过于单因素P<0.05,而多因素大多数没有统计学意义,甚至一个都没有。这可怎么办!!怎么回事!!不仅如此,有些时候单因素>0.05,多因素可以出现统计学差异的惊喜局面哦。


1

单因素、多因素结果矛盾原因

这种情况的原因是什么?大概原因包括:

(1)多因素回归自变量个数太多,样本量不够,建模失败

(2)存在着混杂变量

(3)存在着中介变量

(4)存在着交互效应

(5)排除中介变量后,存在着其它多重共线性

主要的原因是存在着混杂变量和中介变量。


2

单因素、多因素结果矛盾如何处理

如何处理?

当然,最重要的是,在多因素回归分析之前,厘清好各变量的因果关系。对!借助DAG的方法能够形成相应的因果网络。

但是,DAG构建并不是那么容易,更多的时候,我们需要借助统计方法,来绘制DAG的连接线

我觉得可以尝试,“两因素建模法”和“去因子建模法”来探索自变量为什么先单后多结果不一致。

两种方法原理相似,他们的关系如同逐步回归法中的“向前逐步”和“向后逐步”方法。也非常容易理解


3

两因素建模法

”案例分析

例1: Hosmer和Lemeshow于1989年研究了低出生体重婴儿的影响因素,结果变量为是否娩出低出生体重儿,考虑的自变量有产妇妊娠前体重、产妇年龄、种族、是否吸烟、早产次数、是否患高血压等。(数据文件见:logistic_step.sav。)


本文,关注两个变量,吸烟与早产次数

首先是单因素回归分析的结果:


在所有结果中,随访次数,没有统计学意义,因此多因素排除在外,剩下的全部纳入多因素回归分析(P<0.2)。结果如下:

详情请点击下方:

https://mp.weixin.qq.com/s/nBsU6tZGipuuBikwBoA32g


回归分析时,单因素P<0.05,而多因素却没有意义,我该如何是好?的评论 (共 条)

分享到微博请遵守国家法律