回归分析时,单因素P<0.05,而多因素却没有意义,我该如何是好?
昨天有有个朋友问我,回归分析单因素P好多 <0.05,而多因素只有1-2个小于0.05,如何是好。所以我翻箱倒柜找找我两年前写得材料,给大家看看。
先单后多,最令人沮丧的,莫过于单因素P<0.05,而多因素大多数没有统计学意义,甚至一个都没有。这可怎么办!!怎么回事!!不仅如此,有些时候单因素>0.05,多因素可以出现统计学差异的惊喜局面哦。
1
单因素、多因素结果矛盾原因
这种情况的原因是什么?大概原因包括:
(1)多因素回归自变量个数太多,样本量不够,建模失败
(2)存在着混杂变量
(3)存在着中介变量
(4)存在着交互效应
(5)排除中介变量后,存在着其它多重共线性
主要的原因是存在着混杂变量和中介变量。
2
单因素、多因素结果矛盾如何处理
如何处理?
当然,最重要的是,在多因素回归分析之前,厘清好各变量的因果关系。对!借助DAG的方法能够形成相应的因果网络。
但是,DAG构建并不是那么容易,更多的时候,我们需要借助统计方法,来绘制DAG的连接线
我觉得可以尝试,“两因素建模法”和“去因子建模法”来探索自变量为什么先单后多结果不一致。
两种方法原理相似,他们的关系如同逐步回归法中的“向前逐步”和“向后逐步”方法。也非常容易理解
3
“
两因素建模法
”案例分析
例1: Hosmer和Lemeshow于1989年研究了低出生体重婴儿的影响因素,结果变量为是否娩出低出生体重儿,考虑的自变量有产妇妊娠前体重、产妇年龄、种族、是否吸烟、早产次数、是否患高血压等。(数据文件见:logistic_step.sav。)

本文,关注两个变量,吸烟与早产次数
首先是单因素回归分析的结果:

在所有结果中,随访次数,没有统计学意义,因此多因素排除在外,剩下的全部纳入多因素回归分析(P<0.2)。结果如下:
详情请点击下方:
https://mp.weixin.qq.com/s/nBsU6tZGipuuBikwBoA32g
