欢迎光临散文网 会员登陆 & 注册

如何开展先单后多线性回归?

2023-07-21 16:20 作者:郑老师妙趣横生统计学  | 我要投稿


2023年郑老师多门科研统计课程:多次直播,含孟德尔随机化方法     

线性回归是一种常用的统计分析方法,用于建立自变量和因变量之间的线性关系模型。当知道两个变量间存在相关关系时,我们时常想进一步去探讨是否可以通过其中一个变量的数值定量的去预测另外一个变量的数值。

经典案例:父亲身高与儿子身高存在相关关系,是否可以通过父亲身高预测儿子的身高?

这类问题在统计学上常采用线性回归的方法来解决。这类文章一般的统计报告框架主要包括3部分内容:统计描述、相关性分析和先单后多线性回归

多因素线性回归,常见的统计学方法是先单因素,再多因素的分析理念。这种理念,严格符合“严进宽出”的思维:筛选变量纳入多因素回归模型。

实际中,许多人习惯性使用SPSS开展线性回归,但是SPSS需要手动绘制三线表,麻烦得很!而R语言虽然可以解决这个难点但具有一定的门槛。想要又简单无门槛,又能一键生成三线表,来看看这个工具吧——风暴统计智能在线免费统计分析平台!


 本文主要内容包括:

1.案例文献解读

2.实操数据集介绍

3.风暴统计复现先单后多线性回归

4.R语言软件复现先单后多线性回归


1.案例文献解读

通过中国人民解放军空军医大学第一附属医院的一篇核心期刊的文章,为大家简述一下线性回归分析文章的统计分析框架。


(1)变量说明

这是一篇现况研究,探究缺血性脑卒中多病共存患者的出院准备度水平及其影响因素,共收集256例缺血性脑卒中多病共存住院患者为研究对象,下表为可能影响患者出院准备度的一般资料。

(2)统计方法

作者使用SPSS 24.0软件进行数据的录入与分析。定量数据使用均数、标准差描述,不同特征的出院准备度得分采用中位数和四分位间距进行描述。采用Pearson相关分析检验出院准备度与出院指导质量的相关性;采用非参数检验法(Mann-Whitney U检验、Kruskal-Wallis检验)进行单因素分析;多因素分析采用多重线性回归法;检验水准为α=0.05。

(3)统计结果

①统计描述+单因素分析

这篇文章的统计分析框架就是比较典型的线性回归文章的分析框架。由于结局是定量数据,无分组变量,表1进行了变量的描述统计与单因素分析。单因素分析结果显示,不同年龄、合并症数量的患者出院准备度得分差异具有统计学意义(P<0.05)。进一步两两比较,年龄≥75岁组与55~64岁组之间有统计学差异(P=0.036);合并症数量为1~2种组与3~4种组之间存在统计学差异(P=0.001)。

②相关性分析

本研究出院指导质量得分与出院准备度得分呈正相关(r=0.209,P=0.001)。

③多重线性回归分析

考虑单因素分析纳入的变量过少,本研究结合临床专业知识将所有相关变量作为自变量,以出院准备度总分作为因变量进行线性回归分析。多重线性回归分析的结果显示合并症数量、文化程度、出院指导质量总分及BMI值最终进入了回归方程,对模型的解释力为11.5%。

这篇文献的线性回归分析则采用了先单后多的统计分析设计,先对自变量进行单因素分析,将有意义的变量纳入到多因素线性回归中,并且结合专业知识将其他变量纳入进行分析。

2.实操数据集介绍

我们使用R语言MASS包自带数据集birthwt作为实操数据集。这是一份于1986年在在马萨诸塞州收集的与婴儿出生体重低相关的危险因素的数据。以定量数据出生体重(bwt)作为结局变量,探讨下列因素对出生体重的影响。可能的影响因素如下:


详情请点击下方:

https://mp.weixin.qq.com/s?__biz=MzkzMDUxMjYzNQ==&mid=2247483854&idx=1&sn=44ff19bb0224302eededdc100ccd2eb4&chksm=c2786a5af50fe34c0d89bf2a5278b8b14537ee6a85bde577afd34d54bcf3fbe55c4f0f2369bb&token=2144016648&lang=zh_CN#rd



如何开展先单后多线性回归?的评论 (共 条)

分享到微博请遵守国家法律