不要把预测建模写成危险因素筛选
2023年以来浙中医大学郑老师开设了一系列医学科研统计课程,零基础入门医学统计包括R语言、meta分析、临床预测模型、真实世界临床研究、临床试验数据分析、重复测量资料分析等9门课程,如果您有需求,不妨点击下方跳转查看:
2023年9门科研统计课程预售:多次直播,课题报销可先开发票

在我个人审稿过程中,关于预测建模类的文章我觉得比较常见的一个问题就是:用危险因素筛选的思路来写预测建模过程。事实上,危险因素筛选和预测建模尽管有关系,但并不是一回事。不少临床医师很容易搞混,写文章的时候不知不觉就写成了四不像,导致被拒稿的几率大增。所以今天特地说一下这个问题。
举个例子,有个研究要构建某生化指标c对某疾病的预测模型。该文章题目很清楚,就是看c这个指标对某病的预测性能(当然,当我看到文章正文的时候我严重怀疑作者并不清楚自己究竟要做什么)。
在文章的材料方法中,作者介绍了下面内容:
病例选自于某一时期内该医院就诊患者,进行CT造影检查,根据检查结果确定结局。这一点说明结局的确定还是比较客观的。
关于预测变量,主要包括年龄、性别、多个生化指标。
统计方法主要采用logistic回归,采用逐步筛选方法,构建模型。
其实当我看到采用逐步筛选的时候,就已经觉得有点不对。既然作者想分析的是c这个指标,却又用逐步筛选。我不禁替作者有点担心,万一逐步筛选时候把c这个指标筛出去了怎么办?(当然,我相信肯定不会,也许很可能是作者倒推来写的,先发现了c有意义,然后再说用筛选,这时候c没有被晒出去)。
最后的分析结果显示,经logistic回归逐步筛选,结果发现性别和5个生化指标对结局有影响,包括生化指标c。作者列表展示了各影响因素的分析结果,其中生化指标c的OR值要大于其它因素。提示生化指标C对结局具有较大影响和较好的预测价值。
最终作者给出结论:生化指标c对结局具有较好的预测效果。
看到这里,不知道读者有没有一种熟悉的感觉,我反正是看到不少类似文章,这些文章尽管指标各不相同,疾病各不相同,但思路都差不多。或者说,出现的毛病都差不多:从题目来看,作者的思路是要构建一个预测模型,但从文章正文来看,作者通过危险因素筛选,然后比较OR值大小,说明指标的预测效果。
详情请点击下方:
https://mp.weixin.qq.com/s?__biz=MzAwOTYyMDY3OQ==&mid=2650404408&idx=2&sn=c40aaa0e8c52da6c533a405d4d90e670&chksm=83518b90b4260286d7f11c409d395a170c2fb1768ee9f5c56d085cfaa0c20e2429bddb28cd68&token=9721572&lang=zh_CN#rd


更多孟德尔随机化方法,欢迎参加郑老师团队3.25-26举办的“利用孟德尔随机化方法快速撰写SCI论文”科研培训课,详细请点击下方链接了解:
2023年科研实战课程通知
2022年以来,我们召集了一批富有经验的高校专业队伍,着手举行短期统计课程培训班,包括R语言、meta分析、临床预测模型、真实世界临床研究、问卷与量表分析、医学统计与SPSS、临床试验数据分析、重复测量资料分析、结构方程模型等9门课。如果您有需求,不妨点击查看:
2023年郑老师多门科研统计课程:多次直播,含孟德尔随机化方法
2023年统计服务