临床预后研究如何分析？有3种统计分析范式，您可了解？

2023-03-07 16:53 作者:郑老师妙趣横生统计学 0人读过 | 我要投稿

2023年以来浙中医大学郑老师开设了一系列医学科研统计课程，零基础入门医学统计包括R语言、meta分析、临床预测模型、真实世界临床研究、临床试验数据分析、重复测量资料分析等9门课程，如果您有需求，不妨点击下方跳转查看：

2023年9门科研统计课程预售：多次直播，课题报销可先开发票

很多人一碰到人群的数据，就是做个回归，探讨影响因素，把所有变量放到回归分析，多因素回归分析，出来个结果就完事了。
这显然是一种稀里糊涂的考虑。
实际上，除了随即对照研究之外，临床预后研究根据不同的目的，有3种统计学分析的角度，它们在回归分析的策略上有有所区别，今天我来说两句。
主要是两点区别，筛选自变量的区别、模型评价的区别。

第1种，是近年来比较热门的临床预后预测模型。
预测模型的研究，该研究目的是预测患者预后疾病发展，所以是注重于模型整体效果的方法。
它不关注我们挑选的自变量与预后结局指标有没有因果关系，往往要从经济性、可及性、预测效果去挑选自变量。评价自变量的方法不是每个自变量是否具有统计学意义，而是评价该指标的存在是否能够提高模型的性能；而模型的性能往往用R平方、-2倍对数似然值、AIC、BIC、AUC面积等指标来评价。
所以，预测模型回归分析，往往是数据驱动的结果。我们分析的时候，往往可以先单后多挑选自变量、lasso法筛选自变量、逐步回归法筛选自变量。
临床预测模型是用较少的自变量达到不差的预测效果。因此有上述做法，最后留在模型的都应该有它的预测价值。

第2种，是大家熟悉的多影响因素研究。
影响因素研究，目前被广泛的误用，把它等同于预测模型的研究，也用R平方、-2倍对数似然值、AIC、BIC、AUC面积评价，用逐步回归法来筛选自变量。
其实，不是这样的。影响因素研究，不讲究模型建的R平方到底有多大，没有统计学意义的自变量也照样可以留在模型中。
所以没有必要用逐步回归法。
但是影响因素研究，也需要控制自变量数，因为回归模型不允许自变量太多，从建模失败，所以可以采用先单因素再多因素的回归建模策略。
而自变量筛选上与预测模型很大的区别的是，影响因素分析科学的做法，不是数据驱动型，而是理论驱动型，要主动挑选理论上与预后指标有因果关系的指标放入模型。

详情请点击下方：

https://mp.weixin.qq.com/s?__biz=MzAwOTYyMDY3OQ==&mid=2650404313&idx=2&sn=0808b8b673d8663c806bafdec20af8e7&chksm=83518871b426016778f4094a685d83257d82075110000ae7372880bc7a9648948a858e885046&token=1661148070&lang=zh_CN#rd