临床预后研究如何分析?有3种统计分析范式,您可了解?
2023年以来浙中医大学郑老师开设了一系列医学科研统计课程,零基础入门医学统计包括R语言、meta分析、临床预测模型、真实世界临床研究、临床试验数据分析、重复测量资料分析等9门课程,如果您有需求,不妨点击下方跳转查看:
2023年9门科研统计课程预售:多次直播,课题报销可先开发票

很多人一碰到人群的数据,就是做个回归,探讨影响因素,把所有变量放到回归分析,多因素回归分析,出来个结果就完事了。
这显然是一种稀里糊涂的考虑。
实际上,除了随即对照研究之外,临床预后研究根据不同的目的,有3种统计学分析的角度,它们在回归分析的策略上有有所区别,今天我来说两句。
主要是两点区别,筛选自变量的区别、模型评价的区别。
第1种,是近年来比较热门的临床预后预测模型。
预测模型的研究,该研究目的是预测患者预后疾病发展,所以是注重于模型整体效果的方法。
它不关注我们挑选的自变量与预后结局指标有没有因果关系,往往要从经济性、可及性、预测效果去挑选自变量。评价自变量的方法不是每个自变量是否具有统计学意义,而是评价该指标的存在是否能够提高模型的性能;而模型的性能往往用R平方、-2倍对数似然值、AIC、BIC、AUC面积等指标来评价。
所以,预测模型回归分析,往往是数据驱动的结果。我们分析的时候,往往可以先单后多挑选自变量、lasso法筛选自变量、逐步回归法筛选自变量。
临床预测模型是用较少的自变量达到不差的预测效果。因此有上述做法,最后留在模型的都应该有它的预测价值。
第2种,是大家熟悉的多影响因素研究。
影响因素研究,目前被广泛的误用,把它等同于预测模型的研究,也用R平方、-2倍对数似然值、AIC、BIC、AUC面积评价,用逐步回归法来筛选自变量。
其实,不是这样的。影响因素研究,不讲究模型建的R平方到底有多大,没有统计学意义的自变量也照样可以留在模型中。
所以没有必要用逐步回归法。
但是影响因素研究,也需要控制自变量数,因为回归模型不允许自变量太多,从建模失败,所以可以采用先单因素再多因素的回归建模策略。
而自变量筛选上与预测模型很大的区别的是,影响因素分析科学的做法,不是数据驱动型,而是理论驱动型,要主动挑选理论上与预后指标有因果关系的指标放入模型。
详情请点击下方:
https://mp.weixin.qq.com/s?__biz=MzAwOTYyMDY3OQ==&mid=2650404313&idx=2&sn=0808b8b673d8663c806bafdec20af8e7&chksm=83518871b426016778f4094a685d83257d82075110000ae7372880bc7a9648948a858e885046&token=1661148070&lang=zh_CN#rd

