一文学会P trend计算,掌握趋势性分析
2023年以来浙中医大学郑老师开设了一系列医学科研统计课程,零基础入门医学统计包括R语言、meta分析、临床预测模型、真实世界临床研究、问卷与量表分析、医学统计与SPSS、临床试验数据分析、重复测量资料分析、结构方程模型、孟德尔随机化等10门课,如果您有需求,不妨点击下方跳转查看:
2023年郑老师多门科研统计课程:多次直播,含孟德尔随机化方法

趋势性分析,是近年来热门的方法,我也挺喜欢。它给一篇论文带来的锦上添花的效果很受用。
网络上教程很多,但大多数只介绍其形而无里,还可能误导研究者开展分析。因此本文我拟借助一篇非常典型的趋势性研究论文,来帮大家从技术层面真正学习到趋势性检验方法。
一、什么是P trend?
P trend是一个P值。
该P值是统计学中趋势性检验的结果。医学中的趋势性是事物的结局指标随着原因指标水平改变而发生的线性趋势性改变,反映的是剂量反应关系或者剂量效应关系。
说通俗一些,趋势性反映的是结局变量和原因变量是否存在着线性相关性。但是,趋势性分析常用于当暴露指标或者处理因素变量为有序多分类的情况。在回归分析中,一般要求自变量是有序多分类数据。
趋势性检验,即对这种线性趋势性是否存在着作统计学假设检验,计算P值。如果P<0.05,则说明趋势性成立。
在女性卵巢癌和子宫内膜癌的案例里,运动锻炼时间变量分为<1.5h、1.6-6.0h、6.1-12.0 h、12.1-21.5 h,>21.5 h /week;与<1.5h相比,随运动时间的上升一个等级,研究对象子宫内膜癌的发病相对风险HR值分别为1.0、0.94、0.91、0.91、0.84,HR下降的趋势明显,因此P trend=0.06,提示该下降趋势具有统计学有统计学差异,说明卵巢癌的发病风险有随着运动量增加而减少的趋势。

同时对于卵巢癌来说,其HR值分别是1.0、1.21、1.10、1.22、1.10,P trend=0.44,趋势不明显。
P trend有什么意义?
P trend 主要发挥辅助性的作用,同时增加文章的内容与深度。特别是,在其它主要研究结局未取得统计学意义时,趋势性检验结果可能会带来额外的信息。
同样以子宫内膜癌与运动锻炼时间为例。以不锻炼为对照,其它各组均无统计学意义,但P trend有统计学意义,这也能弥补部分分析的遗憾。
二、什么时候需要开展趋势性检验
趋势性检验在高分SCI论文较为常见。一般来说,无论结局指标是均数、中位数、率、OR值、RR值、HR值,均可以开展趋势性检验
对于自变量或者原因变量而言,一般情况下,趋势性检验发生于原因指标是定量数据或者等级数据的情况下:
1. 对于等级变量,根据上述趋势性介绍内容,开展趋势性检验非常常见
2. 对于定量变量,同样需要开展趋势性检验,但是,一般都需要现将定量数据转为等级数据,再进行趋势性检验
三、文献解读
这篇论文是欧洲流行病学发表的文章,探讨的是可可类饮食(包括巧克力)能否预防高血压!具体文章下载请见文末。

首先介绍下这篇文章。该文章目的是基于法国的一个前瞻性队列研究,评估从各种食物来源摄入的可可类食物是否与突发性高血压有关。研究调查了45,653名女性,根据208项饮食问卷和24小时回忆法可可类食物摄入量,并使用详细的食物成分表估可可摄入量。研究分析了可可摄入量与高血压发病的关系。
研究可可摄入量与高血压发病的关系采用生存分析,依靠Cox回归来分析可可摄入量能否延缓高血压发病。
在Cox回归中,可可摄入量是定量自变量,关于定量自变量的分析,我在上一文已经介绍(当回归分析模型遇到连续型自变量,我该怎么办?),若怀疑自变量与应变量线性关系不明确,可以考虑采用设置哑变量的方法。就是这样操作的。
Cox proportional hazard models with age as the timeline and cocoa intake as the exposure variable, considering the lowest consumer group as the reference, were used to assess the risk of incident hypertension .
可可摄入量按照四分位数法,分为四分类数据:

研究基于Cox回归,以Q1为对照,进行了3次回归分析(分别建立纳入不同混杂因素建立了M1、M2、M3三个模型),结果发现,整个队列中的可可消耗中位数在基线时为2.3克/天。可可粉消费量Q3、Q4组,与Q1组相比,可以预防高血压发生(危险比HR Q3 0.93 [0.88:0.98],HR Q4 0.98[0.93:1.03]。此外,作者进行了趋势性检验,结果显示,所有Cox回归模型,均存在着趋势性,也就是说,整体而言,可可消耗量越大,高血压风险越低。

因此,作者对于自变量是定量数据的可可粉,采用了哑变量设置与趋势性检验相结合的方法,应该说,这是一种常见的统计分析方法。
那么如何实现趋势性检验呢?有一些需要注意的事情。在这里,我通过系统的讲解,帮助大家来学习和掌握。
四、如何利用回归进行趋势性分析
对于观察性研究,一般可利用线性、logistic、Cox回归来进行趋势性检验,而且一般和哑变量设置分析结合一起。具体过程如下:
第一步,将定量自变量转为分类变量。在本例,可可摄入根据P25、P50、P75界值转为四分类数据Q1-Q4(产生新变量coco1,数据库赋值1、2、3、4),是为等级自变量。
第二步,分类变量分析,可以设置哑变量分析。因此,可以将Q1组作为对照组,开展哑变量分析(对新变量coco1进行操作)。关于哑变量设置的方法,我在之前文章已经详细介绍了(回归分析时何时设置哑变量?如何设置?手把手教会SPSS分析)
第三步,趋势性检验关键一步。很多人开展所谓趋势性检验,就是把等级变量不设哑变量直接纳入回归统计分析,得到的P值被认为就是趋势性检验的结果。不是的!!!趋势性检验不是直接对等级变量进行分析,而是要进一步指定每一个等级的组中值!一般情况下,组中值推荐中位数。比如可可摄入量四组数据组中值分别是0.12、1.26、3.57、9.47,所以产生新的变量Coco2。

所以我们可以在原文的数据结果中发现这么一列(红框):

所以数据库中,Coco2变量不再是1、2、3、4,而是不等距的四个数字。
第四步,建立Cox回归。Coco2不设哑变量,纳入回归直接开展统计分析。最终得到我们上文的回归分析结果。
关于可可类食物与高血压发病的关系,诸位可以下载原文进行学习,具体下载方式见文末。
详情请点击下方:
https://mp.weixin.qq.com/s?__biz=MzAwOTYyMDY3OQ==&mid=2650404618&idx=2&sn=0e0ae1a9f167368f09a00d19c6636899&chksm=83518aa2b42603b4c90588cb719ca9b2f09c36a7fe7f05e408da6041a075494c204e8b353440&token=1579182731&lang=zh_CN#rd


2023年统计服务