相关系数meta分析详细教程,错过就找不到了
有不少小伙伴反馈了一些新问题,例如Spearman相关系数(rs)怎么转换为Pearson相关系数(r)、怎么做Fisher’ s Z转换;能不能直接用r (95%CI)进行meta分析。
下面的内容将为大家逐一解答,这可以说是迄今为止,最全面的相关系数meta分析教程。
1、相关系数rs与r的相互转换
很多时候,关于A与B的相关关系,不同文献采取了2种统计方法:Pearson相关分析、Spearman相关分析。但r和rs,只能选择其中一个进行meta分析,如此,数据提取时就面临这样的难题,两种相关系数rs和r,该如何转换。
其实,早在1996年,这个问题已经有了答案,Melvin T. Rupinski和William P. Dunlap在他们发表的文献 “Approximating Pearson Product-Moment Correlations from Kendall's Tau and Spearman's Rho”里介绍,经统计学推导,相关系数rs和r的相关转换公式如下:

我们以一篇文献为例,看下具体的操作。

这是一篇关于Apparent Diffusion Coefficient(ADC,表观扩散系数)与Tumor Cellularity(肿瘤细胞构成)相关性的meta分析,在方法学里写道:将Pearson相关系数转换为Spearman相关系数。

我们找到了其中一篇研究结局为Pearson相关系数的纳入文献,如下图所示和表格所示,两个指标表现为负相关,线性回归结果有r2=0.45。

经计算,r = -0.6708。但这是Pearson相关系数,需要转换为Spearman相关系数。我们根据上面的公式做了个Excel小工具,将-0.6708输入“rs”的单元格,得到r = -0.65。与原文的结果一致。

2、相关系数的fisher转换
简单回顾一下相关系数r与Fisher’s Z的转换
1) 相关系数r转换为Fisher’s Z:Z = 0.5 * ln((1+r)/(1-r));
2) 计算Z的方差:Vz = 1/(n-3);
3) 计算Z的标准误:Sez = Vz^0.5;
4) 重新转换为相关系数:r = (e^2z-1)/(e^2z+1)。

网上的资料,大多以Pearson相关系数为例,介绍相关系数meta分析要先做Fisher’s Z转换,但很少介绍Spearman相关系数是怎么转换的。我们从百度百科上找到这样的描述。

除此以外,暂时没发现有用的信息。根据Fisher’ s Z转换的相关介绍,我们猜想Spearman相关系数(rs)也适用r与Z的转换公式,可直接套用。上文介绍的文献, ADC与Tumor Cellularity的相关系数meta分析,正是采用了这个方法(操作见案例2)。
3、实操演示
关于相关系数meta分析的森林图,有两种做法:先做Fisher’ Z的森林图,然后将合并结果转换为r (95%CI);先得到Fisher’ Z及95%CI,然后转换回r (95%CI),继续做森林图。我们通过两个案例,分别给大家介绍具体的操作步骤。
案例1:相关系数meta分析的经典中文教程
《基于Pearson相关系数的老年人社会支持与心理健康相关性研究的Meta分析》,这篇文献可以说是相关系数meta分析学习中必读的中文教程,给我们详细介绍了核心的操作:先进行fisher转换,再对Z值进行合并,最后转换为r (95%CI)。
我们以文献的图2为例,还原这个森林图。由下图可知,这是通过RevMan软件绘制的森林图,由于RevMan没有实现Fisher’ Z转换的工具,我们也准备了一个Excel小工具。

提取上方森林图的4篇文献的相关系数r和样本量,进行Fisher’ s Z转换,转换结果与森林图一致。

将Fisher’ Z和se录入RevMan 5.3软件,调整对应的作图参数,具体操作此处省略,提示几个重点:
1) 综述类型,选择Intervention review;
2) 数据类型,选择Generic Inverse Variance;
3) Effect Measure,选择Name of Effect Measure,然后输入Fisher’ s Z。

我们得到与文献一致的森林图,当然,范文的森林图有一个小问题,图形下方的标签弄错了,标记为“负相关、正相关”比“相关、不相关”更合理。最后,需要将Fisher’ s Z和95%CI转换为r (95%CI)。同样借助Excel小工具,将-0.20 (-0.25, -0.16)输入,得到r (95%CI) = -0.20 (-0.24, -0.16)。

遗憾的是,这时候我们又发现了教程的另一处瑕疵,下方这个汇总表竟然是错误的。表格里显示是r (95%CI),其实是Fisher’ Z和95%CI。但是,这不影响教程对我们的启发和引导作用。指出文献的不足只是提醒大家,辩证地阅读文献,不要盲目相信文献一定是准确无误的,多学习、多思考、多明辨。

案例2:Spearman相关系数的meta分析
这个案例既是rs的meta分析,也给我们带来了一种新的分析思路:先进行fisher转换,再转换为r (95%CI),最后合并。
还是这篇文献:The Correlation between Apparent Diffusion Coefficient and Tumor Cellularity in Patients: A Meta-Analysis,前文已经介绍过,这是Spearman相关系数的meta分析。由于纳入文献比较多,我们选择其中一个亚组的森林图进行操作演示。

上面的森林图,效应值标签为ES,我们没法直接判断是fisher’ s Z还是rs,因此需要验证。同样的,将文献的rs和n输入excel小工具,得到转换后的fisher’ s Z以及rs的95%CI。

这个小工具使用的依然是相关系数的Fisher’ s转换公式,只是我们直接将rs当做是r进行换算。经对比,我们得知ES肯定不是fisher’ s Z。但是,转换后rs 的95%CI也与范文略有差异,这可能与输入的rs的小数点位数不同导致的。
然而,最后2篇文献的数据差异就有点奇怪,该meta分析的数据提取表格中,Yamashita 2009、Guo A 2002的相关系数分别为-0.69和-0.46,不知为何森林图却是-0.67和-0.44。
将数据录入Stata,然后运行以下命令,得到森林图。
metan r rlci ruci, label(namevar=study) fixed texts(150)

我们得到的合并结果与范文的结果并不一致,甚至说差异较大。除了录入数值的差异外,更重要的是权重的差异,Ellingson 2010这个研究,置信区间的范围比较窄,根据meta分析的相关公式推导,95%CI越窄,效应值的标准误越小,则方差越小、权重越大。我们做出的森林图符合上述规律。可是,范文的森林图却不太符合,这是什么原因?我们在最后为大家揭晓。
接下来做个验证,我们得到合并结果是rs (95%CI) = -0.71 (-0.78, -0.64),这跟第一种方法得到的结果有差异吗?
Fisher’ s Z的合并结果为:-0.77 (-0.90, -0.64)。通过Stata将Z转换为rs,结果为:rs 95% (CI) = -0.65 (-0.72, -0.56)。


为了便于对比,我们梳理一下重点:
1) 范文做的是Spearman相关系数的meta分析,直接用rs和(95%CI)做森林图,合并结果是-0.63 (-0.71, -0.55);
2) 实操练习,同样直接用rs和(95%CI)做森林图,合并结果是-0.71 (-0.78, -0.64);
3) 先利用Fisher’ s Z做森林图,得到的合并结果再转换回rs和(95%CI),合并结果是-0.65 (-0.72, -0.56)。
这是一个有趣的现象,两种方法的合并结果不一致,但第二个操作的结果反而与范文的结果比较接近,这是为什么?
以下高能,请注意!
因为范文在做rs (95%CI)的森林图时,使用了Fisher’ Z的森林图的权重!
按照这个方法,我们在操作一次直接用rs和(95%CI)做森林图,合并结果是-0.63 (-0.71, -0.55),跟范文的结果一致!!!另外,这也与-0.65 (-0.72, -0.56)非常接近。

相关系数meta分析的教程就介绍到这里了,重点你都掌握了吗?

