统计学异质性的高低,从来都不是做不做亚组分析或敏感性分析的理由

经常有人会问这样的问题,meta分析没有异质性,还要不要做亚组分析、敏感性分析?
为什么会有这样的问题,难道是因为大家在学习meta分析的时候只看到了:有显著的异质性,需要用亚组分析探讨异质性来源,做敏感性分析评估合并结果的稳定性?可是,反过来不一定成立啊!
异质性高=需要做亚组分析/敏感性分析,并不代表:异质性不高=不需要做亚组分析/敏感性分析。
举个例子,很多人在入职的时候会去做体检,但不代表入职后(再次到其他公司入职前)就不做体检了。因为体检的作用很多,不仅仅是为了评估身体状况符合入职的要求。同理,亚组分析和敏感性分析也如此。

亚组分析
其主要作用有两个:探讨异质性来源、评估分组因素对结果的影响。
下面的亚组分析森林图,纳入研究间存在显著的异质性(I2=74%,P<0.0001),显然要做亚组分析,此时的重点是探讨异质性来源。按高危(High risk)、低危人群(Low risk)分组,分组后前者无显著异质性,后者的异质性依然显著,说明风险高低并不是异质性来源之一。同时,两个亚组的合并结果均有统计学意义,且RR<1,与总合并结果一致,说明钙补充剂对孕妇预防先兆子痫有保护作用,而且对低危和高危人群都有效。

然而,下面的这个meta分析,纳入研究间无显著异质性(I2=6.5%),也做了亚组分析,其目的就是评估研究类型对结果的影响。病例对照研究的合并结果有统计学意义,然而队列研究没有,说明研究类型对合并结果有显著影响。

这个结果怎么解读和下结论呢?作者做了一个很好的示范:尽管总的合并结果有统计学意义,病例对照研究的合并结果也显著,但是由于队列研究的方法学质量更高、证据等级也高于病例对照研究,因此作者更相信队列研究的结果,认为当前没有足够的证据支持咖啡的摄入会增加前列腺癌的发生风险。


敏感性分析
有的人认为敏感性分析的作用是为了找到异质性来源,其实不然,敏感性分析的出发点是探讨结果的稳定性。正因如此,Stata、R等软件做敏感性分析,默认输出的只有逐一剔除法(敏感性分析方法的一种)的合并结果,而不会给出异质性检验结果。

那么什么时候要做敏感性分析呢?在我看来,所有的meta分析都可以做敏感性分析。验证结果的稳定性十分必要,稳定性好,增加合并结果的可信度;反之,进一步探讨结果不稳健的原因,给出一个更客观、谨慎的结论。所以说,做敏感性分析与异质性的大小无关。
可是,为什么会有人通过敏感性分析查找异质性来源呢?这又是一个错误理解meta分析相关理论(纳入文献的异质性高,则不适合做meta分析)的例子:既然异质性显著,那就逐一剔除,异质性显著降低的就是异质性来源,排除后继续做meta分析。如果这个方法可行,那所有的meta分析文章,都不会出现有显著异质性的结果了。
这个方法不可取的原因在于:混淆了“异质性”与“统计学异质性”,前者包括统计学、临床、方法学异质性。统计学异质性在某程度上可反映临床、方法学异质性,但也有特殊情况(临床、方法学异质性显著,但统计学异质性不显著)。

严格来说,在制定纳入排除标准后就可以决定要不要做亚组分析,因为这个时候已经可以判断纳入研究间可能存在哪些临床、方法学的差异。因此,统计学异质性的高低,不是做不做亚组分析的理由,临床、方法学异质性才是。通过亚组分析,评估研究类型、性别、地区等因素对统计学异质性的影响,对合并结果的影响。
