JAMA杂志:工具变量,开展高质量真实世界研究的方法
2023年以来浙中医大学郑老师开设了一系列医学科研统计课程,零基础入门医学统计包括R语言、meta分析、临床预测模型、真实世界临床研究、问卷与量表分析、医学统计与SPSS、临床试验数据分析、重复测量资料分析、结构方程模型、孟德尔随机化等10门课,如果您有需求,不妨点击下方跳转查看:
2023年郑老师多门科研统计课程:多次直播,含孟德尔随机化方法

在临床研究中,无论是拥有严格质量控制的RCT,还是带有大数据背景的真实世界研究,都离不开对其他协变量的控制。临床研究者一直在努力控制除研究因素以外的其他因素的影响,只有去除了其他因素的影响,才能够探索到研究因素的纯净效应。如下图,只有控制了混杂或协变量,我们才能很好地探索暴露与结局的关系。
假设我们的研究目标比较单一,只是想看暴露于结局的关系,那么剩下的所有需要控制的部分都可以叫做混杂因素。混杂可分为已知混杂和未知混杂,已知混杂就是研究者知道的且在本次研究中测量的混杂变量,未知混杂就是研究者不知道的,或者本次研究中未测量的混杂变量。常用的混杂控制方法有分层分析、个体/群体匹配、多因素回归分析、倾向性评分法、敏感性分析、边缘结构模型、多水平模型等。
如果是已知混杂,那么上述大部分方法都可以使用;那么如果是未知混杂,则上述大部分方法都不用,因为研究者也不知道哪些因素会是混杂因素,更没有对其进行测量。工具变量(Instrumental Variable, IV)法可以较好地解决未知混杂的效应。
2018年8月7日,《JAMA》(IF=157.335)发表题为:Association of Broad-Based Genomic Sequencing With Survival Among Patients With Advanced Non–Small Cell Lung Cancer in the Community Oncology Setting的研究论文。
这项研究利用FlatironHealth数据库的数据,比较了接受广泛基因组测序的晚期NSCLC患者与仅接受EGFR突变和/或ALK重排常规检测的对照组患者的临床结局。结果表明,在肿瘤专科诊所接受治疗的晚期非小细胞肺癌患者中,广泛的基因组测序直接为少数患者的治疗提供了信息,并且与更好的生存率无关。
这篇文章就利用了工具变量和倾向得分方法开展了一系列的评价!

摘要与主要结果
一、摘要
重要性
广泛基因组测序正更频繁地用于晚期非小细胞肺癌(NSCLC)患者。然而,关于广泛的基因组测序与晚期NSCLC患者的治疗选择或生存之间的关联知之甚少。
目的
比较接受广泛基因组测序的晚期NSCLC患者与仅接受EGFR突变和/或ALK常规检测的对照组患者的临床结局。
方法
对2011年1月1日至2016年7月31日期间图表确认的晚期非小细胞肺癌患者的回顾性队列研究,这些患者使用Flatiron健康数据库在美国191个肿瘤学专科诊所中的1个接受了护理。患者被诊断为IIIB/IV期或不能切除的非鳞状非小细胞肺癌,并接受了至少1行抗肿瘤治疗。暴露为接受广泛基因组测序或常规检测(EGFR和/或ALKONLY)。广泛基因组测序包括在三线治疗前检查30多个基因的任何多基因小组测序试验。主要结果是从一线治疗开始的12个月死亡率和总生存率。次要结果包括遗传改变的频率和接受的治疗。
结果
在5688例晚期非小细胞肺癌患者中(中位年龄67岁[四分位数范围41-85],63.6%为白人,80%有吸烟史);875人(15.4%)接受了广泛基因组测序,4813人(84.6%)接受了常规检测。在接受广泛基因组测序的患者中,4.5%的患者接受了基于检测结果的靶向治疗,9.8%的患者接受了常规EGFR/ALKT靶向治疗,85.1%的患者未接受靶向治疗。进行广泛基因组测序的患者12个月的未调整死亡率为49.2%,常规检测的患者为35.9%。使用工具变量分析,广泛基因组测序与12个月死亡率之间没有显著关联(12个月时的预测死亡概率,广泛基因组测序为41.1%,常规测序为44.4%;差异为-3.6%[95%CI,-18.4%至11.1%];P=.63)。在倾向评分匹配生存分析中,结果一致(42.0%对45.1%;危险比0.92[95%CI,0.73至1.11];P=0.40)。
结论
在社区肿瘤学环境中接受治疗的晚期非小细胞肺癌患者中,广泛的基因组测序直接为少数患者的治疗提供了信息,并且与更好的生存率无关。
二、研究结果
1. 基线特征
在研究样本中,5688名晚期非小细胞肺癌患者接受了广泛基因组测序或常规检测;875人(15.4%)接受了广泛基因组测序(表1)。中位年龄为67岁(四分位数范围,41-85),大多数为白人(63.6%vs7.5%vs13.4%未知种族),有吸烟史(79.9%)。

2.生存
49.2%的常规患者在12个月时死亡,而接受广泛基因组测序的患者为30.5%(P<.001)。但使用工具变量分析后,广泛基因组测序和12个月死亡率之间没有统计学的联系(两组之间12个月死亡的预测概率差异:-3.6%[95%CI,-18.4%至11.1%];P=.63;表2)。
全样本中使用Kaplan-Meier生存分析,2个队列在未调整的生存曲线中存在统计学差异(HR,0.69 [95% CI,0.62-0.77]; LogRank P < .001)。基于倾向的匹配产生了519对匹配的配对,具有良好的匹配特征和平衡,患者特征的标准化差异为≤0.10。大多数样本(81.2%)都有完整的数据。两组的免疫治疗使用率均为21.2%。在倾向评分匹配的样本中,使用LogRank检验评估的广基基因组测序队列与常规测试队列的总生存期相比没有统计学差异(P = .50)和Cox比例风险模型(HR,0.92 [95% CI,0.73-1.11]; P = .40)。



设计与统计学方法
一、研究设计
P:FlatironHealth数据库2011年1月1日至2016年7月31日期间确诊为晚期非小细胞肺癌的患者,或确诊为早期非小细胞肺癌并随后复发或进展的患者
E/C:接受广泛基因组测序或常规检测(EGFR和/或ALKONLY)
O:主要结局是一线治疗开始的12个月死亡率和总生存期。次要结局包括遗传改变的频率和接受的治疗的比例。
S:回顾性队列研究
二、统计方法
1. 使用χ2检验比较了广泛基因组测序组和常规测试组之间接受的队列特征和治疗类型的分布。
详情请点击下方:
https://mp.weixin.qq.com/s?__biz=MzAwOTYyMDY3OQ==&mid=2650404504&idx=1&sn=43317474b4b992df7390c0369a4e3fdb&chksm=83518b30b426022697f369eb3fe626bc97fe906637461e37008f7efd038410dad2a1cda93bd6&token=2130416981&lang=zh_CN#rd


2023年统计服务