欢迎光临散文网 会员登陆 & 注册

建立 lncRNA 模型有助于 II 期结肠癌患者的预后和预测,提供临床指导

2023-04-06 16:57 作者:275276  | 我要投稿

Prognostic and predictive value of a lncRNA signature in patients with stage II colon cancer

摘要

目前的分期方法无法准确识别 II 期结肠癌(CC)的高危复发患者。为了改善 II 期 CC 的预后预测,我们使用系统和全面的生物标志物发现和验证方法,构建了基于 lncRNA 特征的模型。我们分析了来自 TCGA 数据集的 16 对 II 期 CC 肿瘤组织和邻近正常粘膜组织,鉴定出了 1,377 个表达差异显著的 lncRNA。通过单变量和阶跃多变量 Cox 回归模型,在训练队列中筛选出了 11 个 lncRNA 特征(n = 141),可将患者分为高风险和低风险组(3 年 AUC = 0.801,95% CI:0.724-0.877;5 年 AUC = 0.801,95% CI:0.718-0.885)。与低风险组相比,高风险组患者的无复发生存期(RFS)更短(时序检验,训练队列中 P < 0.001)。验证队列结果进一步证实了基于 lncRNA 的特征的预测能力(P < 0.001)。多变量 Cox 回归和分层生存分析表明,该特征的预后价值独立于其他临床病理学风险因素(如CEA、T 分期和化疗)。时间依赖性接受者操作特征(ROC)分析表明,该特征比任何其他临床风险因素或单个 lncRNA 都有更高的预测准确性(所有P < 0.05)。我们构建了一张列线图,整合了基于 lncRNA 的特征和临床风险因素(如CEA 和 T 分期),在校准图中表现良好,适合于临床使用。总之,基于 lncRNA 特征的模型是一种独立的预后因素,与目前使用的临床病理学风险因素相比,在预测 II 期 CC 患者的复发时具有更强的预测能力。这种基于 lncRNA 特征的模型可能有助于个体化治疗决策和术后咨询,并最终提高患者的生存率。


结果

通过分析 TCGA 数据集识别 DElncRNA

首先,我们从 TCGA-COAD 数据库中检索了转录组分析数据,并获得了 16 个正常样本和 152 个 II 期 CC 肿瘤样本。其中,16对肿瘤组织和邻近的正常组织被用来筛选DElncRNA。结果,1,377 个 lncRNA 被鉴定为绝对倍数变化 > 2 且 FDR < 0.05 的 DElncRNA,其中 863 个在 CC 中与邻近的正常组织相比被上调,514 个被下调

从训练队列中鉴定具有预后意义的 lncRNA

为了挑出具有预后意义的 lncRNA,将 1,377 个 DElncRNA 提交给单变量 Cox 回归分析,以检查它们在训练队列中被 RFS 暗杀的情况。在这些 DElncRNA 中,23 个具有最高统计显着性( P值≤0.01)的候选 lncRNA通过逐步方法进入多变量 Cox 比例风险模型。因此,我们训练了一个由 11 个 lncRNA 组成的 RFS 相关特征 在这些lncRNA中,系数为正的AC090502.1、AL356652.1、AC011352.3、AC100791.2、AC123768.1、AP000911.1、FOXD3-AS1、AC022784.3和LINC02119被确定为风险因子AC093895.1 和AP002358.1是保护因素。

II 期结肠癌患者预后分析的森林图总结。训练集中 11 个 lncRNA 的单变量和多变量 Cox 回归。横线上的方块代表风险比 (HR),横线代表 95% 置信区间 (95% CI)。



lncRNA预后风险模型的构建及其在训练队列中的可预测性评估

我们使用多变量Cox回归模型的回归系数对每个lncRNA在预后lncRNA特征中的表达进行加权,并建立风险评分公式如下:风险评分=(0.2549*AC090502.1)+(0.3677 * AL356652 。 1)+(0.3862* AC011352.3)+(-0.3231* AC093895.1)+(0.4019* AC100791.2)+(0.3629 * AC123768.1)+(-0.9391* AP002358.1)+(0.2024* AP000911。 1 ) + (0.348*`FOXD3-AS1`) + (0.3906* AC022784.3) + (0.2307*LINC02119)。基于该公式,计算出训练队列中每位患者的风险评分,并将患者分为两组:高风险组(n  = 32)和低风险组(n  = 109)从 X-tile 图中获得的截止阈值。数字 3个A、B分别显示风险评分和复发状态的分布,表明高危患者的生存率普遍低于低危患者。热图显示了高风险组和低风险组之间 lncRNA 的表达模式。Kaplan-Meier 生存曲线表明,高风险组患者的 RFS 较短。与低风险组相比(时序检验,P  < 0.001)。不同时间点的时间依赖性 ROC 表明,lncRNA 特征具有预测训练队列中患者复发的良好预后能力(3 年时的 AUC = 0.801,95% CI:0.724–0.877;5 年时的 AUC = 0.801, 95% CI: 0.718–0.885)   在单变量 Cox 回归模型中,与低风险组相比,高风险组的复发风险(95% CI:4.649–16.482,P < 0.001)增加了 8.754 倍。


在训练队列中识别与患者 RFS 显着相关的 11-lncRNA 特征。( A – C ) 根据 lncRNA 特征,高风险和低风险组患者的风险评分分布、生存状态和 lncRNA 表达模式。( D ) 高、低危组患者RFS的Kaplan-Meier曲线分析。( E ) 时间相关的 ROC 曲线分析。我们使用 3 年和 5 年的 AUC 来评估预后准确性,并使用对数秩检验计算P值。


在验证队列中验证用于 RFS 预测的 lncRNA 签名

为了评估 lncRNA 特征在识别高危患者方面的稳健性,我们使用验证队列进一步检查了特征的预后性能。我们计算了验证队列中患者的风险评分,并将他们分为高风险组和低风险组。在训练队列中进行了相同的生存分析。与训练队列的结果一致,高风险患者的 RFS 较差低于验证队列中的低风险患者。时间相关的 ROC 分析 表明用于预测复发的 lncRNA 特征的 AUC 在 3 年时为 0.732(95% CI:0.618-0.847),在 5 年时为 0.733(95% CI:0.634-0.832),突出了 lncRNA 特征的有效性.


验证队列中 lncRNA 特征的 Kaplan-Meier 生存分析和时间依赖性 ROC 曲线。( A ) 高危组和低危组患者RFS的Kaplan-Meier曲线分析。( B ) 时间相关的 ROC 曲线分析。我们使用 3 年和 5 年的 AUC 来评估预后准确性,并使用对数秩检验计算P值。

lncRNA特征的预后价值

为了检查 lncRNA 特征是否可以预测复发而不考虑其他临床病理学特征,我们对由 204 名患者组成的整个队列(训练队列和验证队列的组合)进行了单变量和多变量 Cox 回归分析。结果表明,lncRNA 特征的风险评分与患者的 RFS 显着相关,即使通过其他临床参数进行调整此外,在单变量分析中,患者的年龄、T 分期和术前 CEA 水平是 II 期 CC 患者的重要预后因素(P  < 0.05)。为了更好地评估我们的 lncRNA 特征的预后潜力,引入了分层分析以确认我们的 lncRNA 特征在各个亚组中的独立性(根据年龄、T 分期和术前 CEA 水平)。数字 5个表明高危组的生存曲线在所有亚组中均低于低危组。此外,对数秩检验显示,与所有亚组中的低风险患者相比,高风险患者的 RFS 较差一些II期CC患者接受了术后辅助化疗,这可能会影响患者的预后和复发。为了消除潜在的混杂效应,我们还通过术后化疗进行了分层分析,结果表明,在化疗和非化疗亚组中,通过基于 lncRNA 的特征识别的高风险患者的 RFS 均低于低风险患者无论化疗状态如何,都证实了其可靠的预测能力。

多变量 Cox 分析表明,术前 CEA 水平和 T 分期是 II 期 CC 患者 RFS 的独立预后因素。然后,我们进行了 ROC 分析,以比较 lncRNA 特征与术前 CEA 水平和 T 分期的预测能力。数字 6个显示基于 lncRNA 的签名风险评分模型比任何其他风险因素(术前 CEA 水平和 T 分期)或单独的单个 lncRNA(所有 P < 0.05)具有更强大的预测能力,证实了我们的 lncRNA 签名的可靠预测 能力.

时间依赖性 ROC 曲线,用于比较组合队列中 11-lncRNA 特征与临床病理学风险因素和单个 lncRNA 的预后准确性。( A , B ) 比较基于 11-lncRNA 的特征、年龄、术前 CEA 水平和 T 分期的预后准确性。( C , D ) 基于 11-lncRNA 的特征和单个 lncRNA 的预后准确性的比较。P值显示 lncRNA 特征的 AUC 与其他因素的 AUC。

基于lncRNA特征构建列线图

为了为临床医生提供一种预测癌症复发概率的定量方法,我们构建了一个列线图,它整合了患者 RFS 的 lncRNA 特征和临床病理学独立危险因素。校准图显示 3 年和 5 年的偏差校正线非常接近理想的 45 度曲线,表明预测与观察之间的一致性很. 此外,通过生存 ROC 分析评估列线图的预测准确性。列线图在 3 年和 5 年时的 AUC 分别为 0.818(95% CI:0.700-0.936)和 0.920(95% CI:0.884-0.956),表明具有良好的辨别性能

预测所有 204 名 II 期结肠患者 RFS 概率的列线图。( A ) 预测 RFS 患者比例的列线图。( B ) 3 年和 5 年 RFS 概率列线图的校准图。( C ) 基于复发概率列线图的时间相关 ROC。诺模图预测的复发概率绘制在 x 轴上,观察到的复发概率绘制在 y 轴上。


建立 lncRNA 模型有助于 II 期结肠癌患者的预后和预测,提供临床指导的评论 (共 条)

分享到微博请遵守国家法律