一种新的肝细胞癌焦亡相关预后模型
A Novel Pyroptosis-related Prognostic Model for Hepatocellular Carcinoma

摘要:
肝细胞癌(HCC)由于其显着的异质性和复杂的分子发病机制而成为第二致命的恶性肿瘤。迫切需要新的预后生物标志物,因为目前对于 HCC 患者不存在有效且可靠的预后生物标志物。越来越多的证据表明,细胞焦亡在恶性肿瘤的发生和发展中发挥作用。然而,焦亡相关基因(PRGs)与HCC患者预后之间的关系仍不清楚。在这项研究中,从以前的研究和 GeneCards 中获得了 57 个 PRG。HCC患者的基因表达谱和临床数据来自公共数据门户。使用 TCGA 数据进行最小绝对收缩和选择算子 (LASSO) Cox 回归分析以建立风险模型。此外,该风险模型在独立的 ICGC 数据集中得到进一步验证。我们的结果表明,在 TCGA 队列中,39 个 PRG 在肿瘤和正常肝组织之间存在显着差异表达。功能分析证实这些 PRG 富含细胞焦亡相关途径。根据单变量 Cox 回归分析,14 个差异表达的 PRG 与 TCGA 队列中 HCC 患者的预后相关。构建了一个整合两个 PRG 的风险模型,将患者分为不同的风险组。在 TCGA 的高危组中观察到总生存率较差(功能分析证实这些 PRG 富含细胞焦亡相关途径。根据单变量 Cox 回归分析,14 个差异表达的 PRG 与 TCGA 队列中 HCC 患者的预后相关。构建了一个整合两个 PRG 的风险模型,将患者分为不同的风险组。在 TCGA 的高危组中观察到总生存率较差(功能分析证实这些 PRG 富含细胞焦亡相关途径。根据单变量 Cox 回归分析,14 个差异表达的 PRG 与 TCGA 队列中 HCC 患者的预后相关。构建了一个整合两个 PRG 的风险模型,将患者分为不同的风险组。在 TCGA 的高危组中观察到总生存率较差(p < 0.001) 和 ICGC ( p < 0.001) 患者。受试者工作特征曲线证明了模型的准确性。此外,风险评分通过多变量 Cox 回归分析被确认为独立的预后指标(TCGA 队列:HR = 3.346,p < 0.001;ICGC 队列: HR = 3.699, p < 0.001)。此外,单样本基因集富集分析揭示了高风险和低风险群体之间的不同免疫状态。总之,我们新的细胞焦亡相关风险模型在预测 HCC 患者的预后方面具有潜在的应用价值。
关键词:肝细胞癌,细胞焦亡,预后模型,风险评分,肿瘤免疫
结果
TCGA 队列中差异表达的 PRG 及其功能分析
我们从先前的研究中获得了 57 个 PRG,并分析了这些基因在 TCGA 的 371 名 HCC 患者中的表达水平(Xia 等人,2019 年)。根据FDR<0.05的筛选标准,39个PRGs在肿瘤和正常肝组织之间存在显着差异表达。如箱线图所示,IL1B、MST1、GBP1和NLRP3在肿瘤组织中下调,其他 35 个 PRG 在肿瘤组织中上调。图 1A)。此外,还进行了 GO 和 KEGG 分析以研究这些差异表达的 PRG 的生物学功能。GO功能分析结果表明,凋亡过程中细胞因子产生、炎性体复合物和内肽酶活性的正调控分别是生物学过程、细胞成分和分子功能类别中最丰富的GO术语。图 1B)。在KEGG通路分析中,PRGs主要富集于细胞焦亡相关通路,如NOD样受体信号通路( Fritz et al., 2006 )。此外,PRGs被鉴定参与C型凝集素受体信号通路以及与细菌和病毒感染相关的通路,包括乙型肝炎和丙型肝炎感染。图 1C)。

差异表达的 PRG 和功能富集分析。(A) HCC 和相邻正常样本中 39 个差异表达的 PRG 的表达状态。红色和绿色分别代表肿瘤 (T) 和邻近的正常组织 (N)。(B) 39 个差异表达的 PRG 的 GO 功能分析(BP:生物过程,CC:细胞成分,MF:分子功能)。(C) 39 个差异表达的 PRG 的 KEGG 通路分析。
TCGA 队列中预测特征的构建
在排除没有生存信息的病例和随访时间为 0 天的病例后,进行单变量 Cox 回归分析以评估 TCGA 队列中 365 名 HCC 患者的 PRG 表达与 OS 之间的相关性。结果表明,18 个 PRG 与 HCC 患者的预后显着相关(p < 0.05)(补充图 S1)。我们分析了参与我们研究的患者的临床病理学特征表格1. 我们选择了 14 个差异表达且与 HCC 患者的 OS 显着相关的 PRG(图 2A-C)。这些基因之间的相关网络被建立并呈现在图 2D. 然后,进行 LASSO Cox 回归分析,以确定具有最佳预测性能的标志物并计算回归系数。因此,确定了GSDME和PLK1以建立风险模型。每位患者的风险评分计算如下:风险评分 = 0.1475 × GSDME 的表达水平+ 0.2859 × PLK1的表达水平。根据中位风险评分,将 HCC 患者分为高危组和低危组(图 3A)。随着风险评分的增加,死亡发生率增加(图 3B)。PCA 和 t-SNE 结果表明,具有不同风险状态的患者聚集在两个区域(图 3C、D)。此外,Kaplan-Meier 生存曲线显示,风险评分高的患者的 OS 比风险评分低的患者差(p < 0.001)(图 3E)。生成时间依赖性 ROC 曲线以评估模型预测 TCGA 队列中 HCC 患者预后的准确性,1 年、2 年和 2 年的曲线下面积(AUC)分别为 0.727、0.693 和 0.674。 3年,分别(图 3F)。



在 ICGC 队列中进一步验证模型
为了进一步评估 TCGA 队列中建立的双基因特征的稳健性,ICGC 队列中 HCC 患者的风险评分也根据相同的公式计算。然后,根据中位风险评分将ICGC病例分为高危组和低危组(图 4A)。同样,死亡人数随着风险评分的增加而增加(图 4B)。PCA和t-SNE分析证实了风险评分的分类能力(图 4C、D)。一致地,Kaplan-Meier 图显示高风险评分也与 ICGC 队列中较差的 OS 显着相关(p < 0.001)(图 4E)。从 ROC 曲线分析获得的 1 年 0.716、2 年 0.711 和 3 年 0.726 的 AUC 表明,该模型准确地预测了 ICGC 数据库中 HCC 患者的预后。图 4F)。

模型的独立预测能力
为了评估特征作为独立预后指标的能力,在单变量和多变量 Cox 回归分析中包括了多个变量。结果,单变量 Cox 回归分析显示,在 TCGA 和 ICGC 队列中,较高的风险评分预测 HCC 患者的 OS(HR = 4.197, 95% CI:2.498–7.050, p < 0.001; HR = 4.806, 95% CI : 4.354–9.811, p < 0.001, 分别) (图 5A、B)。在多变量分析中,风险评分被进一步证明是 TCGA 和 ICGC 患者的独立预测因子(HR = 3.346, 95% CI: 1.968–5.689, p < 0.001; HR = 3.699, 95% CI: 1.823–7.504, p < 0.001,分别)(图 5C、D)。

基于 TCGA 和 ICGC Cohorts 模型的功能分析
进行GO和KEGG分析以分析与风险模型相关的生物学功能。分析中包括高风险组和低风险组之间的差异表达基因。前 5 个 GO 术语和 KEGG 结果显示在表 2. 这些基因富含与细胞周期相关的几种功能,例如有丝分裂核分裂、核分裂和染色体分离。肿瘤免疫是影响癌症进展的重要因素。因此,我们还研究了风险模型与肿瘤免疫之间的相关性。用 ssGSEA 量化免疫细胞和免疫相关通路的水平。在 TCGA 队列中,aDC、iDC、巨噬细胞、Tfh 细胞、Tregs 和 MHC I 类的得分显着更高,而 B 细胞、肥大细胞、NK 细胞、I 型 IFN 反应和 II 型 IFN 反应显着降低高危组比低危组(图 6A、B)。在 ICGC 队列中,aDC、DC、巨噬细胞、Th2 细胞、Treg、APC 共抑制和 HLA 的得分显着更高,而 B 细胞、NK 细胞、I 型 IFN 反应和 II 型 IFN 反应显着降低高危组比低危组(图 6C、D)。

