生信预后模型新思路,氧化应激基因,1399 个基因
文章 https://www.ncbi.nlm.nih.gov/pmc/articles/PMC7870842/
综合分析确定与胃癌进展和预后相关的氧化应激基因
据报道,氧化应激 (OS) 反应与肿瘤发生和肿瘤进展有关。然而,关于 OS 在胃癌 (GC) 中的潜在诊断价值知之甚少。该研究确定了与 GC 预后和进展相关的中枢 OS 基因,并阐明了其潜在机制。转录组数据和相应的 GC 临床信息来自癌症基因组图谱 (TCGA) 数据库。筛选肿瘤与邻近正常组织之间异常表达的OS基因,通过一系列生物信息学分析鉴定出11个预后相关基因,并用于构建预后模型。这些基因在基因表达综合 (GEO) 数据库中得到验证。此外,随后进行了加权基因共表达网络分析 (WGCNA),以确定最重要的中枢基因,用于预测 GC 进展。分析表明,在 TCGA 和 GEO 队列中,构建的良好预后模型比其他临床病理特征具有更好的诊断准确性。该模型还与 GC 患者的总生存期显着相关。同时,建立了基于风险评分的列线图,对GC显示出良好的判别能力。在 WGCNA 分析中,确定了 13 个与进展相关的中枢 OS 基因,它们也与 GC 的进展显着相关。此外,还进行了功能和基因本体 (GO) 分析以揭示富含这些基因的潜在途径。
胃癌 (GC) 是 2018 年之前癌症死亡的第三大原因,在全球发病率排名第五,并且仍然是对人类健康的严重威胁1 , 2。GC 的发生和发展是一个复杂的多步骤过程,涉及各种遗传和表观遗传风险因素3,其中幽门螺杆菌感染是最常见的4。由于缺乏特异性症状,大多数 GC 患者在确诊时已处于晚期,因此 5 年生存率显着降低5. 目前,GC 患者的最佳治疗方法是手术切除,尽管其总体 5 年生存率仅为 20-25%。此外,大约一半接受辅助治疗的 GC 患者会出现全身或局部肿瘤复发6。遗憾的是,目前胃癌的诊断和治疗不能满足早期诊断和更长生存期的需要。因此,迫切需要探索提供更高预测价值的新型生物标志物,以改善 GC 的预后。
目前,导致 GC 致癌的明确机制仍然知之甚少。然而,可以提出,氧化应激是通过过量产生活性氧物质(ROS)的驱动肿瘤发生和癌症进展的一个重要因素7 - 9。作为 OS 的一个特征,ROS 包括自由基或活性非自由基物种,包括单线态氧、过氧化氢 (H2O2) 和超氧阴离子10。此外,ROS 在 GC 11患者中显着升高。在没有清除潜力的情况下,ROS 会导致基因毒性并诱导 DNA 损伤12 , 13. 此外,累积的 DNA 损伤最终会诱导各种基因组突变并启动肿瘤发生14 , 15。作为 GC 公认的危险因素,越来越多的证据表明,由于 OS 增加,幽门螺杆菌感染与胃腺癌之间存在正相关关系16。幽门螺杆菌感染通过激活各种产生氧化剂的酶产生 ROS,包括诱导型一氧化氮合酶和烟酰胺腺嘌呤二核苷酸磷酸 (NADPH) 氧化酶17,然后激活多种途径,如 Wnt、mTOR 和 Ras,以启动 GC 18 – 20. 这些研究阐明了 OS 与 GC 的进展密切相关。然而,这些 OS 基因在 GC 预后预测中的预后价值在很大程度上尚不清楚,其潜在机制需要进一步验证。
GC的诊断方法主要依靠影像学检查、分子诊断和组织病理学检查。只有一小部分 OS 相关基因得到了深入研究,并且已知它们在 GC 进展中起关键作用。最近,大规模肿瘤基因组图谱提供了基因表达数据,这为识别潜在的分子标记提供了极好的机会21 , 22. 本研究中 OS 基因的生物信息学分析也可能有助于发现新的 GC 诊断或预后标志物,以筛选创新的治疗目标。在本文中,从癌症基因组图谱(TCGA)和基因表达综合(GEO)数据库下载GC RNA测序数据和相应的临床信息,并选择几个带有预后注释的OS基因构建风险模型。此外,使用加权基因共表达网络分析 (WGCNA) 方法检查 OS 基因的表达与 GC 进展之间的关系,该方法是一种生物信息学方法,可描述不同样本之间基因组和临床特征的相关性23,24. 还进行了基因本体论 (GO) 和京都基因和基因组百科全书 (KEGG) 通路富集分析,以探讨 GC 中 OS 基因的潜在机制。最终,确定了一组参与 GC 预后和进展的 OS 基因,其中一些基因可能在未来被开发为潜在的预后和诊断生物标志物。
结果:










作为世界范围的恶性肿瘤,据报道 GC 在消化系统中具有异质性39. 尽管近年来开发了许多新的诊断技术和手术技能,但它们并不总是足够的。因此,鉴定GC预后相关分子并确定肿瘤进展机制势在必行。在本研究中,基于 TCGA 数据库鉴定了 279 个 DEOSG,并系统地鉴定了这些基因的相关生物学通路和 PPI 网络。通路富集分析显示,DEGs 与多种类型肿瘤的进展显着相关,如黑色素瘤、神经胶质瘤以及膀胱癌、前列腺癌和胰腺癌。此外,这些 DEOSG 在多种生物过程中显着富集,包括炎症反应、活性氧代谢过程和对氧化应激的反应。40 – 42。因此,这些 DEGs 与 GC 进展显着相关,并且对于这些 DEOGs 机制的综合评估至关重要。
此外,预后相关DEOSGs通过单变量Cox和LASSO回归分析,和总共11个DEOSGs筛选:SERPINE1,CTLA4,HBB,F5,AGT,KIT,GPX3,GAD1,CYP19A1,BBC3,和NOX4鉴定用GC 患者预后良好。使用 TCGA 表达数据和 HPA 数据库,这 11 个 DEOSG 在 mRNA 和蛋白质水平上的表达模式显示SERPINE1、CTLA4、F5、AGT、GAD1、CYP19A1、BBC3和NOX4过表达,而HBB、KIT和GPX3在GC 组织。这些发现与之前的研究结果基本一致,表明SERPINE1和CTLA4的表达在胃腺癌中升高,并且作为肿瘤致癌基因,SERPINE1的过表达与 GC 侵袭性和较差的总生存率显着相关43 , 44。此外,GAD1在肺腺癌中过度表达并在肿瘤进展中发挥着重要作用45;然而,它在 GC 结果中的作用尚不清楚。
为了进一步确定这些特定的 DEOSG 是否可以用作预后因素,基于这 11 个中枢基因构建了一个新的预后预测模型。据我们所知,这是第一个用于预测的 OS 相关风险模型。单变量和多变量 Cox 回归分析表明,风险模型是一个独立的预后因素,对 GC 具有稳健的预后价值。此外,生存分析和 ROC 分析也证实了其预测 GC 预后的生物学意义的主要优势。在列线图分析中也观察到了类似的场景,即风险特征在预测 GC 患者的总生存率方面发挥了虚拟作用,其检查效率远优于其他临床病理特征。这些探索,第一次,
在很大程度上,OS起癌变和癌症进展的各个阶段中的关键作用46,47。近年来,许多 GC 研究已经确定 OS 可能与由于 DNA 损伤导致的进展密切相关48。然而,在我们之前的研究中,使用与中心预后相关的 DEOSG 开发的风险模型仅与 GC 患者的 TNM 分期相关,而与肿瘤分级没有显着相关性。因此,在后续研究中,我们定义了与肿瘤进展密切相关的 DEOSG。WGCNA 是一种广泛使用的方法,用于识别感兴趣的潜在生物标志物49 , 50。在本研究中,13 个真正的枢纽基因(FCGR3A、CCR5、IL2RA、CD86、CYBB、CD4、PRKN、ITPR1、KCNMA1、AOC3、FGF2、ANK2和MAPK10)与GC进展密切相关,一系列生物信息学分析表明这些基因均与GC 等级,可能是预测肿瘤分期的潜在生物标志物。此外,考虑到肿瘤进展在 GC 患者总生存中的关键作用,评估了这些枢纽基因的预后价值;MAPK10与患者的总生存期显着相关。与之前的研究相比,关注MAPK10预后价值的 Gu's 和 Ying's 小组也证实了我们的结论,即MAPK10在 GC 细胞系中经常下调51并预测肿瘤进展和预后52。功能和通路富集分析表明,这些基因主要富集在与恶性肿瘤进展相关的方面,包括钙离子转运到细胞质中53、辅助受体活性54和卡波西肉瘤相关疱疹病毒感染55,这可能为探索提供一个视角。预后相关的 DEEOSGs 在 GC 中的作用。
尽管如此,这项研究仍有局限性。首先,本研究设计为回顾性分析;因此,应该进行更多的前瞻性研究来验证这些结果。其次,结果缺乏体外或体内探索来证实机理分析的可靠性。因此,未来将进行大量实验来证明这些基因与 GC 进展之间的机制联系。
总之,经过一系列生物信息学分析和验证,鉴定出11个预后相关的DEEOSGs和13个进展相关的DEEOSGs,它们与GC患者的总生存期或肿瘤分级有关。还构建了具有强大预测效果的预后模型。据我们所知,这是第一份构建 OS 相关恶性肿瘤预后模型的报告。该研究为研究GC患者的发病机制和进展提供了新的研究目标。