细胞衰老相关 lncRNA 特征预测肺腺癌患者预后和肿瘤微环境

摘要
背景:细胞衰老最近被认为是一种新的癌症标志。然而,调节细胞衰老的因素尚未得到很好的表征。本研究的目的是鉴定与肺腺癌 (LUAD) 患者的衰老和预后相关的长链非编码 RNA (lncRNA)。
方法:使用来自癌症基因组图谱肺腺癌 (TCGA-LUAD) 的 RNA 序列数据和来自 CellAge 数据库的衰老基因,首先鉴定了衰老相关 lncRNA 的一个子集。然后,使用单变量和多变量 Cox 回归分析,开发了与 LUAD 预后相关的衰老 lncRNA 特征(LUADSenLncSig)。根据 LUADSenLncSig 风险评分的中位数,将 LUAD 患者分为高风险组和低风险组。Kaplan-Meier 分析用于比较高风险评分和低风险评分亚组的总生存期 (OS)。还比较了高危组和低危组在基因集富集分析(GSEA)、免疫浸润、肿瘤突变负荷(TMB)、肿瘤免疫功能障碍和排除(TIDE)模块评分、化疗和靶向治疗选择方面的差异.
结果:获得了由以下 9 个衰老相关 lncRNA 组成的预后风险模型:LINC01116、AC005838.2、SH3PXD2A-AS1、VIMS-AS1、SH3BP5-AS1、AC092279.1、AC026355.1、AC027020.2和 LINC00996 . LUADSenLncSig 高风险组与较差的 OS 相关(风险比 = 1.17,95% 置信区间 = 1.102–1.242;p< 0.001)。基于接受者操作特征 (ROC)、主成分分析 (PCA) 和内部验证队列进一步支持模型的准确性。此外,还开发了一个由 LUADSenLncSig 组成的诺模图,用于 LUAD 预后,这与 OS 的实际概率一致。此外,免疫浸润分析显示低风险组在肿瘤微环境中具有更强的抗肿瘤免疫反应。值得注意的是,低风险亚组的 CTLA-4、PDCD-1 和 CD274 等免疫检查点基因水平以及 TIDE 评分显着高于高风险亚组 ( p < 0.001)。这一发现表明 LUADSenLncSig 可以潜在地预测免疫疗法的疗效。
结论:在本研究中,开发了一种 lncRNA 特征 LUADSenLncSig,它具有衰老表型鉴定和预后预测的双重功能以及预测 LUAD 对免疫治疗反应的潜力。
Keywords:细胞衰老, lncRNA, 预后, 肿瘤微环境, 免疫治疗, 肺腺癌
LUAD 中衰老相关 DEGs 的富集分析
研究流程图如图图1. 首先,比较279个衰老相关基因在肿瘤和正常组织中的表达水平,以确定这些基因是否在肿瘤组织中异常表达(补充表S1)。在 LUAD 肿瘤组织中,62 个差异表达基因中有 23 个下调,39 个上调(图 2A、B,补充表 S2 )。KEGG 通路分析显示五个最富集的通路是人类 T 细胞白血病病毒一号感染、细胞衰老、细胞周期、卡波西肉瘤相关疱疹病毒感染和 p53 信号通路(图 2C). 相反,GO 分析显示五个最丰富的类别是细胞老化、衰老、有丝分裂细胞周期相变、有丝分裂细胞周期相变的调节和细胞对化学应激的反应(图 2D). 这些发现表明 DEG 主要参与细胞衰老、细胞周期、病毒感染、细胞应激和细胞凋亡。

本研究的流程图。TCGA,癌症基因组图谱;RNA序列,RNA序列;LUAD,肺腺癌;DEGs,差异表达基因;GO,基因本体;KEGG,京都基因和基因组百科全书;lncRNA,长链非编码RNA;ROC,接受者操作特征;GSEA,基因集富集分析。

LUAD 中衰老 DEGs 的富集分析。(A)正常和 LUAD 肿瘤组织中 62 个衰老 DEG 的热图。(B)正常和 LUAD 肿瘤组织中 279 个衰老基因的火山图。粉色点代表肿瘤组织中上调的基因,蓝色点代表肿瘤组织中下调的基因。(C)衰老 DEG 的 KEGG 分析。(D)衰老 DEG 的 GO 分析。DEGs,差异表达基因;LUAD ,肺腺癌;N,正常组织;T,肿瘤组织;FC,折变;KEGG,京都基因和基因组百科全书;GO,基因本体;FDR,错误检测率;BP,生物过程;CC,细胞成分;MF,分子功能。
构建 LUADSenLncSig
Pearson 相关分析确定了 1,081 个与衰老相关的 lncRNA(补充表 S3)。在 lncRNA 中,62 个与 LUAD 预后相关(图 3A). 此外,使用多变量 Cox 回归分析筛选了九个与衰老相关的 lncRNA(LINC01116、AC005838.2、SH3PXD2A-AS1、VIMS-AS1、SH3BP5-AS1、AC092279.1、AC026355.1、AC027020.2和 LINC00996)以形成 LUADSenLncSig 预测签名。图 3B描绘了 LUAD 患者中 LUADSenLncSig lncRNA 表达水平的热图。Cytoscape 软件用于可视化与衰老相关的 lncRNA-mRNA 表达网络(图 3C, | 2 | _ > 0.3,p < 0.001)。AC005838.2、AC026355.1、AC027020.2、AC092279.1和 LINC00996 是保护因素,LINC01116、SH3PXD2A-AS1、VIM-AS1 和 SH3BP5-AS1 是基于 Sankey 图的风险因素图 3D.

鉴定与 LUAD 预后相关的衰老相关 lncRNA 和 lncRNA-mRNA 共表达网络构建。(A)森林图显示了 62 个具有 HR、95% CI 和基于单变量 Cox 比例风险分析的相关 LUAD 预后的p值的衰老相关 lncRNA。(B)热图描述了基于多变量 Cox 回归分析确定的与 LUAD 预后相关的九种衰老相关 lncRNA 的表达水平。(C)衰老相关特征的 lncRNA-mRNA 共表达网络。黄色方块代表 lncRNA,绿色椭圆代表 mRNA。9 个衰老 lncRNA 的表达水平与 12 个衰老 mRNA 的水平相关。(D) Sankey 图描绘了衰老 lncRNA、mRNA 和风险类型之间的关系。LncRNA,长链非编码RNA;HR,风险比;置信区间,置信区间;N,正常组织;T,肿瘤组织;LUAD,肺腺癌。
LUADSenLncSig与LUAD患者预后的相关性
LUADSenLncSig 的风险评分计算如下:风险评分 = (0.348 × LINC01116 表达) + (−0.889 × AC005838.2表达) + (0.516 × SH3PXD2A-AS1 表达) + (−0.429 × VIM-AS1 表达) + ( 0.883 × SH3BP5-AS1 表达)+(-0.611 × AC092279.1表达)+(-0.566 × AC026355.1表达)+(-0.918 × AC027020.2表达)+(-0.869 × LINC00996 表达)。使用该公式计算每位患者的风险评分,并根据中位风险评分将患者分为两组:高风险组(n = 228)和低风险组(n = 220)(图 4A). Kaplan-Meier 分析显示,高风险组的 OS 明显短于低风险组(图 4A).图 4B、C显示个别患者的风险评分和生存统计数据,死亡人数随着风险评分的增加而增加。单变量和多因素 Cox 回归分析显示 LUADSenLncSig 风险评分是 LUAD 的独立预后因素(图 4D、E) 与其他临床病理变量相比,AUC 为 0.764 和 LUAD 预后的最佳预测因子 (图 4F). 1年、3年和5年ROC曲线的AUC分别为0.707、0.677和0.772,说明LUADSenLncSig在LUAD预后中表现良好(图 4G).

基于衰老相关 lncRNA (LUADSenLncSig) 预测模型确定的风险评分的预后价值。(A)根据使用 LUADSenLncSig 确定的风险评分中位数分层的高风险和低风险组 OS 的 Kaplan-Meier 曲线。(B)基于每个样本的风险评分的风险曲线;黄点表示高风险,蓝点表示低风险。(C)基于每个样本生存状态的散点图。黄点和蓝点分别表示生存或死亡的状态。(D)单变量 Cox 回归分析和(E)多变量 Cox 回归分析的临床病理学特征和 LUADSenLncSig 风险评分的森林图。(F)使用 ROC 比较风险评分和其他临床病理变量之间的 AUC。(G) LUADSenLncSig 1 年、3 年和 5 年生存的时间依赖性 ROC 曲线。OS,总生存期;LUAD,肺腺癌,lnc,长非编码;LUADSenLncSig,肺腺癌衰老 lncRNA 特征;AUC,曲线下面积;ROC,接受者操作特征曲线;T,肿瘤;M,远处转移;N,淋巴结转移。
图 5A描述了 LUADSenLncSig 模型中九种 lncRNA 的表达水平和临床病理因素。为了区分高风险和低风险患者,进行了具有全基因组衰老相关 DEG、衰老相关 lncRNA 和 LUADSenLncSig 的 PCA(图 5B–E). LUADSenLncSig 模型清楚地区分了低风险和高风险人群,如图所示图 5E,证明了模型的准确性。

基于临床病理学变量分层和用于将患者分为不同风险组的不同基因组的 PCA 的九种 lncRNA 的表达水平。(A)九个与衰老相关的 lncRNA 和临床病理学变量作为高风险和低风险组的热图分布。基于(B)全基因组 mRNA 转录本、(C)衰老相关 mRNA (D)衰老相关 lncRNA 和(E)的 PCA包括九个 LUADSenLncSig 衰老相关 lncRNA 的风险模型。高风险评分的患者以红色显示,低风险评分的受试者以绿色显示。LncRNA,长链非编码RNA;PCA,主成分分析;LUAD,肺腺癌;LUADSenLncSig,LUAD 衰老 lncRNA 特征;T,肿瘤;N,淋巴结转移;M,远处转移。
此外,图 6A–Q显示临床参数和风险评分之间的关系。在风险评分和年龄(> 65 岁和≤ 65 岁,图 6A 和 B), 性别 (女性和男性,图 6C、D), M0 阶段 (图 6E), N0 和 N1 阶段 (图 6G,H), 总体 TNM 阶段 2 和 3 (图 6K,L), 以及 T2、T3 和 T4 阶段 (图 6O–Q). LUADSenLncSig 风险评分被证明是 LUAD 患者的独立预后风险因素。

根据临床病理变量分类的低风险和高风险人群的 Kaplan-Meier 生存曲线。(A,B)年龄;(C,D)性别;(E,F) M 阶段;(G–I) N阶段;(J–M)总体阶段;(N-Q) T 阶段。T,肿瘤;N,淋巴结转移;M,远处转移。
列线图的构建
使用 LUADSenLncSig 风险评分和其他临床病理学因素建立列线图临床预后评估图,以评估 LUAD 患者 1、3 和 5 年的生存概率(图 7A). 基于三个校准图,列线图估计的死亡率与实际死亡率相似(图 7B–D).

诺模图的构建和验证(A)结合临床病理变量和风险评分的诺模图预测 LUAD 患者的 1 年、3 年和 5 年生存概率。校准曲线评估(B) 1 年(C) 3 年和(D) 5 年预测和实际 OS 的一致性。LUAD,肺腺癌;T,肿瘤;N,淋巴结转移;M,远处转移;OS,总生存期。
LUADSenLncSig 的内部验证
TCGA-LUAD 患者(n = 448)被随机分配到两个内部验证队列(第一个内部队列 n = 224,第二个内部队列 n = 224)以确定 LUADSenLncSig 是否普遍适用于 OS 预测值LUAD。样本的临床特征详见表格1. 在第一和第二个内部队列中,高风险组患者的 OS 比低风险组受试者短(图 8A、C),这与 TCGA-LUAD 数据集的整体结果一致。此外,第一个内部队列的 1 年、3 年和 5 年生存率的 AUC 分别为 0.787、0.683 和 0.79(图 8B),在第二个内部队列中分别为 0.629、0.679 和 0.734 (图 8D). 这些结果表明,LUADSenLncSig 在两个内部验证队列中都表现出色,表明预测模型的稳健性。

用于操作系统的 LUADSenLncSig 的内部验证。(A)第一个内部队列 (n = 224) 的 Kaplan–Meier 生存曲线。(B)在第一个内部队列中,计算了 1 年、3 年和 5 年生存期的 ROC 曲线和 AUC。(C)第二个内部队列 (n = 224) 的 Kaplan–Meier 生存曲线。(D)在第二个内部队列中,计算了 1 年、3 年和 5 年生存期的 ROC 曲线和 AUC。lnc,长非编码;LUAD,肺腺癌;LUADSenLncSig,LUAD 衰老 lncRNA 特征;ROC,接受者操作特征;AUC,曲线下面积;OS,总生存期;TCGA,癌症基因组图谱。
鉴定与 LUADSenLncSig 相关的生物途径
细胞周期的 KEGG 通路(NES = 2.17,NOM p < 0.001,FDR q = 0.004),p53 信号通路(NES = 2.04,NOM p < 0.001,FDR q = 0.019),卵母细胞减数分裂(NES = 2,NOM p < 0.001,FDR q = 0.023),糖脂生物合成-乳酸和新乳酸系列(NES = 1.95,NOM p = 0.004,FDR q = 0.03)和粘附连接(NES = 1.95,NOM p = 0.004,FDR q = 0.028)在高危人群中富集(图 9A), 然而, 哮喘 (NES = −2.16, NOM p < 0.001, FDR q = 0.003), IgA 产生的肠道免疫网络 (NES = −2.11, NOM p < 0.001, FDR q = 0.004), 造血细胞谱系 (NES = −2.1,NOM p < 0.001,FDR q = 0.003),自身免疫性甲状腺疾病(NES = −2.09,NOM p = 0.002,FDR q = 0.003)和 T 细胞受体信号通路(NES = −2.01,NOM p = 0.004,FDR q = 0.009)在低风险组中富集(图 9A). 另一方面,在具有高风险评分的 LUAD 患者中富集的 GO 术语是主轴定位(NES = 2.53,NOM p <0.001,FDR q <0.001),主轴定位的建立(NES = 2.49,NOM p <0.001, FDR q < 0.001),有丝分裂纺锤体定位的建立(NES = 2.48,NOM p < 0.001,FDR q < 0.001),钙粘蛋白结合(NES = 2.46,NOM p < 0.001,FDR q < 0.001),以及涉及的微管细胞骨架组织在有丝分裂中(NES = 2.35,NOM p < 0.001,FDR q < 0.001)。相反,适应性免疫反应的负调节(NES = -2.4,NOM p < 0.001,FDR q = 0.001),肥大细胞激活参与免疫反应(NES = -2.26,NOM p< 0.001,FDR q = 0.007),T 细胞激活参与免疫反应(NES = −2.24,NOM p < 0.001,FDR q = 0.007),T 细胞分化参与免疫反应(NES = −2.22,NOM p < 0.001 ,FDR q = 0.008)和 B 细胞介导免疫的负调节(NES = -2.22,NOM p < 0.001,FDR q = 0.006)在具有低风险评分的 LUAD 患者的肿瘤中富集(图 9B).

不同风险组的基于 LUADSenLncSig 的 GSEA。(A)基于 GSEA 结果,KEGG 基因在衰老相关的 lncRNA 表达方面存在差异富集。五个KEGG项目,细胞周期,p53信号通路,卵母细胞减数分裂,糖脂生物合成-乳糖和新乳糖系列,以及粘附连接在高危组中得到丰富。基于 NES、NOM p值和 FDR q 值,低风险组中哮喘、用于 IgA 生成的肠道免疫网络、造血细胞谱系、自身免疫性甲状腺疾病和 T 细胞受体信号通路得到丰富(B)GO 中基因与衰老相关 lncRNA 的差异富集。纺锤体定位、纺锤体定位的建立、有丝分裂纺锤体定位的建立、钙粘蛋白结合和参与有丝分裂的微管细胞骨架组织这五个 GO 项目在高表达表型中表现出显着的差异富集。其他五个 GO 术语,适应性免疫反应的负调节,免疫反应中涉及的肥大细胞激活,免疫反应中涉及的 T 细胞激活,免疫反应中涉及的 T 细胞分化,以及 B 细胞介导的免疫的负调节,被发现显着丰富在基于 NES、NOM p的低表达表型中- 值和 FDR q 值。(MSigDB) 的参考文件是 c2。cp.kegg.v7.4。symbols.gmt 和 c5。go.v7.4 符号。格林威治标准时间(http://software.broadinstitute.org/gsea/msigdb/index.jsp)。LncRNA,长链非编码RNA;LUAD,肺腺癌;LUADSenLncSig,LUAD 衰老 lncRNA 特征;GSEA,基因集富集分析;KEGG,京都基因和基因组百科全书;NES,归一化富集分数;NOM p - 值,标称p -值;FDR,错误检测率;GO,基因本体;MSigDB,分子特征数据库。
LUADSenLncSig与TMB的关系
在 223 名高危患者和 216 名低危患者中分别检查了体细胞突变(图 10A、B). 在 TTN(53% 对 40%)、MUC16(44% 对 36%)、CSMD3(42% 对 36%)和RYR2(39% 对 33%)。此外,虽然在高风险组和低风险组之间未发现 TMB 差异(图 10C), 低风险组中高 TMB 与 LUADSenLncSig 风险评分的结合导致更好的预后 (图 10D、E), 表明这两个指标之间存在协同效应。理论上,较高的 TMB 会增加肿瘤新抗原的产生,因此可能会增加免疫识别和肿瘤细胞杀伤。此外,在之前的研究中已经发现高 TMB 和 ICI 反应率与 PFS 之间存在关联(Sholl 等人,2020 年)。因此,评估了两组之间的免疫浸润和潜在的免疫治疗反应。

LUADSenLncSig 风险评分与 LUAD 组织中体细胞突变和 TMB 之间的关系。瀑布图显示了高风险 ( A)和低风险(B) LUAD 患者之间的体细胞突变。(C)来自低风险评分亚组和高风险评分亚组的患者之间的 TMB 差异。(D)高和低 TMB 组的 Kaplan-Meier 曲线。(E)根据 TMB 和风险评分分层的患者的 Kaplan-Meier 曲线。p值表示子组之间的方差分析检验。TMB,肿瘤突变负荷;LUAD,肺腺癌;lnc,长非编码。
高风险和低风险 LUAD 亚组的免疫浸润概况
ssGSEA分析结果显示,低危组CD8 + T细胞、巨噬细胞、T辅助细胞等抗肿瘤免疫细胞数量显着高于高危组(图 11A). 免疫功能评分,如抗原呈递细胞(APC)共抑制、CC趋化因子受体(CCR)、检查点、人类白细胞抗原(HLA)、T细胞共抑制、T细胞共刺激和II型干扰素( IFN)反应,在低风险组中显着高于高风险组(图 11B). 这些结果表明低风险组的肿瘤微环境中具有更强的抗肿瘤免疫反应。此外,CIBERSORT 算法显示低风险组的 CD8 + T 细胞和巨噬细胞 M2 数量显着高于高风险组(图 11C), 这证实了 ssGSEA 分析结果。这些差异基于免疫疗法必须依赖于预先存在的免疫热微环境的理论 ( Mlecnik et al., 2016 ),为免疫疗法提供了潜在的治疗指南。

不同风险人群的免疫细胞浸润和免疫相关功能。ssGSEA 算法用于计算 16 种免疫细胞浸润的评分水平。(A)和 13 免疫相关功能。(二)中高危人群和低危人群。(C)Wilcoxon 秩和检验用于确定高风险组和低风险组之间 22 种免疫细胞之间的差异。SsGSEA,单样本基因集富集分析;aDCs,激活的树突状细胞;iDCs,未成熟的树突状细胞;NK,自然杀手;pDCs,浆细胞样树突状细胞;Tfh, T 卵泡辅助细胞;Th1,T 辅助类型 1;Th2,T 辅助类型 2;TIL,肿瘤浸润淋巴细胞;Treg,T调节细胞;APC,抗原呈递细胞;CCR,CC趋化因子受体;HLA,人类白细胞抗原;MHC,主要组织相容性复合体;干扰素,干扰素;* p < 0.05;** p < 0.01;*** p < 0.001;ns,不显着;p < 0.05 表示具有统计学意义。
LUADSenLncSig 与 LUAD 免疫治疗、化疗和靶向治疗有潜在关系
37个免疫检查点基因的表达水平在高危组和低危组之间存在差异(图 12A). CD274(PD-L1蛋白编码基因)、PDCD-1(PD-1蛋白编码基因)、CTLA-4等目前广泛应用于临床试验的免疫治疗标志物,发现在低危人群中显着升高(图 12A),表明低风险患者的潜在免疫治疗反应。此外,如图所示图 12B,当使用在线软件 TIDE 预测 LUAD 患者抗 PD1 或抗 CTLA4 治疗的疗效时,低风险亚组的 TIDE 评分显着高于高风险亚组(p < 0.001)。这一发现表明 LUADSenLncSig 具有预测免疫疗法疗效的潜力。

高、低危人群免疫检查点、TIDE评分、化疗及靶向治疗药物敏感性比较。(A) 37 个免疫检查点基因的表达在高风险组和低风险组之间存在差异。红框代表高危患者,蓝框代表低危患者(B)。在线软件 TIDE 预测接受抗 PD1 或抗 CTLA4 治疗的 LUAD 患者亚组的疗效评分。(C)甲氨蝶呤(D) IPA.3 (E) MK.2206 (F) PD.0332,991 (palbociclib) (G)紫杉醇(H)多西紫杉醇(I)厄洛替尼的 IC 50值(J) BIBW2992 (alphatinib) 在高风险和低风险人群中的作用。TIDE,肿瘤免疫功能障碍和排除模块;IC 50,半数最大抑制浓度;* p < 0.05;** p < 0.01;*** p < 0.001;ns,不显着;p < 0.05 表示具有统计学意义。
最后分析了LUADSenLncSig风险评分与LUAD化疗及靶向治疗疗效的关系。如图所示图 12C–F,传统化疗药物甲氨蝶呤(图 12C) 以及新型靶向疗法,例如 P21 激活激酶 1 (PAK1) 抑制剂 IPA.3 (图 12D), 改变的 Akt 抑制剂 MK.2206 (图 12E), 和 CDK4/6 抑制剂 PD.0332,991 (palbociclib,图 12F), 是高危人群中较敏感的药物之一。相反,紫杉醇(图 12G) 和多西紫杉醇 (图 12H) 以及酪氨酸激酶抑制剂厄洛替尼 (图 12I) 和 BIBW2992(阿尔法替尼,图 12J), 是基于 IC 50的低风险组中更敏感的药物。
总之,我们开发了可用于预测 LUAD 预后的 LUADSenLncSig lncRNA 特征。值得注意的是,LUADSenLncSig 与免疫浸润水平和肿瘤免疫疗法的潜在疗效相关。这些发现突出了肿瘤免疫治疗的潜在未来方向,重点是细胞衰老治疗。此外,由于该技术更容易获得且成本更低,批量测序是一种可能更容易作为标准管理方法引入临床的技术。我们相信,如果有足够的外部数据可用,我们可以将批量测序生成的 lncRNA 模型扩展到 LUAD 患者的标准护理,这可以验证与衰老相关的 lncRNA 的预测功效。