欢迎光临散文网 会员登陆 & 注册

基于m7G相关LncRNA构建乳腺癌预后特征及免疫分析

2022-12-27 04:01 作者:275276  | 我要投稿

结果

差异基因的获得

我们从 TCGA 数据库中获得了 1,113 个乳腺癌组织和 113 个正常组织的 RNA-seq 数据。使用 Wilcoxon 检验比较乳腺癌和非肿瘤组织之间的 DEGs (|log2FC|>1, FDR<0.05)。发现了17个与m7G相关的基因,包括7个下调基因和10个上调基因(图 1A–C).

在 BC 中获得差异表达的 17 个 m7G 相关基因。(A) BC 和癌旁组织之间 17 个 m7G 相关基因的热图。(B) 17 个确定的 m7G 相关基因的箱线图。橙色代表 CC 组织,而紫色代表正常组织。(C)差异表达的 m7G 相关基因的火山图。橙色代表高表达,蓝色代表低表达,黑色代表BC与正常组织无差异。缩写:BC,乳腺癌;N,正常组织;T,肿瘤组织;m7G,N7-甲基鸟苷。

构建 BC 中 m7G 相关 lncRNA 的预测特征

我们总共获得了 1,090 个与 m7G 相关的 lncRNA。根据单变量 Cox 回归分析(补充图 S1),43 个 LncRNA 与 BC 患者的预后有关。与 m7G 相关的九个 lncRNA(LINC01871、AP003469.4、Z68871.1、AC245297.3、EGOT、TFAP2A-AS1、AL136531.1、SEMA3B-AS1、AL606834.2)可用作 BC 患者的预测特征,根据多元Cox回归和Lasso回归分析(图 2A–C). 其中,(LINC01871、AC245297.3、EGOT、TFAP2A-AS1、AL136531.1、SEMA3B-AS1、AL606834.2)为保护因子,(AP003469.4、Z68871.1)为危险因子。此外,九个m7G相关的lncRNA和临床病理因素在高风险和低风险人群中的分布也显示在热图上(图 2D). 结果显示,两组间在性别(p <0.001)、临床分期(p <0.05)、T分期(p <0.05)、M分期(p <0.05)、N分期(p <0.05)上存在差异, 但没有出现任何显着的年龄差异。然后,为了显示 LncRNA 和 mRNA 之间的联系,我们使用 Cytoscape 创建了 lncRNA 和 mRNA 的网络图(图 3A), 同时, 我们制作了桑基图 (图 3B). 然后根据多变量 Cox 回归分析确定的相关系数确定每位 BC 患者的风险评分,并根据中位风险评分将患者分为低风险组和高风险组。我们用来确定风险评分的公式如下: RiskScore=(−0.549×LINC01871 expression) + (0.553×AP003469.4 expression) + (0.746×Z68871.1 expression) + (−0.449×AC245297.3 expression) +(-0.458×EGOT 表达)+(-0.665×TFAP2A-AS1 表达)+(-0.642×AL136531.1 表达)+(-0.270×SEMA3B-AS1 表达)+(-0.806×AL606834.2 表达)。

图 2
BC 坏死相关 lncRNA 特征的建立。(A)使用十倍交叉验证,确定最佳转向参数 (logλ)。(B)最小绝对收缩和选择运算符 (LASSO) 算法对变量选择的 10 倍交叉验证。(C) BC 和正常组织中九种 m7G 相关 lncRNA 的表达水平。(D)高风险和低风险人群中的九种预后 m7G 相关 lncRNA 和临床病理因素分布热图。缩写:BC,乳腺癌;m7G,N7-甲基鸟苷;lncRNA,长链非编码RNA;N,淋巴结;M,转移;T,肿瘤。
图 3
与N7-甲基鸟苷基因相关的LncRNAs和mRNAs之间的关系。(A)预后 m7G 相关 lncRNA 的共表达网络。(B)预后性 m7G 相关 lncRNA 的 Sankey 图。缩写:lncRNAs,长链非编码RNA;m7G,N7-甲基鸟苷;BC,乳腺癌。

N7-甲基鸟苷相关的 LncRNA 特征与 BC 患者的预后:相关性

首先,为了建立 m7G 相关 lncRNA 谱与 BC 患者预后之间的联系,我们进行了 Kaplan-Meier 分析以评估高风险和低风险 BC 组之间的生存期。如图(图 4A), 高风险组的 OS 时间明显短于低风险组。热力图、散点图、风险曲线都是同时绘制的(图 4B–D),并且可以看出,随着时间的推移,风险评分越高,BC患者死亡人数越多,预后越差。之后,我们进行了多变量 ROC 分析以及单变量和多变量 Cox 回归分析,以查看预测特征是否是 BC 患者预后的可靠预测因子。年龄、TNM 分期、临床分期和风险评分 ( p < 0.05) 与 BC 患者的 OS 显着相关,如单变量 Cox 回归分析图所示 (图 5A). 在 BC 患者中,多变量 Cox 回归分析显示年龄和风险评分 ( p < 0.05) 是 OS 的独立预测因子 (图 5B). 用于预测 1 年、3 年和 5 年生存率的 ROC 曲线下面积 (AUC) 值分别为 0.715、0.724 和 0.726(图 5C),这证明了该特征在预测乳腺癌预后方面的有效性。风险评分的AUC值为0.777,在预测BC患者预后方面高于临床变量(图 5D). 通过RiskScore、Kaplan-Meier分析曲线、风险分布、生存结果、坏死相关lncRNAs在训练集和测试集的表达情况,使用单一公式进行分析(图 6A–J),结果证明了我们的预测模型的准确性。此外,将风险评分模型和临床变量相结合以创建精确的预后列线图(图 7A). 校准曲线表明 1、3 和 5 年的实际和预期生存率具有良好的一致性(图 7B–D).

图 4
CC患者预后与预测特征的关系。(A) Kaplan-Meier 分析比较了高风险和低风险 BC 患者的 OS。(B) BC 患者的风险评分分布。(C)死亡和存活的具有各种风险评分的患者数量。橙色表示有多少人死亡,紫色表示有多少人幸存。(D)与 m7G 相关的九个 lncRNA 的表达热图。缩写:m7G,N7-甲基鸟苷;lncRNA,长链非编码RNA;BC,乳腺癌;OS,总生存期。
图 5
坏死性凋亡相关 lncRNA 预后特征的评估。(A)对临床特征和风险评分进行单变量 Cox 回归分析。(B)风险评分和临床特征进行多变量 Cox 回归分析。(C)用于预测 1 年、3 年和 5 年生存率的 ROC 曲线。(D)风险评分和临床病理因素的 ROC 曲线。缩写:m7G,N7-甲基鸟苷;lncRNA,长链非编码RNA;BC,乳腺癌;ROC,接受者操作特征;AUC,曲线下面积;T,肿瘤;N,淋巴结;OS,总生存期。
图 6
训练、测试中 9 个 m7G 相关 lncRNA 特征的预后值。风险曲线(A,B),生存散点图(C,D),9个lncRNA表达热图(E,F),BC患者ROC曲线(G,H),Kaplan-Meier生存曲线(I,J )分别在train、test中的低风险和高风险人群之间。缩写:m7G,N7-甲基鸟苷;lncRNA,长链非编码RNA;BC,乳腺癌;ROC,接受者操作特征;AUC,曲线下面积。
图 7
列线图的构建。(A)整合临床病理因素和风险评分的列线图预测 BC 患者 1、3 和 5 年的 OS。(B – D)校准曲线检查预测的 1、3 和 5 年生存率是否与当时的实际 OS 率一致。缩写:OS,总生存期;BC,乳腺癌。

BC 患者预后与各种临床协变量和预测特征的关系

根据临床病理因素将乳腺癌患者分成许多组,以检查各种临床协变量对 BC 患者预后的影响(图 8A–L). 对于每个分类,高风险组中 BC 患者的 OS 明显低于低风险组。这些结果进一步证明了预测签名的准确性。

图 8
不同临床病理变量下的风险曲线。(一)年龄。(B)性别。(C , D) T 阶段。(E – G) N 阶段。(H , I) M 阶段。(J – L)阶段。缩写:T,肿瘤;N,淋巴结;M,转移。

功能分析

然后我们进行了 KEGG 和 GO 功能富集分析。在 KEGG 分析中(图 9A), m7G 相关的 lncRNA 主要聚集在细胞周期、原发性免疫缺陷、Erbb 信号通路、间隙连接、RNA 降解和卵母细胞减数分裂中。在GO分析中(图 9B),m7G相关的lncRNAs主要集中在ATP水解活性、T细胞稳态、纺锤体定位、淋巴细胞介导免疫调节、适应性免疫反应调节和淋巴细胞稳态。

图 9
KEGG 和 GO 富集分析。(A) KEGG 富集分析。(B) GO 富集分析。缩写:GO,基因本体论;KEGG,京都基因和基因组百科全书。

免疫系统成分及活性分析

我们研究了风险模型与免疫相关成分之间的关系,因为研究人员最近发现免疫因素在癌症中起着重要作用。我们使用ssGESA分析了免疫细胞和免疫通路,结果显示(图 10A) aDCs、B 细胞、CD8 + T 细胞、NK 细胞、T 辅助细胞和 Th1 细胞在低风险 BC 组中表达更多。在 APC 共刺激、检查点、HLA、炎症促进、T 细胞共抑制和 I 型干扰素反应方面,低风险组的免疫功能评分高于高风险组(图 10B),这表明低风险乳腺癌患者比高风险患者具有更活跃的免疫系统。然后我们分析了免疫检查点(图 10C、D),我们从图中可以看出,几乎每一个免疫检查点都被揭示在低危BC组中更加活跃,包括CD274(PDL1)、LAG3、PDCD1(PD1)、TNFRSF18和LGALS9,提示这些个体可能是对免疫疗法更敏感。

图 10
风险评分和免疫相关因素分析。(A)免疫细胞的相关性分析。(B)免疫相关通路分析。(C) CD274 (PD-L1) 在高危和低危人群中的表达。(D)风险人群中常见免疫检查点表达的差异。缩写:ssGSEA,单样本基因集富集分析;PD-L1,程序性细胞死亡配体 1;* p < 0.05;** p < 0.01;*** p < 0.001;ns,不显着。

药敏分析

由于低风险 BC 患者对免疫疗法更敏感,我们对比了高风险和低风险组之间的药物敏感性(图 11A–F),研究结果显示,低危BC患者对免疫药物AZD7762、CCT018159、CGP.60474和化疗药物依托泊苷、吉西他滨反应较好,但对靶向药物伊马替尼耐药。这些结果证明,研究适合高风险和低风险 BC 组的专门治疗计划是有益的。



图 11
药物敏感性分析。(A) AZD7762 在高风险和低风险人群中的 IC50。(B) CCT018159 在高风险和低风险人群中的 IC50。(C) CGP.60474 在高风险和低风险人群中的 IC50。(D)依托泊苷在高危和低危人群中的 IC50。(E)吉西他滨在高危和低危人群中的 IC50。(F)伊马替尼在高危和低危人群中的 IC50。缩写:IC50,半数最大抑制浓度。

 主成分分析进一步证明m7G相关lncRNA特征的可靠性

使用主成分分析 (PCA) 证实,高风险和低风险 BC 组之间存在差异。这个图片显示着 (图 12A–D),预后风险模型可以区分高风险和低风险 BC 组,这进一步说明了签名的准确性。



图 12
主成分分析 (PCA)。(A)整个基因表达谱。(B)与 m7G 相关的基因。(C)连接到 m7G 的 LncRNA。(D)基于与 m7G 相关的 lncRNA 的预测特征。缩写:m7G,N7-甲基鸟苷。lncRNA; 长链非编码 RNA。

预测模型与临床变量的相关性分析

我们使用 TCGA 数据库中的基因表达数据和相关临床数据检查了这些临床特征与预测特征之间的关系(图 13A–H): LncRNA AL606834.2与T期相关;lncRNA EGOT与临床分期和T期相关;lncRNA SEMA3B-AS1与年龄、M期、N期相关;LncRNA TFAP2A-AS1与临床分期和M期相关。



图 13
与 m7G 相关的九个 lncRNA 与临床特征之间的联系。(A) lncRNA AL606834.2 表达与 T 期的关联。 (B – D) lncRNA SEMA3B-AS1 表达水平与年龄、M 期、N 期的关联。 (E , F) lncRNA EGOT 表达水平与临床分期的关联,T期。(G,H) lncRNA TFAP2A-AS1表达水平与临床分期的关联,M期。缩写:m7G,N7-甲基鸟苷;lncRNA,长链非编码RNA;N,淋巴结;M,转移;T,肿瘤。

 BC中m7G相关lncRNA表达的外部验证

通过 qRT-PCR,我们检测了 9 个 m7G 相关 lncRNA 在 BC 组织和正常组织中的相对表达水平。结果表明,AP003469.2 和 Z68871.1 在 BC 组织中显着增加,而 LINC01871、AC245297.3、EGOT、TFAP2A-AS1、AL136531.1、SEMA3B-AS1 和 AL606834.2 显着减少(图 14). 这些结果与数据库分析的结果一致。

图 14
使用 qRT-PCR 分析鉴定与乳腺癌中 m7G 相关的血浆 lncRNA。血浆AP003469.4 (A)、Z68871.1 (B)、TFAP2A-AS1 (C)、EGOT (D)、AC245297.3 (E)、SEMA3B-AS1 (F)、AL136531.1 ( G)、AL606834.2 (H)、LINC01871 (I)通过 qRT-PCR 在乳腺癌组织和正常组织中测量。* p < 0.05.** p < 0.01。


基于m7G相关LncRNA构建乳腺癌预后特征及免疫分析的评论 (共 条)

分享到微博请遵守国家法律