舌鳞状细胞癌中与自噬相关的lncrna预后模型

TCGA数据库中自噬相关lncRNA的鉴定对TSCC患者具有预后意义
我们通过分析从 TCGA 获得的 162 名 TSCC 患者样本的 RNA 序列,鉴定了 14,142 个 lncRNA。从HADb数据库中下载了总共232个自噬相关基因,并获取了患者样本中相应的表达水平。通过设定Pearson系数和p值的阈值,筛选出941个与自噬相关的lncRNA。采用单变量Cox回归分析获得25个与TSCC患者总生存时间显着相关的自噬相关lncRNA。基于最小 AIC,多变量 Cox 分析显示,10 个 lncRNA AC010326.3、AL160006.1、AL122010.1、AC139530.1、AC092747.4、AL139287.1、MIR503HG、AC009318.2、LINC01711 和 LINC02560 是构建预后模型。10个自噬相关lncRNA中,AC010326.3和AL139287.1的HR值大于1,其余为HR值小于1的保护因素。


TSCC 中自噬相关 lncRNA 的预后评估
为了研究自噬相关的lncRNA是否与TSCC的预后相关,我们建立了风险评分模型。该模型是lncRNA表达量乘以相应系数的总和,即风险评分 = (0.3919 × AC010326.3 表达量) + (− 0.3971 × AL160006.1 表达量) + (− 0.4357 × AL122010.1 表达量) ) + (− 0.9133 × AC139530.1 的表达量) + (− 0.1894 × AC092747.4 的表达量) + (0.2274 × AL139287.1 的表达量) + (− 0.2733 × MIR503HG 的表达量) + (− 0.7450 × AC009318 的表达量.2) + (− 1.3486 × LINC01711 的表达式) + (− 0.0652 × LINC02560 的表达式)。根据中位风险评分 1.607,将 TSCC 患者分为高风险组和低风险组。为了验证高危组和低危组在TSCC患者OS中的意义,卡普兰-迈耶生存曲线分析用于创建风险生存曲线。随着生存时间的增加,高危组的生存率急剧下降,而低危组的结果优于高危组。自噬相关lncRNA预后模型的时间依赖性受试者工作特征(ROC)曲线下面积为0.782,这表明预后特征具有预测生存的潜力。数字 1C显示不同组间的生存状况。 1D 描述了根据风险评分将 TSCC 患者分为高风险组和低风险组。这些结果表明,基于自噬相关lncRNA的预后模型可以准确地对TSCC患者的生存状态和风险进行分类。热图显示了高危组和低危组中10个自噬相关lncRNA的表达水平。颜色从红色变为绿色,表明表达水平从高到低呈下降趋势。

自噬相关lncRNA构建的预后模型与临床特征的相关性
我们从TCGA数据库中获取了TSCC患者的临床数据,并分析了风险评分与临床病理特征之间的相关性。结果显示,TSCC患者的风险评分与年龄、性别、分级、AJCC分期、N分期之间无显着统计学差异。同时,在T阶段,T3-T4患者的风险评分高于T1-T2,p < 0.05)。这些分析结果提示自噬相关lncRNA风险评分与TSCC患者的T分期相关。

我们进一步对 TSCC 患者的临床信息进行分层,以评估自噬相关的 lncRNA 预后模型。如图所示。 3,我们根据年龄(年龄 ≥ 65:p = 7.05e−04;年龄 < 65:p = 1.925e−03)、性别(男性:p = 1.234e−02;女性:p = 1.234e−02),肿瘤分级(G1–2:p = 2.152e−05;G3–4:p = 6.335e−02),AJCC 分期(I–II 期:p = 5.429e−02;III 期–IV:p = 2.527e−05)、T 阶段(T1–2:p = 6.708e−04;T3–4:p = 5.056e−03)和 N 阶段(N0:p = 3.141e−03;N1 –2: p = 4.263e−04) 分别。这些表明低风险评分患者的 OS 时间明显长于高风险评分患者。

自噬相关lncRNA预后模型是TSCC的独立预后因素
为了确定我们构建的预后特征是否可以成为 TSCC 的独立预后因素,我们应用了单变量和多变量 Cox 回归分析。单变量Cox回归分析结果显示, TSCC患者的AJCC分期( p =0.018)、T分期(p =0.001)、N分期(p =0.022)和风险评分(p <0.001)的风险比更大大于1。表明这些因素与患者的OS显着相关。多变量Cox回归分析结果显示,T分期(p =0.001)和风险评分(p <0.001)与OS显着相关。我们进一步绘制了AUC曲线。自噬相关lncRNA预后特征的风险评分AUC为0.782,高于年龄(AUC = 0.567)、性别(AUC = 0.497)、分级(AUC = 0.559)、分期(AUC = 0.585) 、T 期(AUC = 0.681)和 N 期(AUC = 0.545)。这些数据表明,自噬相关的 lncRNA 预后特征是 TSCC 患者的独立预后因素。

由自噬相关 lncRNA 预后特征组成的列线图评估
我们构建了一个一致性指数(C 指数)值为 0.81 的列线图,由临床病理特征组成,包括年龄、性别、分级、AJCC 分期、T 分期、N 分期和预后特征的风险评分。数字 5B和C分别显示1年和3年校准曲线分析的结果。如图所示,与参考线相比,实际生存时间与预测生存时间相同。这一结果表明,我们构建的自噬相关lncRNA预后特征可以准确预测TSCC患者的预后生存时间。

基于十种自噬相关lncRNA的预后模型评估。以自噬相关 lncRNA 预后特征风险评分作为参数之一的预后列线图的构建和验证。A建立包含自噬相关 lncRNA 预后特征、风险评分和临床特征的列线图分别是1年和3年预测生存率和实际生存率的校准图,用于评估预后模型的准确性
共表达网络构建及相关功能富集分析
为了进一步明确TSCC患者中自噬相关mRNA与所选10个自噬相关lncRNA之间的关系,我们通过Pearson相关系数阈值(|R 2 | > 0.3)获得97个自噬相关mRNA ,构建通过 Cytoscape(版本 3.7.1)构建 mRNA-lncRNA 共表达网显示了共表达网络中自噬相关lncRNA与危险因素(风险或保护因素)之间的对应关系。数字 6C描绘了基因本体(GO)富集分析中生物过程(BP)、细胞成分(CC)和分子功能(MF)的前十个富集术语。BP 中排名前三位的术语是自噬、利用自噬机制的过程和巨自噬。自噬体、真空膜和晚期内体是 CC 中排名前三位的术语。蛋白丝氨酸/苏氨酸激酶活性、热休克蛋白结合和磷酸酶结合是 CC 中排名前三的术语。在 KEGG 通路分析中,我们显示了前 30 个富集通路、自噬、PI3K-Akt信号通路、内质网通路中的蛋白质加工在mRNA和自噬相关lncRNA的共表达中发挥着不可或缺的作用。

基因集富集分析
进一步的功能GSEA显示,改变的基因(包括mRNA和lncRNA)在自噬、癌症和免疫相关通路中显着富集,例如癌症通路(p = 0.032)、mTOR信号通路(p = 0.008 )、 p53信号通路 ( p = 0.045)、NOD 样受体信号通路 ( p = 0.006)、Toll 样受体信号通路 ( p = 0.021)、肌动蛋白细胞骨架调节 ( p = 0.01) 、趋化因子信号通路 ( p = 0.019) TSCC 高风险患者这表明这些通路的改变可能影响TSCC患者的预后。这些结果为 TSCC 的发病机制和癌症靶向治疗策略(如免疫治疗)提供了新的见解。
