基于坏死来识别肺腺癌的免疫学特征和预后特征
来源 TMR Publishing Group
作者 Medical Data Mining 编辑部
肺癌是最常见的癌症之一,发病率和死亡率高。肺癌的亚型大致可分为两类,非小细胞肺癌(NSCLC)和小细胞肺癌。NSCLC占这两种亚型的85%,可进一步分为鳞状细胞癌、腺癌和大细胞癌,而肺腺癌(LUAD)最为常见。然而,LUAD患者的5年总生存率仅为15%。许多研究表明,lncRNAs可以影响肿瘤微环境(TME),影响肿瘤浸润和进展。因此,识别新的高效的肿瘤生物标志物对LUAD的精确诊断、靶向治疗和预后预测至关重要。长链非编码RNA在肿瘤的发生发展中起着关键作用。坏死是一种新建立的细胞程序性死亡方法,在抗肿瘤治疗中发挥着重要作用。因此,识别与坏死相关的长链非编码RNA并基于其来评估肺腺癌的特征对于患者的生存预测和治疗至关重要。
研究方法
本文从公共数据库中收集数据,并进行LASSO分析,构建一个13-lncRNA预后模型。基于共识聚类、估计、序列排序和加权基因共表达网络分析来识别免疫特征。
研究结果
预后坏死相关lncRNA的鉴定
本研究的工作流程如图1所示。本文对56个坏死相关基因进行单因素Cox回归分析。最终获得了19个预后相关基因,包括FADD、MLKL、TRIM11、IPMK、MYC、TNFRSF1A、TRAF2、PANX1、MAP3K7、diablo、ID1、HSPA4、FLT3、HAT1、PLK1、ALK、TERT、HSP90AA1、DDX58。然后,进行了相关性分析(相关系数>0.4和P<0.001)来筛选与坏死相关的lncRNA。共鉴定出267个lncRNAs,其中与坏死相关的lncRNA的共表达网络如图2A所示。本文采用单因素Cox分析来确定坏死和预后相关的lncRNAs,最终鉴定出41个lncRNAs(P<0.05)(图2B)。41个lncRNA在肿瘤和正常样本中的表达谱如图2C所示。


预后坏死相关lncRNA的共识聚类
基于41个预后与坏死相关的lncRNAs,本文对所有LUAD样本进行了共识聚类分析,以探讨41个lncRNAs的表达特征与LUAD亚型之间的关系。根据经验累积密度函数图,当k=2时,一致性聚类矩阵显示,LUAD样本可以分为两个亚型(图3A)。根据共识聚类分析结果,本研究接下来比较了基于聚类(聚类1和聚类2)的临床信息。性别、N分期和肿瘤分期均有显著性差异(图3B)。此外,为了进一步探讨两个亚组之间的差异,聚类1和聚类1的Kaplan-Meier生存曲线显示,两个亚组的OS存在差异。结果显示,集群2的操作系统优于集群1(图3C)。

集群1和集群2亚组的免疫检查点和TME签名
为了探讨LUAD的两组亚组的TME特征,本文对免疫检查点进行了相关性分析。PDCD1(PD-1)、CD274(PD-L1)、PDCD1LG2(PD-L2)、CTLA4和LAG3与预后坏死相关的lncRNA(图4A)。本文还比较了不同聚类中免疫检查点的表达水平(图4B-图4F)。结果显示,除CTLA4外,其他4个免疫检查点均存在表达差异,且聚类1的表达水平均高于聚类2。此外,为了评估不同集群免疫激活的程度,本文进一步用ESTIMATE算法计算TME分数,表明集群1的免疫分数低于集群2而两者基质得分和估计分数没有显著差异(图4G-图4I)。

免疫细胞浸润分析、WGCNA和GO集群分析
为了评估免疫细胞浸润条件,本文应用CIBERSORT算法来评估LUAD中免疫细胞的比例。图5A显示了簇1和2的22个免疫细胞浸润。结果显示,同时结合免疫细胞具有较高的分数水平,本文最终发现浆细胞、T细胞CD8、巨噬细胞M0和巨噬细胞M1在簇1中较高。相反,T细胞CD4、巨噬细胞M2、树突状细胞、树突状细胞激活和肥大细胞在簇2中较高。
为了进一步探索不同聚类中基因表达模式的特征,本文利用WGCNA算法来识别聚类1和聚类2的特征。根据WGCNA结果,本文确定MEGrey模块与聚类的相关性最高(相关系数=0.56,P<0.001)(图5B)。因此,本文从MEGrey模块中筛选了前30个模块内连接基因,包括ANXA10、ASCL1、ALCA、CDHR2、CDHR5、CSAG1、CSAG3、DDX3Y、EIF1AY、EPS8L3、FER1L6、HNF4A、KDM5D、MAGEA12、MAGEA3、MAGEA6、MT-ATP6、MT-CO1、MT-CO2、MT-CO2、MT-CO3、MT-CYB、MT-ND2、MT-ND4、MT-ND4L、MYO1A、REG4、RPS4Y1、USP9Y、UTY、ZFY。
然后,进行WGCNA分析,鉴定前30个基因的功能特征。GO分析结果显示,CDHR2与丰富的通路具有较高的连通性(图5C)。接下来,进行了Kaplan-Meier生存分析,结果显示CDHR2高表达组的OS时间比LUAD的低表达组差(P=0.033)(图5D)。随后,本文进一步验证了CDHR2在人类蛋白质图谱数据库的表达状态,显示CDHR2高抗体染色在一些免疫组化样本和高CDHR2表达水平的预后状况不良,这表明CDHR2是LUAD患者的预后枢纽基因(图5e)。

基于预后坏死相关lncRNA的LUAD预后模型的开发和验证
共将494份TCGA lncRNAs矩阵的肿瘤样本,按7:3的比例随机分为训练集(348)和测试集(146)。根据之前筛选的41个与预后坏死相关的lncRNA,我们利用lasso回归和10倍交叉验证来过滤预后模型的变量(图6A,图6B)。最后,建立了13个lncRNAs构建模型。在该模型中,有5个基因(LINC02693、FGD5-AS1、TMPO-AS1、LINC01116、LINC02802)具有正系数,表明这些基因是对LUAD患者的有害因素。与此相反,8个基因(RHOQ-AS1、LINC02273、LINC01800、LINC00996、CADM3-AS1、SFTA3、CRNDE、PARP11-AS1)具有负系数,对LUAD患者的预后具有保护作用,其较高的表达水平往往意味着较好的预后。基于该风险预后模型,我们根据中位数风险评分将其分为高风险组和低风险组。对两组患者进行Kaplan-Meier生存分析,log-rank检验显示低危组预后较好(P<0.001,图6C)。然后绘制1年、3年和5年的ROC曲线,估算模型的预测效率,并计算曲线下面积(AUC),分别为0.75、0.7、0.67(图6D)。
随后,为了检验该模型的预后预测效果,本文进行了风险评分。我们在中位数风险分界值将样本分为高和低风险组,并比较了两组的生存差异,绘制了ROC曲线,计算了1、3、5年的AUC。结果显示,两组在生存率上有显著差异,低风险组的预后优于高风险组(P=0.002,图6E)。1、3、5年ROC曲线的AUC分别为0.66、0.6和0.78(图6F)。结果表明,该模型具有良好的预测效果。

对模型的外部验证和独立的预后分析
为了进一步确认该模型的有效性,我们从GEO数据库上验证了该模型,其中包括来自GPL570平台的289个样本。同样,采用Kaplan-Meier生存分析,比较高危组和低危组的生存差异,显示高危组预后较差(图7A)。此外,1年、3年和5年的ROC曲线的AUC分别为0.68、0.64和0.61(图7B)。这些结果表明,该模型在LUAD患者的预后生存预测方面具有良好的性能。
为了验证我们的模型是否可以作为一个独立于其他临床特征的独立预后因素,我们在整个LUAD TCGA数据集中结合临床信息对该模型进行了独立的预后分析。首先,单因素独立预后分析显示,年龄和性别与生存无关,但风险评分和肿瘤分期与生存相关(图7C)。然后,进行多变量独立预后分析,表明风险评分和肿瘤分期可以独立于其他因素作为独立的预后因素(图7D)。综上所述,基于模型的风险评分和肿瘤分期是影响预后的独立因素,而年龄和性别则不是独立的预后因素。因此,我们建立的模型可以作为LUAD预后的独立预后因素。

模型中差异表达基因的筛选及基于风险评分的聚类特征识别
本文使用“limma”软件包分析差异表达基因(lncRNAs)。最后,本研究证实了SFTA3在肿瘤组中表达下调。用盒图比较其在肿瘤组和正常组中的表达水平,显示SFTA3在正常组中表达较高,但在肿瘤组中的表达较低(图8A)。根据之前的Cox回归分析(图2B),SFTA3的危险比为0.842,这提醒我们,检测SFTA3低表达可能是LUAD诊断的必要标志物。
此外,为了更深入地研究LUAD的多重性状。我们根据模型的风险评分,比较了聚类中的差异。结果显示,聚类1的风险评分高于聚类2,这与我们之前的研究一致,即聚类1的预后比聚类2差(图3C,图8B)。结合我们之前的研究,聚类1的免疫评分低于聚类2(图4H),这可以解释为什么聚类1预后较差——因为聚类1处于低免疫浸润状态,导致患者高危,预后不良。因此,这些发现提示免疫过程在LUAD的进展中起着重要的作用。

结论
本文构建了一个新的与13个坏死相关的lncRNA模型,并识别了LUAD患者的免疫特征,可应用于临床评估患者的预后,为LUAD的治疗提供新的思路。
扫描二维码获取全文

引用格式
Xia P, Wang DG, Ouyang SW, et al. Based on necroptosis identifying the immunological features and prognostic signatures of lung adenocarcinoma. Med Data Min. 2022;5(2):8. doi:10.53388/MDM20220520008
Medical Data Mining (ISSN 2624-1587) 是TMR Publishing Group旗下的开放获取英文学术期刊。在生物信息学高速发展的背景下,大数据与人工智能成为现代生命科学与自然科学两大学科融合的具体体现,也是自然科学研究从“还原与微观”走向“综合与宏观”的重要工具与方法。Medical Data Mining 旨在通过对大数据与人工智能数据挖掘,发现生命与医学的科学规律,本刊欢迎以下领域的文章。
人工智能 生物信息学分析 多变量分析 元分析 网络药理学 文献计量学 文本分析 大数据
2022年期刊免除版面费
投稿链接:https://www.tmrjournals.cn/mdm/