热点机制推荐:8+双硫死亡+分型+预后模型生信思路解释!!
今天给同学们分享一篇双硫死亡+分型+预后模型的生信文章“Identification of disulfidptosis related subtypes, characterization of tumor microenvironment infiltration, and development of DRG prognostic prediction model in RCC, in which MSH3 is a key gene during disulfidptosis”,这篇文章于2023年6月23日发表在Front Immunol期刊上,影响因子为8.786。
肾细胞癌(RCC)是全球最常见的肾癌亚型,在泌尿系统最常见的恶性肿瘤中排名第二。RCC的特点是无症状、高死亡率、高复发率、易转移和易于产生治疗耐受性。这使得许多RCC患者在诊断时已经晚期,预后通常较差。幸运的是,随着全球医疗标准和医学研究的快速发展,治疗RCC的疗效显著提高。然而,RCC患者的总体5年生存率(OS)仍然不理想。更糟糕的是,即使接受手术治疗的RCC患者也可能在手术后出现转移和复发。一些文献表明,转移性RCC患者的5年生存率甚至低于10%。因此,迫切需要找到能够有效预测RCC患者预后并为RCC治疗提供新的治疗见解的新的预后生物标志物。
1. 24个DRGs在RCC中的差异表达和预后价值
作者调查了541例RCC患者和72例从TCGA-KIRC数据集中获取的正常人肾组织中24个DRG的表达水平,结果显示大多数24个DRG在肿瘤组和正常组之间表达差异显著(图1A)。对RCC中的24个DRG进行了Kaplan-Meier生存分析,发现其中21个与RCC患者的OS密切相关,作者只展示了其中的15个(图1B-P)。ACTN4、FLNA、FLNB、LRPPRC、MYH9、MYH10、NCKAP1、NDUFS1、NUBPL、OXSM和TLN1在高表达患者中具有更好的OS,相反,ACTB、CAPZB、GYS1和SLC7A11高表达患者的OS较差。
图1 TCGA-KIRC数据集中24个DRG的表达水平和Kaplan-Meier生存分析
2. 鉴定肾癌中的双硫死亡异常亚型和遗传亚型
根据TCGA-KIRC和GSE29609数据集中571个RCC样本的DRGs表达水平,进行双硫死亡型分型。共识累积分布函数(consensus CDF)图显示了在不同聚类数κ下的CDF分布。当κ=3时,CDF分布较为平坦且接近最大值,而在κ=4时,CDF曲线下的面积相对较不明显。因此,作者选择了κ=3时的聚类结果(图2A),并将样本分为三个双硫死亡型亚型(图2C)。PCA结果显示这三个亚型有明显差异(图2E)。通过limma软件包鉴定出了这三个亚型之间的1566个差异表达基因(DEGs)(图3A),然后根据DEGs的表达水平对571个RCC进行了基因分型,CDF分布和Delta面积图的结果表明在κ=3时获得了最佳的聚类结果(图2B)。三个遗传亚型的一致性矩阵(图2D)和PCA结果(图2F)显示了良好的区分度。生存分析结果显示,双硫死亡亚型中最长的OS是亚型A(n=185),其次是亚型C(n=251),最差的是亚型B(n=135)(图2G)。而在基因型中,最差的OS是亚型C(n=90),其次是亚型B(n=266),最好的是亚型A(n=215)(图2H)。根据CIBERSORT方法的结果,三种双硫死亡亚型之间的免疫细胞浸润存在显著差异(图2I)。激活的B细胞、激活的CD4 T细胞、激活的CD8 T细胞、激活的树突状细胞、CD56明亮的自然杀伤细胞、CD56暗的自然杀伤细胞、γδT细胞、未成熟的B细胞、MDSC、巨噬细胞、肥大细胞、单核细胞、自然杀伤T细胞、调节性T细胞、T辅助细胞、T辅助细胞1型、T辅助细胞2型在A亚型中浸润水平最高,嗜酸性粒细胞、未成熟的树突状细胞和自然杀伤细胞在C亚型中浸润水平最高,而中性粒细胞和浆细胞样树突状细胞在B亚型中浸润水平最高。此外,作者还对三种基因型之间的DRG表达水平进行了差异分析,结果显示21个DRG在这三种遗传亚型之间表达差异显著(图2J)。
图2 RCC亚型的测定和相关性分析
图3 基于差异表达基因(DEGs)的功能富集分析和DRG预测模型构建
3. 基于与亚型相关的差异表达基因(DEGs)构建预测风险模型
如图3A所示,通过交集三个亚型的差异基因集,获得了1566个差异表达基因(DEGs)。然后,作者对这1566个DEGs进行了GO分析(图3B)和KEGG分析(图3C)。蛋白酶体介导的泛素依赖性蛋白降解过程、调节肌动蛋白细胞骨架组织、肌动蛋白聚合或解聚、正调控WNT信号通路以及硫化合物生物合成过程是生物学过程(BP)方面的主要富集项。泛素连接酶复合物、肌动蛋白丝、肌动蛋白肌肉、皮质细胞骨架以及蛋白酶体复合物是细胞组分(CC)方面的主要富集项。肌动蛋白结合、Ras GTP酶结合、泛素样蛋白转移酶活性、蛋白结合、桥接以及NADP结合是分子功能(MF)方面的主要富集项。调节肌动蛋白细胞骨架、MAPK信号通路、癌症中的蛋白聚糖、泛素介导的蛋白质降解、鞘脂信号通路、癌症中的胆碱代谢、NF-kappa B信号通路、Th1和Th2细胞分化、PD-L1表达和PD-1检查点通路以及多种物种的凋亡是KEGG通路方面的主要富集项。然后,通过R软件的Caret包,将571个样本随机分为训练组(n=285)和测试组(n=286)。通过对1566个差异表达基因进行单变量Cox回归分析,筛选出1187个与生存期相关的基因。随后,作者对1187个与OS相关的基因进行了LASSO Cox回归分析(图3D,E),最终确定了五个基因来构建DRG风险模型。
每个队列根据中位数风险评分被分为高风险组和低风险组。两组之间24个DRG的表达水平差异分析显示,在高风险组和低风险组之间有19个DRG的表达存在差异(图3F)。生存分析结果显示,高DRG风险组的RCC患者的总生存期比低DRG风险组的患者更差,无论是在训练队列还是测试队列中(图3G,H)。这些结果表明,DRG风险模型和与之相关的基因是RCC患者的关键预后标志物。
4. 临床特征、生存状况和风险评分之间的相关性分析
风险曲线和生存状态图的结果显示,患者的生存状态与风险评分之间存在强烈的正相关性,并且在训练队列(图4A)和测试队列(图4B)中,高风险组和低风险组之间的五个模型基因的差异表达保持一致。随时间变化的ROC曲线显示,DRG风险模型在预测训练队列(图4C)和测试队列(图4F)的1年、3年和5年生存率方面具有良好的准确性。PCA结果显示,与直接用于区分RCC样本的24个DRG相比(图4D),作者的DRG风险模型能够准确区分高风险组和低风险组的RCC样本(图4G)。此外,作者还研究了风险评分与临床特征的关系,并结合患者的临床特征,结果显示晚期RCC患者的风险评分较高(图4E)。基于TCGA数据库的全癌症文件预测患者的PFS的结果显示,高风险组的患者PFS较差(图4H)。对于上述结果,作者得出结论:在组织学分级、病理分期和预后方面,DRG风险评分与RCC患者之间存在显著关联。
图4 生存状态、DRG评分和临床特征之间的相关性分析结果
5. 评估预测效果,并进行独立预后分析
根据获得的临床数据文件和风险文件,作者通过R软件的rms包绘制了一个诺莫图,用于预测患者在1年、3年和5年的存活可能性(图5A)。校准图和ROC曲线的结果显示,该诺莫图在预测存活方面达到了令人满意的准确性(图5B、C)。DCA决策曲线的结果显示,该诺莫图在预测患者5年存活可能性方面最为有效(图5D-F)。随后,作者将风险评分与临床特征结合进行了单变量和多变量Cox回归分析,结果显示,基于五个基因的风险模型、年龄、组织学分级和病理分期均为独立的预后因素(图5G、H)。
图5 风险评分的标尺制定和独立预后分析的发展
6. 基于DRG风险评分的免疫景观和免疫治疗敏感性
根据CIBERSROT算法显示的DRG风险评分与免疫细胞浸润之间的相关性,作者仅选择了十种类型的免疫细胞,并且结果显示DRG风险评分与B细胞记忆、活化NK细胞、浆细胞、活化T细胞CD4记忆、T细胞CD8、滤泡辅助T细胞、调节性T细胞(Tregs)呈正相关,与M2巨噬细胞、单核细胞、γδT细胞呈负相关(图6A)。这五个模型基因也与免疫细胞浸润呈强相关(图6B)。免疫功能富集分析结果显示,高风险组富集在CCR、细胞溶解活性、促炎、副炎症、T细胞共刺激和I型干扰素反应上,而低风险组富集在MHC-I类和II型干扰素反应上(图6C)。TIDE评分评估显示高风险组更有可能发生免疫逃逸,表明患者更不可能从免疫疗法中获益(图6D)。TME评分结果显示,高风险组和低风险组之间的免疫细胞评分和综合评分存在显著差异,而基质细胞评分则没有显著差异(图6E)。
图6 与风险评分相关的肿瘤微环境浸润结果、免疫功能分析结果和TIDE评分结果
7. 分型结果、体细胞突变、危险组和功能富集分析之间的关系
桑基图显示了基于三种残疾表型、三种基因型和DRG风险亚组的患者比例(图7A)。不同的亚型有不同的风险评分。在不利的分类中,B型的风险评分最高,其次是C型,最后是A型(图7B)。在基因分型中,C基因型的风险评分最高,其次是B基因型,最后是A基因型(图7C)。这与基于分类的生存分析的先前结果一致,即分类的风险评分越高,预后越差。体细胞突变分布的瀑布图显示,在两个风险组中变化最大的十个基因是VHL、PBRM1、TTN、SETD2、BAP1、MTOR、MUC16、KDM5C、DNAH9和LRP2。在高DRG组(图7E)中,最常突变的基因是VHL(42%)、PBRM1(33%)、TTN(16%)、SETD2(16%)、BAP1(12%)和MTOR(10%)。在低DRG组(图7F)中,最常突变的基因是VHL(41%)、PBRM1(39%)和TTN(15%)。同时,高风险组和低风险组之间的肿瘤突变负荷存在统计学上的显著差异,高风险组的肿瘤突变负荷高于低风险组(图7G)。高风险组和低风险组的GSEA富集分析结果显示,高风险组主要富集于补体活性、吞噬识别、免疫球蛋白复合物、免疫球蛋白复合物循环和抗原结合功能(图7D),而低风险组主要富集于剪接体SNRNP组装、剪接体TRI-SNRNP复合物组装、细胞顶部、剪接体SNRNP复合物、剪接体TRI-SNRNP复合物功能(图7H)。GSVA的结果通过热图进行可视化(图7I)。接下来,作者从高风险组和低风险组筛选出差异表达基因进行GO和KEGG功能富集分析,并观察到这些基因在不同的功能和通路中富集。GO结果显示,主要富集在细胞外基质解聚、调节底物依赖性细胞扩展、上皮向间质转化的正向调节、调节性T细胞分化、肌动蛋白-肌球蛋白丝滑动、免疫球蛋白复合物、循环、细胞质囊泡腔、基底膜、基于肌动蛋白的细胞突起群、高密度脂蛋白粒子、硫化合物结合、内切肽酶抑制剂活性、半胱氨酸型内切肽酶调节剂活性参与凋亡过程、赋予拉伸强度的细胞外基质结构成分、磷脂酶A2活性(消耗1,2-二棕榈酰磷脂酰胆碱)功能(图7J)。KEGG结果显示,主要富集在细胞因子-细胞因子受体相互作用、补体和凝血级联反应、病毒蛋白与细胞因子和细胞因子受体的相互作用、IL-17信号通路、TNF信号通路、蛋白消化和吸收、阿米巴病、矿物质吸收、类风湿性关节炎、百日咳、胆固醇代谢途径(图7K)。
图7 不同风险组下的聚类结果相关性分析、体细胞变异分析和功能富集分析
8. 基于DRG评分的药物敏感性分析
作者对高风险组和低风险组进行了几种抗癌药物的药物敏感性分析,使用药物的IC50值来表示药物敏感性,并筛选出了许多具有敏感性差异的药物;作者仅选择了六种药物进行演示。高风险组对卡莫司汀、厄洛替尼和吉非替尼更敏感(图8A-C),而低风险组对JAK_8517、索拉非尼和替莫唑胺更敏感(图8D-F)。这些结果表明DRG评分对于药物选择至关重要。
图8 风险群体与药物敏感性之间的相关性分析
9. MSH3可能是肾癌中的一个重要的预后预测标志物
在作者对RCC中五个模型基因的表达进行调查时,作者发现四个基因(MSH3、CRB3、AUP1、RNF10)的表达差异显著(图9A)。相关性弦图显示了这五个模型基因之间的密切关联(图9B)。在对MSH3的研究中,发现随着MSH3的表达增加,其余四个基因的表达也以不同程度发生变化(图9C)。RCC中MSH3的表达被下调(图9D),表达MSH3较低的患者的生存期更糟糕(图9E),ROC曲线显示使用MSH3预测RCC患者预后的准确性较好(图9F)。此外,作者还发现MSH3与RCC患者的临床特征相关。组织学分级较高的患者MSH3的表达较低(图9G),发生转移的患者MSH3的表达较低(图9H),表达MSH3较低的患者的生存期、疾病特异生存期和无进展生存期更糟糕(图9I-K)。
图9 关键基因MSH3对RCC患者的预后有重要影响
接下来,作者分析了MSH3与免疫检查点相关基因之间的相关性,并发现有许多与MSH3相关的免疫检查点基因表达水平(图10A)。作者通过箱线图和棒棒糖图展示了与MSH3相关的免疫微环境浸润景观(图10B、C)。调节性T细胞(Tregs)是肿瘤微环境中常见的免疫细胞,可以抑制免疫反应。它们通过使机体产生对肿瘤细胞的抗原耐受性,促进癌症的发生和发展,从而使肿瘤细胞逃避机体的免疫杀伤作用。MSH3与Tregs之间的相关性分析显示,MSH3的表达水平越低,Tregs的含量越高,预示着预后不良(图10D)。此外,作者对MSH3和NCKAP1进行了Spearman相关性分析,结果显示MSH3与NCKAP1之间存在强正相关(图10E)。根据TCGA数据库的免疫治疗全癌症数据文件,作者使用小提琴图展示了与MSH3相关的免疫治疗情况(图10F、G)。GSEA结果显示,MSH3高表达组主要富集在移植排斥反应中,而MSH3低表达组主要富集在凝血、上皮间质转化、肌肉生成和蛋白质分泌中(图10H)。作者对高低表达水平的MSH3样本进行差异分析,并对获得的差异基因进行功能富集分析。GO分析结果显示,这些差异基因主要富集在体液免疫应答、细胞外基质组织、急性炎症反应、蛋白激活级联、含胶原的细胞外基质、血液微粒子、免疫球蛋白复合物、循环免疫球蛋白复合物、丝氨酸型内切酶抑制剂活性、免疫球蛋白受体结合、肽酶抑制剂活性、受体配体活性功能(图10I)。KEGG分析显示,这些基因主要富集在神经活性配体-受体相互作用、细胞因子-细胞因子受体相互作用、IL-17信号通路、cAMP信号通路、JAK-STAT信号通路、造血细胞系谱、多巴胺能突触、昼夜节律调控、胆固醇代谢、原发性免疫缺陷通路(图10J)。在先前的研究中,NCKAP1是一种名为双硫死亡的新型细胞死亡方式的促进基因,NCKAP1的过表达促进了肿瘤细胞的双硫死亡,从而抑制了肿瘤细胞。综上所述,作者认为MSH3可以成为预测RCC预后的关键标志物,并希望为免疫微环境、免疫治疗、癌症相关功能和通路的研究增添一份贡献。
图10 对与MSH3相关的生物信息学进行全面评估
10. 在葡萄糖饥饿条件下,MSH3的过度表达促进了786-O细胞和A498细胞中的双硫死亡
为了进一步验证RCC中MSH3的表达水平,作者检测了人肾皮质近曲小管上皮细胞和RCC细胞系中MSH3的蛋白表达水平。结果显示,RCC细胞系中MSH3的蛋白水平较低(图11A),与作者之前的结论一致。作者成功地在786-O和A498细胞系中过表达了SLC7A11(图11B)。作者转染了MSH3到过表达SLC7A11的细胞中,结果显示MSH3的转染对SLC7A11的表达没有显著影响(图11C)。细胞死亡实验的结果显示,在葡萄糖饥饿和SLC7A11过表达条件下,MSH3的过表达促进了786-O细胞(图11D)和A498细胞(图11E)的细胞死亡。葡萄糖饥饿会耗尽ATP,而葡萄糖饥饿确实会降低RCC细胞的细胞内相对ATP水平。然而,测试过表达MSH3和SLC7A11的RCC细胞的相对ATP水平显示,MSH3的过表达对相对ATP水平没有显著影响(图11F、G),但在葡萄糖饥饿条件下显著促进了细胞死亡。因此,在葡萄糖饥饿和SLC7A11过表达条件下,由MSH3过表达引起的细胞死亡并非由ATP耗竭引起。为了证明在葡萄糖饥饿和SLC7A11过表达条件下,MSH3在RCC细胞中的过表达是否能促进双硫死亡的发生,并排除其他已知的细胞死亡方式的发生。作者使用了多种细胞死亡抑制剂,包括铁死亡抑制剂铁蛋白-1(Ferr-1)和凋亡抑制剂(Z-VAD-FMK)。此外,作者还使用了一种高效的二硫键还原剂三(2-羧乙基)磷酸(TCEP)。以上试剂分别用于处理在葡萄糖饥饿和SLC7A11过表达条件下过表达MSH3的RCC细胞。结果显示,Ferr-1和Z-VAD对由MSH3过表达引起的RCC细胞在葡萄糖饥饿和SLC7A11过表达条件下的细胞死亡没有挽救效果,而TCEP完全抑制了由MSH3过表达引起的RCC细胞在葡萄糖饥饿和SLC7A11过表达条件下的细胞死亡(图11H,I)。总结一下,作者的研究结果表明,MSH3的过度表达结合葡萄糖饥饿可以在SLC7A11过度表达的RCC细胞中诱导双硫死亡。
图11 细胞实验表明,MSH3促进了双硫死亡
总结
在这项研究中,作者调查了DRGs对RCC预后的影响,确定了与双硫死亡相关的亚型,并展示了不同亚型的免疫景观。然后,作者基于五个DRGs开发了一种新的预后预测模型,并确认它能够准确预测RCC患者的生存期,展示了与风险评分相关的临床特征、体细胞变异、肿瘤微环境浸润和药物敏感性的差异。最后,作者还确定了与RCC患者预后和双硫死亡相关的MSH3基因。总之,作者的研究可能为RCC的亚型和治疗提供新的见解。