欢迎光临散文网 会员登陆 & 注册

4.5分+纯生信!单细胞+bulk RNA-seq + WGCNA联合分析,外加肿瘤微环境新切入点“内皮

2023-06-15 19:00 作者:生信鸟  | 我要投稿

肿瘤微环境一直是生信文章的热门话题,那么,提到肿瘤微环境你会想到哪些?一张图告诉你!

(图片来源:de Visser KE, Joyce JA. The evolving tumor microenvironment: From cancer initiation to metastatic outgrowth. Cancer Cell. 2023 Mar 13;41(3):374-403. )

图片显示了癌症进展所有阶段的肿瘤微环境(TME)演变以及关键的代表性细胞类型。正常组织微环境可以通过多种免疫细胞、肿瘤相关成纤维细胞(CAF)、细胞外基质(ECM)的抑制作用来抑制肿瘤的生长。但是癌症的进展却是要影响TME中的细胞成为肿瘤促进剂,导致原发部位的增殖、侵袭和转移。所以,这些细胞陆陆续续成为了常见生信分析的热点话题。

然而,癌细胞的迁移、侵袭和转移离不开血管的作用。内皮细胞作为血管的重要组成成分,主要功能是调节血管功能,如通透性、内吞作用和血管生成。这么重要的“内皮细胞”却沦落为生信中的冷门话题!

所以今天布小谷给大家推荐一个新的但却容易被忽略的切入点——“内皮细胞”!

目前内皮细胞基本上都是在做临床和基础实验,可还有很多小伙伴没有实验条件或者急需文章,不怕,这时候就该请出咱们“生信”大佬出手啦!

凭布小谷对热点的嗅觉,内皮细胞说不定是一员猛将哦~~

利用内皮细胞相关基因做生信暂时还比较少,那么这波入手内皮细胞生信绝对是个良机!!哦吼,真是大大的惊喜,是时候加速卷起来了呀~~所以有想法的朋友可得搞快些~ ~

话不多说,快来看看“内皮细胞”是如何玩转肿瘤4.5分+纯生信的——利用scRNA-seq数据获得内皮细胞的标记基因,结合bulk RNA-seq数据并利用WGCNA分析构建了GBM的预后模型,再加上验证队列以及一系列突变、免疫、功能分析等等。经典预后模型构建套路,超高性价比,换个疾病快快学起来!(ps:没有思路、不知道怎么创新的找布小谷,超多个性化的分析思路供你选择哦!)

l 题目:胶质母细胞瘤中内皮细胞hub基因的表达——结合单细胞RNA测序和bulk RNA测序的GBM患者预后模型

l 杂志:BMC Cancer.

l 影响因子:IF=4.638

l 发表时间:2022年12月

 

研究背景

多形性胶质母细胞瘤(GBM)是全球最常见的恶性肿瘤之一,其预后很差,虽然辅助药物和手术治疗会在一定程度上改善患者预后,但总体生存率(OS)仍然很低,部分原因是肿瘤微环境和免疫逃避的机制尚未完全了解,而且高级别胶质瘤在空间和时间上具有异质性。目前针对内皮细胞的抗血管生成治疗越来越受到关注。因此,这篇文章利用scRNA-seq发现内皮细胞中的标记基因,并结合传统的bulk RNA-seq构建GBM患者的预后模型。

 

数据来源


研究思路

从TCGA和CGGA数据库中获得bulk RNA-seq数据,从GEO数据库中获得10x的GBM scRNA-seq数据。UMAP方法用于数据降维和聚类识别。通过Find All Markers函数识别不同细胞聚类的标记基因。通过加权基因相关网络分析(WGCNA)鉴定关键模块和差异表达基因(DEGs)。使用非负矩阵分解(NMF)算法来识别基于DEGs的不同亚型,并使用多变量Cox回归分析构建预后模型。最后,研究了不同风险组之间在突变情况、免疫细胞浸润、免疫检查点抑制剂相关基因和富集通路方面的差异。

 

主要结果

1. 胶质母细胞瘤和正常样本的scRNA-seq和细胞分型

对GSE162631数据集中四个GBM和四个正常样本的scRNA-seq数据进行处理与分析,共识别出13个不同的细胞聚类(图1A、B),并鉴定出四种细胞类型(内皮细胞、单核细胞、巨噬细胞和中性粒细胞)(图1C)。通过Find All Markers函数识别不同细胞聚类的标记基因。Fishers精确检验明确内皮细胞(ECs)为最重要的细胞类型,功能富集分析表明,这些细胞类型主要参与经典抗体介导的补体激活、跨膜转运、5-羟色胺受体和心磷脂合成(图1D)。

图1 胶质母细胞瘤和正常样本的scRNA-seq和细胞分型

2. DEGs的识别及hub基因的鉴定

对TCGA-GBM和GTEx队列进行差异性分析,共筛选出3911个差异表达基因(DEGs,2021个上调,1901个下调)(图2A)。然后对TCGA-GBM进行WGCNA分析,识别出8个模块(图2D),其中绿松石色和棕色的模块与GBM的发育显著相关。将ECs的标记基因与WGCNA的模块基因相交,并进行单变量COX回归分析,鉴定出28个基因与GBM预后相关(图2E、F)。

 

图2 DEGs的识别及hub基因的鉴定

3. 不同分子亚型识别

根据单变量分析获得的DEGs,使用NMF算法将所有患者分为两个聚类(图3A)。生存曲线结果显示,聚类2的患者比聚类1的患者具有更好的OS(图3D)。MCPCounter算法显示聚类2中细胞毒性淋巴细胞的浸润水平较高,而聚类1中成纤维细胞的浸润水平较高(图3C)。提示这两个聚类具有不同预后和免疫学特征。经过两组基因表达的差异性分析,56个基因在聚类2中下调,12个基因在聚类2中上调(图3E)。GO和KEGG富集分析,这些DEGs与生物过程(BP)类别中的“伤口愈合”和“水解酶活性的负调控”,细胞成分(CC)类别中“含有胶原的细胞外基质”,以及分子功能(MF)类别的“内肽酶抑制剂活性”有关(图3F),此外也与糖尿病中的HIF-1、P53和信号通路有关(图3G)。



图3 不同分子亚型识别

4. 预后模型的构建与验证

对28个预后基因进行LASSO和多变量COX回归分析,最终建立了一个包含四个基因的预后模型(TUBA1C、RPS4X、KDELR2和SLC40A1)(图4A)。根据风险评分中位数分为高风险组和低风险组。生存曲线显示,与低风险组相比,高风险组患者的OS更差(图4B),并且风险评分对GBM患者的OS具有良好的预测能力(图4C)。此外,单因素和多因素COX分析显示,与其他常见的临床特征相比,风险评分可以作为GBM患者的独立预后因素(图4D)。

 

图4 预后模型的构建与验证

5. 不同风险组之间突变情况、免疫相关和基因富集分析

卡方检验直方图显示,仅高风险组与IDH突变状态有关(图5F)。瀑布图显示TP53、TTN和PTEN是高风险组和低风险组中最常见的突变基因(图5A、B)。不同算法结果显示基底膜肿瘤微环境中免疫细胞的浸润与风险评分之间存在相关性(图5C)。此外,较高的风险评分与CD276、CD274和CD44的免疫检查点上调显著相关(图5D)。GSEA富集分析显示,P53信号通路、细胞周期、DNA修复和肌动蛋白细胞骨架的调节在高风险组富集,而帕金森病、核糖体、阿尔茨海默病和神经活性配体受体相互作用在低风险组富集(图5E)。

图5 不同风险组之间突变情况、免疫相关和基因富集分析

 

文章小结

这篇文章利用10×scRNA-seq数据获得内皮细胞的标记基因,结合bulk RNA-seq数据并利用WGCNA分析构建了GBM的预后模型+分子亚型。虽然整体内容没有脱离常规预后模型分析套路,但用上“内皮细胞”这一切入点后,身价倍增,毫不逊色,发到 4.5分+绝对名副其实!内皮细胞目前的生信发文量还不多,属于黄金抢发期!超高性价比,感兴趣的朋友,换个疾病快快学起来吧~

布小谷之声

如果您的时间和精力有限或者缺乏相关经验,并且对生信分析和思路设计有所需要的话,“生信鸟”非常乐意为您提供如下服务:免费思路评估、付费生信分析和方案设计以及实验项目实施等,有意向的小伙伴欢迎咨询布小谷哦!  

扫码咨询布小谷吧


4.5分+纯生信!单细胞+bulk RNA-seq + WGCNA联合分析,外加肿瘤微环境新切入点“内皮的评论 (共 条)

分享到微博请遵守国家法律