欢迎光临散文网 会员登陆 & 注册

R语言GSVA包实现ssGSEA分析,带你探索肿瘤细胞免疫浸润的多样性!

2023-08-22 09:21 作者:小云爱生信  | 我要投稿

尔云间  一个专门做科研的团队

欢迎点赞+收藏+关注

生信人R语言学习必备

立刻拥有一个Rstudio账号

开启升级模式吧

(56线程,256G内存,个人存储1T)

  • hi!今天,小果要再给大家介绍一个好用的免疫浸润工具包。

  • 在这个教程中,我将介绍如何使用 GSVA 包实现对基因数据集的免疫浸润分析,并根据结果绘制 Boxplot 图,以比较不同样本分类之间的细胞浸润水平差异。感兴趣的话就和小果一起来看吧!

GSVA包的安装与导入


准备数据

首先,我们需要准备两个数据文件:

一个包含基因表达信息的数据文件 :tumor_all_gene_exp.txt。该文件的每一列表示一个基因,在不同样本中的表达情况以数字表示。

一个包含基因集信息的符合 MMC3 数据库格式的文件:mmc3.csv。该文件包含多个基因集(pathway),每个基因集有一个唯一的编号和名称,每一条记录代表该基因集中的一个基因。

小果温馨提示,对于这两个文件,其行名和列名需与代码相应位置要求一致,否则后续操作可能会出错哦!

#读入基因表达数据和基因集信息:


数据预处理

将 gene_set 中的基因按照基因名称分组,以便后续直接输入 GSVA 函数中使用。

接下来,我们使用 gsva 函数计算基因集变化分析指标(GSVA),gsva()函数是一种基于非参数方法的通路富集分析(Pathway Enrichment Analysis)工具,而通路富集分析也是免疫浸润分析中常见的一个应用哦!它用于计算基因表达谱中每个样本与指定基因集的关联程度,将其转化为一个连续值得分。

最后,我们并结果存储到 cellInfiltration_matrix_score.csv 文件中。

运行上述代码后,会在工作目录中生成一个名为 cellInfiltration_matrix_score.csv 的文件,其中包含了每个样本在不同基因集中的 GSVA 得分哦。

至此,我们已经完成了GSVA对基因表达数据的计算分析,我们先来看一下计算之后的部分结果是什么样吧!


绘制箱线图实现结果可视化

计算完成后,我们如何将结果可视化展示出来呢?和小果一起来看一下吧!

接下来,我们将使用 ggplot2、ggpubr 和 ggsignif 包进行绘图。

首先读入数据文件和样本信息文件:

将 data 中的 cluster 列替换为样本分组信息并调整列的顺序:

data$cluster=group$Group

data=data[,c(29,1:28)]

将调整后的数据存储到表格文件 中。

write.csv(data,"28cell_boxplot_data.csv")

读入上述表格文件:

使用 ggplot2、ggpubr、ggsignif 包生成 Boxplot 图,并设置 Boxplot 的相关参数与格式,最终输出 28cell_3cluster_boxplot.pdf 文件,具体的代码流程我们一起来看一下:

#导入所需R包

运行上述代码后,会在工作目录中生成一个名为 28cell_3cluster_boxplot.pdf 的文件,其中包含了绘制好的 Boxplot 图哦!


小果再次提醒:以上代码仅为示例,实际使用时需要根据自己的数据、分析需求和环境对参数进行相应调整哦!

好啦,现在我们一起来看一下最后绘制的结果长什么样吧!

怎么样,今天的R包你学会怎么用了嘛?

“生信果”,生信入门、R语言、生信图解读与绘制、软件操作、代码复现、生信硬核知识技能、服务器、生物信息学的教程,以及基于R的分析和可视化等原创内容,一起见证小白和大佬的成长。

R语言GSVA包实现ssGSEA分析,带你探索肿瘤细胞免疫浸润的多样性!的评论 (共 条)

分享到微博请遵守国家法律