免疫浸润必不可少的工具estimate
在这个春光无限好的烟花三月,在这个本应该四处游玩感受满园春色的三月,各地疫情频发,很多人被封印在了家里,我们一边密切配合疫情防控工作,一边默默等待疫情好转。
很多人感叹疫情蹉跎了我们的青春,其实没有,时间是把控在我们自己手中的。

小编只是个普普通通的生信分析党,在这个时间里除了日常工作之外,还一直在做的一件事情,就是将之前的免疫浸润知识(这毕竟是近很久一段时间的热点)和大家做一个分享,大家有其他的想要学习的方向也可以留言区告诉小编。
特殊时期,小编想多掌握些技能总是没有错的,疫情好转,发个SCI似乎也是个不错的选择,大家觉得呢?之前给大家介绍过其他的工具,那接下来我们就接着学习estimate工具吧~
利用癌症样本转录谱的独特性质来推断肿瘤细胞的内容以及不同的浸润正常细胞,称为Estimation of STromal and Immune cells in MAlignant Tumour tissues using Expression data(ESTIMATE)。
肿瘤微环境中,免疫细胞和基质细胞是两种主要肺肿瘤细胞类型;而ESTIMATE,利用表达谱数据来预测基质细胞和免疫细胞评分,进而预测这两种细胞的含量;最后可以计算每个肿瘤样本里面的肿瘤纯度了,也就是说,基质细胞和免疫细胞含量多,那肿瘤纯度低,反之肿瘤纯度就高了。
第一步 estimate R包的安装
library(utils)
rforge <- "http://r-forge.r-project.org"
install.packages("estimate", repos=rforge, dependencies=TRUE)
library(estimate)
第二步 准备数据
正常表达谱数据即可,ESTIMATE适用平台有"affymetrix", "agilent", "illumina",为了能让RNAseq数据能够适用ESTIMATE,可以使用VOOM法对RNAseq数据进行处理。
示例如下:

第三步 分析代码
in.file <- ‘sample_input.txt’ #输入文件
outfile2E <- ‘ESTIMATE_input.gct’ #生成ESTIMATE 的输入文件
outputgcT(in.file, outfile2E) #该函数以gcT格式写入输入文件
filterCommonGenes(input.f= in.file, output.f= outfile2E, id="GeneSymbol")
# 该功能将每个平台的不同数量的基因与10412个普通基因相结合。
## code chunk number 2: estimate
#这个功能计算基质,免疫,并估计得分每个样本使用基因表达数据。
estimateScore("ESTIMATE_input.gct", "ESTIMATE_score.gct")
plotPurity(scores="ESTIMATE_score.gct", samples="s516")
#根据ESTIMATE score绘制肿瘤纯度。
#将评分保存为txt格式
ESTIMATE_score <- read.table("ESTIMATE_score.gct", skip = 2,#前两行跳过
header = TRUE,row.names = 1)
ESTIMATE_score <- ESTIMATE_score[,2:ncol(ESTIMATE_score)]
write.table(ESTIMATE_score,file = "ESTIMATE_score.txt",quote = F,sep = "\t")
第四部 示例结果展示


好啦,estimate的介绍就到这里啦,大家可以找些表达谱数据,用代码试一试。
欢迎关注“云生信学生物信息学”获取更多干货哦~
