利用R语言进行Ensembl ID转换为Gene name
尔云间 一个专门做科研的团队
欢迎点赞+收藏+关注

今天在做ssGESA分析的时候发现,TCGA下载的基因ID为Ensembl ID,下载的基因集为Gene name,在做分析之前要做一下基因ID转化,代码如下:
01 安装需要的R包
install.packages(“tidyverse”)
02 导入需要的R包
library(tidyverse)
03 数据下载
在Xena数据库下载表达矩阵和ID对应表格
#表达矩阵下载
wget https://gdc-hub.s3.us-east-amazonaws.com/download/TCGA-KIRC.htseq_fpkm.tsv.gz
#基因ID转化列表
wget
https://gdc-hub.s3.us-east-amazonaws.com/download/gencode.v22.annotation.gene.probeMap
04 代码展示



最终将Ensembl ID转化为gene name,有需要的可以借鉴学习,在这里需要注意的是多个Ensembl ID对应一个Gene name。
小果今天的分享就到这里。

生信人R语言学习必备
立刻拥有一个Rstudio账号
开启升级模式吧
(56线程,256G内存,个人存储1T)

“生信果”,生信入门、R语言、生信图解读与绘制、软件操作、代码复现、生信硬核知识技能、服务器、生物信息学的教程,以及基于R的分析和可视化等原创内容,一起见证小白和大佬的成长。