欢迎光临散文网 会员登陆 & 注册

利用R语言进行Ensembl ID转换为Gene name

2023-05-31 09:06 作者:小云爱生信  | 我要投稿

尔云间 一个专门做科研的团队

原创 小果 生信果

欢迎点赞+收藏+关注


今天在做ssGESA分析的时候发现,TCGA下载的基因ID为Ensembl ID,下载的基因集为Gene name,在做分析之前要做一下基因ID转化,代码如下:


01  安装需要的R包

install.packages(“tidyverse”)


02  导入需要的R包

library(tidyverse)


03  数据下载

在Xena数据库下载表达矩阵和ID对应表格

#表达矩阵下载

wget https://gdc-hub.s3.us-east-amazonaws.com/download/TCGA-KIRC.htseq_fpkm.tsv.gz

#基因ID转化列表

wget 

https://gdc-hub.s3.us-east-amazonaws.com/download/gencode.v22.annotation.gene.probeMap


04  代码展示

最终将Ensembl ID转化为gene name,有需要的可以借鉴学习,在这里需要注意的是多个Ensembl ID对应一个Gene name。

小果今天的分享就到这里。


生信人R语言学习必备

立刻拥有一个Rstudio账号

开启升级模式吧

(56线程,256G内存,个人存储1T)



生信果”,生信入门、R语言、生信图解读与绘制、软件操作、代码复现、生信硬核知识技能、服务器、生物信息学的教程,以及基于R的分析和可视化等原创内容,一起见证小白和大佬的成长。



利用R语言进行Ensembl ID转换为Gene name的评论 (共 条)

分享到微博请遵守国家法律