GEO数据中探针ID的转换
尔云间 一个专门做科研的团队

在使用GEO数据的过程中,经常会遇到表达矩阵是探针ID不是我们分析所需要的gene symbol,这时候就需要去对表达数据的探针ID进行转换。接下来我们我们以GSE63067为数据为例进行数据探针ID转换。

1、下载GEO数据,提取表达矩阵,观察表达矩阵中行名是否为探针ID。
通过查看我们发现该表达矩阵的行名为1007sat,1053at,117at,它们是探针ID,不是gene symbol。
通过命令我们可以查看提取的idprob文件中每个探针ID都有对应的gene symbol,idprob文件的ID列正好与第一步中表达矩阵的行名一致接下来就可以进行ID转换了。
通过查看生成的expr_1文件,现在的表达矩阵的行名已经变成了gene symbol,至此探针ID转换就完成了。

推荐阅读
关注小果,小果将会持续为你带来更多生信干货哦。

“生信果”,生信入门、R语言、生信图解读与绘制、软件操作、代码复现、生信硬核知识技能、服务器、生物信息学的教程,以及基于R的分析和可视化等原创内容,一起见证小白和大佬的成长。