一种简单的进行探针ID转换的方法
尔云间 一个专门做科研的团队
在使用芯片数据时经常遇到提取后表达矩阵的探针是全数字的或者字母加数字的,最近小果也遇到同样的问题,如何转换以ILMN_开头的探针ID,这种类型的探针是由Illumina平台产生的,对于小白来说不用进行过多的R语言操作也可进行id转换。小果的操作步骤如下,仅供大家参考:

代码如下:
eSet3 <- getGEO("GSE89632",
destdir = '.',
getGPL = F)
View(eSet3)
exp3 <- exprs(eSet3[[1]])
exp3[1:4,1:4]
dim(exp3)
write.table(exp3, file = "exp3.txt", quote = F, sep="\t")
查看提取到的表达矩阵的结果,探针ID格式均以ILMN_开头

2. 提取表达矩阵的行名,并保存成a.txt文件
代码如下:
a=rownames(exp3)
write.table(a, file = "a.txt", quote = F, sep="\t")
然后用excel打开a.txt文件,观察文件格式(如下图),可以看到文章有两列,B列是我们需要的。

3. 打开gprofiler网站
(https://biit.cs.ut.ee/gprofiler/convert),复制B列数据,粘贴到query框中,选择需要的物种与Target namespace,点击Run query。

4. 运行完成后的导出运行结果,保存为list.txt。

5. 用excel打开list.txt和exp3.txt,使用VLOOKUP函数,用list.txt中转换后的ID匹配到exp3.txt中,最终得到选转换后的表达矩阵。


好了,今天小果的分享就到这里,大家快去实践吧。