GEO数据到底需不需要标准化,看这里
尔云间 一个专门做科研的团队

最近收到果粉的一些私信,对GEO数据标准化提出了一些问题,今天小果就果粉提出的几个主要些问题进行答疑。

问题一
是不是所有的GEO数据都需要标准化,芯片数据标准化的方法有哪些?
答:不是所有的GEO数据都需要标准化。数据标准化数据四分位数标准化,均值标准化,log2标准化和TMM标准化。
问题二
哪些GEO数据不需要进行数据标准化?
答:GEO数据库有些数据是进行标准化的数据,比如说Series Matrix File(s)格式的文件和MINiML formmatted family file就是标准化之后的文件。这里小果分别对两个数据进行了截图。Series Matrix File(s)格式文件的表达矩阵:

MINiML formmatted family file格式文件的表达矩阵:

小伙伴可以观察到这两种数据的基因表达矩阵中的表达丰度值均在50之内,可以判断为是经过标准化的结果。
问题三
哪些GEO数据需要进行数据标准化?
答:上述说的这个标准不是绝对的,有时会遇到的基因表达矩阵是未经过标准化的,需要查看基因表达矩阵的表达丰度值来,有的基因表达矩阵中的表达丰度值在大于50,或者几百之间,甚至更大,此时就需要进行标准化。比如下面小果附上一个MINiML formmatted family file格式的基因矩阵,如下图

这时可以看到基因表达矩阵中的表达丰度值均在几千之间,这时就需要进行数据标准化。
另外就是对于原始的GEO数据,必须要进行数据标准化。总体来说,GEO数据标准具体要视情况而定,不能一概而论。

好了,至此答疑就结束了。小伙伴快去学起来吧。
推荐阅读
shengxinguoer
生信果
生信硬核知识解答
和小果一起学生信