欢迎光临散文网 会员登陆 & 注册

GEO数据到底需不需要标准化,看这里

2023-01-16 09:25 作者:小云爱生信  | 我要投稿

尔云间  一个专门做科研的团队

原创 小果 生信果

最近收到果粉的一些私信,对GEO数据标准化提出了一些问题,今天小果就果粉提出的几个主要些问题进行答疑。

问题一

是不是所有的GEO数据都需要标准化,芯片数据标准化的方法有哪些?


答:不是所有的GEO数据都需要标准化。数据标准化数据四分位数标准化,均值标准化,log2标准化和TMM标准化。


问题二

哪些GEO数据不需要进行数据标准化?


答:GEO数据库有些数据是进行标准化的数据,比如说Series Matrix File(s)格式的文件和MINiML formmatted family file就是标准化之后的文件。这里小果分别对两个数据进行了截图。Series Matrix File(s)格式文件的表达矩阵:

MINiML formmatted family file格式文件的表达矩阵:

小伙伴可以观察到这两种数据的基因表达矩阵中的表达丰度值均在50之内,可以判断为是经过标准化的结果。


问题三

哪些GEO数据需要进行数据标准化?


答:上述说的这个标准不是绝对的,有时会遇到的基因表达矩阵是未经过标准化的,需要查看基因表达矩阵的表达丰度值来,有的基因表达矩阵中的表达丰度值在大于50,或者几百之间,甚至更大,此时就需要进行标准化。比如下面小果附上一个MINiML formmatted family file格式的基因矩阵,如下图

这时可以看到基因表达矩阵中的表达丰度值均在几千之间,这时就需要进行数据标准化。


另外就是对于原始的GEO数据,必须要进行数据标准化。总体来说,GEO数据标准具体要视情况而定,不能一概而论。

好了,至此答疑就结束了。小伙伴快去学起来吧。



推荐阅读


shengxinguoer

生信果


生信硬核知识解答

和小果一起学生信


GEO数据到底需不需要标准化,看这里的评论 (共 条)

分享到微博请遵守国家法律