还在为缺少正常样本发愁吗,试试GTEX数据库吧

小伙伴们好啊,小云今天遇到了见麻烦事,这件事就是小云辛辛苦苦找到了需要的癌症数据集,但是没有正常样本,而小云的这个分析是离不开正常样本的,那这应该怎么办呢,小云不能卡在这里啊,于是小云找到了一个专门有正常样本的数据库,这就是GTEX数据库
GTEx,全称Genotype-Tissue Expression。这个数据库和TCGA和ICGC不同的是。TCGA和ICGC更多的还是肿瘤相关的数据,而GTEx收集的是正常人身上的组织来进行的测序,所以GTEx数据库包括的就只是 正常人的数据。
这个数据集的用处呢,一方面是可以研究正常人不同组织之间的基因表达的区别。另外的一个呢,就是和TCGA联合使用。由于TCGA重点收集的还是癌症组织的数据,对于其正常的数据收集的相对来说较少,由于正常样本少所以对于差异表达的结果可能就不是很准确。这个时候如果我们把GTEx的数据纳入进来。这样分析的结果就会准确一些了。
那么如何获取数据呢,一个比较简便的方法,就是通过http://xena.ucsc.edu/这个数据库下载,这里的DATA SETS里有GETX这个数据链接。

一般我们需要的是表型和表达量,我们拿到的数据是整个的数据集,里面有各个组织,需要根据需要来选择

这个数据库还是比较简单的,把需要的数据集文件下载下来就可以了,USCS Xena有整理好的文件,很是方便。好了,今天的内容就是这样了,有什么问题欢迎来和小云分享讨论啊。
