小云来教你巧妙利用Xena下载TCGA数据

各位小伙伴大家好,小云和大家又见面了,今天呢小云来教大家如何利用Xena下载TCGA数据。小云下面的内容将从以下方面展开:什么是TCGA数据库,利用Xena下载TCGA数据。
1. 什么是TCGA数据库?
TCGA全称为The Cancer Genome Atlas,中文名称为癌症基因组图集,它是一个具有里程碑意义的癌症基因组学项目,对20,000多种原发性癌症进行了分子表征,并匹配了横跨33种癌症类型的正常样本。除此之外还有多组学数据,包括基因表达数据、拷贝数变异、DNA甲基化等数据数据库地址为:https://www.cancer.gov/about-nci/organization/ccg/research/structural-genomics/tcga。

2. 利用Xena下载TCGA数据
关于TCGA数据下载,在这里小云以下载肝癌LIHC数据的基因表达数据,临床数据和生存数据为例进行数据下载。
第一步:进入Xena网站首页,地址为:http://xena.ucsc.edu/,依次点击launch Xena,DATA SETS,到达数据集页面。

第二步:选取肝癌数据集,如下所示,点击进入TCGA Liver Cancer(LIHC)数据集。

第三步:在LIHC中选择自己想要下载的数据,比如说下载基因表达数据,点击gene expression RNAseq下的IlluminaHiSeq (n=423) TCGA Hub,数据就会自动开始下载了。

再比如说下载临床数据和生存数据,找到phenotype,可以看到有生存数据:Curated survival data (n=438) TCGA Hub和临床数据:Phenotypes (n=438) TCGA Hub,点击就可以直接下载。

以上呢就是小云使用Xena下载TCGA数据的分享,小伙伴们快去试试吧。
