欢迎光临散文网 会员登陆 & 注册

简单使用ICGC数据库进行数据查询与下载

2022-12-29 12:18 作者:小云爱生信  | 我要投稿

尔云间  一个专门做科研的团队

原创 小果 生信果 2


各位小伙伴大家好,今天小果给大家介绍一个非常有用的数据库--ICGC数据库,这个数据可以帮助小伙伴解决在数据分析过程中验证数据集不太理想的问题,今天的内容大致分为两块:一是ICGC数据库简介,二是数据查询与下载

1、ICGC数据库简介

ICGC全称为International Cancer Genome Consortium,中文翻译过来是国际肿瘤基因组协作组,它的目标是为全面阐明导致全球人类疾病负担的多种癌症中存在的基因组变化,该数据库收录了来自亚洲、澳大利亚、欧洲、北美和南美17个地区的89个项目,大约包括25000个癌症基因组。


IGCG数据库有50种不同癌症类型(或亚型)的肿瘤数据,其中包括基因异常表达,体细胞突变,表观遗传修饰,临床数据等。如果一般的癌症基因组数据库无法满足小伙伴的需求,可以使用该数据库作的数据来源做验证,以此来补充验证使用TCGA 和 GEO 的数据分析建立的模型。网址为:

https://icgcportal.genomics.cn/。

图片

进入主页后可以看到网站主要有五个功能模块,分别为Cancer Projects、Advanced Search、Data Analysis、DCC Data Releases、Data Repositories。小伙伴可以根据自己的需求自行选择不同的模块进行使用。


2、数据查询与下载

在这里呢小果以肝癌(LIHC)为例,进行数据的查询,然后下载对应的临床数据与基因表达数据。


1.进入ICGC主页,在快速搜索框中输入LIHC,点击Search,数据库就会自动帮助我们检索所有关于LIHC的信息。

图片


2.查看查询结果,选择需要的数据点击进行查看,在这里小果选择查看LIHC整个项目。 

图片


点击LIHC项目条目后,进入到LIHC项目中,可以看到整个项目的数据的概况,如下图

图片


3.在Available Data Types目录下, 点击查看Clinical Data后的蓝色字样377 donors,此时会进入到一个新的页面,如下图所示。

图片


4.进入新页面后,点击Download Donor Data,此时会出现弹窗,这里呢小果选择选择临床数据:Clinical Data和基因表达数据:Sequence-based Gene Expression (EXP-S)数据进行,点击Download进行数据下载。

图片


以上就是小果今天的分享,小伙伴们有没有学会呢,赶快去试试吧。


推荐阅读


简单使用ICGC数据库进行数据查询与下载的评论 (共 条)

分享到微博请遵守国家法律