小果教你使用TCGA数据库下载拷贝数变异数据
尔云间 一个专门做科研的团队
关注我们

各位小伙伴们,大家好呀,我是你们的老朋友小果,最近收到许多粉丝朋友的留言,说是不知道怎么下载TCGA中的拷贝数变异数据,为此小果今天特地为大家带来TCGA下载突变数据教学。

今天的内容分为两小部分:
一是拷贝数变异简介,
二是拷贝数变异数据下载,
接下里就跟随小果一起去看看吧。

一、拷贝数变异简介
拷贝数变异(copy number variation, CNV)管道使用Affymetrix SNP 6.0阵列数据来识别重复的基因组区域并推断这些重复的拷贝数,circular binary segmentation (CBS)分析最终的输出文件被分割成带有每个区域估计拷贝数的基因组区域,GDC进一步将这些拷贝数值转化为片段均值,等于log2(copy-number/ 2)。
一、拷贝数变异数据下载
今天小果在这里以下载肝癌LIHC的拷贝数变异数据为例进行下载,下载步骤如下:
1.进入官网GDC:https://portal.gdc.cancer.gov/,在搜索框中输入LIHC,选择TCGA LIHC搜索

2.查看搜索结果,在Data Category下点击Copy Number Variation后面的数字376,进入单核苷酸突变数据页面
3.在单核苷酸突变数据页面点击FILE,Data Type选择Copy Number Segment ,Data Format选择txt,Access下选择open,点击Add ALL File to Cart。

4.点击完后,查看Cart中的数据情况,点击Downloads选择Cart进行数据下载,这样数据就会下载到本地了。

小果在这里需要说明的是小伙伴可以根据自己的需求下载数据,每个人的需求不一致,下载的内容也就不一样,流程大概一致。好了以上就是小果的分享,小伙伴们快去实践下吧。

推荐阅读
关注小果,小果将会持续为你带来更多生信干货哦。

“生信果”,生信入门、R语言、生信图解读与绘制、软件操作、代码复现、生信硬核知识技能、服务器、生物信息学的教程,以及基于R的分析和可视化等原创内容,一起见证小白和大佬的成长。