欢迎光临散文网 会员登陆 & 注册

GEO数据库之GPL文件学习

2023-01-31 09:26 作者:小云爱生信  | 我要投稿

尔云间  一个专门做科研的团队

原创 小果 生信果 

GEO数据库使用过程中,GPL文件是接触最多的数据之一,那么GPL文件是什么,它又是什么样的?带以上的问题去学习GPL文件。

GPL(GEO Platform)是GEO芯片或数据测序时使用芯片的平台,包含有注释信息,探针信息等。接下来我们以GPL17586 数据为例进行GPL文件学习。


登录到GEO数据库首页(Home - GEO - NCBI (nih.gov) ),然后再搜索框输入GPL17586 ,进行数据检索,检索到的GPL结果如下:

Platform GPL1786:意在说明GPL的ID是 GPL1786

Status:说明数据的状态是公开的,时间是2013年8月20日

Tilte:说明芯片的名字

Technology type:产生数据时用的技术类型

Distribution:说明数据用在哪里

Organism:数据来源于哪个组织

Manufacturer :数据产生的单位是哪里

Manufacture protocol See manufacturers websit:说明数据的生产规程需要去生产商网页查看

Description :就是描述芯片注释的过程,以及注释所使用的参考基因组版本,注释的日期等相关信息


Submission date :数据提及的时间 

Last update date :数据最后更新的时间

Organization :说明组织机构的名称 

E-mail(s) :机构邮箱

Phone:机构联系电话 

URL:机构官方网站

Street address :机构地址 

City :机构所在城市

State/province :机构所在州或者省份 

ZIP/Postal code:机构邮编

country:机构所在国家 

Samples :样本数目

Series :使用该芯片平台的GEO数据系列


Relations:说明与该芯片平台相关的一些其它的芯片平台信息

Data table header descriptions:是芯片注释平台的表头描述

ID:是指探针的编号 

probeset_id:表达集的探针编号

seqname:染色体名称 

strand:是指正列还是负列

start:起始位置 

stop:终止位置

total_probes:总的探针数目 

gene_assignment:基因的描述

mrna_assignment:mrna的描述 

swissprot:蛋白数据库的描述

category:种类 

spot_ID:spot格式的ID


Data table:就是所有的详细数据

Total number of rows: 就是对文件列数的描述


至此,对GPL文件的学习就结束了。

shengxinguoer

生信果


生信硬核知识解答

和小果一起学生信


GEO数据库之GPL文件学习的评论 (共 条)

分享到微博请遵守国家法律