GEO数据库之GPL文件学习
尔云间 一个专门做科研的团队

在GEO数据库使用过程中,GPL文件是接触最多的数据之一,那么GPL文件是什么,它又是什么样的?带以上的问题去学习GPL文件。

GPL(GEO Platform)是GEO芯片或数据测序时使用芯片的平台,包含有注释信息,探针信息等。接下来我们以GPL17586 数据为例进行GPL文件学习。
登录到GEO数据库首页(Home - GEO - NCBI (nih.gov) ),然后再搜索框输入GPL17586 ,进行数据检索,检索到的GPL结果如下:

Platform GPL1786:意在说明GPL的ID是 GPL1786
Status:说明数据的状态是公开的,时间是2013年8月20日
Tilte:说明芯片的名字
Technology type:产生数据时用的技术类型
Distribution:说明数据用在哪里
Organism:数据来源于哪个组织
Manufacturer :数据产生的单位是哪里
Manufacture protocol See manufacturers websit:说明数据的生产规程需要去生产商网页查看
Description :就是描述芯片注释的过程,以及注释所使用的参考基因组版本,注释的日期等相关信息

Submission date :数据提及的时间
Last update date :数据最后更新的时间
Organization :说明组织机构的名称
E-mail(s) :机构邮箱
Phone:机构联系电话
URL:机构官方网站
Street address :机构地址
City :机构所在城市
State/province :机构所在州或者省份
ZIP/Postal code:机构邮编
country:机构所在国家
Samples :样本数目
Series :使用该芯片平台的GEO数据系列

Relations:说明与该芯片平台相关的一些其它的芯片平台信息
Data table header descriptions:是芯片注释平台的表头描述
ID:是指探针的编号
probeset_id:表达集的探针编号
seqname:染色体名称
strand:是指正列还是负列
start:起始位置
stop:终止位置
total_probes:总的探针数目
gene_assignment:基因的描述
mrna_assignment:mrna的描述
swissprot:蛋白数据库的描述
category:种类
spot_ID:spot格式的ID

Data table:就是所有的详细数据
Total number of rows: 就是对文件列数的描述
至此,对GPL文件的学习就结束了。

shengxinguoer
生信果
生信硬核知识解答
和小果一起学生信