欢迎光临散文网 会员登陆 & 注册

GEO数据库使用之数据集下载

2022-12-23 11:24 作者:小云爱生信  | 我要投稿

尔云间  一个专门做科研的团队

原创 小果 生信果

在GEO数据库检索到我们需要的某个疾病的数据集时,往往需要去下载这些数据集,在这里用了三种方法来下载数  据。这里我们以GSE70493为数据为例进行下载

一、网页直接下载

1、首先登录到GEO数据库首页(Home - GEO - NCBI (nih.gov) ),然后再搜索框输入GSE70493,进行数据检索, 检索结果如下:

图片


2、在检索界面中拉动右侧滚动条,可看到Platforms 与Download family关节词条,这些词条底下红色方框圈住的区域的数据就是我们需要下载的数据。

图片


3、下载platform数据,点击上图中红色方框圈住的GPL17586,进入到平台信息界面,在界面下拉找到Download    full table...,点击即可下载到本地。

图片


4、在下载完platform数据信息后,返回GSE70493的搜索界面,在Download family词条下找到Series Matrix File(s) 文件,点击下载保存到本地即可。

图片


二、利用ftp下载

1、进入ftp,Index of /geo (nih.gov) ,找到并点击geo目录,就可以看到有对应的GEO相关的数据目录。

图片


2、在geo目录下,点击platform进去查找对应的GPL编号,点击该编号就可看到所需要下载的文件的格式,点击需    要的格式进行下载,这里我们选soft格式的文件,点击后选取对应的文件进行下载。

图片
图片
图片


3、在geo目录下,点击series目录,进去查找对应的GEO编号,就可以找到对应的文件类型,我们需要matrix文    件,点击就该目录进去选择对应的文件下载即可

图片
图片


三、使用R命令下载


library(GEOquery)

eSet1 <- getGEO("GSE70493",

destdir = '.', getGPL = F)

gpl <- getGEO("GPL17586", destdir= ".")

等待命令运行结束就可看到需要i爱在的文件了,下载的文件如下图所示:


至此,我们GEO数据的下载就结束了。



shengxinguoer

生信果


生信硬核知识解答

和小果一起学生信


GEO数据库使用之数据集下载的评论 (共 条)

分享到微博请遵守国家法律