欢迎光临散文网 会员登陆 & 注册

尔云间生信代码|自行构建CDF包解决读取CEL文件报错

2022-10-21 14:21 作者:尔云间  | 我要投稿


遇到问题

在读取GEO数据库的CEL文件时,出现了报错,无法找到包pd.hursta.2a520709,命令如下:

rm(list=ls());gc();

setwd("C:/22SHB021F/")

library(GEOquery)

library(affyPLM)

library(affy)

library(oligo)

gse="GSE72094_RAW"


baseDir <- "C:/22SHB021F/"

workDir <- file.path(baseDir, gse)

celfiles <- list.files(workDir, "\\.CEL$")  # 匹配以.CEL 结尾的文件。

data.raw <- read.celfiles(filenames = file.path(workDir, celfiles))

因为之前别的数据集是正常读取的,而按照通常的解决思路的话,直接把这个包安装上即可。没怎么想就用BiocManager试了下

BiocManager::install("pd.hursta.2a520709")

结果BiocManager并不存在这个包。

后经搜索引擎查找发现需要自己创建这个包,这类包是CDF包,开始操作


构建CDF包

查找GSE72094_series_matrix.txt文件发现测序芯片为GPL15048

进入GEO数据库,

下载CDF文件

https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GPL15048

下载第一个

使用makecdfenv包创建CDF包pd.hursta.2a520709,代码如下

BiocManager::install('makecdfenv')

library(makecdfenv)



make.cdf.package("GPL15048_HuRSTA_2a520709.CDF.gz", "pd.hursta.2a520709",

                species = "Homo sapiens", compress = TRUE)


install.packages("pd.hursta.2a520709", repos =  NULL, type="source")

再次读取GEO数据库的CEL文件,就可以正常运行了。

兜兜转转终于把问题解决了,希望小云能帮大家少走弯路。



特别说明:本代码经申请软件著作权,仅转让使用权,不转让所有权

如需代码及示例数据等文件,请扫码聊天框回复 “代码”领取!



写在文末:

如果您近期想做生信方面的文章而苦于没有思路,或者不知道如何来入手生信分析,或者兑具体的某一个图有作图需求,都可以扫码咨询小云,我们有专业的技术团队,生信热点思路设计、生信分析、热点方向生信挖掘等,如有需要,可扫码下方二维码了解详情 ! 



尔云间生信代码|自行构建CDF包解决读取CEL文件报错的评论 (共 条)

分享到微博请遵守国家法律