欢迎光临散文网 会员登陆 & 注册

科研代码分享|快速查找miRNA成熟体名称--miRBase数据库中ID转换的两种方法

2022-06-13 14:49 作者:尔云间  | 我要投稿

科研有捷径,输入代码,一键获取科研成果!就是这么省事,来具体看下有多方便!

搜索http://985.so/a9kb查看全部代码(目前共计50+持续新增中),也可以点击右侧【目录】,可以看到更多有趣的代码

真香提示:文末可以知道如何获取代码~  

miRBase 数据库(https://www.mirbase.org/)是microRNA 序列和注释的主要公共存储库和在线资源。最新版本的 miRBase 数据库 (v22) 包含 38589 个条目,代表来自271个生物体的hairpin precursor microRNAs。hairpin precursor和成熟序列都可用于搜索和浏览,并且还可以按名称,关键字,引用和注释检索条目,所有序列和注释数据也可供下载。

场景需求:在UCSC数据库中下载到TCGA中某个癌种的miRNA-seq数据,发现是miRBase数据库官方ID,需要进行id转换再进行下一步分析。今天我们来介绍两种方法来进行miRBase数据库官方ID与miRNA基因id的匹配。

Method 1:miRBase数据库下载对应文件

Step1:进入官网:https://www.mirbase.org/

Step2进入到下载界面https://www.mirbase.org/ftp/CURRENT/

Step3:下载miRNA.xls.zip文件

Step4:解压后打开,便可以得到每个对应的id信息。

Method 2. R包下载对应id

miRBaseVersions.db包是一个注释包,其中包括来自 22 个 miRBase 发布版本的成熟 miRNA 名称。由于每个版本的持续增长和变化,miRNA 名称在不同版本中可能有不同的名称,甚至不再列为有效miRNA。此注释包用作存储库,可用于快速查找成熟的 miRNA 名称。

该包主要实现的四种方法函数分别是:Columns、Keytypes、Keys、Select

安装R包

iif (!requireNamespace("BiocManager", quietly = TRUE))  install.packages("BiocManager")  

BiocManager::install("miRBaseVersions.db")

函数详解:

1. Keytypes:它提供了可以在这个包中使用的表格:输出列出了 23 个表,每个表都可以被查询。键类型“MIMAT”是包含所有支持的 miRBase 版本的所有记录的主表。

library(miRBaseVersions.db)

# keytypes函数:使用此函数接收可以从中检索数据的表名:keytypes(miRBaseVersions.db);

2. Columns:使用columns函数检索有关您可以在最终输出中检索的变量类型的信息:

3. Keys:该函数返回指定keytypes的所有可行的key。以下示例检索miRBase版本6.0的所有可能key。

4. Select:该函数用于提取数据。作为输入值,该函数采用从其他三个函数(键、列和键类型)接收的输出。
例如,要提取有关成熟体 'MIMAT0000092' 的所有信息,我们可以运行以下命令:

参考资料:

http://www.bioconductor.org/packages/release/data/annotation/vignettes/miRBaseVersions.db/inst/doc/miRBaseVersions.db-vignette.htm

搜索http://985.so/a9kb查看全部代码(目前共计50+持续新增中),也可以点击右侧【目录】,可以看到更多有趣的代码

科研代码分享|快速查找miRNA成熟体名称--miRBase数据库中ID转换的两种方法的评论 (共 条)

分享到微博请遵守国家法律