尔云间生信代码|不同物种之间的同源基因名称转换分析

在基础医学研究中,很多实验模型都是在动物上完成的,比如小鼠。假如我们研究某药物的抗肿瘤效果,涉及到机制,最终都会往人上靠的,一般几个基因,数据库直接查一下就可以啦。但如果基因很多,人工查就不太现实。因此整理了可以批量寻找不同物种之间相近同源关系的基因的代码。
本代码利用Ensembl数据库中的同源基因定位信息和不同物种基因序列上同源关系的相近程度,寻找不同物种之间相近同源关系的基因,基于物种间基因的同源性,对不同物种之间的同源基因名称转换。首先提供基因列表和源物种信息,根据输入基因ID转换为Ensembl ENSG标识符,检索目标物种的相应同源基因信息,在直系映射后能够自动检索与其输入基因列表对应的同源基因。
使用方法:
Rscript -Gorthgene.R -querylist=querylist.txt -source_organism= -target_organism=
参数说明:
USAGE:
Gorthgene.R -querylist=<querylist> -source_organism=<source_organism> -target_organism=<target_organism>
PARAMETERS:
-querylist the query genes list ,input txt format and filenames.
-source_organism the name of the source organism (default set at hsapiens) ,string
-target_organism the name of the target organism (default set at mmusculus) ,string
操作步骤:
1、打开命令行界面,输入“Rscript Gorthgene.R”调阅帮助文档,确定该程序所需的输入文件。
2、用户根据帮助文档中的参数说明内容,对参数进行设置。这里,必须输入参数有3个,分别是-querylist,用户提供基因列表;-source_organism,源物种信息(默认设置为hsapiens);-target_organism,目标物种信息(默认设置为mmusculus)。
目前可以提供转化的物种信息列表如下

3、完成参数提交后,按下回车键,整个程序即正式开始进入执行。每步执行内容都会给出提示。程序执行完毕后,界面会显示"Program execution is completed"结束语。
结果展示:
共输出1个表格xls格式文件
1. result.xls

注:检索出来的同源基因信息:
input:输入基因symbol;
input_ensg:输入基因ensembl ID;
ortholog_name:转化后的同源基因symbol;
ortholog_ensg:转化后的同源基因ensembl ID;
description:同源基因具体描述
特别说明:本代码经申请软件著作权,仅转让使用权,不转让所有权
如需代码及示例数据等文件,请扫码聊天框回复 “B50”领取!

写在文末:
如果您近期想做生信方面的文章而苦于没有思路,或者不知道如何来入手生信分析,或者兑具体的某一个图有作图需求,都可以扫码咨询小云,我们有专业的技术团队,生信热点思路设计、生信分析、热点方向生信挖掘等,如有需要,可扫码下方二维码了解详情:
