欢迎光临散文网 会员登陆 & 注册

尔云间生信代码|基于Spearman算法构建关联网络

2022-09-27 14:45 作者:尔云间  | 我要投稿


目前对于关联分析的相关研究在疾病的分析中至关重要,我们在进行研究的过程中往往会关注与某一疾病相关的信息(如:基因位点,表达位点,甲基化位点,表型位点)。就目前引起广泛关注的疾病‘癌症’而言,研究人员通过分子生物学的手段对于其治疗过程中基因的表达或甲基化进行研究,发现了一些潜在的免疫治疗机制。在复杂的微环境变化中,多种免疫因子在疾病的进程中发挥着不同的作用,错综复杂的通路反应中总是存在协同于相反作用的蛋白或者一些小分子物质,从转录组学中包含了多种类型的转录因子如蛋白编码,非蛋白编码RNA等,探索他们之间的关系更加有利于我们关注到疾病发生过程中体内转录组学内部的关联性,寻找到更加可靠的研究靶点。

对于相关性网络的构建,我们是利用多个特征之间的线性相关关系,以构建出多个特征之间错综复杂的网络,如基因共表达网络,蛋白共表达网络,以及代谢表达网络等多种类型的网络分析。帮助我们寻找到我们所关注的一些特征最中心的特征。本代码是基于Spearman算法构建的任意特征之间的相关网络。基于两组特征数据(以公共数据库TCGA的表达矩阵与甲基化矩阵为例)会自动计算网络中的相关系数,并构建关键节点构建网络,只需要输入矩阵A和矩阵B即可产生相关网络图。


使用方法:

Rscript Network.R -Expression1= -Expression2= -Threshold.Positive= -Threshold.Negative=


参数说明:

USAGE:

Network.R -Expression1=<Expression1> -Expression2=<Expression2> -Threshold.Positive=<Number> -Threshold.Negative=<Number>

PARAMETERS:

-Expression1 the gene expression matrix, gene as row, sample as column, input csv format.

-Expression2 the gene expression matrix, gene as row, sample as column, input csv format. Expression2 can be the same matrix as Expression1. At this time, the focus is on internal relevance.

-Threshold.Positive the number. Choose the number of Positive relationships you want to show.

-Threshold.Negative the number. Choose the number of Negative relationships you want to show.


操作步骤:

1. 打开命令行界面(MAC & Linux ),输入“Rscript Network.R”调阅帮助文档,确定该程序所需的输入文件。


2. 根据帮助文档中的参数说明内容,对参数进行设置。首先,必须输入参数有4个(注意大小写保持一致),其中两个分别是-Expression1,-Expression2,两个文件均表示基因表达矩阵文件,以基因为行,样本为列,保存为csv文件;注:两个表达矩阵的样本量必须保持一致,且文件中数据类型保持一致,不可出现‘null’等字样,如有出现请替换成‘NA’。最后两个为两个非零的正整数,-Threshold.Positive参数是指你想要在网络图中展示的正相关关系的个数,而-Threshold.Negative参数则是指你想要在网络图中展示的负相关关系的个数。


完成参数提交后,按下回车键,整个程序即正式开始进入执行。每步执行内容都会给出提示。程序执行完毕后,界面会显示“Program execution is completed”结束语。


结果展示

共输出三个pdf格式的图片文件,三个csv格式文件,

1. Network.all.pdf

该图片涵盖了表达矩阵中纳入的全部基因之间的关联作用,是一个整体的概况,但由于信息量巨大,因此仅能用圆形图案进行展示


2. Network.Top.pdf & Network.-Top.pdf(每组有两种形式选择)


上述图片涵盖了以基因之间的相关系数作为依据,选取相关系数为负的Top20的相关关系为基础进行圆形关系网络绘制,此图片充分展示了彼此之间的相互作用。(包含两中图,上图为两个类别不同颜色的图,下图为同种颜色,如输入的两个Expression1 == Expression2 则可选用第二种图)

上述图片涵盖了以基因之间的相关系数作为依据,选取相关系数为正的Top60的关系以及相关系数为基础进行圆形关系网络绘制,此图片充分展示了彼此之间的相互作用(包含两中图,上图为两个类别不同颜色的图,下图为同种颜色,如输入的两个Expression1 == Expression2 则可选用第二种图)。

3. links.csv

该文件包括了相关分析的结果,此文件可作为Cytoscape软件的输入文件。

特别说明:本代码经申请软件著作权,仅转让使用权,不转让所有权

如需代码及示例数据等文件,请扫码聊天框回复 “代码”领取!

写在文末:

如果您近期想做生信方面的文章而苦于没有思路,或者不知道如何来入手生信分析,或者兑具体的某一个图有作图需求,都可以扫码咨询小云,我们有专业的技术团队,生信热点思路设计、生信分析、热点方向生信挖掘等,如有需要,可扫码下方二维码了解详情: 



尔云间生信代码|基于Spearman算法构建关联网络的评论 (共 条)

分享到微博请遵守国家法律