欢迎光临散文网 会员登陆 & 注册

尔云间生信代码|基于DiffCorr包识别不同表型下的差异共表达关系对

2022-10-28 15:19 作者:尔云间  | 我要投稿


高通量数据分析中常用到相关性计算方法,比如层次聚类分析方法。通常,分析分子表达水平变化是常见的研究对象,但是分子在实验(case)和对照(control)样本中的变化相关性也是值得研究的。比如,如何分析基因与实验样本的相关性,与对照样本的相关性,或在两种条件下的变化系数等。

本代码利用R包DiffCorr,可用来解决该问题,结合关联分析方法如Pearson系数,来计算实验和对照条件下分子的相关性系数,以及挖掘不同实验条件下的基因关联模块。并结合Fisher’s z-test 分析在2种实验因素条件下的基因相关性差异,根据分析结果,可进一步得到分子的差异共表达情况。该代码适用于2种实验条件(例如实验组和对照组)的数据分析,可分析基因、miRNA等基因组学数据和代谢组学数据。

只需要基因表达谱,代码将自行计算出差异的共表达关系对、相应的表型下的共表达网络,同时通过聚类分析挖掘出各个表型下的显著共表达的网络模块及对应的基因集合。


使用方法:

Rscript diffcorr.r  -number_control=  -gene_gene_cor=  -module_module_cor=


参数说明:

       USAGE:

diffcorr.r -exp=-number_control=-gene_gene_cor=-module_module_cor=

PARAMETERS:

-exp    exprmatrix input txt format.

-number_control  the number of control sample.

-gene_gene_cor  the Correlation coefficient between gene and gene,will be used for clustering,default:0.6.

-module_module_cor      the Correlation coefficient between module in control and module in case,default:0.8.


操作步骤:

1、打开命令行界面,输入“Rscript diffcorr.r”调阅帮助文档,确定该程序所需的输入文件。

2、用户根据帮助文档中的参数说明内容,对参数进行设置。这里,必须输入参数有2个,分别是-exp,表示基因表达矩阵文件,这里必须保存为txt格式,并且属于同一个处理组的样本列必须挨着,这里对照组在前,处理组在后;-number_control表示对照组样本的个数。

可选参数有2个,分别为-gene_gene_cor,表示对各个表型下基于基因相关性进行聚类的阈值,默认为基因之间相关性大于0.6被聚为一个模块。-module_module_cor,表示对各个表型的模块进行相关性分析的阈值,这里默认为挖掘相关性大于0.8的两个模块。

3、完成参数提交后,按下回车键,整个程序即正式开始进入执行。每步执行内容都会给出提示。程序执行完毕后,界面会显示”Program execution is completed"结束语。


结果展示:

1、control_nerwork.pdf(对照组模块共表达网络)


2、case_nerwork.pdf(处理组模块共表达网络)


3、module_list_control.txt和module_list_case.txt(按照所设阈值得到的各个表型下的共表达模块及对应基因)

注:第一列表示模块名称,需要注意的是和图中并不对应,图中的模块表示第几个模块,而不是模块的名称,第二列表示模块内包含的基因。


4、module_module_cor.txt(按照所设阈值0.8挖掘出来的共表达模块)

第一列表示对照组中模块id(这里和图中对应),第二列表示处理组中的模块id(这里和图中对应),第三列表示模块的相关性系数


5、diff_group_Correlation.txt(计算出来具有显著差异的共表达关系对)

注:r1表示对照组中两个基因的相关系数

p1表示对照组中两个基因的相关显著性p.value值

r2表示处理组中两个基因的相关系数

p2表示处理组中两个基因的相关显著性p.value值

p (difference)表示相关性差异显著性p.value值

(r1-r2)表示相关性差异程度

lfdr (in cond. 1)表示校正后的对照组中两个基因的相关显著性FDR值

lfdr (in cond. 2)表示校正后的对照组中两个基因的相关显著性FDR值

lfdr (difference)表示校正后的相关性差异显著性FDR值

这里默认将FDR<0.05的差异共表达关系对导出


特别说明:本代码经申请软件著作权,仅转让使用权,不转让所有权

如需代码及示例数据等文件,请扫码聊天框回复 “代码”领取!


写在文末:

如果您近期想做生信方面的文章而苦于没有思路,或者不知道如何来入手生信分析,或者兑具体的某一个图有作图需求,都可以扫码咨询小云,我们有专业的技术团队,生信热点思路设计、生信分析、热点方向生信挖掘等,如有需要,可扫码下方二维码了解详情 ! 



尔云间生信代码|基于DiffCorr包识别不同表型下的差异共表达关系对的评论 (共 条)

分享到微博请遵守国家法律