欢迎光临散文网 会员登陆 & 注册

尔云间生信代码|基于线性建模方法对代谢组和转录组数据整合分析

2022-09-29 14:47 作者:尔云间  | 我要投稿


代谢组学数据的解释非常具有挑战性,转录组学和代谢组学数据的整合改善了疾病相关代谢组学的功能解释,并促进了代谢物生物标志物和基因靶标的发现。目前,公共数据或客户自有的多组学数据,基因和代谢物谱,在这些类型的研究中,考虑到转录物 - 代谢物关系的复杂性,途径/网络方法可能既不适用也不容易发现新的关系。考虑到这一点,我们提出了一种简单的线性建模方法来捕获捕获疾病(或其他表型)特定的基因和代谢物关联,通过假设共同调节模式反映功能相关基因和代谢物。

线性模型公式如下:

E(m|g,t) = β1 + β2 g + β3 p + β4 (g:p) + ε

其中'm'和'g'分别是代谢物丰度和基因表达水平,'p'是表型(癌症类型,患者诊断,治疗组等),'(g:p)'是基因表达和表型之间的关联,'ε'是错误术语,即正常分布 


使用方法:

Rscript Integration.R -input=input.csv -diffcorrvalue=0.8


参数说明:

USAGE:Integration.R  -input=<input> -diffcorrvalue=<diffcorrvalue>PARAMETERS:- input  Users need to input a CSV file with two required columns:type and filenames.The CSV file is expecected to have the following 2 columns and 6 rows:type,filenamesmetabData,myfilenamegeneData,myfilenamemetabMetaData,myfilename (optional)geneMetaData,myfilename (optional)sampleMetaData,myfilename- diffcorrvalue the absolute value difference of the gene-metabolite Spearman correlation (default set at 0.8) between the two groups,string

操作步骤:

1、打开命令行界面,输入“Rscript  Integration.R”调阅帮助文档,确定该程序所需的输入文件。

2、用户根据帮助文档中的参数说明内容,对参数进行设置。这里,必须输入参数有2个,分别是- input,列出导入的基因表达和代谢物数据文件的位置(代谢物数据、基因表达数据、代谢物元数据、基因元数据和样本元数据)。这些文件夹必须在同一个文件夹中。不要在文件名中包含路径名。该文件位置表格格式如下所述。

请确保所有文件都为CSV文件且都位于同一文件夹中。

-diffcorrvalue  两组间基因代谢物Spearman相关系数的绝对值差(默认设置为0.8)

3、完成参数提交后,按下回车键,整个程序即正式开始进入执行。每步执行内容都会给出提示。程序执行完毕后,界面会显示”Program execution is completed"结束语。


结果展示

共输出1个表格csv格式文件,1个pdf格式的图片文件,2个html格式的图片文件

1. corResults.csv


注:筛选出来的符合阈值条件的基因-代谢物关系对, metab:代谢物名称;gene:基因名称;case_cor:疾病组内,基因代谢物两者相关性; normal_cor:正常组内,基因代谢物两者相关性; diff.corr:两组间基因代谢物两者相关性;Pval:关联性p值;FDRadjPval:校正后p值 


2. KEGG enzyme.csv


代谢物网络节点在KEGG数据库中的具体含义,KEGG.id:KEGG数据库中对应的ID号,Entry.type:类别,KEGG.name:名称,p.score:p值

3. Distributions.html


转录组、代谢组表达柱形图 横坐标为样本,纵坐标为表达量,左图为基因样本,右图为代谢组样本

4. PCA.html

代谢物和基因表达数据主成分分析结果 左图为基因数据,右图为代谢组数据,红色圆形为xx样本,蓝色方形为xx样本 


5.DistPvalues.pdf     


所有基因和代谢物关联性p值分布图 横坐标为关联性p值,纵坐标为该p值出现频率。


特别说明:本代码经申请软件著作权,仅转让使用权,不转让所有权

如需代码及示例数据等文件,请扫码聊天框回复 “代码”领取!


写在文末:

如果您近期想做生信方面的文章而苦于没有思路,或者不知道如何来入手生信分析,或者兑具体的某一个图有作图需求,都可以扫码咨询小云,我们有专业的技术团队,生信热点思路设计、生信分析、热点方向生信挖掘等,如有需要,可扫码下方二维码了解详情: 




尔云间生信代码|基于线性建模方法对代谢组和转录组数据整合分析的评论 (共 条)

分享到微博请遵守国家法律