尔云间生信代码|基于稳健排序整合算法对多数据集进行整合及可视化
科研有捷径,输入代码,一键获取科研成果!就是这么省事,来具体看下有多方便!
搜索http://985.so/a9kb查看全部代码(目前共计50+持续新增中),也可以点击右侧【目录】,可以看到更多有趣的代码;真香提示:文末可以知道如何获取代码~
不同芯片数据的差异基因整合,常规的思路是先进行样本整合,然后去除批次效应,最后进行差异分析。阅读相关文献也有很多文章用了R包—RobustRankAggreg:对每个数据集进行独立分析,然后RRA整合DEG,拿到多个数据集共有的DEG。
稳健排序整合( Robust rankaggregation,RRA)法是一种利用概率模型整合排序列表的方法,这个RobustRankAggreg包超级简单,RRA算法中最核心的为aggregateRanks函数,aggregateRanks函数其实就是对多个排好序的基因集,进行求交集的同时还考虑一下它们的排序情况。总体上来说,就是挑选那些在多个数据集都表现差异的基因,并且每次差异都排名靠前的那些。
结合R包RobustRankAggreg,将多个GSE数据集差异表达基因(按logFC值排序)并为一个list(正序倒序各一个list),然后获得所有差异基因在多个GSE数据集中logFC矩阵,经过预先设置的筛选阈值,筛选共同上调和下调基因,得到在多个数据集中共同的上下调基因,并利用热图可视化上下调top10共有差异基因。
使用方法:
Rscript RRA.R -files= -padj= -logfc=
参数说明:
USAGE:
RRA.R -files=-padj=-logfc=
PARAMETERS:
-files\tThe results name of differentially expressed genes were obtained by limma.
-padj the DEG Threshold padj,Default value 0.05,string.
-logfc the DEG Threshold logFC,Default value 1,string.
操作步骤:
1、打开命令行界面,输入“Rscript RRA.R”调阅帮助文档,确定该程序所需的输入文件。
2、用户根据帮助文档中的参数说明内容,对参数进行设置。这里,必须输入参数有3个,是- files,表示使用limma法获得的各个GSE数据集差异基因结果名称,例'GSE7476.txt,GSE13507.txt,GSE37815.txt,GSE65635.txt';-padj 共有差异基因筛选阈值,建议阈值为0.05,可根据需要调整;-logfc 共有差异基因筛选阈值,建议阈值为1,可根据需要调整。
3、完成参数提交后,按下回车键,整个程序即正式开始进入执行。每步执行内容都会给出提示。程序执行完毕后,界面会显示”Program execution is completed<span data-raw-text="" "="" data-textnode-index-1661241119773="17" data-index-1661241119773="1118" class="character" style="margin: 0px; padding: 0px;">"结束语。
流程图:

结果展示:

1.所有的共有上调基因结果Gene:基因名称;logFC:差异倍数,P.Value:为p值,adj.P.Val:矫正p值

2.共有上调基因根据软件设置阈值筛选得到的共有上调显著差异基因,Gene:基因名称;logFC:差异倍数,P.Value:为差异分析p值,adj.P.Val:差异分析矫正p值

3.所有的共有下调基因结果Gene:基因名称;logFC:差异倍数,P.Value:为p值,adj.P.Val:矫正p值

4.共有下调基因根据软件设置阈值筛选得到的共有下调显著差异基因,Gene:基因名称;logFC:差异倍数,P.Value:为差异分析p值,adj.P.Val:差异分析矫正p值

5.按照上调基因和下调基因的差异倍数排序,差异基因top10热图图,依次代表输入的GEO数据集
特别说明:本代码经申请软件著作权,仅转让使用权,不转让所有权
如需代码及示例数据等文件,请扫码聊天框回复 “B40”领取!
写在文末:
如果您近期想做生信方面的文章而苦于没有思路,或者不知道如何来入手生信分析,或者兑具体的某一个图有作图需求,都可以扫码咨询小云,我们有专业的技术团队,生信热点思路设计、生信分析、热点方向生信挖掘等,如有需要,可扫码下方二维码了解详情:
