MultiQC:这个简单又实用的数据合并小工具一定要掌握
尔云间 一个专门做科研的团队
欢迎点赞+收藏+关注
生信人R语言学习必备
立刻拥有一个Rstudio账号
开启升级模式吧
(56线程,256G内存,个人存储1T)

它通过扫描给定目录中的可识别日志文件来生成一个 HTML 报告来汇总统计数据,比如说我们测序了很多个样本并生成了很多qc质量报告,这个时候,利用MultiQC将所有的报告合并能够让我们更轻松地查看结果。
这个小工具简单而实用,一定要掌握哦~下面和小果一起看看吧。
这里我们需要使用fastqc对cleandata进行质控,查看单个fastq的测序质量,再使用multiqc合并多个fastqc的结果。
使用fastqc进行质控的代码如下(小果分享过关于fastqc的具体使用方法哦,这里就直接放代码了):
这里是对指定目录的所有后缀名为.gz的文件进行fastqc质控分析,并指定输出目录,注意使用的时候修改为自己的目录哦,结果是这样的:

可以看到每条reads都生成了一个html格式的报告,这么多样本和报告查看起来非常麻烦,这个时候就需要用multiqc来帮忙了。
没有这软件的话安装一下:
然后我们可以合并一下报告,同样注意修改代码中的路径哦:
##生成一个文件名称的列表方便批量操作
不出意外的话我们会看到生成一个总的报告:

和小果一起看看这个总的报告长什么样子吧:

是不是看起来简洁多了呢!
好啦,今天的内容暂时就到这里了,我们下期继续!
欢迎使用:云生信 - 学生物信息学 (biocloudservice.com)
如果想用服务器可以私信小果哦

“生信果”,生信入门、R语言、生信图解读与绘制、软件操作、代码复现、生信硬核知识技能、服务器、生物信息学的教程,以及基于R的分析和可视化等原创内容,一起见证小白和大佬的成长。