FastQC——转录组数据质控的得力助手

2023-08-11 09:05 作者:小云爱生信 0人读过 | 我要投稿

尔云间一个专门做科研的团队

原创小果生信果

欢迎点赞+收藏+关注

生信人R语言学习必备

立刻拥有一个Rstudio账号

开启升级模式吧

（56线程，256G内存，个人存储1T）

在RNA-seq数据分析中，数据能否使用是最基本的问题，因此进行质量控制（Quality Control, QC）是不可或缺的步骤

今天小果介绍了一个高效好用的软件工具——fastqc，它可是转录组数据质控的得力的助手。

FastQC是一个免费使用的质量控制工具，能够对高通量测序数据进行快速、准确的评估。在这篇文章中，小果将以拟南芥转录组数据为例，详细介绍FastQC在RNA-seq数据质控方面的应用。

安装fastaqc

conda create –name fastqc###创建环境

conda activate fastqc###激活环境

conda install -c bioconda fastqc###安装

fastqc -version###验证否安装成功

数据准备

上一期我们对拟南芥的3组共9个转录组测序rawdata进行了过滤，这一期，小果继续用上次的数据带大家进行质量控制，当然啦，正确的做法是先对数据进行质量控制，然后根据结果报告来进行数据的过滤处理。小果先对数据进行了处理，然后进行了数据质控。

质量控制

这一步操作很简单，进入文件所在目录

fastqc -t 4 *_paired.fq.gz

或者

nohup fastqc -t 4 -o ~/my_folder/trimm/ninanjie_output/ninanjie_qc *_paired.fq.gz &

这一程序会在后台运行，并对所有以 _paired.fq.gz 结尾的文件进行质控，同时使用4个线程进行计算，结果输出到给定目录。

这一步可以根据自己的实际修改命令。

可以看到程序在后台并给出了进程ID，可以进入输出目录查看结果，下面是部分，结果，慢慢等待即可。

查看结果

程序结束后我们会看到每个样本都生成了read1和read2的.html报告和压缩文件，我们可以打开.html查看报告。

今天的内容就到这里了，你学会了吗！

欢迎使用：云生信 - 学生物信息学 (biocloudservice.com)

“生信果”，生信入门、R语言、生信图解读与绘制、软件操作、代码复现、生信硬核知识技能、服务器、生物信息学的教程，以及基于R的分析和可视化等原创内容，一起见证小白和大佬的成长。