FastQC——转录组数据质控的得力助手
尔云间 一个专门做科研的团队
欢迎点赞+收藏+关注
生信人R语言学习必备
立刻拥有一个Rstudio账号
开启升级模式吧
(56线程,256G内存,个人存储1T)

在RNA-seq数据分析中,数据能否使用是最基本的问题,因此进行质量控制(Quality Control, QC)是不可或缺的步骤
今天小果介绍了一个高效好用的软件工具——fastqc,它可是转录组数据质控的得力的助手。

FastQC是一个免费使用的质量控制工具,能够对高通量测序数据进行快速、准确的评估。在这篇文章中,小果将以拟南芥转录组数据为例,详细介绍FastQC在RNA-seq数据质控方面的应用。
安装fastaqc
conda create –name fastqc###创建环境
conda activate fastqc###激活环境
conda install -c bioconda fastqc###安装
fastqc -version###验证否安装成功
数据准备
上一期我们对拟南芥的3组共9个转录组测序rawdata进行了过滤,这一期,小果继续用上次的数据带大家进行质量控制,当然啦,正确的做法是先对数据进行质量控制,然后根据结果报告来进行数据的过滤处理。小果先对数据进行了处理,然后进行了数据质控。
质量控制
这一步操作很简单,进入文件所在目录
fastqc -t 4 *_paired.fq.gz
或者
nohup fastqc -t 4 -o ~/my_folder/trimm/ninanjie_output/ninanjie_qc *_paired.fq.gz &
这一程序会在后台运行,并对所有以 _paired.fq.gz 结尾的文件进行质控,同时使用4个线程进行计算,结果输出到给定目录。
这一步可以根据自己的实际修改命令。

可以看到程序在后台并给出了进程ID,可以进入输出目录查看结果,下面是部分,结果,慢慢等待即可。

查看结果
程序结束后我们会看到每个样本都生成了read1和read2的.html报告和压缩文件,我们可以打开.html查看报告。


今天的内容就到这里了,你学会了吗!
欢迎使用:云生信 - 学生物信息学 (biocloudservice.com)

“生信果”,生信入门、R语言、生信图解读与绘制、软件操作、代码复现、生信硬核知识技能、服务器、生物信息学的教程,以及基于R的分析和可视化等原创内容,一起见证小白和大佬的成长。