欢迎光临散文网 会员登陆 & 注册

FastQC——转录组数据质控的得力助手

2023-08-11 09:05 作者:小云爱生信  | 我要投稿

尔云间  一个专门做科研的团队

原创 小果 生信果

欢迎点赞+收藏+关注

生信人R语言学习必备

立刻拥有一个Rstudio账号

开启升级模式吧

(56线程,256G内存,个人存储1T)

在RNA-seq数据分析中,数据能否使用是最基本的问题,因此进行质量控制(Quality Control, QC)是不可或缺的步骤

今天小果介绍了一个高效好用的软件工具——fastqc,它可是转录组数据质控的得力的助手。

FastQC是一个免费使用的质量控制工具,能够对高通量测序数据进行快速、准确的评估。在这篇文章中,小果将以拟南芥转录组数据为例,详细介绍FastQC在RNA-seq数据质控方面的应用。


安装fastaqc

conda create –name fastqc###创建环境

conda activate fastqc###激活环境

conda install -c bioconda fastqc###安装

fastqc -version###验证否安装成功


数据准备

上一期我们对拟南芥的3组共9个转录组测序rawdata进行了过滤,这一期,小果继续用上次的数据带大家进行质量控制,当然啦,正确的做法是先对数据进行质量控制,然后根据结果报告来进行数据的过滤处理。小果先对数据进行了处理,然后进行了数据质控。


质量控制

这一步操作很简单,进入文件所在目录

fastqc -t 4 *_paired.fq.gz

或者

nohup fastqc -t 4 -o ~/my_folder/trimm/ninanjie_output/ninanjie_qc *_paired.fq.gz &

这一程序会在后台运行,并对所有以 _paired.fq.gz 结尾的文件进行质控,同时使用4个线程进行计算,结果输出到给定目录。

这一步可以根据自己的实际修改命令。

可以看到程序在后台并给出了进程ID,可以进入输出目录查看结果,下面是部分,结果,慢慢等待即可。

查看结果

程序结束后我们会看到每个样本都生成了read1和read2的.html报告和压缩文件,我们可以打开.html查看报告。

今天的内容就到这里了,你学会了吗!

欢迎使用:云生信  - 学生物信息学 (biocloudservice.com)

“生信果”,生信入门、R语言、生信图解读与绘制、软件操作、代码复现、生信硬核知识技能、服务器、生物信息学的教程,以及基于R的分析和可视化等原创内容,一起见证小白和大佬的成长。


FastQC——转录组数据质控的得力助手的评论 (共 条)

分享到微博请遵守国家法律