欢迎光临散文网 会员登陆 & 注册

Seqkit:强大的序列处理工具

2022-10-14 11:02 作者:笨笨熊爱吃肉  | 我要投稿

Seqkit是一款专门处理fsata/q序列文件的软件。

github地址:

https://github.com/shenwei356/seqkit

下载地址:

https://bioinf.shenwei.me/seqkit/download/

选择适合自己的版本

图片

tar -zxvf seqkit_linux_amd64.tar.gz,解压后只有一个seqkit程序。

发现有很多的功能,多到自己曾经遇到过的所有的序列处理问题(相见恨晚),从序列查看到提取序列、拆分、处理、排序等等,实在是序列处理居家必备良药,思绪两秒钟,加入自己环境变量。

这次检索到这个工具,的因为想评估一下我用Hifiasm组装出来的序列碱基数,剩下的功能几乎涉及了我能想到的所有的序列处理工作,在CSDN社区中,作者“生信宝典”几乎阐述了所有的功能(Ref1),时间原因,我就不探索了。

seqkit stat 统计序列信息

$ seqkit stats *.f{a,q}.gz #统计序列信息

$ seqkit stats *.f{a,q}.gz -T #tab分割

$ seqkit stats *.f{a,q}.gz -a # 统计更多信息

$ seqkit stats -j 10 refseq/virual/*.fna.gz #多文件统计( -j:使用多线程)

补充37个工具:

图片

上图参考生信宝典的帖子。

Ref1

https://blog.csdn.net/qazplm12_3/article/details/115535361

Ref2 https://www.jianshu.com/p/471283080bd6?utm_campaign=hugo



本文使用 文章同步助手 同步


Seqkit:强大的序列处理工具的评论 (共 条)

分享到微博请遵守国家法律