欢迎光临散文网 会员登陆 & 注册

linux 003

2023-03-22 17:11 作者:今天没发paper的楊骁尧  | 我要投稿

理解基本内容之后就是使用,每遇到一个,就把他记住,坚持半年再来看

以下是文本处理相关内容

一、三驾马车

https://mp.weixin.qq.com/s/w1nGKH-_hv5YSmAcRQFIcA

grep -f :将id中的内容在info中查找

grep -c:将结果进行wc

grep -w:必须一样的,不模糊

grep -v:反选

二、马哥linux及练习题,来自生信技能树

如果只是生物信息学需要,请不要全部看完,太复杂了,看第2~9章节即可。 https://www.bilibili.com/video/av40331948/ 就是到P30即可,视频可能难度超纲,毕竟是程序员的知识点。

其实你应该是学习的是我的生物信息学之linux,视频链接在 https://www.bilibili.com/video/av28813815 学完应该可以完成 LINUX的练习题:

最低要求是完成我的 linux 20题 http://www.bio-info-trainee.com/2900.html

其次完成生物信息学数据格式的习题(blast/blat/fa-fq/sam-bam/vcf/bed/gtf-gff),收集这些格式的说明书。

fasta和fastq格式文件的shell小练习 http://www.bio-info-trainee.com/3575.html

sam和bam格式文件的shell小练习 http://www.bio-info-trainee.com/3578.html

VCF格式文件的shell小练习 http://www.bio-info-trainee.com/3577.html

三、sort 

1、sort -u:去重

cut -f1 gtf | sort -u

2、-k field1[,field2] 按指定的列进行排序

四、paste

awk '{print $1}' tmp | paste -s -d + | bc

-s是把列放在一行,默认用    分隔

bc为任意精度算术语言提供解释器。BC的含义是:Binary Calculator,用于实现任意精度计算(往往是高精度计算),如echo 2*2|bc

四、查看使用命令的频率,并排序

history | awk '{print $2}'|sort |uniq -c|awk '{print $1"\t"$2}'|sort -k 1,1 -n

五、Tee是Linux命令,用于显示程序的输出并将其复制到一个文件中

六、查看系统版本: cat /etc/issue

https://blog.csdn.net/suma110/article/details/54382862

linux 003的评论 (共 条)

分享到微博请遵守国家法律