linux 003
理解基本内容之后就是使用,每遇到一个,就把他记住,坚持半年再来看
以下是文本处理相关内容
一、三驾马车
https://mp.weixin.qq.com/s/w1nGKH-_hv5YSmAcRQFIcA
grep -f :将id中的内容在info中查找
grep -c:将结果进行wc
grep -w:必须一样的,不模糊
grep -v:反选
二、马哥linux及练习题,来自生信技能树
如果只是生物信息学需要,请不要全部看完,太复杂了,看第2~9章节即可。 https://www.bilibili.com/video/av40331948/ 就是到P30即可,视频可能难度超纲,毕竟是程序员的知识点。
其实你应该是学习的是我的生物信息学之linux,视频链接在 https://www.bilibili.com/video/av28813815 学完应该可以完成 LINUX的练习题:
最低要求是完成我的 linux 20题 http://www.bio-info-trainee.com/2900.html
其次完成生物信息学数据格式的习题(blast/blat/fa-fq/sam-bam/vcf/bed/gtf-gff),收集这些格式的说明书。
fasta和fastq格式文件的shell小练习 http://www.bio-info-trainee.com/3575.html
sam和bam格式文件的shell小练习 http://www.bio-info-trainee.com/3578.html
VCF格式文件的shell小练习 http://www.bio-info-trainee.com/3577.html
三、sort
1、sort -u:去重
cut -f1 gtf | sort -u
2、-k field1[,field2] 按指定的列进行排序
四、paste
awk '{print $1}' tmp | paste -s -d + | bc
-s是把列放在一行,默认用 分隔
bc为任意精度算术语言提供解释器。BC的含义是:Binary Calculator,用于实现任意精度计算(往往是高精度计算),如echo 2*2|bc
四、查看使用命令的频率,并排序

history | awk '{print $2}'|sort |uniq -c|awk '{print $1"\t"$2}'|sort -k 1,1 -n
五、Tee是Linux命令,用于显示程序的输出并将其复制到一个文件中
六、查看系统版本: cat /etc/issue
https://blog.csdn.net/suma110/article/details/54382862