「生信技能树」2021公益课(linux基础 & conda)

看完啦!
老师声音很好听,讲得也很棒,普通话也好,可以推荐!
BTW,由于是自用笔记,所以自己已经会的东西就没有记录啦,只记录了自己有点记不清或者新学到的东西嘿嘿嘿!
新姿势:
- wget:-c, --continue 断点续传(恢复获取部分下载的文件)
- source ~/.bashrc:刷新环境配置,即重新加载一下 ~/.bashrc 让修改生效,也可用 . ~/.bashrc ,. 等同于source
- 软链接:ln,分为软链接(常用)和硬链接(默认),软链接相当于Windows下的快捷方式。ln不加参数即为硬链接,加上-s参数即为软链接。常见用法:ln -s TARGET[绝对路径] DIRECTORY
尚未理解:
- 巧用alias19-conda的进阶技巧 P19 - 11:23
- 删除没有使用的包19-conda的进阶技巧 P19 - 13:06
快捷方式:
Ctrl + U 剪切光标位置到行首的字符
Ctrl + E 回到行尾
Ctrl + A 回到行首
Ctrl + W 剪切一个单词
Ctrl + Y 粘贴命令行剪切的内容
Ctrl + K 剪切光标位置到行首的字符
一些命令:
cd - # 返回上次的工作目录
ls -t # 以时间排序列出当前目录下文件
ls -R # 递归目录列出文件
ls -d # 显示目录本身,而非目录下文件
ls ./*txt # 列出当前目录下以txt结尾的文件
ls ../ # 列出上层目录的文件
ls -l # 列出当前目录下文件的详细信息
mkdir -p # 递归创建目录
mv # 移动或重命名
cp -r # 复制
rm -rfi # 递归删除/不显示警告讯息/删除前询问用户
head/tail # 查看文件前/后n行,默认10行。head常结合管道符用于控制输出行数。(管道符:|)
more # 逐页查看,按空格翻页,按回车换行,q退出
less -S # 单行显示
less -N # 显示行号
zless # 查看压缩文件
cat # 查看文本文件内容,输出到屏幕

tree # 以树的结构展示文件目录结构

tar # 解压




wc # 统计文本

cut # 文本切割


sort # 排序

uniq # 去除重复行(只去除相邻的重复行),-c 统计每个字符串连续出现的行数
paste # 文本合并,-d 指定分隔符,-s 按行合并

tr # 字符替换,-d 删除指定字符,-s 缩减连续重复字符
文件夹详解:

生物信息常见数据格式:
fasta:是一种基于文本用于表示核酸序列或多肽序列的格式。其中核酸或氨基酸均以单个字母表示,且允许在序列前添加序列名及注释。特征,2行,ID行和序列行。ID行以“>”开头,有时会包含注释信息;序列行一个字母表示一个碱基/氨基酸。
fastq:是一种存储了生物序列以及相应的质量评价的文本格式(测序的原始序列)。特征,4行。ID行,以@开头,记录必要信息;序列行;附加信息行(+ ,大部分后面啥都没有,有的是和第一行一样);碱基质量行(PHRED值,根据ASCII表,用一个字符来表示一个碱基质量的好坏)。
gff:记录序列中转录起始位点、基因、外显子、内含子等组成元件在染色体中的位置信息。现在多用第3版,即gff3。

gtf:现在多用第2版,即gtf2。可以用cufflinks里的gffread命令互相转换格式。

进阶——三驾马车
grep:

正则表达式:

sed:


