欢迎光临散文网 会员登陆 & 注册

「生信技能树」2021公益课(linux基础 & conda)

2022-03-21 15:13 作者:一只小蛮要  | 我要投稿

看完啦!

老师声音很好听,讲得也很棒,普通话也好,可以推荐!


BTW,由于是自用笔记,所以自己已经会的东西就没有记录啦,只记录了自己有点记不清或者新学到的东西嘿嘿嘿!



新姿势:

  • wget:-c, --continue 断点续传(恢复获取部分下载的文件)
  • source ~/.bashrc:刷新环境配置,即重新加载一下 ~/.bashrc 让修改生效,也可用 . ~/.bashrc ,. 等同于source
  • 软链接:ln,分为软链接(常用)和硬链接(默认),软链接相当于Windows下的快捷方式。ln不加参数即为硬链接,加上-s参数即为软链接。常见用法:ln -s TARGET[绝对路径] DIRECTORY



尚未理解:

  • 巧用alias
    
    19-conda的进阶技巧 P19 - 11:23
    
  • 删除没有使用的包
    
    19-conda的进阶技巧 P19 - 13:06
    



快捷方式:

Ctrl + U 剪切光标位置到行首的字符

Ctrl + E 回到行尾

Ctrl + A 回到行首

Ctrl + W 剪切一个单词

Ctrl + Y 粘贴命令行剪切的内容

Ctrl + K 剪切光标位置到行首的字符



一些命令:

cd - # 返回上次的工作目录

ls -t # 以时间排序列出当前目录下文件

ls -R # 递归目录列出文件

ls -d # 显示目录本身,而非目录下文件

ls ./*txt # 列出当前目录下以txt结尾的文件

ls ../ # 列出上层目录的文件

ls -l # 列出当前目录下文件的详细信息

mkdir -p # 递归创建目录

mv # 移动或重命名

cp -r # 复制

rm -rfi # 递归删除/不显示警告讯息/删除前询问用户

head/tail # 查看文件前/后n行,默认10行。head常结合管道符用于控制输出行数。(管道符:|)

more # 逐页查看,按空格翻页,按回车换行,q退出

less -S # 单行显示

less -N # 显示行号

zless # 查看压缩文件

cat # 查看文本文件内容,输出到屏幕


tree # 以树的结构展示文件目录结构


tar # 解压





wc # 统计文本


cut # 文本切割



sort # 排序


uniq # 去除重复行(只去除相邻的重复行),-c 统计每个字符串连续出现的行数

paste # 文本合并,-d 指定分隔符,-s 按行合并


tr # 字符替换,-d 删除指定字符,-s 缩减连续重复字符



文件夹详解:



生物信息常见数据格式:

fasta:是一种基于文本用于表示核酸序列或多肽序列的格式。其中核酸或氨基酸均以单个字母表示,且允许在序列前添加序列名及注释。特征,2行,ID行和序列行。ID行以“>”开头,有时会包含注释信息;序列行一个字母表示一个碱基/氨基酸。

fastq:是一种存储了生物序列以及相应的质量评价的文本格式(测序的原始序列)。特征,4行。ID行,以@开头,记录必要信息;序列行;附加信息行(+ ,大部分后面啥都没有,有的是和第一行一样);碱基质量行(PHRED值,根据ASCII表,用一个字符来表示一个碱基质量的好坏)。

gff:记录序列中转录起始位点、基因、外显子、内含子等组成元件在染色体中的位置信息。现在多用第3版,即gff3。

gtf:现在多用第2版,即gtf2。可以用cufflinks里的gffread命令互相转换格式。



进阶——三驾马车

grep:


正则表达式:


sed:







「生信技能树」2021公益课(linux基础 & conda)的评论 (共 条)

分享到微博请遵守国家法律