R可视化——ggseqlogo包绘制序列分析图
序列分析图(sequence logo)一般指以图形方式依次展示序列比对中各个位置上出现的残基及其频率,常用于描述序列特征,如DNA中的蛋白质结合位点或蛋白质中的功能单元。序列分析图中每个残基对应图形字符的大小与残基在该位置上出现的频率是成正比的!
安装、加载R包
数据
支持序列与矩阵两种格式的文件,以以ggseqlogo包自带示例数据ggseqlogo_sample为例:




ggseqlogo包绘图参数
1、基本参数查看
2、基本序列分析图绘制


3、方法的选择——“bits”(默认)和“probability”

4、绘制多个图时通过facet与ncol控制


5、序列类型的指定


6、配色方案



7、自定义配色方案——通过make_col_scheme参数实现,有离散型与连续性两种方式


8、字体设置


9、字母宽度设置

10、注释——与ggplot2注释原理一致




绘图模板代码

参考:https://omarwagih.github.io/ggseqlogo/