欢迎光临散文网 会员登陆 & 注册

生物信息学一非生信人如何看懂生信图合集1(1一16)

2023-08-24 22:04 作者:花臂白泽  | 我要投稿

1.火山图可以用来展示基因表达的总体差异情况,通常使用红色表示上调,绿色表示下调,灰色表示无显著变化。

2.在火山图中,纵坐标p的负对数,显著性是指p值小于0.05,p越小,点位置越高。Y=1.3以上的点p<0.05,越上越小

3.倍数变化被用来判断基因表达的差异,当基因表达的变化超过两倍时,可以定义为差异表达基因。横坐标的fc表示倍数变化,以≥2来作为标准

1.热图,用于展示基因在不同样本中的表达情况。热图由小色块构成的数值矩阵,每个色块代表一个基因的表达量,颜色越红表达量越高,越蓝表达量越低。tumor指肿瘤样本,normal指正常样本

2.聚类分析,聚类分析可以将表达模式相似的样本归为一类,通过叠加可以形成层级结构,指图中所示顶部白色线条

3热图常常与火山图一起使用,用来展示差异基因的表达情况


富集分析

1.富集分析,不筛选差异基因,预定义基因集A(自己想求证某个信号通路中的所有基因),自己的表达数据B(根据fold change基因表达程度排序),然后进行检验预定义基因集A是否在表达数据集B的顶端或底端富集或随机分布,判断基因集A在表达中的贡献

2.纵坐标ES富集分数,指A在B中的顶部或底部过表达程度,富极分数会随着计算动态变化,并在最大峰值处达到最大值。根据富极分数的正负值可以确定基因的位置,正值表示基因位于排序列表顶部,负值表示基因位于排序列表底部

3.排序列表横坐标是基因的表达量,一般从大到小排列

4.读图,rank文件排在峰值前代表上调,峰值后代表下调,NES是负值代表基因富集在底端,底端小于峰值,故该通路趋势下调。

FDRq越小,假阳性越低,,p值越准确


生物信息学一非生信人如何看懂生信图合集1(1一16)的评论 (共 条)

分享到微博请遵守国家法律