GO/KEGG/GSEA通路富集那些事

常用的通路富集分析的原理
GO富集分析 (gene ontology)
- 分类(把基因注释到不同水平)
MF(molecular function)
CC(cellular component)
BF(biological process)
三者相互独立
- 分析过程
① 差异分析选择变化具有显著性的差异基因P<0.05, I logfc I >1。
② input 导入基因名,程序比对到三个层级的通路。
③ 超几何检验(推导)

KEGG富集分析
由于实验变量的作用使得实验个体或者组发生了较大的基因表达变化,导致通路有较大变化。
- 分析过程
① 差异分析选择变化具有显著性的差异基因P<0.05, I logfc I >1。from DEG
② input 导入基因名,程序比对到三个层级的通路。
③ 超几何检验
GSEA富集分析
特点:不需要使用差异分析,不需要人为设定一个阈值。 从而保留了基因表达变化较小,但是仍然能导致通路发生较大改变的对象。
- 分析过程
① 导入:基因表达矩阵/ logfc 全部的基因
② 排序:根据基因表达量对基因进行排序
③ 打分:在通路中/不在通路中

峰值之前 (核心基因)