欢迎光临散文网 会员登陆 & 注册

EWAS数据分析(4)—关联分析篇

2022-06-13 13:45 作者:鲸舟基因  | 我要投稿

通过前面3篇EWAS数据分析技术干货介绍,我们已经把进行关联分析得数据和样本都准备好了,接下来是否可以做关联分析了呢?如果你得样本性状数据已经整理好了,那我们就开始吧!

对于预处理后所得甲基化水平Beta表,针对每个CpG位点,可以Beta值为自变量,目标性状为因变量,其他因素如性别、年龄等为协变量,利用回归分析进行CpG位点甲基化显著关联分析。

当目标变量是连续型时,可以采用线性回归分析(linear regression);若样本存在关联分层现象,也可采用混合线性回归分析(linear mixed regression)进一步处理样本分层问题。

当目标变量是离散型(二值)时,可以采用Logistic回归分析。相比于普通的t检验或KW检验,采用Logistic回归的优势在于可以进行协变量校正、处理样本分层现象。


1. 分析结果

表1 CpG位点甲基化显著关联分析结果。注:CHR:染色体;CpG pos:CpG位点编号;TEST:统计模型种类;Effective Size:效应量,即回归系数或Odds Ratio;STAT:回归系数检验统计量;P:回归分析P值


2. 展示图

根据所有CpG位点关联分析结果,可以根据全基因组的Manhattan图和QQ图:

图1 全基因组的Manhattan图和QQ图


根据特定基因区域上CpG位点关联检验结果,可以利用CoMet绘制区域展示图:


图2 特定区域位点关联检验结果展示图


其中最上方图内时区间内部CpG位点关联检验结果展示图;中间区域是不同来源的基因、功能注释信息;最下方区域是CpG位点之间Beta值的相关系数展示图。


通过上述关联分析,我们就可以发现与疾病某些特定形状显著性相关得甲基化位点。那么,是不是说EWAS分析已经结束了呢?这只是刚刚开始,更多精彩内容请看下回分解

EWAS数据分析(4)—关联分析篇的评论 (共 条)

分享到微博请遵守国家法律