EWAS数据分析(4)—关联分析篇
通过前面3篇EWAS数据分析技术干货介绍,我们已经把进行关联分析得数据和样本都准备好了,接下来是否可以做关联分析了呢?如果你得样本性状数据已经整理好了,那我们就开始吧!
对于预处理后所得甲基化水平Beta表,针对每个CpG位点,可以Beta值为自变量,目标性状为因变量,其他因素如性别、年龄等为协变量,利用回归分析进行CpG位点甲基化显著关联分析。
当目标变量是连续型时,可以采用线性回归分析(linear regression);若样本存在关联分层现象,也可采用混合线性回归分析(linear mixed regression)进一步处理样本分层问题。
当目标变量是离散型(二值)时,可以采用Logistic回归分析。相比于普通的t检验或KW检验,采用Logistic回归的优势在于可以进行协变量校正、处理样本分层现象。
1. 分析结果

2. 展示图
根据所有CpG位点关联分析结果,可以根据全基因组的Manhattan图和QQ图:

根据特定基因区域上CpG位点关联检验结果,可以利用CoMet绘制区域展示图:

其中最上方图内时区间内部CpG位点关联检验结果展示图;中间区域是不同来源的基因、功能注释信息;最下方区域是CpG位点之间Beta值的相关系数展示图。
通过上述关联分析,我们就可以发现与疾病某些特定形状显著性相关得甲基化位点。那么,是不是说EWAS分析已经结束了呢?这只是刚刚开始,更多精彩内容请看下回分解。