EWAS数据分析（4）—关联分析篇

2022-06-13 13:45 作者:鲸舟基因 0人读过 | 我要投稿

通过前面3篇EWAS数据分析技术干货介绍，我们已经把进行关联分析得数据和样本都准备好了，接下来是否可以做关联分析了呢？如果你得样本性状数据已经整理好了，那我们就开始吧！

对于预处理后所得甲基化水平Beta表，针对每个CpG位点，可以Beta值为自变量，目标性状为因变量，其他因素如性别、年龄等为协变量，利用回归分析进行CpG位点甲基化显著关联分析。

当目标变量是连续型时，可以采用线性回归分析（linear regression）；若样本存在关联分层现象，也可采用混合线性回归分析（linear mixed regression）进一步处理样本分层问题。

当目标变量是离散型（二值）时，可以采用Logistic回归分析。相比于普通的t检验或KW检验，采用Logistic回归的优势在于可以进行协变量校正、处理样本分层现象。

1. 分析结果

2. 展示图

根据所有CpG位点关联分析结果，可以根据全基因组的Manhattan图和QQ图：

根据特定基因区域上CpG位点关联检验结果，可以利用CoMet绘制区域展示图：

其中最上方图内时区间内部CpG位点关联检验结果展示图；中间区域是不同来源的基因、功能注释信息；最下方区域是CpG位点之间Beta值的相关系数展示图。

通过上述关联分析，我们就可以发现与疾病某些特定形状显著性相关得甲基化位点。那么，是不是说EWAS分析已经结束了呢？这只是刚刚开始，更多精彩内容请看下回分解。

标签：

EWAS数据分析（4）—关联分析篇的评论 (共条)