EWAS数据分析(6)— 因果分析篇
一篇介绍了mQTL和共定位分析,可以将SNP和甲基化联系起来。但是,在SNP → Methy → Phenotype这个模型中,到底谁是原因,谁是结果呢?因此,需要进行因果关联分析。
1. 因果推断检验(CIT)分析
找到差异甲基化位点之后,如果想进一步判断差异甲基化位点是否对疾病等表型起因果决定作用,可以进行因果推断检验(CIT)分析。其通过4个假设条件的检验,找到类似于SNP→Methy→Phenotype的中间调控作用关系。这4个假设分别是:
i)SNP与Phenotype具有显著关联;
ii)SNP与Methy具有显著关联(在校正Phenotype的影响之后);
iii)Methy与Phenotype具有显著关联(在校正SNP的影响之后);
iv)SNP与Phenotype相互独立(在校正Methy的影响之后);
如果上述4个条件同时满足,则SNP→Methy→Phenotype的关系在当前实验数据下具有统计显著性。其中第4个条件尤为值得注意,其验证SNP与Phenotype相互独立,从而排除了SNP同时影响Phenotype和Methy且后两者并无直接关联的情况。

2. 孟德尔随机化分析(MR)
除了CIT分析外,也可以进一步进行孟德尔随机化分析(MR)。
孟德尔随机化分析也是一种检验因果关联关系的方式。该方法的侧重点在于检验“甲基化 -> 性状”的因果关联显著性。而CIT分析则是检验“SNP -> 甲基化 -> 性状”的因果关联显著性。不过孟德尔随机化分析需要引入instrument变量,即同时对甲基化和性状产生影响的变量,一般即为SNP。在instrument变量的前提下,进行统计分析。

注:CHR:染色体;CpG pos:CpG位点编号;TEST:统计模型种类;Effective Size:效应量;STAT:回归系数检验统计量;P:因果分析P值;
通过上述两种方法的分析,我们对甲基化,SNP,性状三者的关系有了进一步的了解,把表观遗传,基因组遗传和外在表型的关系联系了起来。如果一个研究能做到这一步,发现好的结果,那么离成功就很近了。