欢迎光临散文网 会员登陆 & 注册

GWAS的meta分析:控制假阳的常见手段之一

2023-08-20 19:00 作者:尔云间  | 我要投稿

相信各位在学习GWAS原理时对GWAS的作图群体有了一定的了解,在林木、农作物等生长时间较长的物种来说,构建子代、RIL甚至NAM群体需要较长的时间,在群体构建完成之前,GWAS是少有的自然群体适合做的分析之一。尽管如此,受限于自然群体的特性,自然群体无法获得明确的谱系,一般都是通过基因型PCA确定亲缘关系,减少假阳性。因此当群体出现分层时,常规手段是将分层的群体独立进行分析,最后再做meta分析。

1.如何判断群体是否分层

首先使用plink计算PCA,具体方法详见小云以往公众号。

绘制出不同群体PC1、PC2的双标图后,就可以观察群体之间是否明显分开,如果群体明显分层了,需要单独进行关联分析,最后在做meta分析。

2.如何做meta分析

这里小云推荐使用metal进行meta分析,原因当然是简单好用,还有windows版呢。下载链接如下:

http://csg.sph.umich.edu/abecasis/metal/download/

metal支持三个平台,小云这里还是以最常见的Linux举例,下载命令如下:

wget http://csg.sph.umich.edu/abecasis/metal/download/Linux-metal.tar.gz

解压软件:

tar -zxvf Linux-metal.tar.gz

分析的文件来源于metal的示例数据,解压后的文件夹中包含两个示例文件,咱使用./generic-metal/examples/GlucoseExample下的数据进行演示

示例文件中运行meta分析的文档分别为DGI_three_regions.txt和magic_SARDINIA.tbl,

DGI_three_regions.txt如下所示

magic_SARDINIA.tbl如下所示

运行分析前需要准备一个metal.txt文件,如下图所示

其中MARKER对应的是DGI_three_regions.txt文档的SNP列名;

WEIGHT对应的是DGI_three_regions.txt文档的SNP列名;

 

其他的以此类推;相当于metal分析的config文件。

 

运行代码

metal metal.txt

 

进行meta分析,meta分析后会生成两个文件,分别是METAANALYSIS1.TBL和 METAANALYSIS1.TBL.info

 

其中METAANALYSIS1.TBL 是meta分析的结果文档;

咱们一般主要专注meta分析后的pvalue。

 

METAANALYSIS1.TBL.info文件主要是对METAANALYSIS1.TBL的注释,感兴趣的可以仔细阅读。

好啦,meta分析到这就结束了,关注小云,小云带你学习更多生信分析。


GWAS的meta分析:控制假阳的常见手段之一的评论 (共 条)

分享到微博请遵守国家法律