R语言进行单倍型分析
注:第一次发布时,自定义函数的代码块被吞了,2月15日补上了。
GWAS分析得到QTN后,需要鉴定已知基因和挖掘候选基因。单倍型分析可以用于验证所得到的的候选基因是否可靠。
单倍型分析的大致思路是:遍历候选基因表,对于其中的每一行,提取该基因范围内的SNP,结合其对应的表型数据集,进行方差分析。
提取SNP这一步可以用plink进行,以提取1号染色体的10000到15000位点之间的SNP为例,指令如下。
plink处理只适用于候选基因较少且有plink格式基因型文件的情况。(或许也可以批量处理,但我不会)
候选基因很多,或者不能转换得到plink格式时,可以直接使用R处理。

下面演示可用于单倍型分析的两个函数内容以及使用方法。
已经得到候选基因对应的SNP数据、表型数据时,可只使用haplo1_single或haplo1_meja函数,然后对得到的数据框使用aov函数即可;如果没有,可以使用haplo2函数来处理得到上述数据,将直接输出多个包含方差分析结果的列表。
single为单环境分析,meja为多环境联合分析(Multi-environment joint analysis)。