欢迎光临散文网 会员登陆 & 注册

R语言进行单倍型分析

2023-02-13 16:37 作者:托芙  | 我要投稿

注:第一次发布时,自定义函数的代码块被吞了,2月15日补上了。


GWAS分析得到QTN后,需要鉴定已知基因和挖掘候选基因。单倍型分析可以用于验证所得到的的候选基因是否可靠。

单倍型分析的大致思路是:遍历候选基因表,对于其中的每一行,提取该基因范围内的SNP,结合其对应的表型数据集,进行方差分析。


提取SNP这一步可以用plink进行,以提取1号染色体的10000到15000位点之间的SNP为例,指令如下。


plink处理只适用于候选基因较少且有plink格式基因型文件的情况。(或许也可以批量处理,但我不会)

候选基因很多,或者不能转换得到plink格式时,可以直接使用R处理。


后续使用的基因型数据结构,与hmp格式类似


下面演示可用于单倍型分析的两个函数内容以及使用方法。

已经得到候选基因对应的SNP数据、表型数据时,可只使用haplo1_single或haplo1_meja函数,然后对得到的数据框使用aov函数即可;如果没有,可以使用haplo2函数来处理得到上述数据,将直接输出多个包含方差分析结果的列表。

single为单环境分析,meja为多环境联合分析(Multi-environment joint analysis)。



R语言进行单倍型分析的评论 (共 条)

分享到微博请遵守国家法律