R语言进行单倍型分析

2023-02-13 16:37 作者:托芙 0人读过 | 我要投稿

注：第一次发布时，自定义函数的代码块被吞了，2月15日补上了。

GWAS分析得到QTN后，需要鉴定已知基因和挖掘候选基因。单倍型分析可以用于验证所得到的的候选基因是否可靠。

单倍型分析的大致思路是：遍历候选基因表，对于其中的每一行，提取该基因范围内的SNP，结合其对应的表型数据集，进行方差分析。

提取SNP这一步可以用plink进行，以提取1号染色体的10000到15000位点之间的SNP为例，指令如下。

plink处理只适用于候选基因较少且有plink格式基因型文件的情况。（或许也可以批量处理，但我不会）

候选基因很多，或者不能转换得到plink格式时，可以直接使用R处理。

下面演示可用于单倍型分析的两个函数内容以及使用方法。

已经得到候选基因对应的SNP数据、表型数据时，可只使用haplo1_single或haplo1_meja函数，然后对得到的数据框使用aov函数即可；如果没有，可以使用haplo2函数来处理得到上述数据，将直接输出多个包含方差分析结果的列表。

single为单环境分析，meja为多环境联合分析（Multi-environment joint analysis）。

R语言进行单倍型分析的评论 (共条)