GWAS文件格式
HapMap / hmp
全称为 haplotype map
haplotype:单条染色体中的一段,即单体型。
map:单体型图谱,即全基因组上所有SNP、DNA序列的SNP分布、人群、频率、标签SNP、连锁性质与规律等。

plink
plink 主要处理五种格式的文件:
ped + map(实质为txt的原始文件)
bed + fam + bim
ped文件
即 pedigree 家系信息。

map文件
包括SNP位置信息。

bed文件
主要是二进制文件,无法查看。
bim文件
是 binary map 二进制位置信息,是map的拓展。

fam文件
即 family 家系。

vcf
描述SNP、INDEL(插入缺失标记)和SV(结构变异位点)结果的文本文件。
分为注释部分和主体部分;每一行为一个variant的信息,每一列为一个标记。
