R|利用rTASSEL进行全基因组关联分析(四)
上节回顾:数据前处理,过滤最小等位基因频率≤0.05的SNP位点。
本节主要内容是:利用rTASSEL对自己的数据进行全基因组关联分析。
一、从路径读取数据
基因型数据的首行和基因型数据如下:



*共238份样品,97276个SNP位点。
二、数据过滤

*可以看到数据过滤后剩57227个SNP位点【这里缺失率依据样本自行调整】
三、计算亲缘关系

四、计算混合线性模型(MLM)
五、数据结果可视化绘制曼哈顿图(Manhattan)
注:这里一开始使用rTASSEL中的内置包绘制曼哈顿图踩了一个坑,是自己数据的问题。


很好,自己的数据成功白屏。9w SNP还是挺大数据的。
换种思路,让他直接导出到PDF文档中。

*额……一开始以为是数据量太大。后来想起自己文件的Chr数据直接是基因,而不是染色体。

那咱就直接导出数据包,然后手动进行修改哈。不要难为自己,一码到底。
导出后的数据:

修改后数据,直接保留作图需要的四列即可。


后边就可以寻找具显著关联的染色体和位点啦!

预告:
1. CMplot、qqman代码简介。
2. 对hmp文件进行修改。(这里使用自己的数据进行分析时出现的问题)
3. 修改曼哈顿图绘制数据中的染色体一列。使用qqman染色体位置需要用数字类型,像小麦这种染色体命名为1A、1B、1D的命名方式需要修改成1、2、3才可以用qqman作图。
……【后续想起来再补充】

【最复杂的代码,做最简单的事。】