欢迎光临散文网 会员登陆 & 注册

R|利用rTASSEL进行全基因组关联分析(四)

2023-04-26 22:11 作者:伏见锁骨上的印记_  | 我要投稿

上节回顾:数据前处理,过滤最小等位基因频率≤0.05的SNP位点。

本节主要内容是:利用rTASSEL对自己的数据进行全基因组关联分析。

一、从路径读取数据

基因型数据的首行和基因型数据如下:

基因型数据的首行
基因型数据
查看数据信息

*共238份样品,97276个SNP位点。

二、数据过滤

查看数据类型

*可以看到数据过滤后剩57227个SNP位点【这里缺失率依据样本自行调整】

三、计算亲缘关系

亲缘关系数据结果查看

四、计算混合线性模型(MLM)

五、数据结果可视化绘制曼哈顿图(Manhattan)

注:这里一开始使用rTASSEL中的内置包绘制曼哈顿图踩了一个坑,是自己数据的问题。

结果白屏

很好,自己的数据成功白屏。9w SNP还是挺大数据的。

换种思路,让他直接导出到PDF文档中。

额……

*额……一开始以为是数据量太大。后来想起自己文件的Chr数据直接是基因,而不是染色体。

那咱就直接导出数据包,然后手动进行修改哈。不要难为自己,一码到底。

导出后的数据:

混合线性模型结果

修改后数据,直接保留作图需要的四列即可。

用于绘制曼哈顿的数据
结果输出

 后边就可以寻找具显著关联的染色体和位点啦!

预告:

1.     CMplot、qqman代码简介。

2.     对hmp文件进行修改。(这里使用自己的数据进行分析时出现的问题)

3.     修改曼哈顿图绘制数据中的染色体一列。使用qqman染色体位置需要用数字类型,像小麦这种染色体命名为1A、1B、1D的命名方式需要修改成1、2、3才可以用qqman作图。

……【后续想起来再补充】

 

【最复杂的代码,做最简单的事。】 

R|利用rTASSEL进行全基因组关联分析(四)的评论 (共 条)

分享到微博请遵守国家法律