欢迎光临散文网 会员登陆 & 注册

R数据处理-卡方检验

2022-04-30 12:27 作者:托芙  | 我要投稿

卡方(χ2)检验

连续性数据的χ2指多个相互独立的正态离差平方值的总和。

分布特点:

  • 取值范围为[0,∞)

  • 平均数为μ

  • 分布图形为一组具不同自由度v值的曲线,自由度小时呈偏态,随着自由度增加,偏度降低,至+∞时,呈对称分布。

适合性检验

指根据调查结果测验未知总体是否符合已知理论规律的统计方法,也叫拟合优度(goodness of fit)检验。

常见于次数分布资料的观察次数与理论次数的分布。


独立性检验

又叫次数资料的相依性检验,是检验两个方向上数据资料的表现是相互独立的还是相互影响的一种统计分析方法。


卡方检验的一般步骤

1.做出零假设

2.统计资料观测次数和理论次数

3.计算χ2值和p值

4.进行统计推断


适合性检验

1.假设现有大豆花色一对等位基因的遗传研究,在F2获得分离,产生红花(AA)、粉色花(Aa)、白花(aa)三种表型。 分析基因F2群体分离情况(example5-1.csv)是否符合孟德尔分离比。

2.假设有一水稻遗传试验,以非糯品种与糯性品种杂交,其F2代性状会按非糯(A1)和糯性(A2)分离(example5-2.csv)。根据观测结果推测糯性性状的遗传模式。 

①一对基因控制,3:1 

②两对基因隐性抑制, 9:7 

③两对基因显性互补, 15:1


独立性检验

假设有460粒小麦种子,现调查其是否经过灭菌处理及发生散黑穗病的情况(example5- 3.csv)。分析种子是否灭菌(A1、A2)与是否发生散黑穗病穗(B1、B2)有关。


适合性检验-遗传群体偏分离和杂合度检验

假设现有一个玉米重组自交系F6群体,共192个株系,现取其第1染色体上前20个SNP标记基因型,0为缺失,1为AA,2为TT,3为杂合AT(example5-4.csv)。试估计这20个SNP标记的偏分离和杂合度情况是否符合理论值。


独立性检验-基因型与性状关联分析

假设有约500个玉米自交系,玉米棒子轴色存在红轴(1)和白轴(0)分离,已知控制玉米轴色的基因p1在第1染色体。现有通过Golden Gate芯片获得的SNP基因型数据(example5-5-1.csv)和自交系的轴色数据(example5-5-2.csv)。是通过统计方法(case-control association)估计轴色基因p1的大致位置。


R数据处理-卡方检验的评论 (共 条)

分享到微博请遵守国家法律