欢迎光临散文网 会员登陆 & 注册

R数据处理-t测验

2022-04-08 14:23 作者:托芙  | 我要投稿

假设检验

  • 定义

又称显著性测验,指根据总体或样本参数,提出假设(H0和HA,通常构成完全事件系),在H0假设下,计算样本观测值发生的概率,从而做出判断。

  • 常用方法

u检验、t检验、F检验和卡方检验。

  • 基本理论依据

理论分布、小概率不可能性原理。

小概率不可能性原理:在一次试验中,概率很小的事件实际上是不可能发生的。(第一类错误 / 假阳性 α ;第二类错误 / 假阴性 β )

  • 步骤

① 根据总体和样本参数,提出无效假设

② 确定一个否定H0成立的概率 (α ) 

③ 计算H0在1-α下成立的接受域,或H0成 立的概率p 

④ 做出统计推断并对此加以解释


单样本t检验

推断该样本来自的总体平均数μ与已知的某一总体均数μ0(常为理论值或标准值)有无显著差别。


假设某水稻品种A千粒重为34g,现对另一新品种的千粒重进行100次测量,结果列于examp3-1.csv。

检验新品种的千粒重是否显著高于A?


多组数据t检验

假设某水稻品种A的千粒重为34g,现对另三个新品种的千粒重进行100次测量,结果列于example3-2.csv。

检验三个新品种的千粒重是否显著高于A 5%?另输出三个新品种的平均数、标准差、t统计数。


成对数据t检验

两组样本应一一对应,一对数据来源于实验条件基本一致的小区。


假设现要研究某肥料能否比原肥料每亩增产5kg以上皮棉,选各条件最近似的相邻小区组成一对,其中一区(x1)施新肥料,另一区施原肥料作对照(x2),重复9次。产量结果见example3-3.csv。

检验新肥料能否比原肥料每亩增产10斤以上皮棉?


研究发现,基因的表达丰度主要受基因附近变异的顺式调 控。现有418个玉米品种,经RNA-seq获取了四个开花期基因 MADS69、ZCN8、myb74和Rap2.7的表达谱数据( example3-4-2.csv),并检测了每个基因启动子区的一个核苷酸变异基因型(example3-4-1.csv)。

检验启动子区的该核苷酸突变是否会显著影响该基因本身的表达量?


R数据处理-t测验的评论 (共 条)

分享到微博请遵守国家法律