R数据分析-f测验
方差分析的意义
单个或两个样本的样本平均数检验常用u或t检验,但一般不在两个以上样本平均数的比较中使用t检验的方法。
① t检验要进行两两比较,若在多样本中进行则过于繁琐;
② t检验无统一的试验误差,误差估计的准确性与检验灵敏性低;
③ t检验增大犯α错误的概率。
综上,多个平均数的差异显著性检验不适合用t检验,需要使用方差分析法(analysis of variance, ANOVA)。
方差分析的一般步骤
① 平方和与自由度的分解
② 列出方差分析表,作F测验
③ 若F检验显著,则进行多重比较
④ 结果的解释/说明
常用lm()和aov()函数分析ANOVA模型。
formula中可使用特殊符号(y是因变量,字母 A,B,C是因子自变量)。
~ 分隔符号,左边为因变量,右边为自变量, 如y~A
+ 自变量分隔符,如y~A+B
: 变量交互项,如y~A+B+A:B
* 表示所有可能交互项,如y~ABC等同于 y~A+B+C+A:B+A:C+B:C
. 表示除因变量外,数据框中所有的变量。
单因素方差分析
假设现作水稻施肥的盆栽试验,有5种施肥方式,每种方式各处理4盆。20盆水稻的稻谷产量列于example4-1.csv,试测验各处理平均数的差异显著性。
双因素方差分析
玉米开花期调控通路中,MADS69通过激活ZCN8基因的表达,从而促进开花。现有 MADS69和ZCN8启动子区的某个SNP基因型,以及ZCN8基因在玉米苗期的表达量丰度,列于example4-2.csv。利用双因素方差分析,检验该SNP位点的互作是否会影响ZCN8基因表达。