欢迎光临散文网 会员登陆 & 注册

数理统计分析方法及数学原理

2023-01-10 11:21 作者:洛溪い  | 我要投稿

(1)正态性检验:利用观测数据判断总体是否服从正态分布的检验称为正态性检验,它是统计判决中重要的一种特殊的拟合优度假设检验。常用的正态性检验方法有正态概率纸法、夏皮罗维尔克检验法(Shapiro-Wilktest),科尔莫戈罗夫检验法,偏度-峰度检验法等。


正态性检验

(2)方差齐性检验:F检验(F-test),最常用的别名叫做联合假设检验(英语:joint hypotheses test),此外也称方差比率检验方差齐性检验。它是一种在零假设(null hypothesis, H0)之下,统计值服从F-分布的检验。其通常是用来分析用了超过一个参数的统计模型,以判断该模型中的全部或一部分参数是否适合用来估计母体。


计算过程

(3)t检验:t检验,亦称student t检验(Student's t test),主要用于样本含量较小(例如n < 30),总体标准差σ未知的正态分布。 t检验是用t分布理论来推论差异发生的概率,从而比较两个平均数的差异是否显著。t检验可分为单总体检验和双总体检验,以及配对样本检验。


单总体检验
独立样本t检验

配对样本t检验

(4)曼-惠特尼(Mann whitney)U检验:

第一步:将两组样本数据混合,并按照数据大小的升序编排等级。最小的数据等级为1,第二小的数据等级为2,以此类推(注意,如果混合后的数据中存在相等的情况,那么相同数据的等级值应该是相同的,并取未经排名的数组中的平均值。如数据{3, 5, 5, 9},那么他们的等级值应该是{1, 2.5, 2.5, 4}。)

第二步:分别求出两个样本的等级和R1,R2

第三步:假设n1 = “一号样本观察值的项数”;n2 = “二号样本观察值的项数”;R1 = “一号样本各项等级和”;R2 = “二号样本中各项等级和”。那么U1U2 的计算公式分别如下所示:

1
U1 = R1 - n1*(n1+1)/ 2
1
U2 = R2 - n2*(n2+1)/ 2

那么 U1与U2之和的计算公式如下所示,

1
U1 + U2 = R1 + R2 - (n1 * (n1 + 1) + n2 * (n2 + 1))/ 2

设2组样本总共数据有N 个,即 N = n1 + n2,又因为R1 + R2 = N(N + 1)/ 2 ,代入上式,可得

1
U1 + U2 = n1 * n2

选择U1 和U2 中最小者与临界值 比较,当U < Uα时,拒绝H0,接受H1

在原假设为真的情况下,随机变量 的均值和方差分别为:

E(U)=n1*n2/2 D(u)=n1*n2*(n1+n2+1)/12

n1 和n2 都不小于 10 时,随机变量近似服从正态分布。

第四步:作出判断。

设第一个总体的均值为 u1,第二个总体的均值为 u2,则有:

1)Ho:u1 ≤ u2,H1:u1 >u2 if Z< -Za, 拒绝 Ho;

2)Ho:u1 ≥ u2,H1:u1 < u2 if Z> -Za, 拒绝 Ho;

3)Ho: u1 = u2, H1:u1 != u2 if Z> -Za / 2,拒绝 Ho。

(5)Z检验:Z检验(Z Test)又叫U检验。由于实际问题中大多数随机变量服从或近似服从正态分布,U作为检验统计量与X的均值是等价的,且计算U的分位数或查相应的分布表比较方便。通过比较由样本观测值得到的U的观测值,可以判断数学期望的显著性,我们把这种利用服从标准正态分布统计量的检验方法称为U检验(U-test)。


选择统计量

运算及说明

(6)克鲁斯卡尔-沃利斯检验(Kruskal-Wallis test):克鲁斯卡尔-沃利斯检验(Kruskal-Wallis test)亦称“K-W检验”、“H检验”等。用以检验两个以上样本是否来自 同一个概率分布的一种非参数方法。被检验的几个样本必须是独立的或不相关的。与此检验对等的参数检验是单因素方差分析,但与之不同的是,K-W检验不假设样本来自正态分布。它的原假设是各样本服从的概率分布具有相同的中位数,原假设被拒绝意味着至少一个样本的概率分布的中位数不同于其他样本。此检验并未识别出这些差异发生在哪些样本之间以及差异的大小。


检验步骤
表1

表2
图像

(7)卡方分布:若n个相互独立的随机变量ξ₁,ξ₂,...,ξn ,均服从标准正态分布(也称独立同分布于标准正态分布),则这n个服从标准正态分布的随机变量的平方和构成一新的随机变量,其分布规律称为卡方分布(chi-square distribution)。


卡方分布

(8)Fisher确切概率法:费希尔精确概率检验(Fisher's precision probability test),亦称“四格表的确切概率法”。主要用于四格表资料各格中有一格理论次数小于 5 时的独立性检验的方法。先将根据实际资料所列的四格表在边缘次数不变的情况下,排出有一格次数为零的各种组合。


计算概率



数理统计分析方法及数学原理的评论 (共 条)

分享到微博请遵守国家法律