欢迎光临散文网 会员登陆 & 注册

医学数据的正态性的检验方法之K-S检验(使用spss统计软件)——【杏花开医学统

2023-01-19 15:57 作者:specCthul  | 我要投稿

【核心】正态性检验之 直方图(任何样本量)&K-S检验(样本量>2000

【连续数值型资料】正态性检验:

①图示法(直方图法、P-P图法、Q-Q图法)

②参数法(K-S检验、S-W检验、峰度和偏度系数等)。

正态分布(normal distribution)是一种最常见、最重要的连续型随机变量分布,许多统计方法如t检验、方差分析等需要样本数据满足正态分布的条件。

一、直方图

1.正态性检验界面:分析—描述统计—探索

2.单样本正态性检验界面,选入“体重”至“因变量列表”,“图”模块进行正态性检验

① 因变量列表(dependent variable):这一选框选入检验变量、或者结局变量(是希望去探讨的目标变量)

② 图:见下图:选“含检验的正态图、茎叶图、直方图”

① 茎叶图和直方图,两者都√上。特别是直方图,可以直观地看出数据的分布形态。

② 含检验的正态图:这一选项即进行正态性检验。

3.单样本正态性分析结果及解释

SPSS提供两种正态性检验结果,分别是柯尔莫戈洛夫-斯米诺夫(Kolmogorow-Smironov,KS)检验,另外一个是夏皮洛-威尔克(Shapiro-wilk,SW)。中文翻译起来非常别扭,建议用英文和缩写区别二者。二者结果均有统计量(statistic),df(自由度),显著性(sig., P值)。 

划重点:一般样本量在2000以下时选择SW的方法,因此SW适合样本量较小的研究(一般小样本量为30-50以内一组),本例亦是如此。事实上,可能大部分研究正态性检验选择SW检验方法。正态性检验最重要的是看“显著性”。

0.05 服从正态分布

0.05 不服从正态分布

因此,本例结论是,P=1.000>0.05,差异没有统计学意义,不能说明该样本的总体分布是偏态分布,可以认为该体重正态性是符合的

此外,直方图能够较直观判断数据分布特征。可以看出,体重大致属于中间多两边少的正态分布。

4.多样本正态性检验界面

多样本正态性与单样本正态性检验相似,但“探索”界面稍有不同。

① 因子列表(Factor variable):这一选框选入分组变量、或者原因变量。本研究分组变量为group(饲料类型),可以分为2组。

② 图:见单样本正态性检验,此处略

5.多样本正态性检验结果及解释

经SW检验,结果为:高蛋白组体重P=0.977,低蛋白组体重P=0.974,没有统计学意义,两组数据正态性均符合。 

它们各自的直方图如下:

实际统计策略方面,诸位可以将数据分布分为三类:正态分布、近似正态分布数据和严重偏态分布数据。

第1类:正态分布符合,P >0.05;

第2类:正态分布不符合,P=<0.05,但直方图还是呈现大致的中间多两边少,无严重极端值;

第3类:正态分布不符合,P=<0.05,数据严重偏态,或者存在明显极端异常值。

第1类(左)和第2类(右)数据的正态曲线图


第3类数据的正态图:存在严重极端值(左)、严重偏态分布(右)

*一般情况下,前两类仍然可以用均数及标准差描述,用t检验和F检验进行统计推断,后者须用非参数检验。

总结来说,判断数据正态性,需要结合直方图和正态性检验,将数据分布分为三大类,在此基础上分别选择不同的统计方法进行统计描述和统计推断。


二、K-S

一、基本原理

   (1)什么是正态分布?

  如果随机变量X的分布服从概率密度函数

则称X服从正态分布,记作X~ N(μ,σ 2 ),μ为X的总体均数,σ 2为总体方差。

 可以知道,正态分布有两个参数,即位置参数μ和形态参数σ。

  若固定形态参数σ,则正态曲线的位置随着μ的改变沿X轴左右移动;若固定位置参数μ,则正态曲线的形状随着σ的改变沿着Y轴变高变低。

(2)什么是K-S检验?

  K-S(Kolmogorov-Smirnov)检验,也称D检验,基于累计分布函数,通过对两个分布之间的差异的分析,用以检验样本是否服从某一指定分布的方法。若累计频数分布与指定分布差异很小,则推论该样本服从该指定分布。其基本原理如下:

  H0:样本来自的总体分布服从某指定分布。

  H1:样本来自的总体分布不服从某指定分布。

  检验统计量为:

注:该指定分布可以是连续分布如正态分布、指数分布、均匀分布,也可以是离散分布如泊松分布。

(3)适用条件

  K-S检验适合大样本的检验,样本量一般在100以上。

二、案例解读

  现有一组儿童身高及其身高评分的样本数据,样本量为164。我们采用K-S检验儿童身高和身高评分数据是否符合正态分布。

(1)在SPSS中的具体操作

  ①依次点击“分析——非参数检验——1个样本”。

 ②在出现的“单样本K-S检验”窗口中,

 ③将“儿童身高”和“身高评分”变量放入“检验变量列表”;检验分布选择“常规”。

  ④点击“确定”,得到检验结果。

儿童身高 身高评分

Z统计量: 0.054 0.058

显著性水平: 0.200 0.200

(2)结果解读

  由检验结果可知,儿童身高和身高评分的显著性P=0.200>0.05,则接受原假设,认为样本与所指定的分布方法一致,即与正态分布一致,可认为儿童身高和身高评分服从正态分布

0.05 服从正态分布

0.05 不服从正态分布


医学数据的正态性的检验方法之K-S检验(使用spss统计软件)——【杏花开医学统的评论 (共 条)

分享到微博请遵守国家法律