欢迎光临散文网 会员登陆 & 注册

小卫智库 | 概率分布与抽样分布别再傻傻分不清!

2021-12-20 10:32 作者:卫灿公卫研习社  | 我要投稿


在学习统计学的过程中,掌握好各种统计概念也是我们学好统计中必不可少的一步。只有在掌握好概念的基础上,我们才能更好的运用。概率分布和抽样分布是我们进行统计推断基础,那我们今天一起来看一看吧!


概率分布


什么是概率分布?


在概率论和统计学中,随机变量是一个随机值的东西,比如投骰子时1出现的可能性。给定一个随机变量x时,我们想要一种描述它的值的方法,更重要的是我们想要描述该变量获取特定值x的可能性。因此就需要一种明确的数学方法来表达变量x可以采用的每个可能值x,以及某事件(x)发生的可能性。概率分布就是用来描述这一系列数值的规律。


概率分布有哪些类型呢?


在开始说分布类型之前,我们先来看看数据的类型。随机变量可以根据其取值特征,可以分为离散(不连续)变量和连续变量。离散变量是指具有一组离散的可能值,如投骰子只能出现1、2、3、4、5、6。而连续变量指的就是在给定范围内取任何值,如人的身高,可以是155cm、也可以是155.65cm。那我们再来看看常见的概率分布有哪些呢?


(1)正态概率分布(正态分布):

这一类是自然界中很常见的分布,如人的身高分布。这一类的变量分布是对称的,以均值为中心,数据类型是连续性随机变量。

(2)二项分布:

举个“栗子”,如抛硬币,结果只有正面和反面两种结果,每次正面或反面的结果可能性均为0.5,这里就可以知道二项分布的应用条件就是每个观察单位的结果相互独立即每次发生的可能性不会改变,并且实验的结果只有互相对立的两种结果之一,数据类型是离散型随机变量。

(3)泊松分布(Poisson分布):

适用于描述单位时间或单位空间内随机事件发生次数的概率分布,如研究每升水中大肠菌群数的分布。它的应用条件与二项分布应用要求是一致的,即要求事件的发生是互相独立的,且发生的概率不变,结果也是只有互相对立的两种结果之一,数据类型是离散型随机变量。

抽样分布


什么是抽样分布?


抽样,就是从研究的总体中抽取一部分个体作为我们真正的研究对象,可以简单把样本理解为总体的一个子集,通过样本的结果来推测总体情况。比如我们想知道中国成年男性的平均体重,理论上最准确的办法是调查中国所有成年男性的体重,然后计算平均数。


显然这并不是现实的,因此我们抽取一部分中国成年男性,测量这部分的体重,计算出平均体重,由这个平均体重来大致估计总体的平均体重了。


听起来是不是很简单,事实上就是需要用到抽样分布啦!对同一总体中每进行一次随机抽样就会得到一个随机样本,通过每一个随机样本就可以计算一个随机统计量(如平均数、标准差),理论上如果对这一总体的所有可能样本都进行抽取,则所有可能样本的统计量所形成的概率分布就是抽样分布。


根据中心极限定理,无论总体分布的形态如何,只要样本量足够大,则统计量的抽样分布就一定接近正态分布。因此抽样分布是一种理论分布,它既不是总体分布也不是某一样本的分布。


抽样分布有哪些?


正态分布是最重要的一种理论分布,是连续随机变量分布,t分布、F分布和卡方分布均在它的基础上推导出来的。


(1)正态分布:

是一种概率密度函数曲线,若随机变量X是服从均数为μ,方差为σ2的钟型曲线。


(2)t分布:

若随机变量X是服从X~N(0,1)分布,随机变量服从t分布,即,则服从自由度为n-1的t分布。

(3)卡方分布:

(4)F分布:

小卫点睛


课本定位:


《卫生统计学》(人卫第八版)第四章基本概率理论及第五章统计量的抽样分布;《医学统计学》(陆守曾第三版)第二章个体变异与变量分布及第三章抽样误差


知识点:概率分布


 正态分布、二项分布、Poisson分布 

t分布、卡方分布、F分布


小卫智库 | 概率分布与抽样分布别再傻傻分不清!的评论 (共 条)

分享到微博请遵守国家法律