有意思的概率与统计(九)
好了!进入到又一个重点了!
在介绍完基本的随机变量特征和性质之后,我们就要开始了解一些重要的分布了。这些分布基本涵盖了我们日常分析各种问题时所能面临的各种情况。因此,仔细学习和了解这些重要的分布十分必要的。
希望大家好好理解哟~
Chapter Two 随机变量及其分布
2.4 常用离散分布
我们先从离散分布入手,介绍一些基本的随机变量分布~
首先是——二项分布。
我们在中学阶段已经了解过二项分布的基本概念和特征,其与独立随机试验有所关联。
我们来考虑这样一个例子:
例1:某特效药的临床有效率为p,今有n人服用,求治愈人数X的分布列。
对于这10个服用特效药的人而言,彼此之间是否治愈是相互独立的,并不会因为其中某一个人治愈与否就会影响其他人的治愈结果。因此,这是一个独立重复试验。
基于此,我们很容易就给出X的分布列为:
其中,组合数的含义是在n个人中选择出k个人被治愈,剩余的n-k个人未被治愈。
如果X是n重Bernoulli试验中某事件A成功的次数,那么我们称X的概率分布满为二项分布,记作。其概率分布列满足上式。
利用二项式定理,我们不难证明:
想要充分了解一个分布,我们接下来就要研究它的数字特征。首先是数学期望。按照定义,由于随机变量X的取值非负,因此我们只需直接计算下式即可:
方差的计算有两种方式,一种是直接利用定义,另一种是利用公式:
我们采用这种方法。通过直接计算得到:
这就是二项分布的方差的公式。

我们接下来介绍另一种非常重要的离散型随机变量的分布——Poisson分布。它在很多放射性物质衰变过程中有所应用。
Poisson分布的分布列为:
其中,参数λ>0。如果随机变量X服从Poisson分布,那么我们记做。
利用函数项级数的知识,我们很容易验证得到:
对于Poisson分布,我们也是要研究它的数学期望和方差。对于数学期望,我们直接计算,能够得到:
而方差则为:
这说明,对于Poisson分布而言,数学期望和方差的表达式是一致的。

对于二项分布,我们通过一个例子已经直观地感受到了它的应用情形,但是对于Poisson分布而言,我们并没有介绍其相关的应用。所以,为了让大家见识一下Poisson分布的重要作用,接下来,我们来看一看有关Poisson分布的一个非常重要的结果——Poisson定理。
我们先说明,Poisson定理是联系二项分布与Poisson分布的非常重要的结果。有了Poisson定理之后,很多二项分布的计算都可以用Poisson分布来计算。这样就会大大简化计算的复杂度与难度。
我们先来看组合数的极限,即:
利用Stirling公式,我们很容易就得到:
对于二项分布而言,设一次试验中某事件发生的概率为(与试验次数n相关)。当n一定时该事件发生的概率也一定。如果
满足:
(λ是Poisson分布的特征参数。)
那么,我们就有:
于是,我们将这两个结果组合到一起,就得到了:
这说明,在n重Bernoulli试验当中,若:
(1)n足够大;
(2);
(更进一步,可以是)
则可以用Poisson分布来近似代替二项分布去计算各种概率统计量。(包括概率,数学期望和方差。)
一种最为常见的应用环境是,当n足够大,而p足够小,且np大小适中。(不会是一个特别大的数,否则会被视为无穷大;也不会特别小,否则Poisson分布无意义。)这时,基于Poisson定理,我们就可以使用Poisson分布的结论近似计算二项分布的结果。
当然,事实上,使用最多的还是用于计算概率。毕竟,就算不使用Poisson定理,我们也很容易能够在定理的条件下得到:
因此,数学期望和方差的近似计算是很显然的,不必一定要以Poisson定理为依据。

接下来,我们要介绍一下一个也已经在中学阶段就接触过的分布——超几何分布。
我们以一个基本的例子来引入。
例2:我们在概率的确定方法那一节介绍过很多的基本模型。其中十分经典的一个古典概型,就是抽样模型。我们在当时的不放回抽样模型的例子当中已经给出了事件A=“取出的球中有m个红球”的概率:
我们现在定义随机变量X取出的红球的数目,那么就有分布列:
利用专栏(二)的思考1.(3)的结论,我们直接得到:
于是我们就得到:
我们称该分布为超几何分布,记为。
对于超几何分布,直接计算数学期望得到:
这个结果可以理解为,在N个球中抽出红球的均值等于一次取出的球数n与红球在球堆中分布的比例(也可以是在盒子里抽出一个红球的概率)的乘积。
考虑到这样的意义,我们很容易将其与二项分布再度联系起来。事实上,如果N足够大,大到抽出n个球对比值M/N几乎无影响(或者是n相较于N足够小),这时我们就可以将比值视为常数p,则超几何分布就近似为二项分布。
超几何分布的方差公式留给大家自行推导~

最后,我们来介绍一下几何分布。
几何分布在实际应用当中出现的也比较多。设若在某Bernoulli试验中,某一事件A在每次试验中发生的概率恒定为p。现在不断重复该实验,直到事件A发生。我们定义随机变量X为实验进行的次数n,那么对于X而言,其分布列就应该是:
此时,我们称X服从几何分布,记作。
最简单地,我们可以让试验为“射击手射击靶子”,让事件A为“射击手射击第X次首次射中靶子”。这样,我们就很好理解几何分布的意义了。
直接计算,我们能得到:
这说明几何分布满足最基本的必要条件,确实可能作为一个分布出现。
对于几何分布,我们有一些初等的方法去求它的数学期望和方差,在这里将给大家介绍这些方法,至于非初等的方法(利用级数理论等),大家可以自由探索~
几何分布的数学期望如下:
我们记:
于是,利用等差比数列的规律(这是中学阶段的一种题型来着?),我们能够计算出:
于是,我们得到了:
至于方差,类似地,我们也可以算出:
记:
类似于刚才的做法,我们得到:
同理,有:
几何分布另一个令人惊奇的性质是它的无记忆性,即:
这一点的证明是十分简单的,直接利用条件概率的定义即可。但是,这一特点的意义却是是扥鲜明的,它表明,无论前面发生了多少次试验,只要事件A未发生,那么之后事件A再经过n次试验才首次发生的概率与前面的试验无关。这就是几何分布的无记忆性。

作为拓展,我们来介绍负二项分布,它是基于二项分布的一种分布形式。
我们说,几何分布是描述某一事件首次发生的试验次数的随机变量的分布。那么,如果我们想要研究某一事件发生了第k次时的试验次数X,又当如何考虑呢?
在Bernoulli试验中,我们仍然记待研究的事件A的概率为p不变。那么,考虑到我们要研究的情形,如果试验进行了到第m次时,事件A第k次发生(m≥k),那么这个模型此时等价于:
(1)前m-1次试验一共发生了k-1次事件A;
(2)第m次发生了事件A;
这样,我们就能够很容易地得到随机变量X的分布列为:
中括号中的项是一个二项分布的概率表达,代表我们考虑了(1);中括号外的p代表我们考虑到(2)。
直接计算,我们可以发现:
最后的结果我们暂时搁置,在后续的讨论当中我们很快就能给出答案。
由于这一分布涉及到了二项分布的应用,因此称其为负二项分布也不难理解。有些时候,我们也称随机变量X服从Pascal分布。为了方便,我们记其为。
还是一样,我们研究负二项分布的数学期望的表达式,但是方差的表达式就留给大家~
直接计算:
记:
由级数的相关理论知识,以及我们上面对组合数极限的讨论,我们不难知道对于每一个k而言,都是存在且有意义的,因为级数是收敛的。同时,我们就也得到了该数列是有界的。
又因为:
不难看出,这是一个等比数列,又:
(参考几何分布的数学期望的计算。)
于是,这个数列的通项就为:
代入数学期望的表达式中,就得到:
并且,我们还能得到:
这也说明了,负二项分布满足了作为分布的基本条件。
值得注意的是,当我们令k=1时,就得到了几何分布。可以说,负二项分布是几何分布的推广。当然,这点从这两个分布各自所描述的实际意义来看也不难理解。

思考:
证明或回答下列问题:
(1)试证明
时的Poisson定理;
(2)计算一般的超几何分布的方差公式;
(3)试用数学语言说明,在n远远小于N时,超几何分布可以近似为二项分布;
(4)证明几何分布的无记忆性;
(5)试推导负二项分布的方差公式;
设随机变量X服从Poisson分布(参数为λ):
(1)试求事件A=“X取奇数”的概率;
(2)试证明:
一批产品的不合格率为0.02,现从中任取40件进行检查,若发现两件或两件以上不合格拒收这批产品。分别用以下方法求拒收的概率:
(1)用二项分布作精确计算;
(2)用Poisson分布作近似计算;
设随机变量X(n,p)服从二项分布b(n,p)试证明:
(1)
(2)
设X服从参数为p的几何分布,试证明:
最後の最後に、ありがとうございました!