欢迎光临散文网 会员登陆 & 注册

有意思的概率与统计(九)

2023-08-29 20:56 作者:不能吃的大鱼  | 我要投稿

好了!进入到又一个重点了!

在介绍完基本的随机变量特征和性质之后,我们就要开始了解一些重要的分布了。这些分布基本涵盖了我们日常分析各种问题时所能面临的各种情况。因此,仔细学习和了解这些重要的分布十分必要的。

希望大家好好理解哟~


Chapter  Two  随机变量及其分布

2.4  常用离散分布

我们先从离散分布入手,介绍一些基本的随机变量分布~

首先是——二项分布。

我们在中学阶段已经了解过二项分布的基本概念和特征,其与独立随机试验有所关联。

我们来考虑这样一个例子:

例1:某特效药的临床有效率为p,今有n人服用,求治愈人数X的分布列。

对于这10个服用特效药的人而言,彼此之间是否治愈是相互独立的,并不会因为其中某一个人治愈与否就会影响其他人的治愈结果。因此,这是一个独立重复试验。

基于此,我们很容易就给出X的分布列为:

P(X%3Dk)%3D%5Cbinom%7Bn%7D%7Bk%7Dp%5Ek%20(1-p)%5E%7Bn-k%7D

其中,组合数的含义是在n个人中选择出k个人被治愈,剩余的n-k个人未被治愈。

如果X是n重Bernoulli试验中某事件A成功的次数,那么我们称X的概率分布满为二项分布,记作X%5Csim%20b(n%2Cp)。其概率分布列满足上式。

利用二项式定理,我们不难证明:

%5Csum_%7Bk%3D0%7D%5En%20P(X%3Dk)%3D%5Csum_%7Bk%3D0%7D%5En%20%5Cbinom%7Bn%7D%7Bk%7Dp%5Ek%20(1-p)%5E%7Bn-k%7D%3D%5Bp%2B(1-p)%5D%5En%3D1

想要充分了解一个分布,我们接下来就要研究它的数字特征。首先是数学期望。按照定义,由于随机变量X的取值非负,因此我们只需直接计算下式即可:

%5Cbegin%20%7Bequation%7D%0A%5Cbegin%20%7Baligned%7D%0AE(X)%26%3D%5Csum_%7Bk%3D0%7D%5En%20kP(X%3Dk)%5C%5C%0A%26%3D%5Csum_%7Bk%3D0%7D%5En%20k%5Cbinom%7Bn%7D%7Bk%7Dp%5Ek%20(1-p)%5E%7Bn-k%7D%5C%5C%0A%26%3D%5Csum_%7Bk%3D1%7D%5En%20n%5Cbinom%7Bn-1%7D%7Bk-1%7Dp%5Ek%20(1-p)%5E%7Bn-k%7D%5C%5C%0A%26%3Dnp%5Csum_%7Bk%3D0%7D%5E%7Bn-1%7D%20%5Cbinom%7Bn%7D%7Bk%7Dp%5E%7Bk%7D%20(1-p)%5E%7Bn-1-k%7D%5C%5C%0A%26%3Dnp%0A%5Cend%20%7Baligned%7D%0A%5Cend%20%7Bequation%7D

方差的计算有两种方式,一种是直接利用定义,另一种是利用公式:

%5Ctext%20%7BVar%7D(X)%3DE(X%5E2)-E%5E2(X)

我们采用这种方法。通过直接计算得到:

%5Cbegin%20%7Bequation%7D%0A%5Cbegin%20%7Baligned%7D%0A%5Ctext%20%7BVar%7D(X)%26%3DE(X%5E2)-E%5E2(X)%5C%5C%0A%26%3D%5Csum_%7Bk%3D0%7D%5En%20k%5E2P(X%3Dk)-(np)%5E2%5C%5C%0A%26%3D%5Csum_%7Bk%3D0%7D%5En%20k%5E2%5Cbinom%7Bn%7D%7Bk%7Dp%5Ek%20(1-p)%5E%7Bn-k%7D-n%5E2p%5E2%5C%5C%0A%26%3Dnp%5Csum_%7Bk%3D0%7D%5E%7Bn-1%7D%20(k%2B1)%5Cbinom%7Bn%7D%7Bk%7Dp%5E%7Bk%7D%20(1-p)%5E%7Bn-1-k%7D-n%5E2p%5E2%5C%5C%0A%26%3Dnp%5Csum_%7Bk%3D0%7D%5E%7Bn-1%7D%20k%5Cbinom%7Bn%7D%7Bk%7Dp%5E%7Bk%7D%20(1-p)%5E%7Bn-1-k%7D%2Bnp%5Csum_%7Bk%3D0%7D%5E%7Bn-1%7D%20%5Cbinom%7Bn%7D%7Bk%7Dp%5E%7Bk%7D%20(1-p)%5E%7Bn-1-k%7D-n%5E2p%5E2%5C%5C%0A%26%3Dnp(n-1)p%2Bnp-n%5E2p%5E2%5C%5C%0A%26%3Dnp(1-p)%0A%0A%5Cend%20%7Baligned%7D%0A%5Cend%20%7Bequation%7D

这就是二项分布的方差的公式。

我们接下来介绍另一种非常重要的离散型随机变量的分布——Poisson分布。它在很多放射性物质衰变过程中有所应用。

Poisson分布的分布列为:

P(X%3Dk)%3D%5Cfrac%7B%5Clambda%20%5Ek%7D%7Bk!%7De%5E%7B-%5Clambda%20%7D%20%5Cquad(k%3D0%2C1%2C2%2C%5Ccdots)

其中,参数λ>0。如果随机变量X服从Poisson分布,那么我们记做X%5Csim%20P(%5Clambda%20)

利用函数项级数的知识,我们很容易验证得到:

%5Csum_%7Bn%3D0%7D%5E%E2%88%9E%20%5Cfrac%7B%5Clambda%20%5Ek%7D%7Bk!%7De%5E%7B-%5Clambda%20%7D%3De%5E%7B-%5Clambda%20%7D%5Csum_%7Bn%3D0%7D%5E%E2%88%9E%20%5Cfrac%7B%5Clambda%20%5Ek%7D%7Bk!%7D%3De%5E%7B-%5Clambda%20%7De%5E%7B%5Clambda%20%7D%3D1

对于Poisson分布,我们也是要研究它的数学期望和方差。对于数学期望,我们直接计算,能够得到:

%5Cbegin%20%7Bequation%7D%0A%5Cbegin%20%7Baligned%7D%0AE(X)%26%3D%5Csum_%7Bk%3D0%7D%5E%E2%88%9E%20kP(X%3Dk)%5C%5C%0A%26%3D%5Csum_%7Bk%3D0%7D%5E%E2%88%9E%20k%5Cfrac%7B%5Clambda%20%5Ek%7D%7Bk!%7De%5E%7B-%5Clambda%20%7D%5C%5C%0A%26%3De%5E%7B-%5Clambda%20%7D%5Csum_%7Bk%3D0%7D%5E%E2%88%9E%20k%5Cfrac%7B%5Clambda%20%5Ek%7D%7Bk!%7D%5C%5C%0A%26%3De%5E%7B-%5Clambda%20%7D%5Csum_%7Bk%3D1%7D%5E%E2%88%9E%20%5Cfrac%7B%5Clambda%20%5Ek%7D%7B(k-1)!%7D%5C%5C%0A%26%3D%5Clambda%20e%5E%7B-%5Clambda%20%7D%5Csum_%7Bk%3D0%7D%5E%E2%88%9E%20%5Cfrac%7B%5Clambda%20%5Ek%7D%7Bk!%7D%5C%5C%0A%26%3D%5Clambda%20%0A%5Cend%20%7Baligned%7D%0A%5Cend%20%7Bequation%7D

而方差则为:

%5Cbegin%20%7Bequation%7D%0A%5Cbegin%20%7Baligned%7D%0A%5Ctext%20%7BVar%7D(X)%26%3DE(X%5E2)-E%5E2(X)%5C%5C%0A%26%3D%5Csum_%7Bk%3D0%7D%5E%E2%88%9E%20k%5E2%5Cfrac%7B%5Clambda%20%5Ek%7D%7Bk!%7De%5E%7B-%5Clambda%20%7D-%5Clambda%20%5E2%5C%5C%0A%26%3De%5E%7B-%5Clambda%20%7D%5Csum_%7Bk%3D1%7D%5E%E2%88%9Ek%20%5Cfrac%7B%5Clambda%20%5Ek%7D%7B(k-1)!%7D-%5Clambda%20%5E2%5C%5C%0A%26%3D%5Clambda%20e%5E%7B-%5Clambda%20%7D%5Csum_%7Bk%3D0%7D%5E%E2%88%9E%20(k%2B1)%5Cfrac%7B%5Clambda%20%5Ek%7D%7Bk!%7D-%5Clambda%20%5E2%5C%5C%0A%26%3D%5Clambda%20e%5E%7B-%5Clambda%20%7D%5Cbigg(%5Csum_%7Bk%3D0%7D%5E%E2%88%9E%20k%5Cfrac%7B%5Clambda%20%5Ek%7D%7Bk!%7D%2B%5Cfrac%7B%5Clambda%20%5Ek%7D%7Bk!%7D%5Cbigg)-%5Clambda%20%5E2%5C%5C%0A%26%3D%5Clambda%5E2%2B%5Clambda%20-%5Clambda%20%5E2%5C%5C%0A%26%3D%5Clambda%0A%5Cend%20%7Baligned%7D%0A%5Cend%20%7Bequation%7D

这说明,对于Poisson分布而言,数学期望和方差的表达式是一致的。

对于二项分布,我们通过一个例子已经直观地感受到了它的应用情形,但是对于Poisson分布而言,我们并没有介绍其相关的应用。所以,为了让大家见识一下Poisson分布的重要作用,接下来,我们来看一看有关Poisson分布的一个非常重要的结果——Poisson定理

我们先说明,Poisson定理是联系二项分布与Poisson分布的非常重要的结果。有了Poisson定理之后,很多二项分布的计算都可以用Poisson分布来计算。这样就会大大简化计算的复杂度与难度。

我们先来看组合数的极限,即:

%5Clim_%7Bn%5Cto%E2%88%9E%7D%20%5Cbinom%20%7Bn%7D%7Bk%7D%20%3D%5Clim_%7Bn%5Cto%E2%88%9E%7D%20%5Cfrac%7Bn!%7D%7Bk!(n-k)!%7D%20

利用Stirling公式,我们很容易就得到:
%5Clim_%7Bn%5Cto%E2%88%9E%7D%20%5Cfrac%7Bn!%7D%7Bk!(n-k)!%7D%20%3D%5Cfrac%7B1%7D%7Bk!%7D%20%5Clim_%7Bn%5Cto%E2%88%9E%7D%20%5Cfrac%7B%5Csqrt%7B2%5Cpi%20n%7D%5Cbigg(%5Cdisplaystyle%20%5Cfrac%7Bn%7D%7Be%7D%20%5Cbigg)%5En%20%7D%7B%5Csqrt%7B2%5Cpi%20(n-k)%7D%5Cbigg(%5Cdisplaystyle%20%5Cfrac%7Bn-k%7D%7Be%7D%20%5Cbigg)%5E%7Bn-k%7D%20%7D%20%5Csim%20%5Cfrac%7Be%5Ek%7D%7Bk!%7D%5Cbigg(%5Cfrac%7Bn-k%7D%7Be%7D%20%5Cbigg)%5E%7Bk%7D

对于二项分布而言,设一次试验中某事件发生的概率为p_n(与试验次数n相关)。当n一定时该事件发生的概率也一定。如果p_n满足:

np_n%3D%5Clambda%20

(λ是Poisson分布的特征参数。)

那么,我们就有:

%5Clim_%7Bn%5Cto%E2%88%9E%7D%20p_n%5Ek(1-p_n)%5E%7Bn-k%7D%20%3D%5Clim_%7Bn%5Cto%E2%88%9E%7D%20%5Cbigg(%5Cfrac%7B%5Clambda%20%7D%7Bn%7D%5Cbigg)%5Ek%20%5Cbigg(1-%5Cfrac%7B%5Clambda%20%7D%7Bn%7D%5Cbigg)%5E%7Bn-k%7D%20%5Csim%20%5Clambda%20%5Ek%5Cbigg(%5Cfrac%7B1%7D%7Bn%7D%5Cbigg)%5Ek%20e%5E%7B-%5Clambda%20%7D

于是,我们将这两个结果组合到一起,就得到了:

%5Clim_%7Bn%5Cto%E2%88%9E%7D%20P(X%3Dk)%3D%5Cfrac%7B%5Clambda%20%5Ek%7D%7Bk!%7De%5E%7B-%5Clambda%20%7D%5Clim_%7Bn%5Cto%E2%88%9E%7D%20%20%20e%5Ek%5Cbigg(%5Cfrac%7Bn-k%7D%7Be%7D%20%5Cbigg)%5E%7Bk%7D%5Cbigg(%5Cfrac%7B1%7D%7Bn%7D%5Cbigg)%5Ek%3D%5Cfrac%7B%5Clambda%20%5Ek%7D%7Bk!%7De%5E%7B-%5Clambda%20%7D

这说明,在n重Bernoulli试验当中,若:

(1)n足够大;

(2)np_n%3D%5Clambda%20

(更进一步,可以是np_n%5Crightarrow%20%5Clambda%20%5Cquad(n%5Crightarrow%20%E2%88%9E)

则可以用Poisson分布来近似代替二项分布去计算各种概率统计量。(包括概率,数学期望和方差。)

一种最为常见的应用环境是,当n足够大,而p足够小,且np大小适中。(不会是一个特别大的数,否则会被视为无穷大;也不会特别小,否则Poisson分布无意义。)这时,基于Poisson定理,我们就可以使用Poisson分布的结论近似计算二项分布的结果。

当然,事实上,使用最多的还是用于计算概率。毕竟,就算不使用Poisson定理,我们也很容易能够在定理的条件下得到:

E(X)%3Dnp_n%3D%5Clambda

%5Ctext%20%7BVar%7D(X)%3Dnp_n(1-p_n)%3D%5Clambda%5Cbigg(1-%5Cfrac%7B%5Clambda%20%7D%7Bn%7D%20%5Cbigg)%5Crightarrow%20%5Clambda%5Cquad%20(n%5Crightarrow%20%E2%88%9E)

因此,数学期望和方差的近似计算是很显然的,不必一定要以Poisson定理为依据。

接下来,我们要介绍一下一个也已经在中学阶段就接触过的分布——超几何分布。

我们以一个基本的例子来引入。

例2:我们在概率的确定方法那一节介绍过很多的基本模型。其中十分经典的一个古典概型,就是抽样模型。我们在当时的不放回抽样模型的例子当中已经给出了事件A=“取出的球中有m个红球”的概率:

P(A)%3D%5Cfrac%7B%5Cbinom%7BM%7D%7Bm%7D%5Cbinom%7BN-M%7D%7Bn-m%7D%7D%7B%5Cbinom%7BN%7D%7Bn%7D%7D%20

我们现在定义随机变量X取出的红球的数目,那么就有分布列:

P(X%3Dm)%3D%5Cfrac%7B%5Cbinom%7BM%7D%7Bm%7D%5Cbinom%7BN-M%7D%7Bn-m%7D%7D%7B%5Cbinom%7BN%7D%7Bn%7D%7D%20

利用专栏(二)的思考1.(3)的结论,我们直接得到:

%5Csum_%7Bm%3D0%7D%5Er%20%5Cbinom%7BM%7D%7Bm%7D%5Cbinom%7BN-M%7D%7Bn-m%7D%3D%5Cbinom%7BN%7D%7Bn%7D%5Cquad%20(r%3D%5Cmin%5C%7BM%2Cn%5C%7D)

于是我们就得到:

%5Csum_%7Bm%3D0%7D%5Er%20P(X%3Dm)%3D1

我们称该分布为超几何分布,记为X%5Csim%20h(n%2CN%2CM)

对于超几何分布,直接计算数学期望得到:

%5Cbegin%20%7Bequation%7D%0A%5Cbegin%20%7Baligned%7D%0AE(X)%26%3D%5Csum_%7Bm%3D0%7D%5Er%20m%5Cfrac%7B%5Cbinom%7BM%7D%7Bm%7D%5Cbinom%7BN-M%7D%7Bn-m%7D%7D%7B%5Cbinom%7BN%7D%7Bn%7D%7D%5C%5C%0A%26%3D%20%20M%5Csum_%7Bm%3D1%7D%5Er%20%5Cfrac%7B%5Cbinom%7BM-1%7D%7Bm-1%7D%5Cbinom%7BN-M%7D%7Bn-m%7D%7D%7B%5Cbinom%7BN%7D%7Bn%7D%7D%5C%5C%0A%26%3Dn%5Cfrac%7BM%7D%7BN%7D%20%5Csum_%7Bm%3D0%7D%5E%7Br-1%7D%20%5Cfrac%7B%5Cbinom%7BM%7D%7Bm%7D%5Cbinom%7BN-M%7D%7Bn-m%7D%7D%7B%5Cbinom%7BN-1%7D%7Bn-1%7D%7D%5C%5C%0A%26%3Dn%5Cfrac%7BM%7D%7BN%7D%20%0A%5Cend%20%7Baligned%7D%0A%5Cend%20%7Bequation%7D

这个结果可以理解为,在N个球中抽出红球的均值等于一次取出的球数n与红球在球堆中分布的比例(也可以是在盒子里抽出一个红球的概率)的乘积。

考虑到这样的意义,我们很容易将其与二项分布再度联系起来。事实上,如果N足够大,大到抽出n个球对比值M/N几乎无影响(或者是n相较于N足够小),这时我们就可以将比值视为常数p,则超几何分布就近似为二项分布。

超几何分布的方差公式留给大家自行推导~

最后,我们来介绍一下几何分布。

几何分布在实际应用当中出现的也比较多。设若在某Bernoulli试验中,某一事件A在每次试验中发生的概率恒定为p。现在不断重复该实验,直到事件A发生。我们定义随机变量X为实验进行的次数n,那么对于X而言,其分布列就应该是:

P(X%3Dn)%3D(1-p)%5E%7Bn-1%7Dp

此时,我们称X服从几何分布,记作X%5Csim%20Ge(p)

最简单地,我们可以让试验为“射击手射击靶子”,让事件A为“射击手射击第X次首次射中靶子”。这样,我们就很好理解几何分布的意义了。

直接计算,我们能得到:

%5Csum_%7Bk%3D1%7D%5E%E2%88%9E%20P(X%3Dk)%3D%5Csum_%7Bk%3D1%7D%5E%E2%88%9E%20(1-p)%5E%7Bk-1%7Dp%3D%5Cfrac%7Bp%7D%7B1-p%7D%20%5Clim_%7Bk%5Cto%E2%88%9E%7D%20%5Cfrac%7B1-p-(1-p)%5E%7Bk%2B1%7D%7D%7B1-(1-p)%7D%20%20%3D1

这说明几何分布满足最基本的必要条件,确实可能作为一个分布出现。

对于几何分布,我们有一些初等的方法去求它的数学期望和方差,在这里将给大家介绍这些方法,至于非初等的方法(利用级数理论等),大家可以自由探索~

几何分布的数学期望如下:

%5Cbegin%20%7Bequation%7D%0A%5Cbegin%20%7Baligned%7D%0AE(X)%26%3D%5Csum_%7Bk%3D1%7D%5E%E2%88%9E%20kP(X%3Dk)%5C%5C%0A%26%3D%5Csum_%7Bk%3D1%7D%5E%E2%88%9E%20k(1-p)%5E%7Bk-1%7Dp%5C%5C%0A%26%3Dp%5Csum_%7Bk%3D1%7D%5E%E2%88%9E%20k(1-p)%5E%7Bk-1%7D%5C%5C%0A%5Cend%20%7Baligned%7D%0A%5Cend%20%7Bequation%7D

我们记:

S_n%3D%5Csum_%7Bk%3D1%7D%5En%20k(1-p)%5E%7Bk-1%7D

于是,利用等差比数列的规律(这是中学阶段的一种题型来着?),我们能够计算出:

%5Cbegin%20%7Bequation%7D%0A%5Cbegin%20%7Baligned%7D%0ApS_n%26%3DS_n-(1-p)S_n%5C%5C%0A%26%3D%5Csum_%7Bk%3D1%7D%5En%20k(1-p)%5E%7Bk-1%7D-%5Csum_%7Bk%3D1%7D%5En%20k(1-p)%5E%7Bk%7D%5C%5C%0A%26%3D1-n(1-p)%5En%2B%5Csum_%7Bk%3D1%7D%5E%7Bn-1%7D%20(k%2B1-k)(1-p)%5E%7Bk%7D%5C%5C%0A%26%3D1-n(1-p)%5En%2B%5Csum_%7Bk%3D1%7D%5E%7Bn-1%7D%20(1-p)%5E%7Bk%7D%5C%5C%0A%0A%5Cend%20%7Baligned%7D%0A%5Cend%20%7Bequation%7D

于是,我们得到了:

E(X)%3D%5Clim_%7Bn%5Cto%20%E2%88%9E%7D%20(pS_n)%20%3D%5Clim_%7Bn%5Cto%20%E2%88%9E%7D%20%5Cbigg%5B1-n(1-p)%5En%2B%5Csum_%7Bk%3D1%7D%5E%7Bn-1%7D%20(1-p)%5E%7Bk%7D%5Cbigg%5D%3D1-0%2B%5Cfrac%7B1-p%7D%7Bp%7D%20%3D%5Cfrac%7B1%7D%7Bp%7D%20

至于方差,类似地,我们也可以算出:

%5Cbegin%20%7Bequation%7D%0A%5Cbegin%20%7Baligned%7D%0A%5Ctext%20%7BVar%7D(X)%26%3DE(X%5E2)-E%5E2(X)%5C%5C%0A%26%3D%5Csum_%7Bk%3D1%7D%5E%E2%88%9E%20k%5E2P(X%3Dk)-%5Cfrac%7B1%7D%7Bp%5E2%7D%20%5C%5C%0A%26%3D%5Csum_%7Bk%3D1%7D%5E%E2%88%9E%20k%5E2(1-p)%5E%7Bk-1%7Dp-%5Cfrac%7B1%7D%7Bp%5E2%7D%5C%5C%0A%26%3D%20p%5Csum_%7Bk%3D1%7D%5E%E2%88%9E%20k%5E2(1-p)%5E%7Bk-1%7D-%5Cfrac%7B1%7D%7Bp%5E2%7D%0A%5Cend%20%7Baligned%7D%0A%5Cend%20%7Bequation%7D

记:

T_n%3D%5Csum_%7Bk%3D1%7D%5En%20k%5E2(1-p)%5E%7Bk-1%7D

类似于刚才的做法,我们得到:

%5Cbegin%20%7Bequation%7D%0A%5Cbegin%20%7Baligned%7D%0ApT_n%26%3DT_n-(1-p)T_n%5C%5C%0A%26%3D%5Csum_%7Bk%3D1%7D%5En%20k%5E2(1-p)%5E%7Bk-1%7D-%5Csum_%7Bk%3D1%7D%5En%20k%5E2(1-p)%5E%7Bk%7D%5C%5C%0A%26%3D1-n%5E2(1-p)%5En%2B%5Csum_%7Bk%3D1%7D%5E%7Bn-1%7D%20%5B(k%2B1)%5E2-k%5E2%5D(1-p)%5E%7Bk%7D%5C%5C%0A%26%3D1-n%5E2(1-p)%5En%2B%5Csum_%7Bk%3D1%7D%5E%7Bn-1%7D%20(2k%2B1)(1-p)%5E%7Bk%7D%5C%5C%0A%5Cend%20%7Baligned%7D%0A%5Cend%20%7Bequation%7D

同理,有:

%5Cbegin%20%7Bequation%7D%0A%5Cbegin%20%7Baligned%7D%0A%5Ctext%20%7BVar%7D(X)%26%3D%5Clim_%7Bn%5Cto%E2%88%9E%7D%20%20(pT_n)-%5Cfrac%7B1%7D%7Bp%5E2%7D%20%5C%5C%0A%26%3D%5Clim_%7Bn%5Cto%E2%88%9E%7D%20%5Cbigg%5B1-n%5E2(1-p)%5En%2B%5Csum_%7Bk%3D1%7D%5E%7Bn-1%7D%20(2k%2B1)(1-p)%5E%7Bk%7D%5Cbigg%5D-%5Cfrac%7B1%7D%7Bp%5E2%7D%20%5C%5C%0A%26%3D1-0%2B2(1-p)%5Cfrac%7B1%7D%7Bp%5E2%7D%2B%5Cfrac%7B1-p%7D%7Bp%7D%20%20-%5Cfrac%7B1%7D%7Bp%5E2%7D%20%20%5C%5C%0A%26%3D%5Cfrac%7B1-p%7D%7Bp%5E2%7D%20%0A%5Cend%20%7Baligned%7D%0A%5Cend%20%7Bequation%7D

几何分布另一个令人惊奇的性质是它的无记忆性,即:

P(X%EF%BC%9Em%2Bn%7CX%EF%BC%9Em)%3DP(X%EF%BC%9En)%5Cquad%20(%5Cforall%20m%2Cn%5Cin%20%5Cmathbf%20N%5E*)

这一点的证明是十分简单的,直接利用条件概率的定义即可。但是,这一特点的意义却是是扥鲜明的,它表明,无论前面发生了多少次试验,只要事件A未发生,那么之后事件A再经过n次试验才首次发生的概率与前面的试验无关。这就是几何分布的无记忆性

作为拓展,我们来介绍负二项分布,它是基于二项分布的一种分布形式。

我们说,几何分布是描述某一事件首次发生的试验次数的随机变量的分布。那么,如果我们想要研究某一事件发生了第k次时的试验次数X,又当如何考虑呢?

在Bernoulli试验中,我们仍然记待研究的事件A的概率为p不变。那么,考虑到我们要研究的情形,如果试验进行了到第m次时,事件A第k次发生(m≥k),那么这个模型此时等价于:

(1)前m-1次试验一共发生了k-1次事件A;

(2)第m次发生了事件A;

这样,我们就能够很容易地得到随机变量X的分布列为:

P(X%3Dm)%3D%5Cbigg%5B%5Cbinom%7Bm-1%7D%7Bk-1%7Dp%5E%7Bk-1%7D(1-p)%5E%7Bm-k%7D%5Cbigg%5Dp%3D%5Cbinom%7Bm-1%7D%7Bk-1%7Dp%5Ek(1-p)%5E%7Bm-k%7D

中括号中的项是一个二项分布的概率表达,代表我们考虑了(1);中括号外的p代表我们考虑到(2)。

直接计算,我们可以发现:

%5Csum_%7Bm%3Dk%7D%5E%E2%88%9E%20P(X%3Dm)%3D%5Csum_%7Bm%3Dk%7D%5E%E2%88%9E%20%5Cbinom%7Bm-1%7D%7Bk-1%7Dp%5Ek(1-p)%5E%7Bm-k%7D%3Dp%5Ek(1-p)%5E%7B-k%7D%5Csum_%7Bm%3Dk%7D%5E%E2%88%9E%20%5Cbinom%7Bm-1%7D%7Bk-1%7D(1-p)%5E%7Bm%7D

最后的结果我们暂时搁置,在后续的讨论当中我们很快就能给出答案。

由于这一分布涉及到了二项分布的应用,因此称其为负二项分布也不难理解。有些时候,我们也称随机变量X服从Pascal分布。为了方便,我们记其为X%5Csim%20Nb(m%2Cp)

还是一样,我们研究负二项分布的数学期望的表达式,但是方差的表达式就留给大家~

直接计算:

%5Cbegin%20%7Bequation%7D%0A%5Cbegin%20%7Baligned%7D%0AE(X)%26%3D%5Csum_%7Bm%3Dk%7D%5E%E2%88%9E%20mP(X%3Dm)%5C%5C%0A%20%26%3D%5Csum_%7Bm%3Dk%7D%5E%E2%88%9E%20m%5Cbinom%7Bm-1%7D%7Bk-1%7Dp%5Ek(1-p)%5E%7Bm-k%7D%5C%5C%0A%26%3D%5Csum_%7Bm%3Dk%7D%5E%E2%88%9E%20k%5Cbinom%7Bm%7D%7Bk%7Dp%5Ek(1-p)%5E%7Bm-k%7D%5C%5C%0A%26%3Dkp%5Ek(1-p)%5E%7B-k%7D%5Csum_%7Bm%3Dk%7D%5E%E2%88%9E%20%5Cbinom%7Bm%7D%7Bk%7D(1-p)%5Em%5C%5C%0A%0A%5Cend%20%7Baligned%7D%0A%5Cend%20%7Bequation%7D

记:

Q_k%3D%5Csum_%7Bm%3Dk%7D%5E%E2%88%9E%20%5Cbinom%7Bm%7D%7Bk%7D(1-p)%5Em

由级数的相关理论知识,以及我们上面对组合数极限的讨论,我们不难知道对于每一个k而言,Q_k都是存在且有意义的,因为级数是收敛的。同时,我们就也得到了该数列是有界的。

又因为:

%5Cbegin%20%7Bequation%7D%0A%5Cbegin%20%7Baligned%7D%0ApQ_k%26%3DQ_k-(1-p)Q_k%5C%5C%0A%26%3D%5Csum_%7Bm%3Dk%7D%5E%E2%88%9E%20%5Cbinom%7Bm%7D%7Bk%7D(1-p)%5Em-%5Csum_%7Bm%3Dk%7D%5E%E2%88%9E%20%5Cbinom%7Bm%7D%7Bk%7D(1-p)%5E%7Bm%2B1%7D%5C%5C%5C%0A%26%3D(1-p)%5Ek%2B%5Csum_%7Bm%3Dk%2B1%7D%5E%E2%88%9E%20%5Cbigg%5B%5Cbinom%7Bm%7D%7Bk%7D-%5Cbinom%7Bm-1%7D%7Bk%7D%5Cbigg%5D(1-p)%5Em%5C%5C%0A%26%3D(1-p)%5Ek%2B%5Csum_%7Bm%3Dk%2B1%7D%5E%E2%88%9E%20%5Cbinom%7Bm-1%7D%7Bk-1%7D(1-p)%5Em%5C%5C%0A%26%3D(1-p)%5Ek%2B(1-p)%5Csum_%7Bm%3Dk%7D%5E%E2%88%9E%20%5Cbinom%7Bm%7D%7Bk-1%7D(1-p)%5Em%5C%5C%0A%26%3D(1-p)%5Ek%2B(1-p)%5BQ_%7Bk-1%7D-(1-p)%5E%7Bk-1%7D%5D%5C%5C%0A%26%3D(1-p)Q_%7Bk-1%7D%0A%5Cend%20%7Baligned%7D%0A%5Cend%20%7Bequation%7D

不难看出,这是一个等比数列,又:

Q_1%3D%5Csum_%7Bm%3D1%7D%5E%E2%88%9E%20%5Cbinom%7Bm%7D%7B1%7D(1-p)%5Em%3D%5Csum_%7Bm%3D1%7D%5E%E2%88%9E%20m(1-p)%5Em%3D%5Cfrac%7B1-p%7D%7Bp%5E2%7D%20

(参考几何分布的数学期望的计算。)

于是,这个数列的通项就为:

Q_k%3D%5Cbigg(%5Cfrac%7B1-p%7D%7Bp%7D%5Cbigg)%5E%7Bk-1%7D%20%5Cfrac%7B1-p%7D%7Bp%5E2%7D%20%3D%5Cfrac%7B(1-p)%5Ek%7D%7Bp%5E%7Bk%2B1%7D%7D%20

代入数学期望的表达式中,就得到:

E(X)%3Dkp%5Ek(1-p)%5E%7B-k%7D%5Cfrac%7B(1-p)%5Ek%7D%7Bp%5E%7Bk%2B1%7D%7D%20%3D%5Cfrac%7Bk%7D%7Bp%7D%20

并且,我们还能得到:

%5Cbegin%20%7Bequation%7D%0A%5Cbegin%20%7Baligned%7D%0A%5Csum_%7Bm%3Dk%7D%5E%E2%88%9E%20P(X%3Dm)%26%3Dp%5Ek(1-p)%5E%7B-k%7D%5Csum_%7Bm%3Dk%7D%5E%E2%88%9E%20%5Cbinom%7Bm-1%7D%7Bk-1%7D(1-p)%5E%7Bm%7D%5C%5C%0A%26%3Dp%5Ek(1-p)%5E%7B-k%7D%5Cbigg%5B(1-p)%5Ek%2B%5Csum_%7Bm%3Dk%2B1%7D%5E%E2%88%9E%20%5Cbinom%7Bm-1%7D%7Bk-1%7D(1-p)%5E%7Bm%7D%5Cbigg%5D%5C%5C%0A%26%3Dp%5Ek(1-p)%5E%7B-k%7DpQ_k%5C%5C%0A%26%3Dp%5E%7Bk%2B1%7D(1-p)%5E%7B-k%7D%5Cfrac%7B(1-p)%5Ek%7D%7Bp%5E%7Bk%2B1%7D%7D%20%5C%5C%0A%26%3D1%0A%5Cend%20%7Baligned%7D%0A%5Cend%20%7Bequation%7D

这也说明了,负二项分布满足了作为分布的基本条件。

值得注意的是,当我们令k=1时,就得到了几何分布。可以说,负二项分布是几何分布的推广。当然,这点从这两个分布各自所描述的实际意义来看也不难理解。

思考:

  1. 证明或回答下列问题:

    (1)试证明np_n%5Crightarrow%20%5Clambda时的Poisson定理;

    (2)计算一般的超几何分布的方差公式;

    (3)试用数学语言说明,在n远远小于N时,超几何分布可以近似为二项分布;

    (4)证明几何分布的无记忆性;

    (5)试推导负二项分布的方差公式;

  2. 设随机变量X服从Poisson分布(参数为λ):

    (1)试求事件A=“X取奇数”的概率;

    (2)试证明:

    E(X%5En)%3D%5Clambda%20E%5B(X%2B1)%5E%7Bn-1%7D%5D

  3. 一批产品的不合格率为0.02,现从中任取40件进行检查,若发现两件或两件以上不合格拒收这批产品。分别用以下方法求拒收的概率:

    (1)用二项分布作精确计算;

    (2)用Poisson分布作近似计算;

  4. 设随机变量X(n,p)服从二项分布b(n,p)试证明:

    (1)

    P(X(n%2Cp)%5Cle%20i)%3D1-P(X(n%2C1-p)%5Cle%20n-i-1)%20

    (2)

    E%5Cbigg(%5Cfrac%7B1%7D%7BX%2B1%7D%5Cbigg)%20%3D%5Cfrac%7B1-(1-p)%5E%7Bn%2B1%7D%7D%7B(n%2B1)p%7D%20

  5. 设X服从参数为p的几何分布,试证明:

    E%5Cbigg(%5Cfrac%7B1%7D%7BX%7D%20%5Cbigg)%3D%5Cfrac%7B-p%5Cln%20p%7D%7B1-p%7D%20


最後の最後に、ありがとうございました!

有意思的概率与统计(九)的评论 (共 条)

分享到微博请遵守国家法律