欢迎光临散文网 会员登陆 & 注册

有意思的概率与统计(七)

2023-08-03 15:54 作者:不能吃的大鱼  | 我要投稿

好耶!进度又进一步!

随机变量的基本概念——分布函数与分布列(概率密度函数)已经介绍给大家了,相信大家也已经对随机变量有了最初步的认识,同时也比中学阶段的认识更深入了一些。

随机变量的分布函数以及分布列(概率密度函数)实际上是随机变量及其分布的基本特征,它是描述和研究随机变量的最基础的概念和内容。而接下来,我们就要介绍一些随机变量的其他特征。这些特征一般被称为“数字特征”。

首先,我们就要来介绍——


Chapter  Two  随机变量及其分布

2.2  随机变量的数学期望

据说,历史上第一次提到数学期望这个概念,是来自于一个赌徒向当时的法国数学家Pascal提出的一个分赌本的问题——

17世纪中叶,一位赌徒向Pascal写信提问,说有一个他苦恼了很久的问题想请教他。

他之前与朋友赌博,两个人的赌技不相上下。规定两个人各出50法郎作为赌本,并且每局结果不设平局;谁先赢得三局,就拿走全部的100法郎。结果赌局进行到一半,朋友因为国王召见不得不终止赌局。此时,他赢了两局,朋友赢了一局。他苦恼的是,这100法郎的赌本要怎么分配呢?

这个问题引起了很多人的兴趣。大家都认为,平分对于这个人而言并不公平;而如果全部分配给这个人,对于他的朋友又不公平。所以很明显,应该找到一个合适的比例,使得这个人分得的赌本更多一些,他的朋友的分得的赌本要少一些。

有人提出,根据现在的胜负情况,这个人赢了两局,他的朋友赢了一局,那么他应该分得2/3,他的朋友应该分得1/3,因为他们各自赢得的局数代表了目前他们各自的优势情况。

但是,1654年,Pascal却提出了另一种解法。他认为,既然规则认定,只有赢得了三局才能获得全部赌本,那么根据只已胜利局数来分配赌本显然不合适。那么,设想赌局还可以再继续下去,最多两局,赌局一定会结束。此时,二人的胜负情况可以构成一个样本空间,X为对应于这个样本空间的离散型随机变量,记为“这个人拿走的赌本数量”。显然,X取值为0或100。

这样,我们就可以对这个随机变量写出它的分布列:

P(X%3D0)%3D%5Cfrac%7B1%7D%20%7B4%7D%20%5Cquad%20P(X%3D100)%3D%5Cfrac%7B3%7D%20%7B4%7D%20

Pascal基于分布列,提出用数值:

E%3D0%5Ccdot%20P(X%3D0)%2B100%5Ccdot%20P(X%3D100)%3D0%5Ctimes%20%5Cfrac%7B1%7D%20%7B4%7D%20%2B100%5Ctimes%20%5Cfrac%7B3%7D%20%7B4%7D%3D75%20

来作为最终这个人应分到的赌本数目。这种分法不仅考虑到了已赌局数对总结果的可能影响,同时也考虑到了对继续赌下去的结果的“期望”。因此,我们将这种结果称为随机变量X的数学期望,或称均值。

那么,我们现在要来对数学期望给一个十分具体而严谨的定义,这样能够为我们研究和应用这一概念打下基础:

设离散型随机变量X的分布列为:

p(x_i)%3DP(X%3Dx_i)%5Cquad%20(i%3D1%2C2%2C%5Ccdots%2Cn%2C%5Ccdots)

如果级数:

%5Csum_%7Bn%3D1%7D%5E%E2%88%9E%20%7Cx_i%7Cp(x_i)%5Cquad%20(1)

收敛,则称:

E(X)%3D%5Csum_%7Bn%3D1%7D%5E%E2%88%9E%20x_ip(x_i)%5Cquad%20(2)

为随机变量X的数学期望,简称为期望均值。若级数(1)不收敛,则称X的数学期望不存在。(即使级数(2)收敛。)

那么,对应地,对于连续型随机变量而言,用概率密度函数代替概率,那么其数学期望的定义就是:

设连续型随机变量X的概率密度函数为p(x)。若反常积分:

%5Cint_%7B-%E2%88%9E%7D%5E%7B%2B%E2%88%9E%7D%20%7Cx%7Cp(x)%5Ctext%20dx%5Cquad%20(1)%20

收敛,则称:

E(X)%3D%5Cint_%7B-%E2%88%9E%7D%5E%7B%2B%E2%88%9E%7D%20xp(x)%5Ctext%20dx%20%5Cquad%20(2)

为随机变量的数学期望,简称期望均值。若积分(1)不收敛,则称X的数学期望不存在。(即使积分(2)收敛。)

这般定义不仅符合Pascal在解决问题时的想法,同时也严格地刻画了数学期望本身的特点与性质。最主要的,我们可以在定义中看见,如果数学期望表达式对应的级数与积分只是条件收敛的,那么按照规定,我们只能说数学期望不存在,即使级数的和与积分值是可求的。

这点并不难理解,只要我们还记得,在数学分析篇章的级数部分,我们在介绍绝对收敛与条件收敛时,曾经提到过的有关更序级数这样两个性质:

(1)绝对收敛级数的更序级数仍然是绝对收敛级数,且与原级数和一致;

(2)Riemann定理:对于任意实数和任意条件收敛级数,都存在该级数的更序级数,使之收敛到该实数。 

——转自数学分析篇章,专栏(四十九)

这表明,如果数学期望表达式不是绝对收敛的,那么通过调换求和顺序与规律,我们得到的期望值并不唯一,甚至是覆盖到整个实数域的。这显然违背了数学期望的应用背景与提出条件。

对于任意分布而言(以离散型随机变量为例),本应该无所谓乘积项的加和顺序,毕竟这是对于随机现象的客观描述。但如果是条件收敛,这就不能够被满足。这一点需要大家仔细理解,深刻记忆~

介绍完了定义,我们就要来研究数学期望的性质。

我们来分析一个简单的离散型随机变量X的分布列:

%5Cbegin%20%7Bequation%7D%0A%5Cbegin%20%7Baligned%7D%20%0AP(X%3D-2)%26%3D0.2%5C%5C%0AP(X%3D-1)%26%3D0.1%5C%5C%0AP(X%3D0)%26%3D0.1%5C%5C%0AP(X%3D1)%26%3D0.3%5C%5C%0AP(X%3D2)%26%3D0.3%0A%5Cend%20%7Baligned%7D%0A%5Cend%20%7Bequation%7D

现在,我们想基于这个分布列,求随机变量Y%3DX%5E2的数学期望。那么,显然,按照最一般的流程,我们先要求出X%5E2的分布列:

%5Cbegin%20%7Bequation%7D%0A%5Cbegin%20%7Baligned%7D%20%0AP(X%5E2%3D(-2)%5E2)%26%3D0.2%5C%5C%0AP(X%5E2%3D(-1)%5E2)%26%3D0.1%5C%5C%0AP(X%5E2%3D0%5E2)%26%3D0.1%5C%5C%0AP(X%5E2%3D1%5E2)%26%3D0.3%5C%5C%0AP(X%5E2%3D2%5E2)%26%3D0.3%0A%5Cend%20%7Baligned%7D%0A%5Cend%20%7Bequation%7D

合并Y取值相同的项,得到Y的分布列:

%5Cbegin%20%7Bequation%7D%0A%5Cbegin%20%7Baligned%7D%20%0AP(Y%3D0)%26%3D0.1%5C%5C%0AP(Y%3D1)%26%3D0.4%5C%5C%0AP(Y%3D4)%26%3D0.5%0A%5Cend%20%7Baligned%7D%0A%5Cend%20%7Bequation%7D

从而求出,Y的数学期望为:

E(Y)%3D0%5Ctimes%20%200.1%2B1%5Ctimes%200.4%2B4%5Ctimes%200.5%3D2.4

但是,我们也能够注意到,即使不合并取值相同的Y,而使用X%5E2的分布列,我们也能够得到:

E(Y)%3DE(X%5E2)%3D(-2)%5E2%5Ctimes%200.2%2B(-1)%5E2%5Ctimes%200.1%2B0%5E2%5Ctimes%20%200.1%2B1%5E2%5Ctimes%200.3%2B2%5E2%5Ctimes%200.3%3D2.4

因此,我们不难自然地想到:

若离散型随机变量X的分布用分布列p(x_i)表示,那么其某一函数g(X)的数学期望为:

E%5Bg(X)%5D%3D%5Csum_%7Bn%3D1%7D%5E%E2%88%9E%20g(x_n)p(x_n)

(假定X和g(X)的数学期望都存在,下同。)

推及到连续型随机变量,就有:

若连续型随机变量X的分布用概率密度函数p(x)表示,那么其某一函数g(X)的数学期望为:

E%5Bg(X)%5D%3D%5Cint_%7B-%E2%88%9E%7D%5E%7B%2B%E2%88%9E%7D%20g(x)p(x)%5Ctext%20dx

我们就离散型随机变量的情况给出证明(当然可能并不完善),以此便于大家理解这一定理。

根据数学期望的定义,对于新的随机变量Y=g(X),应该有:

%5Cbegin%20%7Bequation%7D%0A%5Cbegin%20%7Baligned%7D%20%0AE(Y)%26%3D%5Csum_%7Bn%3D1%7D%5E%E2%88%9E%20y_np(y_n)%5C%5C%0A%26%3D%5Csum_%7Bn%3D1%7D%5E%E2%88%9E%20y_nP(Y%3Dy_n)%5C%5C%0A%26%3D%5Csum_%7Bn%3D1%7D%5E%E2%88%9E%20y_n%5Cbigg(P%5Cbig(%5Cbigcup_%7Bx_i%3Ag(x_i)%3Dy_n%7D%20%5C%7BX%3Dx_i%5C%7D%5Cbig)%5Cbigg)%5C%5C%0A%26%3D%5Csum_%7Bn%3D1%7D%5E%E2%88%9E%20y_n%5Cbigg(%5Csum_%7Bx_i%3Ag(x_i)%3Dy_n%7D%20P(X%3Dx_i)%5Cbigg)%5C%5C%0A%26%3D%5Csum_%7Bn%3D1%7D%5E%E2%88%9E%20%5Cbigg(%5Csum_%7Bx_i%3Ag(x_i)%3Dy_n%7D%20g(x_i)P(X%3Dx_i)%5Cbigg)%5C%5C%0A%26%3D%5Csum_%7Bn%3D1%7D%5E%E2%88%9E%20g(x_n)P(X%3Dx_n)%5C%5C%0A%26%3D%5Csum_%7Bn%3D1%7D%5E%E2%88%9E%20g(x_n)p(x_n)%0A%5Cend%20%7Baligned%7D%0A%5Cend%20%7Bequation%7D

这样,我们就证明了离散情形下的结论。

(这里需要注意到,因为我们所需要的数学期望是都存在的,因此绝对收敛性有所保证,这样我们才敢放心地将括号打开;否则,按照我们在数学分析部分指出的,这样的括号只可以任意添加,并不能够任意打开。)

对于连续型随机变量的情况,则需要充分考虑到有关积分的很多性质,包括无穷积分的定义(将上下限转化为任意有限的实数)以及定积分的定义(将积分号转换为求和号,积分表达式转化为Riemann和的形式)等,综合这些内容才能够给出一个较为完善的证明。

但不管怎么说,结论目前是没有错的,只是我们不再进一步给出证明了。

基于这个定理,我们能够直接得到以下几条常用的基本性质:

(1)

E(c)%3Dc%EF%BC%8Cc%5Cin%20%5Cmathbf%20R

(2)

E(aX)%3DaE(X)%EF%BC%8Ca%5Cin%20%5Cmathbf%20R

(3)

E%5Bf(X)%5Cpm%20g(X)%5D%3DE%5Bf(X)%5D%5Cpm%20E%5Bg(X)%5D

思考:

  1. 求以下随机变量的数学期望:

    (1)一海运货船的甲板上放着20个原料桶,其中有5个被海水污染了。从中随机取出8桶,X为8桶中被污染的桶数;

    (2)有10只电子元件,其中2只不合格。从中任取一只装配仪器,若不合格则丢弃重新抽取,依次重复。X为抽到合格品之前丢弃的不合格品的数目;

    (3)X的分布函数如下:

    %5Cbegin%20%7Bequation%7D%0AF(x)%3D%5Cbegin%20%7Bcases%7D%0A%5Cdisplaystyle%20%5Cfrac%7Be%5Ex%7D%7B2%7D%2C%20%26x%EF%BC%9C0%5C%5C%0A%5C%5C%0A%5Cdisplaystyle%20%5Cfrac%7B1%7D%7B2%7D%20%2C%260%5Cle%20x%EF%BC%9C1%5C%5C%0A%5C%5C%0A1-%5Cdisplaystyle%20%5Cfrac%7B1%7D%20%7B2%7D%20e%5E%7B-%5Cfrac%7B1%7D%7B2%7D(x-1)%20%7D%2C%26x%5Cge%201%0A%5Cend%20%7Bcases%7D%0A%5Cend%20%7Bequation%7D

  2. 若X为仅取非负整数的离散型随机变量,且其数学期望存在,证明:

    (1)

    E(X)%3D%5Csum_%7Bn%3D1%7D%5E%E2%88%9E%20P(X%5Cge%20n)

    (2)

    %5Csum_%7Bn%3D0%7D%5E%E2%88%9E%20nP(X%EF%BC%9E%20n)%3D%5Cfrac%7B1%7D%7B2%7D%20%5BE(X%5E2)-E(X)%5D

  3. 设连续型随机变量X的分布函数为F(x),且X的数学期望存在,证明:

    E(X)%3D%5Cint_%7B0%7D%5E%7B%2B%E2%88%9E%7D%20%5B1-F(x)%5D%5Ctext%20dx-%5Cint_%7B-%E2%88%9E%7D%5E%7B0%7D%20F(x)%5Ctext%20dx

  4. 设X为非负连续型随机变量,若E(X%5En)存在,试证明:

    (1)

    E(X)%3D%5Cint_%7B0%7D%5E%7B%2B%E2%88%9E%7D%20P(X%EF%BC%9Ex)%5Ctext%20dx

    (2)

    E(X%5En)%3D%5Cint_%7B0%7D%5E%7B%2B%E2%88%9E%7D%20nx%5E%7Bn-1%7DP(X%EF%BC%9Ex)%5Ctext%20dx


最後の最後に、ありがとうございました!

有意思的概率与统计(七)的评论 (共 条)

分享到微博请遵守国家法律