有意思的概率与统计(一)
诶嘿!又开新坑了!
(明明旧坑还有一堆没填完,新坑就又开了……就是这么随性!)
高代实在是太难学太难写了,所以就准备再看看了……常微分方程就会一直更新的,目前进展还可以~
想开概率论和数理统计主要还是因为应用的场合比较多吧,最近也正好在重温,所以就写着看看。而且,概统部分其实和数学分析相关的内容有很多。可以说概统发展到目前,已经是一个分析学的样子了,有一点代数学的参与。甚至于,大家可以了解到,如果概率论需要深入了解和学习的话,可能会涉及到实变函数论的内容。这就是后话了。
总而言之,概统的坑就这么开了,希望能帮到大家吧!
(补充一句,这里使用的教材是茆诗松老师等人编写的《概率论与数理统计教程》~)
Chapter One 随机事件与概率
1.1 随机事件及其运算
在日常生活中,我们总是能够遇到各种各样我们拿得准或拿不准的事件。比如说,我们可以肯定,在地球上观测,太阳每天都是偏东升偏西落的;而我们并不好说什么时候买的哪一张彩票会中奖。对于我们拿得准的事件,我们几乎可以完全预测某种结果的出现,而对于不清楚的事件,我们就无法给出定论。
在一定的条件下,并不总是出现相同的结果的现象称为随机现象。一般而言,这样的现象有两个特点:
(1)结果不只有一个;
(2)任何人都很难预测哪一种结果出现;
而只有一种结果的事件,就称为确定性事件。
很多时候,为了确定随机现象出现的规律,我们会在特定的条件下进行大量的重复试验,并对结果进行观测和记录,这样的过程称为随机试验。
不难想到,对于随机试验而言,当试验的数目足够多时,随机现象的各种可能结果都会出现。不过很多时候,我们能做的随机试验的次数是有限的(比如说一次比赛等),这种情况下我们并没有办法通过试验来找出所有的可能结果。
但是,对于某些事件,甚至于说是绝大部分事件,我们其实都能够对随机现象的可能结果有所预见,比如说掷骰子。在一次投掷中,骰子落地后的点数是有范围的;同时,这里每个点数都有可能出现。这样,我们无需做很多次随机试验,也很清楚地就推得了随机现象的可能结果。
我们将随机现象的各种可能结果归纳,组成一个集合,称为样本空间,记为。其中,
表示其中的可能结果,又称样本点。这样,寻求随机现象的可能结果的问题,就转变成了求解样本点和样本空间的问题。
根据样本点的性质不同,我们很容易就将样本空间分为两类。一类是样本空间为至多可数集,称之为离散样本空间;另一类是样本空间为不可数集,称为连续样本空间。
样本空间的子集,是样本空间内某一些样本点的集合,表示在给定条件下能够代表某一事件发生的全部结果,因此也就代表了该事件。仍然以掷骰子为例,集合代表了事件“掷出的点数为奇数”。类似的例子有很多,我们就称样本空间内某一些样本点的集合为随机事件,简称事件,一般以大写字母标记。
有一些特别典型的事件类型,需要小伙伴们多加注意。如果事件是单元素集,就称之为基本事件;样本空间所代表的事件,称之为必然事件;如果事件为空集,就称之为不可能事件。
既然随机现象具有不确定性,那么也就是说,对于任何一次试验而言,结果都是变数,并不为人们所预知。但是,一般而言,利用事件的內秉性质,我们总可以将结果数字化,从而表示为数字变量的形式。我们称用于表示随机现象的结果的变量称为随机变量。常用大写字母X,Y,Z等表示。由于随机变量与事件的內秉性质高度相关,因此一般在设置随机变量时都要写明其含义。
单独的一个事件的各种概念我们已经明确,接下来我们就有必要研究两个及以上的事件之间的关系和作用了。
不难理解,事件之间的基本关系大致可分为以下几种:
(1)互相包含:此时,两个事件A与B之间应该满足关系;
(2)二者相等:此时,事件之间应满足且
;
(3)互不相容:此时,事件之间没有任何包含关系。
了解了事件之间可能的基本关系,我们接着就可以来研究事件之间的相互作用的结果。
由于事件本身是集合,因此事件之间的相互作用本质上也就是集合之间的相互运算。可以说,集合之间有多少种运算,事件之间就有多少种作用。
我们回忆一下基本的集合论知识,不难想起,集合之间具有交,并,补和差四种运算。
由于集合运算大家都已经十分熟练了,所以集合表示法等方面的内容在这里就不再赘述了。我们主要集中于这几种结果从概率论的角度出发,如何用自然语言描述的问题。换句话说,就是说,原事件之间作用出来的新事件描述的事件性质是怎么样的。
首先来看事件的交。由集合运算性质,所谓交,就是取两个或多个集合中所共有的元素组成一个新的集合。也就是说,事件的交当中,包含的样本点是几个事件所共有的样本点。这表明,所谓的交事件,就是事件“原各事件同时发生”。
接下来就也十分容易。类似的道理,我们不难推知,并事件,就是事件“原各事件至少有一个发生”;差事件就是事件“原某事件发生,而另外某事件不发生”。
但是,补事件有所不同。一般而言,补事件需要对应一个全事件。也就是包含某事件A在内的一个事件G。在这个全事件G中,事件A之外的样本点构成了一个新的事件B,称为该事件在全事件中的补事件。一般而言,全事件就是样本空间,也就是必然事件本身。这时,补事件B就称为该事件的对立事件,记为。
得到以上各种事件的过程,统称为事件的运算。
既然是运算,就一定会有运算性质。不难得到:
(1)交换律:
(2)结合律:
(3)分配律:
(4)De Morgen定理:
①;
②
最后,我们介绍一个稍微抽象一些的概念——事件域,以便我们后面正式介绍概率时提供方便。
事件域,实际上就是样本空间中的某些子集进行运算之后所得到的全部结果而组成的集合类,记为。这里的“某些子集”,既可以是全部子集,也可以是部分子集。
对于离散样本空间,很容易就理解,其全部子集构成的集合类就是一个事件域。但是,对于连续样本空间而言,事情就没这么简单了。
例如,当样本空间对应于实数轴上的一个区间时,我们可以总可以选出至少一个子集,我们无法定义这个子集的长度。这样无法测量长度的集合,在这里我们称为不可测集。(需要注意与Lebesgue测度和Jordan测度区分。)
当我们具体了解了概率的相关内容之后,我们就能理解,这样的子集对应的事件是无法定义概率的。我们并不希望看到这样的事情发生,所以,尤其对于连续样本空间而言,我们并不是需要将所有子集都看成是事件。我们只要将可测集看做是事件即可。
考虑到:
(1)交可以通过并和补来完成(De Morgen定理);
(2)差可以通过交和补来完成。
(命题1)
这样,在四种运算当中,最基本的运算,就是并和补(对立)。这样,我们就可以定义事件域如下:
设为一样本空间,
为
的某些子集所组成的集合类。如果
满足:
(1);
(2)若,则对立事件
;
(3)若,则可列并
则称为一个事件域,又称
域,或
代数。
在概率论中,我们称为可测空间。只有在可测空间上才可以定义概率。这是,事件域中的全部事件就称为有概率可言的事件。
在高等代数部分,我们了解过数域的概念。实施上,更一般的概念来自于“域”这一名词。我们在这里给出定义“域”的基本公理,小伙伴们可以自己对照一下,事件域是否满足这些基本公理:
(1)具有基本运算:加法和乘法;(注意,这里的加法和乘法只是一种泛称,并不一定对应着数字运算中的加法和乘法。)
(2)封闭性:对于加法和乘法封闭;
(3)交换律&结合律&分配律;
(4)存在单位元:对于加法和乘法,均存在单位元,其满足任意元素与之经过对应运算之后,该元素不变。(例如,对于数字运算的加法,单位元是0,任何数与之相加都不变;乘法的单位元就是1。)
(5)存在逆元:对于加法和乘法,除个别元素外,任意元素均存在对应的逆元,其满足任意元素与其逆元运算之后,结果为单位元。(例如,对于加法而言,任何一个数的相反数就是该数的逆元,相加的结果是0;乘法的逆元就是其倒数。)
最后,我们来给出样本空间的分割的概念,这对于我们后面研究各种概率论的问题都有所帮助。它可以简化被研究的问题,因而被广泛应用于各种各种概率与统计研究中:
对样本空间,如果有n个事件
,满足:
(1);
(2)
则称构成了样本空间
的一组分割。
思考:
证明De Morgen定理;
证明命题1;
写出下列随机试验的样本空间:
(1)抛三枚硬币;
(2)连续抛一枚硬币,直到出现正面为止;
(3)掷两颗骰子;
设A,B,C为三个事件,试表示下列事件:
(1)A,B,C都发生或都不发生;
(2)A,B,C中至多一个发生;
(3)A,B,C中至少有两个发生;
设X为随机变量,其样本空间为
。记事件:
写出下列各事件:
(1)
;
(2)
;
(3)
;
(4)
;
证明下列事件的运算公式:
(1)
(2)
设
为一个事件域,若:
试证明:
(1)
;
(2)
;
(3)
;
(4)
;
(5)
最後の最後に、ありがとうございました!