有意思的概率与统计（四）

2023-07-23 20:34 作者:不能吃的大鱼 0人读过 | 我要投稿

很快啊！我们终于进行到概率的基本知识部分的最为重要的内容——条件概率了。

条件概率作为我们目前所接触到的第一个重要的知识点，可以说同时它也是整个概率论中十分重要的一个点。条件概率在实际应用当中几乎很多地方都能见得到。因此，小伙伴们可要好好掌握哟~

Chapter One 随机事件与概率

1.4 条件概率

条件概率，顾名思义，它也是概率的一个类别。但是，与一般事件的直接概率不同，条件概率之所以称之为“条件”，就说明，它实际上是某一事件在另一事件的条件下发生的概率。例如说，事件A=“掷骰子掷出5点”在事件B=“掷骰子掷出的点数为奇数”发生的前提下发生的概率，就是一个典型的条件概率。

经过之前几篇专栏的介绍，我们不难求出，事件A的直接概率为1/6；而当事件B发生了之后，由于新的样本空间中的样本点数发生了变化（从6减小为3），因此此时事件A再发生的概率就变为了1/3。

再比如，我们定义事件A=“抛两枚硬币，结果是一正一反”，定义事件B=“抛两枚硬币，其中一枚是正面”。事件A的直接概率我们已经求解过（见专栏（二）），为1/2；而当事件B发生了之后，由于样本空间中的“（反，反）”已经不会再出现了，因此此时事件A再发生的概率就变为了2/3。

从这两个例子当中，我们可以很容易地看出直接概率与条件概率的区别。同时，我们也不难归纳出：

设A与B是事件域 $%5Cmathscr%20F$ 中的两个事件，若P(B)＞0，则称：

$P(A%7CB)%3D%20%5Cfrac%7BP(AB)%7D%7BP(B)%7D%20$

为“在B发生的条件下A发生的条件概率”，简称为条件概率。

基于这个定义，我们首先要明确的一点就是，条件概率虽然名为概率，但它到底是不是严格意义上的概率呢？

首先，由于条件概率是两个直接概率之商，因此非负性不用怀疑。而由交集的性质，我们知道， $%5CvarOmega%20%5Ccap%20B%3DB$ 。于是，就有：

$P(%5CvarOmega%7CB)%3D%20%5Cfrac%7BP(%5CvarOmega%20B)%7D%7BP(B)%7D%3D%20%5Cfrac%7BP(B)%7D%7BP(B)%7D%3D1%20%20$

这就满足了正则性。

最后，由事件运算的分配律，我们能够知道：

$%5Cbigg(%5Cbigcup_%7Bn%3D1%7D%5E%7B%E2%88%9E%7D%20A_n%5Cbigg)%5Ccap%20B%3D%5Cbigcup_%7Bn%3D1%7D%5E%7B%E2%88%9E%7D%20(A_n%20B)$

又由事件序列 $%5C%7BA_n%5C%7D$ 的互不相容性，则事件序列 $%5C%7BA_n%20B%5C%7D$ 也是互不相容的。故而，根据条件概率的定义，我们能推得：

$P%5Cbigg(%5Cbigcup_%7Bn%3D1%7D%5E%7B%E2%88%9E%7D%20A_n%7CB%5Cbigg)%3D%20%5Cfrac%7BP(%5Cbigcup_%7Bn%3D1%7D%5E%7B%E2%88%9E%7D%20(A_n%20B))%7D%7BP(B)%7D%3D%20%5Cfrac%7B%5Csum_%7Bn%3D1%7D%5E%E2%88%9E%20P(A_n%20B)%7D%7BP(B)%7D%3D%5Csum_%7Bn%3D1%7D%5E%E2%88%9E%20%5Cfrac%7B%20P(A_n%20B)%7D%7BP(B)%7D%3D%5Csum_%7Bn%3D1%7D%5E%E2%88%9E%20P(A_n%7CB)$

这说明，条件概率满足可列可加性。

综上，我们终于可以肯定地说，条件概率是概率。

对条件概率的基本内涵有了深入的了解之后，我们就可以开始研究条件概率的应用了。

从定义式，我们首先能得到的，就是：

$P(AB)%3DP(A%7CB)P(B)%20$

（前提总要保证P(B)＞0，这一点后面我们就不再重复叙述了~）

而将这个式子稍作推广，不难得出：

$%5Cbegin%20%7Bequation%7D%0A%5Cbegin%20%7Baligned%7D%0AP(A_1A_2%5Ccdots%20A_n)%20%26%3DP(A_1)P(A_2%7CA_1)%20P(A_3%7CA_1A_2)%5Ccdots%20P(A_n%7CA_1A_2%5Ccdots%20A_%7Bn-1%7D)%5C%5C%0A%5Cend%20%7Baligned%7D%0A%5Cend%20%7Bequation%7D$

（其中， $P(A_1A_2%5Ccdots%20A_%7Bn-1%7D)%EF%BC%9E0$ ）

这就是条件概率的乘法公式。

接下来，我们从条件概率所涉及到的各个部分，来对条件概率的各个性质和公式加以研究。

首先，我们从定义当中可以窥见，条件概率，最主要的两个核心就是——条件，以及结果。

从条件入手，我们可以想见，如果我们不断弱化条件（实际上就是放大事件B的范围，比如说，从“掷出奇数”放大到“掷出奇数或偶数”，就将条件弱化了），那么结果事件A发生的概率将会逐渐接近事件A发生的本来概率，直到相等（弱化到样本空间为条件）。

那么，我们就构造一个事件序列 $%5C%7BB_n%5C%7D$ ，其构成了样本空间 $%5CvarOmega%20$ 的一个分割。事件A是其事件域 $%5Cmathscr%20F$ 中的某一事件。那么，利用有限可加性，我们能够直接得到：

$P(A)%3DP(A%5CvarOmega%20)%3D%5Csum_%7Bi%3D1%7D%5En%20P(AB_i)$

利用条件概率的乘法公式，我们就直接得到：

$P(A)%3D%5Csum_%7Bi%3D1%7D%5En%20P(AB_i)%3D%5Csum_%7Bi%3D1%7D%5En%20P(A%7CB_i)P(B_i)%20$

这就是全概率公式。

全概率公式作为概率论中十分重要的一个公式，可以大大简化很多问题中概率的计算。并且，它也揭示了事件的概率与条件之间的一种作用关系，从而能够利用不同条件下的结果来推算本来的概率。

研究完了条件对条件概率的影响，我们接下来看结果能够引导出什么样的性质和公式。

我们上面将条件不断弱化，实际上是通过不断地累加条件事件，使其最终扩大成为样本空间，以此推导出事件A的本来概率。现在，我们也可以将结果事件A补全，使之成为样本空间 $%5CvarOmega%20$ 的一个分割中的某一事件，进而来研究该事件在条件B下的概率。

设事件A是样本空间 $%5CvarOmega%20$ 的一个分割 $%5C%7BA_n%5C%7D$ 中的某一事件，记为事件 $A_i$ 。这样，其在事件B的条件下发生的概率就为：

$P(A_i%7CB)%3D%5Cfrac%7BP(A_iB)%7D%7BP(B)%7D%20%20$

利用全概率公式，这个式子就可以被改写成：

$P(A_i%7CB)%3D%5Cfrac%7BP(A_i%20B)%7D%7BP(B)%7D%20%20%3D%5Cfrac%7BP(B%7CA_i)P(A_i)%20%7D%7B%20%5Csum_%7Bi%3D1%7D%5En%20P(B%7CA_i)P(A_i)%7D$

这就是有名的Bayes公式。

其中，我们称 $P(A_i)%20$ 为 $A_i$ 的先验概率，而称条件概率 $P(A_i%7CB)$ 为后验概率。那么，不难理解，Bayes公式，就是在已知先验概率的条件下，求其后验概率的重要方法。

至此，我们已经将条件概率的基本内容介绍完了。不过光有单纯的理论叙述，似乎大家理解和应用起来应该会有一定的难度。所以，接下来给大家分别举几个例子，来具体了解一下，全概率公式和Bayes公式到底是怎么使用的~

例1：（彩票模型）

一般而言，在彩票站的彩票箱里，总是那么几张有奖的彩票（且不论能中多少的奖）。现在，设在彩票箱里的n张彩票当中有m张是有奖的，那么我们要问，第k（k≤n）个人摸彩票时中奖（记为事件A）的概率是多少？

我们的直觉告诉我们，概率应该是m/n。从结果上来讲，这相当于是说，抽取彩票的人排在第几个无关紧要，无论如何抽到中奖彩票的概率不会改变。

但事实上如何呢？是否真如我们所预期的那样，概率就是m/n呢？

我们先来看k=2时的情况。很明显，我们需要考虑，第一个人是否抽到了中奖彩票。如果没有，那么，事件 $B_1$ =“第一个人没有抽到中奖彩票”，对于第二个抽彩票的人产生的影响，就是相当于从剩下没有奖的n-m张彩票当中抽走了一张，此时，条件概率：

$P(A%7CB_1)%3D%5Cfrac%7Bm%7D%7Bn-1%7D%20$

如果第一个人抽到了奖，那么，类似地，我们可以分析出，事件 $B_2$ =“第一个人抽到了中奖彩票”的条件概率为：

$P(A%7CB_2)%3D%5Cfrac%7Bm-1%7D%7Bn-1%7D%20$

这样，利用全概率公式，事件A的概率就为：：

$P(A)%3D%5Csum_%7Bi%3D1%7D%5E2%20P(A%7CB_i)P(B_i)%20%3D%5Cfrac%7Bn-m%7D%7Bn%7D%5Cfrac%7Bm%7D%7Bn-1%7D%20%2B%20%5Cfrac%7Bm%7D%7Bn%7D%5Cfrac%7Bm-1%7D%7Bn-1%7D%20%3D%5Cfrac%7Bm%7D%7Bn%7D%20$

这初步说明我们的想法是有道理的。但是，对于任意的k≤n，这样的结论是否都成立，显然只有这一个例子是还不够的。但是，既然我们已经有了猜测的结论，那么不难想到，我们可以使用数学归纳法来证明。证明此处略去，但是很显然，我们并没有想错。

这一结论切实地表明，只要我们每个人抽彩票时不知道其他人是否已经中奖，就不会影响到我们自己中奖的概率。所以，这也告诉各位，抽奖小游戏当中，包括很多时候抽序号也是一样，其实不必太在意自己是第几个去抽的，因为结果并不会有所改变~

例2：（敏感性问题调查）

敏感性问题，其实就是大家都难以启齿去准确回答的问题。一个经典的问题就是——你有没有看过エロティック映画？（你猜是什么意思~）

你如果直接问出这个问题，我想任何一个人都很难直接回答出是或否。毕竟，这实在是太隐私了。

因此，我们就要想一个办法，能够让大家在保证隐私的情况下配合我们的调查。这个时候，全概率公式就能起到很大的作用。

我们设置如下两个问题：

问题1：你的生日是否在7.1之前？

问题2：你是否看过エロティック映画？

我们预先设置好调查环境，确保大家抽中哪个问题以及做出何种回答都是只有受调查者自己清楚。（比如说，在一个没有监控设备的封闭室内，独自一人随机抽取代表问题的标志物，并快速放回。）我们规定，在一个盒子当中放着两种颜色的球，一种为红色，另一种为白色。抽到红色回答问题1，抽到白色回答问题2。

由于盒子里放置多少球是我们自己决定的，因此两种颜色的球的比例我们是清楚的，不妨记为π（红：白=π）。

这两种问题都是一般疑问，都只需要回答是或否，因此我们收集到的结果也只会是标记有是或否的答卷。（这也进一步保证了回答问题的私密性。）

我们假设，一次社会调查之后，我们收集到n份答卷，一共有k份回答了“是”。这样，事件A=“抽到问卷后，回答了‘是’”的概率为k/n。（用频率估计概率）

按照我们对问题的设置，我们就可以将条件分成两个部分：

$B_1$ =“抽到了问题1”

$B_2$ =“抽到了问题2”

这样，利用全概率公式，我们就得到：

$P(A)%3D%5Csum_%7Bi%3D1%7D%5E2%20P(A%7CB_i)P(B_i)%20$

其中，这两个条件事件的概率受盒子中两种颜色的球的比例控制，都是已知量。而对于问题1，对于大量的样本而言，其概率理应趋近于0.5。因此，在公式当中，目前就只有我们希望得知的“在抽到问题2之后，回答了‘是’”的概率是未知的。

将数据代入，我们就得到：

$%5Cfrac%7Bk%7D%7Bn%7D%20%3D%200.5%20%5Cfrac%7B%5Cpi%7D%20%7B1%2B%5Cpi%7D%20%2Bp%5Cfrac%7B1%7D%20%7B1%2B%5Cpi%7D%20$

变换一下，我们就得到：

$p%3D%5Cfrac%7Bk(1%2B%5Cpi)%7D%20%7Bn%7D%20-%5Cfrac%7B%5Cpi%7D%7B2%7D%20$

比如说，n=1000，k=375，π=3/7，那么我们就能算出p=5/28≈17.86%。

这个结果表明，在此调查下，大概有17.86%的人看过エロティック映画。

例3：（癌症检测）

医学研究表明，对于任何疾病的化验，其结果都有可能是错误的。医学上对于癌症的检测，通常是针对特征产物甲胎蛋白来进行检验。（检测出甲胎蛋白则呈阳性，反之则阴性。）社会调查显示，某地区居民患癌症的概率为0.0004。据当地医院统计，患癌症的人，检测呈阳性的概率为99%；未患癌症的人，检测呈阴性的概率为99.9%。

现在，有一位居民感觉身体不适，去医院自行体检，甲胎蛋白检测呈现阳性（记为事件B）。那么，他到底有多大的概率确实得了癌症（记为事件A）呢？

很明显，我们现在要求的条件概率为 $P(A%7CB)$ 。利用Bayes公式，我们很容易就写出：

$P(A%7CB)%3D%5Cfrac%7BP(B%7CA)P(A)%20%7D%20%7B%20P(B%7CA)P(A)%2BP(B%7C%5Coverline%20A)P(%5Coverline%20A)%7D$

等式右侧的各个概率我们都是已知的，将数据代入，我们就得到：

$P(A%7CB)%3D%5Cfrac%7B0.99%C3%970.0004%7D%7B0.99%C3%970.0004%2B(1-0.999)%C3%97(1-0.0004)%7D%20%3D%200.2837$

这是一个十分意外的结果，因为它说明，即使你检测呈阳性，你也未必就患了癌症；相反，甚至有很大可能其实你并没有什么事。究其原因，虽然患癌症之后检测基本呈现阳性，但是由于实际上患癌症的人实在太少，所以占比并不大；而虽然未患癌症的人误诊概率极低，但是因为未患癌症的人是相当多的，因此反而总能发现几个实际上患了癌症的阴性患者。

这也就是为什么，在流行性感冒肆虐的日子，人们总是不太能相信检测结果的原因。因为与癌症正相反，对于流行性感冒来说，传染和患病的概率是很高的，反倒是暴露在这样的氛围当中的未患病者很难独善其身。因此，即使你检测出来自己是阴性，但也没办法确认自己是未患病的；相反，你很可能已经得病了，只是你自己还不知道罢了。

但是，我们可以通过一些手段来提高检测的准确率。事实上，我们可以看到，如上结果出现的核心问题就在于，一次检测的准确率虽然很高，但是相对应的，在没有任何其他了解的情况下，我们已知的患癌的概率太低，这大大降低了检测准确性的效用。如果我们能提高对人群的患癌概率的认识，那么这个问题就可以大大缓解。

比如说，如果我们已经做了一次检测，那么这个时候，按照我们刚才的计算结果，此时，患癌症的概率变为0.2837。这时，我们进行第二次检测，仍然按照上述公式代入，计算出的条件概率为：

$P(A%7CB)%3D%5Cfrac%7B0.99%C3%970.2837%7D%20%7B0.99%C3%970.2837%2B(1-0.999)%C3%97(1-0.2837)%7D%20%3D%200.9975$

可以见到，此时准确率实际上的准确率就大大提高了。

至此，我们就介绍完了所有的条件概率的公式，并初步展示了它们的重要作用。希望大家能够充分理解这些~

思考：

求以下概率：

（1）设一批产品中一、二、三等品各占60%，35%，5%。从中任意取出一件，结果不是三等品，求取到一等品的概率；

（2）掷两颗骰子，以A记事件“两颗点数之和为10”，以B记事件“第一颗点数小于第二颗点数”，求 $P(A%7CB)$ 和 $P(B%7CA)$ ；

（3）设10件产品中有3件不合格品，从中任取两件，已知一件是不合格品，求另一件也是不合格品的概率；
求以下概率：

（1）钥匙掉了，掉在宿舍里、路上和教室里的概率分别为0.5、0.2和0.3，而各自被找到的概率分别是0.8、0.1和0.3。求钥匙能够找到的概率；

（2）已知男人中有5%是色盲患者，女人中有0.25%是色盲患者。今从男女比例为22:21的人群当中随机地挑选一人，发现恰好是色盲患者，求此人是男性的概率；

（3）口袋中有一个球，不知它的颜色是黑还是白。现再向其中放入一个白球，然后从口袋中任意取出一个，发现取出的是白球，试问口袋中原来的球是白球的概率；
证明：

（1）

$P(B%7CA)%5Cge%201-%5Cfrac%7BP(%5Coverline%20B)%7D%7BP(A)%7D%20%20%5Cquad%20(P(A)%EF%BC%9E0)$ ；

（2）

$P(A%7C%5Coverline%20B)%5Cge%20%5Cfrac%7BP(A)%7D%20%7B1-P(B)%7D%20%5Cquad%20(P(%5Coverline%20B)%E2%89%A00%EF%BC%8CAB%3D%5Cvarnothing)$

（3）

$P(A)%5Cle%20P(A%7CB)%20%5Cquad%20(A%5Csubset%20B%EF%BC%8CP(B)%EF%BC%9E0)$

（4）

$%5Cfrac%7BP(A)%2BP(B)-1%7D%7BP(B)%7D%5Cle%20P(A%7CB)%5Cle%20%5Cfrac%7BP(A)%7D%7BP(B)%7D%20%20$

（5）

$P(%5Coverline%20B%7C%5Coverline%20A)%3D1%5Cquad%20(P(A%7CB)%3D1)$