欢迎光临散文网 会员登陆 & 注册

囚徒问题与积分

2022-08-23 01:53 作者:げいしも_芸  | 我要投稿

题目描述:

现有100名囚犯,编号1~100;100个位于密闭房间中的不透明容器,编号1~100;以及一百张分别写有数字1~100的纸条

现将100张纸条随机放入100个容器中

然后,让100名囚犯分别进入房间中,每名囚犯可以打开50个容器,寻找与自己编号相同的纸条,开完50个容器后,必须将所有东西放回原位,且不得与其他囚犯有交谈。但在这之前,囚犯们可以商量对策。若所有囚犯都找到了与自己编号相同的纸条,这这100名囚犯可以全部无罪释放,但若有一人没找到自己编号的纸条,则所有人必须继续服刑

那么,囚犯们应该选择怎么样的策略,才能使得无罪释放就几率最大?

策略

首先,很容易想到全随机选择,那么对于单个囚犯来说,找到自己的纸条的概念均为%5Cfrac%2012,那么100名囚犯都找到自己纸条的概率自然是(%5Cfrac%2012)%5E%7B100%7D%5Capprox%207.888609%5Ccdot%2010%5E%7B-31%7D

这是个什么概念呢?

据估计,地球上沙粒的数量在10%5E%7B22%7D左右,也就是说,使用这个策略获胜的可能性,是让你从地球上随机挑出一颗沙粒,挑到指定的那一粒沙粒的概率的不足亿分之一,可见这必然不是最佳策略

那么我们应该使用怎样的策略呢?

我们知道:对任意一个容器r_%7Bi_1%7D而言,其中有一张纸条p_%7Bi_2%7D,不管纸条编号是否与容器相同,其纸条必定指向箱子r_%7Bi_2%7D,像这样,容器中有纸条,纸条指向箱子,形成一个循环,直到容器r_%7Bi_k%7D中有纸条p_%7Bi_1%7D,此时循环结束

我们称这样的循环为“环”,记作l

那么对于囚犯t,其只需要从容器r_t开始寻找,对所在的环进行遍历后,必定能在容器r_%7Bt_0%7D中找到纸条p_t,考虑到囚犯只能打开至多50的容器,则r_%7Bt_0%7D所在的环l的长度必须小于51,即%5Ctext%7Blength%7D(l)%5Cleq%2050

那么,这个策略成功的概念,就是100个纸条和100个容器随机组合,形成的若干个环中,最长环的长度l_%7B%5Cmax%7D小于等于50的概率

求出概率

在下文中,我们记最长环的长度为s

要得到s%5Cleq%2050的概率,直接算肯定不好算,因为长度小于等于50的最长环有时不止一个

但是,s%5Cgeq%2051的情况肯定只有一个最长环,我们可以计算P(s%5Cgeq%2051%EF%BC%89,那么:

考虑s%3Dn(51%5Cleq%20n%20%5Cleq%20100%2Cn%5Cin%20N)

选出n个数,不妨令这个环的结构如下:

l%3D%5B1%2C14%2C51%2C4...19%2C8%2C10%5D

容易知道:

第一个数字有n-1种选择,第二个数字有n-2种选择,以此类推,第k的数字有n-k种可能,而第n个数字只有一种可能,才能保证成环

那么这个环就有%5Cprod_%7Bi%3D1%7D%5E%7Bn-1%7D%20(n-i)%3D(n-1)!种排法

考虑剩下的容器,用同样的方法可以算出有有A%5E%7B100%7D_%7B100-n%7D%3D%5Cfrac%7B100!%7D%7Bn!%7D种可能

故长度为n的环有

(n-1)!%5Ccdot%5Cfrac%7B100!%7D%7Bn!%7D%3D%5Cfrac%7B100!%7D%7Bn%7D

所以:

P(s%3Dn)%3D%5Cfrac%7B%E9%95%BF%E5%BA%A6%E4%B8%BAn%E7%9A%84%E7%8E%AF%E6%95%B0%E9%87%8F%7D%7B%E6%80%BB%E7%9A%84%E6%8E%92%E5%88%97%E6%96%B9%E5%BC%8F%7D%3D%5Cfrac%7B%5Cfrac%7B100!%7D%7Bn%7D%7D%7B100!%7D%3D%5Cfrac1n

故长度最长的环长度为n的概率为%5Cfrac%201n

%E5%88%99P(s%5Cgeq51)%3D%5Cfrac%201%7B51%7D%2B%5Cfrac%7B1%7D%7B52%7D%2B...%2B%5Cfrac%7B1%7D%7B100%7D%3D%5Csum_%7Bi%3D51%7D%5E%7B100%7D%5Cfrac%7B1%7D%7Bi%7D

这个式子的值约为0.688

则成功几率为1-0.688=0.312

可见,使用这种策略可以使成功的几率大大提高

优势

更有趣的是,这种策略所带来的优势随着人数的上升而增加

%E8%80%83%E8%99%91%E6%9C%892a%E4%B8%AA%E5%9B%9A%E7%8A%AF%EF%BC%8C%E6%AF%8F%E4%BA%BA%E5%BC%80a%E4%B8%AA%E5%AE%B9%E5%99%A8

则获胜几率为:

P_%7B%5Ctext%7Bwin%7D%7D%3D1-%5Csum_%7Bn%3Da%2B1%7D%5E%7B2a%7D%5Cfrac%201n

%E5%BD%93%5Clim_%7Ba%5Cto%20%E2%88%9E%7D%E6%97%B6%EF%BC%8C%E5%8E%9F%E5%BC%8F%3D1-%5Cint_%7Ba%7D%5E%7B2a%7D%5Cfrac%201n%5Ctext%20dn%3D1-%5B%5Cln(2a)-%5Cln(a)%5D%3D1-%5Cln2

故成功几率稳定在1-%5Cln2%5Capprox%200.3069

而这比(%5Cfrac%2012)%5E%7B2a%7D的值要大的多

注:

本专栏是基于视频BV17W4y1S7WR的基础上撰写,对部分原视频讲的不清楚的地方进行了补充,主要是最长环概率处,感兴趣的也可以去看这个视频

另外,没意外这就是我暑假的最后一更了,过几天就要去新学校报道了,上了高中不能常更新,可能只有长假才会更新了,不好意思啦~

囚徒问题与积分的评论 (共 条)

分享到微博请遵守国家法律