欢迎光临散文网 会员登陆 & 注册

《10堂概率极简课》标注

2023-02-20 20:26 作者:阿强憨憨  | 我要投稿

 

间接押注的总成本是P(p)+P(q)。根据相关性,直接押注的成本应该等于间接押注的成本:P(p或q)=P(p)+P(q)。如果等号两边不相等,那么显然有可能被人利用,以贱买贵卖的方式实施荷兰赌。在满足模型假设条件的情况下,相关性从本质上看就是指可通过不止一种方式实现的赌博协议能够得出一致的估算结果。

 

第四个问题。A向B承诺:如果B用一枚普通的骰子,第一轮就掷出6点,A就给B一枚硬币;如果B第二轮掷出6点,A就给B两枚硬币;如果B第三轮掷出6点,A就给B三枚硬币;如果B第四轮掷出6点,A就给B 4枚硬币,以此类推。请问B的期望值是多少?第五个问题。问题同上,但是A承诺付给B的硬币数目不是按照1、2、3、4、5…这样的规律增长,而是按照像1、2、4、8、16…或者1、3、9、27…或者1、4、9、16、25…或者1、8、27、64…这样的规律递增。尽管这些问题大多不难解答,但你会有一些非常奇怪的发现。蒙特莫特回答道,这些问题并不难,只要求出无穷级数的和即可,而“你的伯父雅各布·伯努利早就给出了这类级数的求和方法”。尼古拉·伯努利在回信中建议蒙特莫特亲自试一试。虽然第四个问题中的无穷级数之和是6,但第五个问题中的几个无穷级数之和都是无穷大。这就是伯努利所说的“非常奇怪的发现”。这样的结果意味着什么呢?这个赌博游戏的期望值怎么会大于所有的有限和呢?

 

克莱姆认为效用是金钱的平方根;伯努利则认为金钱增量产生的效用与已经拥有的金钱数量成反比,财富的派生效用等于财富数量的对数。接着,伯努利又对风险厌恶进行了描述,并讨论了购买保险的合理性。

 

 

如果股票价格的对数真的像布朗运动那样波动,研究布朗运动就可以预测和确定股票价格。基于这样的假设,数学家和经济学家推导出定价公式,比如布莱克–斯科尔斯期权定价模型[迈伦·斯科尔斯(Myron Scholes)和罗伯特·默顿(Robert Merton)因为这项成果获得1997年的诺贝尔经济学奖]。

 

 

贝叶斯的前辈们,包括伯努利和棣莫弗,都是根据概率来推断频率,而贝叶斯则是根据频率来推断概率,从而为统计推断奠定了数学基础。

 


 

 

贝叶斯的动力似乎不是源自法律、医学等实际事务,而是与数学哲学问题有关

 

 

从这个角度看,这个方法似乎可以用作大卫·休谟问题的答案。休谟在1748年出版的《人类理解研究》中写道:

尽管世界上并不存在概率这种事物,但由于我们不知道任何事件的真实原因,因此我们的无知对理解产生了同样的影响,并产生了一种类似的信念或观点。……我们在做一切推断时,都会在习惯的支配下将过去的经验套用到将来的头上。因此,如果一件事在过去充满规律性和一致性,我们就会信心十足地预期未来它也是这样,而不会做任何相反的假设。但是,如果我们发现多个不同的结果是由表面上非常相似的原因造成的,当我们把过去的经验套用到将来的头上时,这些结果就会浮现在我们的脑海里,我们在决定那个事件发生的概率时,也肯定会考虑到它们。虽然我们会倾向于最常见的结果,并且相信这种结果肯定会发生,但我们也不应当忽略其他结果。当然,我们必须按照它们发生频率的多少,赋予每个结果或多或少的权重和信度。

 

 

哈尔·帕施勒和克里斯汀·哈里斯在《心理科学》杂志关于复制研究的特刊上发表了一篇文章,指出心理学领域关于效力与先验的假设不可谓不合理,但与5%的p值相结合,就会导致真实效果的概率不到一半。流行病学领域在分析某个效果的概率时可能需要考虑许多相关因素,但由于先验概率较低,情况可能要糟糕得多。此外,人们还可能通过某些主动的方式得到期望的p值。有的是因为操作出了问题,因此某些轮次的实验被视为失败。有的实验者尽管做出了努力,但因为没有取得效果,所以无法公开发表实验结果。在这种情况下,纯噪声迟早会达到统计显著性水平,实验结果也得以顺利发表。又或者是实验者修改假设,以便从数据中得到一个理想的p值。这种做法被称为p值操纵。

 

 

贝叶斯的哲学理念改变了世界。关于概率,我们都有一个先验。我们获取数据,运用贝叶斯定理更新概率,最终得到一个后验。在获取数据之前,我们把已知的一切信息都归到对未知的先验之中。然后,我们输入数据并更新。这个一般性方法的应用范围很广,不仅限于抛硬币或掷骰子。我们未知的事物可能是向量、曲线或者图形的发生概率。当分析遭遇瓶颈时,我们可以使用渐进法或蒙特·卡罗模拟法。

 

当时,阿兰·图灵领导的一个小组破解了德国海军的恩尼格码。此前英国人试图根据字母出现的频率来破解该密码,但没有成功。而图灵采用了贝叶斯技术,在某些情况下还进行了创新,取得了不错的效果。有的信息——比如电文来源,发送的具体时间,电文长度是否与为了迷惑英国人而发送的标准“噪声”电文相同,同一名发报员是否总以相同长度的报尾结束电文——对老式的解码技术而言是毫无作用的。

 

 

贝叶斯的伟大思想是,通过给不同的概率分布Pi指定一个先验分布πi,使统计学成为概率的一个组成部分。


 

 

我们以抛掷一枚真实的图钉为例。如果图钉落地后针尖朝上,则计1;如果它落地后针尖指向地面,则计0。在经典的贝叶斯分析中,θ表示单次抛掷后针尖朝上的概率,它是未知的。假设θ的先验是均匀的,图钉已被抛掷了10次,而且从未出现针尖朝上的结果。那么,在接下来的10次抛掷中,不会出现针尖朝上的结果的概率是多少?经典计算表明,这个概率大约为1/2(11/21)。假设把数字10换成n。在n次实验未取得成功的情况下,接下来的n次实验也不会成功的概率是多少?无论之前未成功实验的次数是多少,答案同样约为1/2,即(n+1)/(2n+1)。如果这个答案在令我们吃惊之余还让我们感到失望,就说明我们假设的均匀先验可能是存疑的。这个答案让哈罗德·杰弗里斯和多萝西·林奇忧心忡忡,为此他们尝试了各种各样的先验。他们建议为0和1这两个位置分别赋予某个先验概率质量。如果赋予0的先验概率是1/3,赋予1的先验概率是1/3,而且两者之间的概率是均匀的,那么在已知前10次失败的情况下,接下来失败10次的概率超过90%

 

 

在贝叶斯理论中,偏倚先验是由表示定理决定的。我们把这种估算先验概率称作菲尼蒂先验。如果你对结果序列的置信度具有某种对称性,即可交换性,那么这些结果序列就好像是由偏倚未知、有菲尼蒂先验的抛硬币概率模型得到的。因此,只要我们的置信度具有可交换性,即使我们认为概率不存在,应用贝叶斯的数学方法也不会有任何问题。

 

 

贝叶斯是参数贝叶斯分析之父。他分析的概率模型——独立、同分布的抛硬币序列,有一个未知参数——硬币的偏倚。我们可以为这个参数赋予一个先验置信度,然后利用反向推理,由数据得出一个后验置信度和新的预期数据。尽管贝叶斯本人并没有这样做,但他揭示了机会、频率和置信度是如何相互作用并给出统计推断的。菲尼蒂是主观贝叶斯分析之父。他将对称这个古老的概念应用于置信度,指出贝叶斯概率模型的元素都可以被视为对称的手工艺品,即可交换性。对于不具有可交换性的情况,菲尼蒂给出了适用于较弱对称性的相同概念:马尔可夫可交换性和更具一般性的部分可交换性。概率成了适当对称性的一种位置标记。

 

 

什么是对称?它是经过一组变换后保持不变的特征,这是赫尔曼·外尔在一部经典著作中对这个概念给出的明确解释。[插图]某些特征经旋转或反射后仍保持不变,这是物理对称性的常见标志。一般而言,我们有一个状态的集合和一个由其可测子集构成的集合。如果每个可测集合A与它的逆像T–1(A)的概率相同,那么概率测度相对于一个变换群(或半群)保持不变。随机过程相对于时间变化保持不变,这是一种特别重要的对称,具有这种特征的随机过程被称为平稳随机过程。如果变换将可测集变成其自身(概率为0的集合除外),那么该可测集相对于该变换保持不变。如果不变集的概率为1或0,那么概率测度相对于该变换具有遍历性。遍历分解定理认为,每个不变概率都可以表示成遍历概率的平均值(混合)。具体来说,遍历分解定理告诉我们平稳过程可以表示成多个遍历过程的混合。二值随机变量序列的可交换概率——对实验进行有限排列时保持不变——是固定的。遍历分解概率使抛硬币的结果为独立同分布,这与菲尼蒂表示定理没有任何区别


 

 

更复杂的随机数生成器使用的是高阶递归函数。Xn+ 1=Xn–24·Xn–55 (mod 232–1)是随机数生成器的一个早期经典案例,也是本书作者最喜欢的一个,该程序启动所需的种子X1, X2, …, X55。现代最流行的生成器——梅森旋转算法,也采用类似的随机数生成方案。这些方案有效吗?答案既是肯定的,也是否定的。对某些任务来说,比如求积分和玩电脑游戏,这些方案通常很有效。

 

人们曾利用几种新的经过改进的随机数生成方案,求解一个统计物理问题的若干常见实例的结果。通过解析,人们已经知道该问题的正确解,但这些随机数生成方案却都失败了。今天的老虎机使用的就是上文中描述的那些简单生成器,据我们所知,这个事实已被赌场骗子掌握并加以利用。他们通过数百次的观察,了解拉下拉杆的结果,继而洞悉了N和f(i)的秘密。之后,根据当前的X(n),就可以推断出X(n+1), X(n+2), …。他们在赌场伺机而动,等到累计奖金金额非常高时,就会“一不小心”把咖啡洒在正在玩老虎机的玩家身上。(“哎呀,衣服清洗费算我的,请收下这个50美元的筹码吧。”)。然后,他们就会堂而皇之地坐到那台老虎机前,拉动拉杆,满载而归。关于银行诈骗和计算机系统遭黑客入侵的报道也不绝于耳。

 

 

归纳怀疑论的经典陈述来自大卫·休谟,尽管他会让我们想起它的古老渊源。休谟问道,我们如何验证归纳推理的合理性呢?它不能通过意识关系——数学演绎——来证明:“太阳明天不会升起”的命题和“太阳明天会升起”的命题,都是可以理解的。因此,如果我们试图证明它是错误的,必将徒劳无功。

 

 

除了可交换性,置信度可能还有其他对称性,这些对称性通常会产生某些归纳结果。对称性减弱,让步于顺序效应,并产生马尔可夫可交换性。顺序效应不仅限于此,还包含不同类型的时间顺序和时空顺序。一般来说,置信度的对称性是进行各种类比推理的原因。菲尼蒂早在1938年就提出了这一观点,后来该观点被多次发展完善。

 


《10堂概率极简课》标注的评论 (共 条)

分享到微博请遵守国家法律