概率分布模拟(二)
一、指数分布模拟
指数分布常用来描述某个事件发生的等待时间的分布。我们知道在x≥0时,f(x)=λe^(-λx),所以F(x)=1-e^(-λx)。借助Excel,设置公式-LN(1-RAND())/λ,便可求出已知λ和随机概率对应的x值,同时还可以借助公式EXPONDIST(x,0.2,1)返回F(x)。生成服从λ为0.2的指数分布的随机数,制图如图1。

一个非负随机变量X是无记忆的,是指
P{X>m+n|X>m}=P{X>n} m,n≥0
显然指数随机变量是无记忆的。假设一个梗产生时间间隔(小时计算)服从λ为0.01的指数分布,那么产生新梗的时间超过2天的概率为1-F(48)=0.619,在第2天到第5天的概率为0.318。
二、二项分布
借助BINOM.DIST(i,n,p,1)返回n次实验中i次试验成功且每次成功概率为p的概率。
三、泊松分布
P{X=k}=e^(-λ)[(λ^k)/k!],借助POISSON.DIST(k,λ,1)返回参数为λ发生次数为k的概率。我们知道当n充分大而p非常小且np保持一定大小,参数(n,p)的二项分布近似为λ=np的泊松分布
四、综合模拟

图2的WS小世界模型有30个节点、每个节点有5个邻居节点且随机化重连概率为0.5。
一个人单独完成作业的时间(小时计算)服从参数λ=0.02的指数分布。完成作业指F(X)大于等于0.995。
(1)假设一个班有30人,从编号0到编号29,每个人的交际关系如图2。
(2)完成作业时间限定在30天内,编号0到编号4一定会选择从第1天开始完成,编号5到编号24一定会从第10天开始完成,编号25到编号29一定会从第20天开始完成开始完成。
(3)如果一个人获得了他人已完成的作业,那么他完成作业的时间或剩余时间将服从λ=0.03的指数分布。
(4)只有单独完成作业时间早的向晚的发送作业;只有完成作业的人或获得完成作业的人发送作业,前者在其完成作业当天,后者在获得完成作业当天。
(5)一个人发送给他人的概率与可能发送人数相关,若有N人可能被发送,发送任意n人的概率为1/(N+1)。
问题:编号29最早在哪一天完成作业且概率为多少?
由(1)可知每个人单独完成作业的时间约为288小时,即12天,这由于
EXPONDIST(288,0.02,1)=0.997
从而可知:编号0到编号4一定在第12天完成作业。
与编号29直接相联系的人有编号5、编号7、编号8、编号25和编号28。从图2可以看出编号5有0.5的概率发送作业给编号29,编号7有0.5的概率发送给编号29,编号8有0.5的概率发送给编号29。
编号4会在第12天完成作业,有5人可能被发送,编号4选择发多少人的概率都为1/6。若只发送1人,编号5有1/5的概率获得;若发送2人,编号5有4/10的概率获得;若发送三人,编号5有6/10的概率获得;若发送4人,编号5有1/5的概率获得;若发送5人,编号5一定获得。编号5获得作业的概率为(1+2+3+4+5)/30=1/2。
编号5获得编号4的作业是在第12天,那么当天编号29有0.5的概率获得作业并在第20天开始完成,由(5)可知编号29获得作业后会在第27天完成作业,这是因为
EXPONDIST(192,0.03,1)=0.997
其在第27天完成的概率为0.25。当然我们也可以知道编号5只需81小时便可完成作业,换言之上述过程并不是最短的,最短时长为48+17=65小时,即直接借助编号5、编号7或编号8完成的作业,这主要是由于指数函数性质。