欢迎光临散文网 会员登陆 & 注册

几个概率不等式(二)Chernoff_bounds_初步_用高斯分布来演示

2023-08-24 09:22 作者:乐吧的数学  | 我要投稿

这个文章讲一下 Chernoff Bounds,这个限其实是一种思路,不是一种固定的限,所以,如果上网搜的话,会有各种各样的不等式都被称为 Chernoff Bounds.   另外,名称上也有叫  Chernoff-Hoeffding Bounds,  Chernoff 首先阐述了这种思想,用在抛硬币上,后来 Hoeffding 推广到更一般的情况。

这个限的思路如下:


1). 把不等式转换成 e 的指数形式,并引入一个自由变量

2). 使用 Markov 不等式

3). 应用其它各种已知的条件,例如独立性,例如其他纯数学上的不等式

4).把限看成是 t 的函数,求解以 t 为变量的这个函数的极值(求最小值,以便让上界尽可能地低)


我们以正态分布为例子来把上面的思路演示一下:

X 是满足 N(%5Cmu%2C%5Csigma%5E2) 的随机变量,则:

我们要看的概率是:

P(X%5Cge%20a)

1). 我们把上面的概率换成:

P(X%20%5Cge%20a)%20%3D%20P(e%5E%7BtX%7D%20%5Cge%20e%5E%7Bta%7D)%20%5Cquad%20%5Cquad%20where%20%5Cquad%20%5Cforall%20t%3E0%20%5Ctag%201

2). 使用 Markov 不等式

P(e%5E%7BtX%7D%20%5Cge%20e%5E%7Bta%7D)%20%5Cle%20%5Cfrac%7BE(e%5E%7BtX%7D)%7D%7Be%5E%7Bta%7D%7D%20%20%5Ctag%202

现在,来计算公式 (2) 中的数学期望

%0A%5Cbegin%7Baligned%7D%0A%0AE(e%5E%7BtX%7D)%20%26%20%3D%20%5Cint_%7B-%5Cinfty%7D%5E%7B%2B%5Cinfty%7D%20e%5E%7Btx%7D%20%5Cfrac%7B1%7D%7B%5Csqrt%7B2%5Cpi%7D%5Csigma%7D%20e%5E%7B-%5Cfrac%7B(x-%5Cmu)%5E2%7D%7B2%5Csigma%5E2%7D%7D%20dx%20%5C%5C%20%5C%5C%0A%0A%26%3D%20%5Cint_%7B-%5Cinfty%7D%5E%7B%2B%5Cinfty%7D%20%5Cfrac%7B1%7D%7B%5Csqrt%7B2%5Cpi%7D%5Csigma%7D%20e%5E%7B-%5Cfrac%7B(x-%5Cmu)%5E2%20-%202%5Csigma%5E2%20tx%7D%7B2%5Csigma%5E2%7D%7D%20dx%20%5C%5C%20%5C%5C%0A%0A%26%3D%20%5Cint_%7B-%5Cinfty%7D%5E%7B%2B%5Cinfty%7D%20%5Cfrac%7B1%7D%7B%5Csqrt%7B2%5Cpi%7D%5Csigma%7D%20e%5E%7B-%5Cfrac%7Bx%5E2%20-%202%5Cmu%20x%20%2B%5Cmu%5E2%20-%202%5Csigma%5E2%20tx%7D%7B2%5Csigma%5E2%7D%7D%20dx%20%5C%5C%20%5C%5C%0A%0A%26%3D%20%5Cint_%7B-%5Cinfty%7D%5E%7B%2B%5Cinfty%7D%20%5Cfrac%7B1%7D%7B%5Csqrt%7B2%5Cpi%7D%5Csigma%7D%20e%5E%7B-%5Cfrac%7Bx%5E2%20-%202(%5Cmu%20%2B%5Csigma%5E2%20t)%20x%20%20%2B%20%5Cmu%5E2%7D%7B2%5Csigma%5E2%7D%7D%20dx%20%5C%5C%20%5C%5C%0A%0A%26%3D%20%5Cint_%7B-%5Cinfty%7D%5E%7B%2B%5Cinfty%7D%20%5Cfrac%7B1%7D%7B%5Csqrt%7B2%5Cpi%7D%5Csigma%7D%20e%5E%7B-%5Cfrac%7B(x%20-%20(%5Cmu%20%2B%5Csigma%5E2%20t))%5E2%20-%20(%5Cmu%20%2B%5Csigma%5E2%20t)%5E2%20%2B%20%5Cmu%5E2%7D%7B2%5Csigma%5E2%7D%7D%20dx%20%5C%5C%20%5C%5C%0A%0A%26%3D%20e%5E%7B%20%5Cfrac%7B%20(%5Cmu%20%2B%5Csigma%5E2%20t)%5E2%20-%20%5Cmu%5E2%7D%20%7B2%5Csigma%5E2%7D%20%7D%5Cint_%7B-%5Cinfty%7D%5E%7B%2B%5Cinfty%7D%20%5Cfrac%7B1%7D%7B%5Csqrt%7B2%5Cpi%7D%5Csigma%7D%20e%5E%7B-%5Cfrac%7B(x%20-%20(%5Cmu%20%2B%5Csigma%5E2%20t))%5E2%20%7D%7B2%5Csigma%5E2%7D%7D%20dx%20%5C%5C%20%5C%5C%0A%0A%26%20%3D%20e%5E%7B%20%5Cfrac%7B%20(%5Cmu%20%2B%5Csigma%5E2%20t)%5E2%20-%20%5Cmu%5E2%7D%20%7B2%5Csigma%5E2%7D%7D%20%5C%5C%20%5C%5C%0A%0A%26%20%3D%20e%5E%7B%5Cfrac%7B%5Csigma%5E2%20t%5E2%7D%7B2%7D%20%2B%20%5Cmu%20%20t%7D%0A%0A%5Cend%7Baligned%7D%20%20%5Ctag%203

把公式 (3) 代入 公式 (2):

P(e%5E%7BtX%7D%20%5Cge%20e%5E%7Bta%7D)%20%5Cle%20%5Cfrac%7Be%5E%5Cfrac%7B%5Csigma%5E2%20t%5E2%7D%7B2%7D%20%2B%20%5Cmu%20%20t%7D%7Be%5E%7Bta%7D%7D%20%3D%20e%5E%7B%5Cfrac%7B%5Csigma%5E2%20t%5E2%7D%7B2%7D%20%2B%20%5Cmu%20%20t%20-%20ta%7D%20%20%5Ctag%204

我们的目标,是让公式 (4) 中右侧尽可能地小,也就是让这个概率的上界尽可能小。


我们对公式 (4) 中右侧的指数部分,求最小值:

%5Cfrac%7B%5Cpartial(%5Cfrac%7B%5Csigma%5E2%20t%5E2%7D%7B2%7D%20%2B%20%5Cmu%20%20t%20-%20ta)%20%7D%20%7B%20%5Cpartial%20t%7D%20%3D%20%5Csigma%5E2%20t%20%2B%20%5Cmu%20%20-%20a%20%3D%200%20%20%5Ctag%205

所以得到:

t%20%3D%20%5Cfrac%7Ba-%5Cmu%7D%7B%5Csigma%5E2%7D%20%20%20%5Ctag%206

把 (6) 代入 (4) 有:

P(e%5E%7BtX%7D%20%5Cge%20e%5E%7Bta%7D)%20%5Cle%20e%5E%7B-%5Cfrac%7B(a-%5Cmu)%5E2%7D%7B2%5Csigma%5E2%7D%7D%20%20%5Ctag%207

即:

P(X%5Cge%20a)%20%5Cle%20%20e%5E%7B-%5Cfrac%7B(a-%5Cmu)%5E2%7D%7B2%5Csigma%5E2%7D%7D%20%20%5Ctag%208

我们用标准正态分布来代入看看 N(0,1)

P(X%5Cge%20a)%20%5Cle%20%20e%5E%7B-%5Cfrac%7Ba%5E2%7D%7B2%7D%7D%20%20%5Ctag%209

其中 a > 0,是因为 公式 (6) 中要求 t > 0


几个概率不等式(二)Chernoff_bounds_初步_用高斯分布来演示的评论 (共 条)

分享到微博请遵守国家法律