超几何分布
先放一段超几何分布的定义。
一般的,假设一批产品共有
件,其中有
件次品,从
件产品中随机抽取
件(不放回),用
表示抽取的
件产品中的次品数,则
其中
很烦?
我们来看通俗版本。
考虑一批产品,比如说有件,其中有
件次品。
我们从中挑选出件产品。
那么,如果挑选出了件正品,
件次品,也就是说要从
件正品中挑选出
件正品,同时从剩余的
件次品挑选出
件次品。
而这一切,都发生在从件中挑选出
件产品这一件事中。
因此,其概率为
至于其中的定义域问题,主要原因如下:
仍然考虑一批产品,比如说有件,其中有
件次品。
那么,这里面最多挑选出件次品,即使总共挑选出再多的产品,次品数最多也只有
件。
下图为超几何分布。


概率和
注:为讨论方便起见以及主干把握要求,以下一般不再考虑定义域问题,默认为最开始讨论的情况。
根据实际情景,我们容易得知:
从含有件次品的
件产品中挑选出
件产品,可能情况如下。
因此,我们容易得到
同样的,写成一般式就是
从而我们得到

期望
根据定义,易得
与二项分布的期望相同。
蓝色标识可参见以下文档:

思考:从独立角度来看,二项分布的期望为是显然的。
那么,超几何分布呢?

方差
根据定义,易得
推导思路其实大同小异。
与二项分布的方差相比,多出了最后一个因子。
易知当时,超几何分布的方差比二项分布的方差小。