充分统计量含义与因子分解定理的应用
充分统计量
仅为个人理解,谨慎参考,如有谬误欢迎指出
直观含义:
随机抽取10件产品(产品不合格率为p)。(检验目的:得到产品不合格率p)得到结果1:不合格,0:合格 。汇报检验结果有几种选择:
"第一件产品不合格,第二件产品不合格,第三件产品合格,.....,第十件产品合格。"显然这种汇报方式虽然详细,但是不够精简,没有简化数据。
"10件产品中共有2件不合格品。"
。这样报告既没有损失重要的信息,又足够简单,即满足了充分统计量的要求。
"前两件产品不合格",
,这就损失了部分有关于不合格率p的重要信息,只汇报了前两件,而后八件产品的情况不明,显然不能作为充分统计量。
分布层面对充分统计量分析:
设总体分布函数
已知,但参数
未知。我们把确定分布的问题归结为未知参数
的估计问题。由此,从总体得到一个样本
,得样本分布函数:
为了估计
,我们构造一个统计量
.如果统计量T的抽样分布
和样本分布
所含信息量一样,则统计量T(精简汇报)就可以代替样本x(产品一个一个汇报)从事统计推断。
那么如何去证明统计量是充分统计量呢?
验证思路:
统计量T取值为 t ,可以看做条件分布。
设想:
如果
经计算得到结果,会受
影响(含有关于
的信息)。这就反向说明统计量
,并没有完全包含
的信息,它不够充分。
如果
最后结果是不含
的一个常数。则说明统计量
具有充分性。
综上所述:证明统计量
是否具有充分性,其关键就是证明
得到的结果是否与
有关。
例:我们使用一个服从两点分布的总体.从中取出样本量为n(n>=2)的样本
.检验两个统计量
。
首先,两点分布的分布函数
由此可得,样本的联合分布
第二统计量
的分布,即为(n重伯努利试验)服从二项分布
得统计量
的分布
最后,再
的条件下,样本的条件分布为:
其中计算过程
这样的结果表面,条件分布的结果与
无关,所以统计量
的充分性得到验证,
就不在这里验证了。
关于充分统计量的定义:
有一个分布族F={X}
在给定T=t的情况下,样本x的条件分布与总体分布X无关,则称T为此分布族F的充分统计量.
在给定T=t的情况下,样本x的条件分布与参数无关,则称T为参数
的充分统计量.
所以上述得到验证的统计量T1既可以称为两点分布的充分统计量,也可以成为成功概率
的充分统计量.
因子分解定理简单说明:
若存在一个充分统计量,那么得到一个样本,样本分布
一定可以分解为两个因子的乘积,其中一个因子与参数
无关,仅仅与样本x有关;另一个因子与参数
有关,但是
与样本x的关系,一定要通过充分统计了
表现出来。
例题:

