欢迎光临散文网 会员登陆 & 注册

充分统计量含义与因子分解定理的应用

2023-08-12 00:10 作者:莲子下摸鱼  | 我要投稿

充分统计量

仅为个人理解,谨慎参考,如有谬误欢迎指出

直观含义:

随机抽取10件产品(产品不合格率为p)。(检验目的:得到产品不合格率p)得到结果1:不合格,0:合格 %5Cbegin%7Bpmatrix%7D%0A%20%201%26%201%20%26%200%20%26%200%20%26%200%5C%5C%0A%20%200%26%20%200%26%20%200%26%20%200%260%0A%5Cend%7Bpmatrix%7D。汇报检验结果有几种选择:

  1. "第一件产品不合格,第二件产品不合格,第三件产品合格,.....,第十件产品合格。"显然这种汇报方式虽然详细,但是不够精简,没有简化数据。

  2. "10件产品中共有2件不合格品。"T_1%3D%5Csum_%7Bi%3D1%7D%5E%7B10%7Dx_i%20%3D2%20。这样报告既没有损失重要的信息,又足够简单,即满足了充分统计量的要求。

  3. "前两件产品不合格",T_1%20%3D%20x_1%2Bx_2%3D2,这就损失了部分有关于不合格率p的重要信息,只汇报了前两件,而后八件产品的情况不明,显然不能作为充分统计量。

分布层面对充分统计量分析:

  • 设总体分布函数F_%7B%5Ctheta%7D%20(x)已知,但参数%7B%5Ccolor%7BRed%7D%20%5Ctheta%20%7D%20未知。我们把确定分布的问题归结为未知参数%5Ctheta的估计问题。由此,从总体得到一个样本x%20%3D%20(x_1%2Cx_2%2C...%2Cx_n),得样本分布函数:

    F_%7B%5Ctheta%7D%20(x)%20%3D%20%5Cprod_%7Bi%3D1%7D%5En%20F_%7B%5Ctheta%7D%20(x_i)

  • 为了估计%5Ctheta,我们构造一个统计量T(x).如果统计量T的抽样分布F_%5Ctheta%5ET(x)和样本分布F_%5Ctheta(x)所含信息量一样,则统计量T(精简汇报)就可以代替样本x(产品一个一个汇报)从事统计推断。

  • 那么如何去证明统计量是充分统计量呢?

验证思路:

p_%5Ctheta(x)

统计量T取值为 t ,可以看做条件分布P_t%3DP%5Cleft%20%5C%7B%20X_1%3Dx_1%2CX_2%3Dx_2%2C...%2CX_n%3Dx_n)%7CT%3Dt%20%5Cright%20%5C%7D%20

设想:

  1. 如果P_t经计算得到结果,会受%5Ctheta影响(含有关于%5Ctheta的信息)。这就反向说明统计量T(x),并没有完全包含%5Ctheta的信息,它不够充分。

  2. 如果P_t最后结果是不含%5Ctheta的一个常数。则说明统计量T(x)具有充分性。

  • 综上所述:证明统计量T(x)是否具有充分性,其关键就是证明P%5Cleft%20%5C%7B%20X_1%3Dx_1%2CX_2%3Dx_2%2C...%2CX_n%3Dx_n)%7CT%3Dt%20%5Cright%20%5C%7D%20得到的结果是否与%5Ctheta有关。

:我们使用一个服从两点分布的总体X%5Csim%20B(1%2Cp).从中取出样本量为n(n>=2)的样本x_1%2Cx_2%2C...%2Cx_n.检验两个统计量T_1%20%3D%20%5Csum_%7Bi%3D1%7D%5E%7Bn%7D%20x_i%20%2CT_2%3Dx_1%2Bx_2

  • 首先,两点分布的分布函数(x%3D0%2C1)P(X%20%3D%20x)%3Dp%5Ex(1-p)%5E%7B1-x%7D

    由此可得,样本的联合分布P(X_1%3Dx_1%2CX_2%3Dx2%2C...%2CX_n%3Dx_n)%3Dp%5E%7B%5Csum_%7Bi%3D1%7D%5Enx_i%7D(1-p)%5E%7Bn-%5Csum_%7Bi%3D1%7D%5Enx_i%7D

  • 第二统计量T_1(x)%3D%5Csum_%7Bi%3D1%7D%5En%20x_i的分布,即为(n重伯努利试验)服从二项分布B(n%2Cp)

    得统计量T_1(x)的分布P(T_1(x)%3Dt)%3D%5Cbegin%7Bpmatrix%7D%0A%20n%5C%5Ct%0A%5Cend%7Bpmatrix%7D%0Ap%5Et(1-p)%5E%7Bn-t%7D

  • 最后,再T_1%3Dt的条件下,样本的条件分布为:

    P(X_1%3Dx_1%2CX_2%3Dx_2%2C..%2CX_n%3Dx_n%7CT%3Dt)

    %3D%5Cfrac%7BP(X_1%3Dx_1%2C...%2CX_n%3Dx_n%2CT_1%3Dt)%7D%7BP(T_1%3Dt)%7D%20

    %3D%5Cfrac%7BP(X_1%3Dx_1%2C...%2CX_%7Bn-1%7D%3Dx_%7Bn-1%7D%2CX_n%3Dt-%5Csum_%7Bi%3D1%7D%5E%7Bn-1%7Dx_i%20)%7D%7B%5Cbegin%7Bpmatrix%7D%0A%20n%5C%5Ct%0A%5Cend%7Bpmatrix%7D%0Ap%5Et(1-p)%5E%7Bn-t%7D%7D%20

    %3D%5Cfrac%7Bp%5Et(1-p)%5E%7Bn-t%7D%7D%7B%7B%5Cbegin%7Bpmatrix%7D%0A%20n%5C%5Ct%0A%5Cend%7Bpmatrix%7D%0Ap%5Et(1-p)%5E%7Bn-t%7D%7D%20%7D%20%3D(C_n%5Et)%5E%7B-1%7D

  • 其中计算过程

    P(X_1%3Dx_1%2C...%2CX_%7Bn-1%7D%3Dx_%7Bn-1%7D%2CX_n%3Dt-%5Csum_%7Bi%3D1%7D%5E%7Bn-1%7Dx_i%20)

    %3Dp%5E%7B%5Csum_%7Bi%3D1%7D%5E%7Bn-1%7D%20x_i%7D(1-p)%5E%7Bn-1-%5Csum_%7Bi%3D1%7D%5E%7Bn-1%7Dx_i%20%7Dp%5E%7Bt-%5Csum_%7Bi%3D1%7D%5E%7Bn-1%7Dx_i%20%7D(1-p)%5E%7B1-t%2B%5Csum_%7Bi%3D1%7D%5E%7Bn-1%7Dx_i%20%7D%0A

    %3Dp%5Et(1-p)%5E%7Bn-t%7D

  • 这样的结果表面,条件分布的结果与p无关,所以统计量T_1(x)%3D%5Csum_%7Bi%3D1%7D%5En%20x_i的充分性得到验证,T_2%3Dx_1%2Bx_2就不在这里验证了。

关于充分统计量的定义:

有一个分布族F={X}

在给定T=t的情况下,样本x的条件分布与总体分布X无关,则称T为此分布族F的充分统计量.

在给定T=t的情况下,样本x的条件分布与参数%5Ctheta无关,则称T为参数%5Ctheta的充分统计量.

所以上述得到验证的统计量T1既可以称为两点分布B(1%2Cp)的充分统计量,也可以成为成功概率p的充分统计量.

因子分解定理简单说明:

若存在一个充分统计量T%3DT(x),那么得到一个样本,样本分布p_%5Ctheta(x)一定可以分解为两个因子的乘积,其中一个因子与参数%5Ctheta无关,仅仅与样本x有关;另一个因子与参数%5Ctheta有关,但是%5Ctheta与样本x的关系,一定要通过充分统计了T(x)表现出来。

p_%5Ctheta(x)%3Dh(x)g_%5Ctheta(t)

例题:


    

简要题解过程


充分统计量含义与因子分解定理的应用的评论 (共 条)

分享到微博请遵守国家法律