欢迎光临散文网 会员登陆 & 注册

『芸榛概率论』为什么会有充分统计量/完备统计量

2022-12-14 16:31 作者:芸榛Corylus  | 我要投稿

充分统计量:在T一定的情况下,X的其他(不影响T的)变动不再影响参数。 为什么说充分统计量包含所有关于参数a的信息呢? 这里其实是限定了在Fisher式统计的语境下的。当然,这样的直觉可以推广到更大意义上的信息。但是在建立理论之初,我们只有fisher的那一套,即参数估计和假设检验。(不一定全部是fisher发明的,人名不重要,只是说现代课本上最经典的那一套。) 参数是密度函数族的指标集,也就是编号。如果强令两个不同参数对应同一个分布,自然就无法根据抽样来反推参数是两个中的哪一个。所以所谓参数的信息,就是参数改变后分布整体也改变,所带来的变化/不确定性。 注意这不是指方差,而是指参数不同时分布整体也不同。 如果已经有了充分统计量,获得了一部分信息,也就是确定了一部分样本的情况,那么剩下的情况理应包括其他关于a的信息。但如果无论a怎么变,除T以外的X不再随T而变化,就相当于是上述的无用编号,不再可通过剩余的X的情况去反推参数a。 此外我们还遇到一个问题:既然x bar可估计均值参数a,为什么不闲着没事给它加个东西呢?凭什么老师说是这样最好,那就是这样最好? 我来个x1-x2+x bar,不是也能估得挺好吗? 实际上因为方差是加性的而不是减性的,这样估计会导致方差增大。因为基本不等式(或同类,本质上是信息熵)只有在对各个样本平均权重时达到极值(也可以说是数学的对称性原理导致的。另一种极值在权重极端偏向于一个样本时,毕竟极值有极大极小两种),而我们魔改的统计量的权重更偏向x1和x2,自然达不到极值。 是x bar而不是我们魔改的东西最好,不是老师说的,而是完备性决定的。 如果一个估计量里面被偷偷夹带了一个均值为0的东西,也就是夹带噪声,那么它就可以通过减去这个噪声而改善性能。虽然方差不是减性的,但是如果我们把噪声想象成具有独立于估计量本体的另一部分的话,方差就暂时可减了,就像(x1+x2)-x2一样。或者说,也可以理解成减掉那部分多出来的权重。 这样的噪声,也就是均值为0但本体不为0的统计量,称为0无偏倚估计。注意到如果方差为0则随机变量为0,可以加深对这一现象的理解。 如果我们允许加工所有样本来获得统计量,那么诸如x1-x2这种东西就一直存在。 如果我们只允许打包利用一个统计量T,比如我们只剩下充分统计量,其他的次序、range或第一次抽样等信息被狗吃了,那么就有望使得T的函数的期望为0时,这个函数的本体为0。毕竟我们已经削减了很大一部分可用的函数,且注意到x2-xn之类的容易想象到的噪声已经不可能再出现,因为它不是T的函数,不是将T作为一个整体去利用的。 这就是完备性。完备性是不存在这种噪声的一个充分条件。而且我的直觉让我认为这两者的结合可能很紧密,甚至可能是充要的。 所以正确的讲授方法是先讲授充分统计量,然后讲授0无偏倚噪声的直觉,然后就能自然地引入完备性了。即便没有basu定理,完备性本身也有一些统计价值。 完备性有不同的定义(陈希孺书),不过我想意思是差不多的。 参考书:statistical inference

『芸榛概率论』为什么会有充分统计量/完备统计量的评论 (共 条)

分享到微博请遵守国家法律