【十分钟速成课:统计学】第20集 置信区间

置信区间:允许一些摇摆,某个事件范围内,大约
95%的置信度 置信区间 给予我们的观测结果给出的合力轨迹范围值,它的中心让然是样本均值,但预留了一些空间 不确定性 100名患者的样本 样本均值的分布
提供一个均值数字范围而不是某一个确切的均值值
学会假设 有所变化 再次抽样 相同样本量重新做100次,我们将会得到100个略有不同的置信区间,
95%置信区间的数字95%告诉我们,如果我们从100个不同的样本中计算置信区间,其中约95个将包含真实的总本均值,我们的“信心”在于计算这个置信区间的过程中,只会在5%的时间里没有将总本均值包含进来, 也可以包含不真实的值,我们无法得到绝对的值,DNA置信区间 通常情况下会包含真实的总本均值,
计算:95%指的是包含我们估计的采样分不止的中间95%的范围,为了得到该范围,我们可以得到Z分数,Z分位数可以告诉我们以标准差为单位的分布均值和数据点之间的距离,以前我们用Z分位数找到百分位数,我们想要中间95%的数据,标准差误差 标准差除以根号下频数转回卡路里值,Z分位数*标准误差加上平均值 实际的总本均值在这个区间内,但我们不确定,不过我们可以确定的是如果我们不断取样,并假设每一个置信区间都包含总本均值,我们只会在5%的情况下出错,例如一个胶皮糖工厂会定期检查,他们的装袋机是否校准正确,因此他们每周采取100袋胶皮糖的样本,测量平均重要和标准差,并计算95%置信区间,他们使用置信区间来决定是否支付高昂的费用来请维修工来修胶皮糖套袋机,他们期待胶皮糖大约每袋重十盎司,并且只要置信区间包含这个数据,他们的理想重量,他们就假设他们的机器没有问题,给予他们的置信区间所做的决定将帮助他们只在5%的情况下不需要请维修工的时候来请维修工,
研究者使用置信区间来确定是否包含一些有价值的信息,比如蛋糕中某卡路里的含量是否是合理的,如果采样值落在他们的置信区间内,似乎这是一个合理的值,但若采样值落在置信区间外,我们也不能说不合理,因为我们不知道这个置信区间是那95%个包含真实总本均值的置信区间,还是那5%个没包含的,并不总是需要使用95%的置信区间,我们也可以计算其他百分比的置信区间,但 到负无穷,这你想要的置信区间包含的百分比越大,你的数字范围会越宽。这种情况下,你可以更自信地说你的置信区间包含真正的总本均值,但这没有太大的意义,因此你需要做出取舍,你想要一个足够宅的置信区间,足够窄到令其结果有意义,你也想要一个足够宽的置信区间,足够宽到大部分情况下包括总本均值,我们不会总有很大数据量的样本,通常情况下,我们没有足够的时间和金钱去收集100个数据点来计算置信区间,样本量较小时,样本均值分布并不总是正态的,所以我们金蝉使用T分布而不是Z分布来找出数据中间的95%,与Z分布一样,T分布式单峰的连续的概率分布,是表示采样分布的一个好方法,t分布根据信息数量改变形状,样本量较小,信息较少时,t分布的尾部较粗,表示当没有太多数据时我们的估计更不确定,然而,随着我们获得越来也多的数据,t分布变得与z分布相同,通常,大于30的样本被认为是“足够大”,科学家普遍认为样本为30+的样本分布是足够接近正态的,30这个数字并没有什么特殊的含义,就像0.05.但是,当我们估算总本比例时,例如色盲人口的总本比例时,通常情况下,你的样本容量必须足够大,平均而言,你期望得到至少10个色盲人和至少10个非色盲人,因此大多数人认为这“足够接近”,约8%的男性是色盲,所以如果我又50个男性的样本,我将期待每组平均大约有四名男性是色盲, 这时我的样本量不足够大到足以认为这是正态的,所以,这里我会使用几乎呈正态的t分布,如果某正在开发的药物声称可以减少准妈妈产下色盲男性的比例,我们可以采取50名男性婴儿的样本,看看色盲的比例是否是8%,虽然色盲通常不会危及生命,但它可能会带来不便,所以你决定计算一个置信区间,以确定它是否有效,从服用该药物的母亲产下的婴儿中随机选择50名男性婴儿后,计算得出色盲婴儿的样本比例为6%,并计算有着6%均值(和样本均值相同)和0.033标准差的样本比例的分布,由于我们的样本量不够大,不能假设样本比例的分布形状像z分布,我们可以使用t分布来计算我们的95%的置信区间,我之前提过,t分布的形状随着我们拥有的数据量而变化,虽然存在t值表,但通常使用统计程序去计算,对应于2.5和97.5百分位数的t值会更轻松,因为存在很多不同的t分布,电脑告诉你,与这些百分位数对应的t值为2.01与-2.01,要从t分位数转换为原始分数,我们再次使用此公式,

这里使用的是t分数而不是z分数,色盲男性比例的置信区间是-0.6%至12.63%,8%在我们的置信区间捏,因此我们可以认为8%可能是真实的人口比例,即使我们观察到的人口比例是6%,去得出这个药物是否有效的结论,根据这个置信区间,我们没有足够的证据,因此研究药物的公司非常谨慎,他们决定先放一放,现实生活中,置信区间的一个例子在选举季节的新闻中,当新闻播报员报告民意调查的结果时,他们通常会说出这样的话,“候选人A的选择率为6.4%,误差幅度为3%”,或者你可能会看到一个这样的图表,边际误差通常表示置信区间的两边距均值有多远,并由置信公式这一部分表示:边际误差就像置信区间一样,反映了样本预测参数,如平均值或比例的不确定性,如果民意调查现实总统候选人目前得到64%的选票,加上或减去3%,若事实证明真正的投票是61%,我们不应该感到惊讶, 因为这是在边际误差范围内,你可以将边际误差或置信区间内的值视为,可能是真实总本参数的合理预测值,置信区间量化了我们的不确定性,还展示了准确性和精度的权衡,100%置信区间总是包含真实的总本均值,但它没太大用处,我们必须牺牲一点准确性才能获得更高的精度,99%的置信区间将为我们提供更有用的范围,因为它不是无限宽,但现在我们的置信区间可能不包含真正的平均值,你可能咋日常生活中遇到过这种平衡,假设你正在跑马拉松(人人都爱马拉松),同时你还想用你的iphone听歌,但你不知道你要跑多久,你可以在ITunes上买150首歌,这很贵,或者只买70首歌,但有可能不够听,没歌听的风险就增加了,但是你省下了80首歌的钱,或许就能买碟看了,置信区间证明了这种微妙的平衡能力,并帮助我们理解如何达到信息与准确性的最佳平衡点,