欢迎光临散文网 会员登陆 & 注册

统计分析-标准差、标准误差、偏差、峰度

2023-09-06 16:42 作者:信女发大愿  | 我要投稿
  • 标准差(Standard Deviation,缩写为SD)

标准差(Standard Deviation,通常用符号σ表示)是用于衡量一组数据的分散程度或离散程度的统计量。它告诉我们数据点在平均值周围的平均距离。标准差越大,数据点越分散;标准差越小,数据点越集中在平均值附近。数据的稳定性

标准差的计算公式如下:

σ = √[Σ(xi - μ)² / N]

其中:

σ(sigma)是标准差。

Σ 表示求和符号,计算所有数据点的和。

xi 表示每个数据点的值。

μ(mu)表示数据集的平均值。

N 表示数据点的总数。

  • 标准误差 (Standard Error,通常缩写为SE)

主要将样本平均值作为变量。

SE = σ / √n

SE 是标准误差。

σ(sigma)是总体的标准差,用于衡量总体数据的分散程度。

n 是样本的大小(观测值的数量)。

标准误差是标准差的估计值。标准差用于衡量数据集中各数据点与平均值之间的离散程度。标准误差告诉你,如果你多次抽取样本并计算它们的平均值,这些平均值将如何变化。

这个公式的含义是,标准误差是总体标准差除以样本大小的平方根。标准误差用于估计样本统计量(例如平均值)与总体参数之间的差异。

具体来说,标准误差告诉我们,如果我们多次从同一个总体中抽取不同大小的样本,并计算每个样本的平均值,那么这些平均值将如何变化。标准误差越小,表示这些平均值变化的幅度较小,估计更加准确。相反,标准误差较大表示估计的不确定性较高,样本平均值可能与总体平均值之间存在较大的差异。

需要注意的是,标准误差通常与一个置信水平一起使用,通常是95%。这表示在多次采样中,有95%的概率总体参数位于样本统计量的2倍标准误差的范围内。

总之,标准误差是一个用于衡量样本统计量估计与总体参数之间差异的指标,它的计算基于总体标准差和样本大小。较小的标准误差通常表示更精确的估计,而较大的标准误差表示估计的不确定性较高。

  • 偏度(Skewness)

偏度用于度量数据分布的不对称性。它描述了数据在平均值左侧和右侧的相对扭曲程度。

偏度为正表示数据分布右偏(正偏),即数据的尾部向右边延伸,右侧的数据点较为稀疏,左侧较为密集。

偏度为负表示数据分布左偏(负偏),即数据的尾部向左边延伸,左侧的数据点较为稀疏,右侧较为密集。

偏度为零表示数据分布大致对称,左右两侧的数据点均匀分布在平均值周围。

偏度的计算通常使用三阶矩(三阶中心矩)来衡量。

  • 峰度(Kurtosis):

峰度用于度量数据分布的峰态或尖峰程度,即数据集中度。

峰度大于正态分布(峰度为3)表示数据分布具有更尖的峰,尾部更厚。

峰度小于正态分布表示数据分布相对扁平,峰不太尖。

峰度等于正态分布表示数据分布与正态分布相似。

峰度的计算通常使用四阶矩(四阶中心矩)来衡量。


统计分析-标准差、标准误差、偏差、峰度的评论 (共 条)

分享到微博请遵守国家法律