统计分析-方差齐性校验、正态Q-Q图
方差齐性检验
方差齐性假设假定在不同组或条件下的数据具有相等的方差,即数据的离散程度不会随着自变量的不同水平而变化。
零假设(H0):不同组或条件下的数据具有相等的方差。
备择假设(H1):不同组或条件下的数据的方差不相等。
数据分组:将数据按照不同的组或条件进行分类。通常,这些组或条件是自变量的不同水平。
如果方差齐性检验的 p-value 较大(通常大于0.05),则没有足够的证据拒绝零假设,可以认为数据满足方差齐性假设。
如果方差齐性检验的 p-value 较小(通常小于0.05),则有足够的证据拒绝零假设,表明数据不满足方差齐性假设。采取措施:如果数据不满足方差齐性假设,可能需要采取一些措施来处理这一问题。这可能包括数据变换(如对数变换)、使用不同的模型或者进行分层分析等。

正态Q-Q图(Normal Quantile-Quantile Plot)
是一种用于检验数据是否服从正态分布的图形工具。它通过将观察值的分位数与正态分布的分位数进行比较,来直观地检查数据是否呈现出正态分布的特征。
数据排序:首先,将观察数据按升序排序,即从小到大排列。
计算分位数:对于排序后的数据,计算每个数据点的分位数,这些分位数通常使用百分位数来表示。例如,25% 分位数对应于第一个四分之一的数据点,50% 分位数对应于中位数,75% 分位数对应于前三分之一的数据点。
计算期望的分位数:根据正态分布的理论,计算相同数量的期望分位数。这些期望分位数可以通过正态分布的累积分布函数(CDF)计算得出。
绘制 Q-Q 图:在图上,横轴通常表示期望的分位数(正态分布的分位数),纵轴表示实际观察数据的分位数。每个数据点对应一个点,表示实际观察数据的分位数与期望分位数的比较。
正态 Q-Q 图的解释:
如果数据点均匀地沿着一条45度对角线分布,那么这意味着观察数据的分布与正态分布非常接近,数据很可能服从正态分布。
如果数据点在图上弯曲或偏离了45度对角线,那么这表明观察数据的分布与正态分布存在差异。例如,数据可能呈现出尾重或尾轻、峰态不同等特征。
正态 Q-Q 图的特点:
数据点分布在45度对角线附近,且较为均匀,通常表示数据接近正态分布。
数据点偏离45度对角线,可能表明数据分布存在偏差,不符合正态分布。
正态 Q-Q 图是一种直观的工具,可以帮助你快速检查数据是否服从正态分布。但它并不提供定量的检验结果,因此通常需要结合正态性检验(如Shapiro-Wilk检验)来更全面地评估数据的正态性。