简单到哭!一文教你get【卫统计算题分析思路】!

流统计算题集训营开展至今
相信大家的解题速度和技巧都有所提高
这些知识点你掌握没有~
很多考研儿对统计推断中的如何对不同资料的假设检验方法进行选择,到现在还是傻傻分不清楚。
现在跟着小卫一起攻克它吧!


假设检验中的统计推断通常考察题型为综合分析类题目,需要同学综合考虑多方面的因素之后选出合理的假设检验方法。
✨ 判别检验方法主要通过:
①资料类型、②研究目的、③对比组数、④研究设计类型、⑤数据分布特征及样本量五个步骤。


▲ 图1 定量资料5步分析步骤

✨ 表1和表2总结了常用的假设检验与关联性分析方法。掌握这两张表,统计分析将不再复杂!



🎈小试牛刀
*题目及解析来源于集训营-20天带过计算题。
将19只雌性大白鼠随机分为2组,分别喂以高蛋白和低蛋白饲料8周,各鼠体重的增加克数如下。不同饲料组大白鼠的增重有无差别?(写出假设检验和计算公式,不需要计算)
● 高蛋白组(X1) : 134, 146, 104, 119, 124, 161, 107, 83, 113, 129, 97, 123
● 低蛋白组(X2) : 70, 118, 101, 85, 107, 132, 94
>>>分析<<<
✅ 第一步:审题、锁定题眼→给出什么?直接条件+隐含条件
✅ 第二步:分析、匹配所学→想要什么?
✅ 第三步:作答、简要清晰→精准答案?


📕题目解析
①由题可知,资料类型为定量资料,实验设计为完全随机设计,研究目的是对两个样本来自的两个独立总体的均值是否有差异进行推断,需进行两独立样本定量资料的假设检验。
②两独立样本定量资料的假设检验可考虑用t检验、秩和检验、z检验,本组资料样本量较小、从检验效能角度优先选择成组t检验,但t检验需满足独立、正态、方差齐三个条件。一般来说,资料的独立性是由抽样方式决定的,因此主要考察资料的正态性和方差齐性。
③总体思路:对两独立样本定量资料进行假设检验,当资料满足正态性(或样本量较大),方差齐性时,选用t检验;
● 如果两独立样本总体方差不齐,但两组资料服从正态性(或样本量较大),用t'检验;
● 如果资料不满足方差齐性、正态性的条件,可用Wilcoxon秩和检验。

📑具体步骤如下:
第一步:正态性检验。
①立检验假设,确定检验水准建
H0:资料服从正态分布。
H1:资料不服从正态分布。
α=0.05
②正态性检验的方法很多,可以选用 Shapiro-Wilk正态性检验、拟合优度检验。
③确定P值,作出结论
●当P>α,按α=0.05的水准不拒绝H0,资料服从正态分布。
●当P<α,按α=0.05的水准拒绝H0,资料不服从正态分布。
第二步:判断资料对应的总体方差是否相等,进行方差齐性检验。
①建立检验假设,确定检验水准
H0:两总体方差相等
H1:两总体方差不相等
α=0.1
②本题是两组方差的比较,且不确定原始数据是否是正态分布,故选用Levene检验。
③确定P值,作出结论
●当P>α,按α=0.05的水准不拒绝H0,两总体方差相等。
●当P<α,按α=0.05的水准拒绝H0,两总体方差不等。

第三步:选择检验方法
1、两独立样本均数比较的t检验和t’检验详细步骤
①建立检验假设,确定检验水准
● H0: μ1 = μ2,高蛋白组合低蛋白组大白鼠的体重增量总体均数相同;
● H1: μ1≠μ2,高蛋白组合低蛋白组大白鼠的体重增量总体均数不同。
②计算检验统计量
● 若两总体方差齐

● 若两总体方差不齐,使用t’统计量

③确定P值,作出结论
● 当P>α,按α=0.05的水准不拒绝H0,高蛋白组合低蛋白组大白鼠的体重增量总体均数相同;
● 当P<α,按α=0.05的水准拒绝H0,高蛋白组合低蛋白组大白鼠的体重增量总体均数不同。
2、Wilcoxon秩和检验步骤。
①建立假设,确定检验水准
H0:两总体分布相同;
H1:两总体分布不同。
检验水准α=0.05。
②编秩,求秩和,确定统计量T
将两组原始数据混合由小到大排序编秩,遇到相同的数据,取平均秩次。分别将两组的秩次相加,得到两组的秩和T1和T2。
● 如两组样本含量不等,以样本含量较小组的秩和作为统计量T;
● 如两组样本量相等,任取一组秩和作为统计量T。
③确定P值范围,得出结论
✅ 查表法:当n1 ≤ 10,且n2 - n1 ≤ 10,可根据n1和n2-n1查T界值表。
● 如果统计量T等于T界值或在T界值范围外,P ≤ 0.05,拒绝H0,认为两总体分布不同。
● 如果统计量T在T界值范围之内,P>0.05,不拒绝H0,尚不能认为两总体分布不同。
✅ 正态近似法:当n1 > 10,且n2 - n1 > 10,超出T界值表范围,这时统计量T近似服从总体均数为n1(N+1)/2,方差为n1n2(N+1)/12的正态分布,由于秩为离散性数据,正态分布为连续型分布,需进行连续性校正,并用正态近似法,计算正态分布统计量Z确定P值。当存在较多的相同观察值同秩时,需对Z值校正,计算Zc。
● 如果Z ≥ Z0.05/2 = 1.96,P ≤ 0.05
拒绝H0,认为两总体分布不同。
● 如果Z<Z0.05/2 = 1.96,P>0.05
不拒绝H0,尚不能认为两总体分布不同。
