教育统计学试题库
教育统计学
一、选择题
1、当一组数据用中位数来反映集中趋势时,这组数据最好用哪种统计量来表示离散程度?( B ) A.全距 (差异量) B.四分位距(差异量) C.方差(差异量) D.标准差(差异量) 2、总体不呈正态分布,从该总体中随机抽取容量为1000的一切可能样本的平均数的分布接近于:( D ) A. 二项分布 B.F分布 C. t分布 D.正态分布 3、检验某个频数分布是否服从正态分布时需采用:( C ) A.Z检验 B. t检验 C.χ2 检验 D. F检验 4、对两组平均数进行差异的显著性检验时,在下面哪种 情况下不需要进行方差齐性检验?( B ) A.两个独立样本的容量相等且小于30; B.两个独立样本的容量相等且大于30; C.两个独立样本的容量不等,n1小于30,n2大于30; D.两个独立样本的容量不等,n1大于30,n2小于30。 5、下列说法中哪一个是正确的?( C ) A.若r1=0.40,r2=0.20,那么r1就是r2的2倍; B.如果r=0.80,那么就表明两个变量之间的关联程度达到80%; C.相关系数不可能是2; D.相关系数不可能是-1。 6、当两列变量均为二分变量时,应计算哪一种相关?( B ) A.积差相关(两个连续型变量) B.φ相关 C.点二列相关(一个是连续型变量,另一个是真正的二分名义变量) D.二列相关(两个连续型变量,其中之一被人为地划分成二分变量。) 7、对多组平均数的差异进行显著性检验时需计算:( A ) A.F值 B. t值 C.χ2 值 D.Z值 8、比较不同单位资料的差异程度,可以采用何种差异量?( A ) A.差异系数 B.方差 C.全距 D.标准差
二、名词解释
1.分层抽样:按与研究内容有关的因素或指标先将总体划分成几个部分,然后从各部分(即各层)中进行单纯随机抽样或机械抽样,这种抽样方法称为分层抽样。 2.描述统计:对已获得的数据进行整理、概括,显现其分布特征的统计方法称为描述统计。 3.集中量:集中量是代表一组数据典型水平或集中趋势的量。它能反映频数分布中大量数据向某一点集中的情况。 4.统计表:统计表是用来表达统计指标与被说明的事物之间数量关系的表格。 5.总体:总体是我们所研究的具有某种共同特性的个体的总和。样本是从总体中抽出的作为观察对象的一部分个体。 6.二列相关:当两个变量都是正态连续变量,其中一个变量被人为的划分为二分变量,表示这两个变量之间的相关,称为二列相关。 7.参数:总体上的各种数字特征是参数。业绩反映总体上各种特征的数量是参数。 8.小概率事件:样本统计量(随机事件)在其抽样分布上出现的概率小于或等于事先规定的水平,则该事件为小概率事件。 9.中位数:在一组安大小顺序排列的数据中,位于中央位置上的那个数称为中为数。 10.统计量和参数:样本上的数字特征量是统计量。总体上的各种数字特征量是参数。 11.回归分析:把存在相关的两个变量,一个作为自变量,另一个作为因变量,并建立方程式,由自变量的值估计、预测因变量的值,这一过程称为回归分析。 12.相关关系:两个变量间的不精确、不稳定的变化关系称为相关关系。
三、填空题
1.从变化方向上看,两个变量之间的相关类型有正相关、
负相关
、
零相关
。 2.教育统计资料的来源有两个方面:
经常性资料
、
专题性资料
。 3.表示间断变量的统计图有
直条图
和
圆形图
。 4.假设检验一般有两个相互对立的假设,即
零假设
和
备择假设
。 5.统计图的结构一般包括标题、图号、
标目
、
图形
、图注等。 6.差异系数是
标准差
与
平均数
的百分比。 7.统计数据按来源方式可分为
点计数据
和
测量数据
。 8.统计表一般由标题、表号、
标目
、
线条
、数字和表注等构成。 9.教育统计学的内容一般分为
描述统计
、
推断统计
和实验设计三部分。 10.统计学是研究统计
原理和方法
的科学。 11.我们所研究的具有某种共同特性的个体总和称为
总体
。 12.一般情况下,大样本是指样本容量
超过30
的样本。 13.表示总体的数字特征的特征量称为参数。
14.要了解一组数据的集中趋势,需计算该组数据的
集中量
。 15. “65、69、72、87、89”这组数据的算术平均数是
76.4
。 16. “78、69、53、77、54”这组数据的中位数是
69
。 17. 6位学生的身高分别为:145、135、128、145、140、130厘米,他们的众数是
145厘米
。 18.要了解一组数据的差异程度,需计算该组数据的
差异量
。 19.有7个学生的语文成绩分别为:80、65、95、70、55、87、69分,他们的全距是
40分
。 20.若某班学生数学成绩的标准差是5分,平均分是85分,其差异系数是
5.88%
。 21.比较某班学生在身高和体重两方面的差异程度,要把学生身高和体重的标准差转化为差异系数。
22.两个变量之间不精确、不稳定的变化关系称为相关关系。
23.要描述两个变量之间变化方向及密切程度,需要计算
相关系数
。 24.若两个变量之间存在正相关,则它们的相关系数是正数 。
25.若两个变量之间的相关系数是负数,则它们之间存在 负相关 。
26.质与量的相关分析的方法主要包括二列相关、点二列相关和多系列相关。
27.品质相关的分析方法包括
四分相关
、Φ相关和列联相关。 28.某班50个学生中有30个女生,若随机抽取一个同学,抽到男生的概率是
2/5
。 29.某一种统计量的概率分布称为抽样分布。
30.平均数差异显著性检验中需要判断两个样本是相关样本还是
独立样本
。 31.单纯随机抽样能保证抽样的
随机性
和独立性。 32.χ2检验的数据资料是
点计数据
。 33.单向表是把实测的点计数据按
一种
分类标准编制而得的表。 34.单向表χ2检验是对
单向表
的数据进行χ2检验,即单因素的χ2检验。 35.双向表是把实测的点计数据按
两种
分类标准编制而得的表。 36.双向表χ2 检验是对
双向表
的数据进行的χ2检验,即双因素的χ2检验。 37.假设检验的方法包括参数检验和
非参数
检验。 38.符号秩次检验属于
非参数
检验。 39.标准正态曲线在
Z=0
处为最高点。 40.直条图是表示
间断
变量的统计图。 41.直方图是表示
连续
变量的统计图。 42.教育统计资料的来源主要是经常性资料和
专题性
资料。 43.教育调查从范围来看,可分为全面调查和
非全面
调查。
四、简答题
1. 简述积差相关系数的使用条件 答:积差相关系数的使用条件: (1)两个变量都是由测量获得的连续性数据。 (2)两个变量的总体都呈正态分布,或接近正态分布。 (3)必须是成对数据,而且每对数据之间相互独立。 (4)两个变量之间呈线性关系。 (5)要排除共变因素的影响。 (6)样本容量n≥30. 2. 二列相关使用的条件 答:(1)两个变量都是连续变量,且总体呈正态分布。 (2)两个变量之间是线性关系。 (3)二分变量是人为划分的,其分界点应尽量靠近中值。 (4)样本容量n 应当大于80。 3. 简述Ⅰ型错误,II型错误及其控制方法。 答:(1)I型错误:零假设为真而被拒绝所犯的错误。 (2)II型错误:保留了不真实的零假设所犯的错误。 (3)I型错误的控制由检验者选择检验的水平来控制。 (4)II型错误的控制:一是合理安排拒绝区域的位置;二是增大样本容量。 4、制作直方图需要哪些步骤? 答:直方图是连续型变量的频数分布图。 制作直方图需要以下步骤: (1)作横轴,即把各组的上、下限或组中值按相等的 距离依次画在横轴上。 (2)作纵轴,在纵轴上标明尺度及其单位,以指示频数。 (3)在纵轴上定出各组的高度,并在各组频数高度处画一条横线与各组上、下限上的两条纵线相交,形成一个矩形。各矩形组合在一起,即可得到一个直方图。 5、制作频数分布表需要哪些步骤? 答:制作频数分布表一般需要采取以下步骤: (1)求全距 (2)决定组数和组距 (3)决定组限 (4)登记频数 6、请说出总体平均数显著性检验的基本步骤。 答:(1)提出零假设(样本平均数等于总体平均数)和备择假设(样本平均数不等于总体平均数)。 (2)选择检验的统计量(t或Z),并计算其值。 (3)确定检验形式(单侧检验,还是双侧检验)。 (4)做出拒绝或接受零假设的统计决断。 7、简述教育统计学的研究对象和内容。 答:教育统计学的主要任务是研究如何搜集、整理、分析有关教育研究和教育实践工作中的数字资料,并以此为依据进行科学推断,揭示教育现象所蕴涵的客观规律。 教育统计学的主要内容包括描述统计、推断统计和实验设计。 8、学习教育统计学有哪些意义? 答:⑴教育统计学为科学研究提供了科学方法。 ⑵教育统计学是教育科研定量分析的重要工具。 ⑶教育统计学的方法可用于教育实践工作和有关课程的学习中。 9、数据有哪些种类? 答:根据来源可分为:⑴点计数据:计算个数所获得的数据。⑵测量数据:用一定的工具或标准测量所获得的数据。 根据随机变量取值情况可分为: ⑴间断变量的数据:取值个数有限的数据。 ⑵连续变量的数据:取值个数无限的数据。 10、编制统计表有哪些注意事项? 答:统计表由标题、表号、标目、线条、数字、表注等项目构成。各个部分都有一些规范性的具体要求,例如,标题要写在表的上方等。 11、简述统计图的基本结构和绘制规则。 答:统计图由标题、图号、标目、图形、图注等项目构成。在绘制统计图时对各组成部分有一些具体的要求,例如,标题要写在图的下方等。对于具体的统计图又有特殊的制作要求。 12、比较集中量和差异量的含义和用途。 答:集中量是代表一组数据典型水平或集中趋势的一类特征量。它能反映一组数据的分布中大量数据向某一点集中的情况。我们可以通过计算所搜集数据的集中量来反映变量分布的集中趋势,说明所研究对象整体的发展水平和效果。 差异量是表示一组数据变异程度或离散程度的一类特征量。我们可以通过计算所搜集数据的差异量来反映数据分布的离散程度,差异量越大,说明数据分布的范围越广,分布越不整齐;差异量越小,说明数据变动范围越小,分布就越集中。 13、结合实例说明推断统计包含的内容。 答:推断统计包括参数估计和假设检验。参数估计是根据样本统计量对相应的总体参数进行的估计。分为点估计和区间估计。 假设检验是根据一定概率,利用样本信息对总体参数或分布的某一假设作出拒绝或保留的决断。
14、简述符号检验的含义和用途。
答:符号检验是以正负号作为检验资料的统计检验方法,是通过对两个相关样本的每对数据之差的符号(正号或负号)进行检验,以比较这两个样本差异的显著性。适用于两个相关样本的差异检验。在符号检验中,只考虑两个相关样本每对数据之差的符号即方向,不考虑差异的大小。 15、简述秩和检验的含义和用途。 答:秩和是秩次的和或者等级之和。秩和检验是以秩和为检验资料的检验方法。秩和检验是对两个独立样本的差异进行检验的方法。 五、计算题 1、请计算下列数据的平均数和标准差。 9,3,7,5,6,8,7,5,8,9,4,6,5,6,8,7,4,10。 解:根据平均数和标准差的计算公式,得 2、请计算下列数据的中位数和标准差。 11,11,11,15,14,13,13,9,17, 10,10,10,12,12,12,8,8,9。 解:根据中位数的计算方法,先对数据进行从小到大排序: 8,8,9,9,10,10,10,11,11,11, 12,12,12,13,13,14,15,17。 Md=(11+11)/2=11 根据标准差的计算公式,得 3、请计算下面这组数据的中位数。 7,3,2,9,4,4, 7,8,9,5。 解:中位数=(5+7)/2=6 =Md 4、调查者对68名小学生提出的问题是:“你喜欢上学吗?”样本按年级分成高低二组,高年级组有38人,低年级组有30人。两组人对该问题答“喜欢”的数目分别为17和23,问对该问题的回答是否与小学生的年级有关? 解:(1)、提出假设 对该问题的回答与被访问者的年级无关 对该问题的回答与被访问者的年级有关 (2)、计算χ2值 5、调查者对106名小学生提出的问题是:“你喜欢你的班主任吗?”对该问题答“喜欢”、“无所谓”、“不喜欢”的人数分别为57、29和20,问小学生对班主任的态度是否有显著差异? 解:(1)、提出假设 H0: 小学生对班主任的态度没有显著差异 H1: 小学生对上班主任的态度有显著差异 (2)、计算c2值 因为ft=106¸3=35.33 所以, 6、某年级对三个班进行了语文统一测验,一班共40人,平均分是80.2分;二班共32人,平均分是72.6分;三班共36人,平均分是75分。全年级的平均分是多少? 解: 答:全年级的平均分是76.2分。 7、学生的期中和期末成绩在学期总平均分中各占40%和60%,某学生期中成绩是85分,期末成绩是80分,这个学生的学期总平均分是多少? 8、随机抽取32名男教师和50名女教师进行一项测试,测查结果:男教师的平均分是80分,标准差是8分;女教师的平均分是76分,标准差是10分。请检验男、女教师的测查结果有无显著性差异。
解:⑴提出假设:
H0:μ1=μ2 H1∶μ1≠μ2
⑵计算Z值:
采用独立大样本Z检验,计算Z值的公式如下:
根据公式计算出:Z=2 ⑶检验形式:双侧检验
⑷统计决断:1.96<Z=2*<2.58,根据双侧Z检验的决断规则做出决断:在0.05的显著性水平上拒绝零假设,接受备择假设,即男女教师的测试结果有显著差异。
六、综合题 1、请回答当: (1)显著性水平取a=0.05时哪些变量间彼此相关? (2)显著性水平取a=0.01时哪些变量间彼此相关? 答:当显著性水平取a=0.05时,T1、T2、T3、T4四个变量彼此都相关。 当显著性水平取a=0.01时,T2与T3、T4以及T3与T4相关。 2、进一步在上述数据文件中将AVG变量的数值变成以优、良、中等、及格和不及格表达的几种成绩,并生成一个新的变量“总评”。其中: 60以下为:不及格 60到70为:及格 71到80为:中等 81到90为:良好 91及其以上为:优 应该使用什么命令?命令中至少回答什么内容? 答:应选择[Transform][Recode][Into different Variables]命令,并在“Input Variable -> Output”中输入:avg, 在“Output Variable”中输入新的变量名“总评”,然后点击“Change”按钮。 在“Old and New Values”中输入Old Values 的Values 和New Values的Values,通过Add添加到Old --> New:对照表中。对照关系分别为: 60以下为:不及格 60到70为:及格 71到80为:中等 81到90为:良好 91及其以上为:优 执行OK。 3、将下列20个学生的体育成绩以5分为组距编制一个频数分布表。
表1-20个学生的体育成绩 75 76 80 81 82 77 78 79 83 84 89 86 85 87 88 84 83 83 88 89 答案: 表2 20个学生体育成绩的频数分布表
成绩 组中值 频数 累计频数 累计百分比 85-
80-
75-
87.5
82.5
77.5
7 8 5 20 13 5 100.0
65.0
25.0
总和
20 《教育统计学》作业题:(任选十题) 1. 简述积差相关系数的使用条件 2. 二列相关使用的条件 3. 简述Ⅰ型错误,II型错误及其控制方法。 4.制作直方图需要哪些步骤? 6.请说出总体平均数显著性检验的基本步骤。 7.简述教育统计学的研究对象和内容。 8.学习教育统计学有哪些意义? 9.数据有哪些种类? 10.编制统计表有哪些注意事项? 11.简述统计图的基本结构和绘制规则。 12.比较集中量和差异量的含义和用途。 13.结合实例说明推断统计包含的内容。 14.简述符号检验的含义和用途。
15.简述秩和检验的含义和用途。