统计学原理资料
第一章 绪论
统计是对客观事物的数量方面进行核算和分析,是人们对客观事物的数量表现、数量关系和数量变化进行描述和分析的一种计量活动。
统计的三层含义:统计工作、统计资料、统计学
统计工作:即统计实践活动,是人们对客观事物的数据资料进行搜集、整理、分析的工作的总称,是一种社会调研活动
统计资料:是统计工作的成果,包括各种统计报表、统计图形及文字资料等。
统计学: 是研究大量社会现象(经济)的总体方面的方法论科学
三者关系:统计学与统计实践活动的关系是理论与实践的关系,理论源于实践,理论又高于实践,反过来又指导实践 。统计工作和统计数据是工作和工作成果关系。
统计工作过程(统计工作的基本环节):
1.统计设计(准备阶段)设计方案、指标体系、分类目录等
2.统计调查(调查阶段)收集和占有统计资料
3.统计整理(整理阶段)分布数列、次数分布等加工资料(承上启下)
4.统计分析(分析阶段)绝对指标、相对指标等
5.统计的表现与运用(工作总结)
统计研究的基本方法:1.大量观察法2.综合指标法3.统计分组法4.归纳推理法5.统计模型
社会统计学的特点
1、数量性: 统计研究对象是客观事物的数量方面。
2、总体性: 主要是研究社会经济现象的总体数量规律
3、具体性: 社会经济统计的研究对象是具体事物的数量,不是抽象的量。
4、变异性:总体中各单位的数值表现存在差异
5、不确定性:是在现有的统计资料基础上或样本数据基础上进行阶段性分析,所获得的结论不确定
统计的职能:信息职能、咨询职能、监督职能。
第二章统计数据的搜集
统计学中几个基本概念
统计数据的计量尺度
统计数据:是对客观社会经济现象进行计量的结果。
1.定类尺度:也称类别尺度或列名尺度,是按照现象的某种属性对其进行平行的分组或分类。是最粗略、计量层次最低的计量尺度。
2.定序尺度:又称顺序尺度,是对现象之间的等级差或顺序差别的一种测度。可以确定类别的优劣或顺序
3.定距尺度:也称间隔尺度,是对现象类别或次序之间间距的测度。能进行排序以及准确地指出类别之间的差距是什么。
4.定比尺度:,也称为比率尺度,比定距尺度高一个层次,可以计算两个测量值之间的比值,其计算结果也表示为数值。
上述四种尺度对现象的测量层次是由低级到高级 、由粗劣到精确逐步递进的。
统计数据的类型
因为测量尺度不同,分为四种类型:定类数据、定序数据、定距数据、定比数据
统计总体和总体单位
总体 即统计总体,是指客观存在的、在同一性质基础上结合起来的许多个别事物的整体。
总体单位(简称单位)是组成总体的各个个体。
例如:要研究全国城镇居民的收支情况,就以全国城镇居民作为一个总体,每一个居民为总体单位。
总体的特点:1同质性:是确定总体的前提和基础。它是根据统计的研究目的而定的。
大量性 :统计总体应该由足够数量的同质性单位构成(必要条件)。
差异性 :构成总体的各个同质性单位的特征存在着差异(前提和内容)。
注:构成中提的单位必须是同质的,不能把不通知的单位混在总体之中。总体与总体单位具有相对性,随着研究任务的改变而改变。同一研究对象,在一种情况下为总体,但在另一情况下又可能变成单位。标志和指标
标志是说明总体单位属性和数量特征的名称
标志表现是指标所反映的属性和数量特征在各总体单位的具体表现
标志分类:
★标志表现(品质标志、数量标志)
品质标志:说明总体单位质的特征,只能用文字、符号或数字代码来表现 。
数量标志:表示总体单位量的特征,用数值来表现称为标志值(变量值)。
★标志变异(不变标志、可变标志)
不变标志: 在同一总体中,当一个标志在各个总体单位的表现都相同称为不变指标。不变标志是总体同质性的基础。
变异标志:亦称可变标志,在一个总体中,当一个标志在各单位的具体表现有可能不同时,称为可变标志。作为总体,同时必须存在变异标志,这表示所研究的现象在各单位之间存在着差异,才需要进行统计研究。
统计指标与统计指标体系
统计指标:由指标名称和指标数值构成。反映统计总体数量特征的概念和数值。
特点:能用数字表示、说明综合特征、反映一定社会经济范畴的数量
构成:统计指标由两项基本要素构成,即指标的概念(名称)和指标的取值。例如:经统计调查某民营企业固定资产原值(指标名称)为9.2亿元(指标数值)
统计指标分类:1.按其反映的内容不同分为数量指标(对应总量指标)反映总体绝对数量多少的总量指标(指标总量和总体单位数)质量指标(对应相对指标和平均指标)反映总体内部结构和总体单位平均水平,说明工 作效率、工作质量的统计指标
2.按其作用和表现形式的不同分为总量指标(绝对数)相对指标(相对数)平均指标(平均数)
3.概念性指标:反映现象总体数量状况的基本概念。三要素:指标名称、计量单位、计算方法。 例如,年末全国人口总数、全国国内生产总值、社会消费品总额等。
具体的统计指标:反映现象总体数量状况的概念和数值。六要素:指标名称、计量单位、计量
方法、指标数值、时间限制、空间限制。例如:2011年我国国内生产总值为471564亿元,2011年末国家外汇储备31811亿美元。
特性:数量性、具体性、综合性
指标与标志的关系
▲标志反映总体单位的属性和特征,而指标则反映总体的数量特征。
▲指标都是用数值表示,标志用属性表示
▲指标数值经汇总得出,标志中的数量标志不一定通过汇总,可直接
▲标志一般不具有时间、地点等条件
▲总体和单位的概念会随着研究目的不同而变化,因此指标与标志的概念也是相对而言的。
▲有许多统计指标的数值是从总体单位的数量指标汇总而来的
变异与变量
变异:标志在总体单位之间的不同具体表现
变量:说明某种特征的概念。可变的数量标志。标志和指标都属于变量的范畴。变量的具体数值表现即变量值。
变量的分类:
1.属性变量(定类变量、定序变量)数值型变量(定距变量、定比变量)
数值型变量又可分为离散型变量、连续型变量
连续型变量是指变量的取值在数轴上连续不断,例如,气象上的温度、湿度,零件的尺寸等。
按取值是否连续:
离散型变量是指变量的其取值是整数值,例如,企业数,职工人数等。
2.按所受因素不同:
确定性变量:是受确定性因素影响的变量
随机变量:是受许多微小的不确定因素(又称随机因素)影响的变量。
流量与存量
流量:一定时期 存量:一定时点
统计数据搜集的方法
1.概念:指获取被调查对象数据的渠道或途径
2.分类:(1)直接观察法(2)通信法(3)采访法(4)登记法
统计调查
1.概念:指为了达到对客观进行认识的目的,把所要认识的对象作为一个研究总体,按照已设计的统计标准体系和统计指标体系,采用科学的方式和方法,对研究总体进行计数、测量和登记,取得反映总体各单位有关特征的统计原始数据的统计方法。
2.基本特征:
(1)以统计认识为直接的、唯一的目的对统计总体的有关特征进行计数、测量和登记。
(2)统计调查搜集的是原始数据
调查方式(调查的类型/组织形式)
1、按调查对象范围:全面调查(普查)非全面调查(抽样调查 统计报表 重点调查 典型调查)
2、按调查目的:应用性调查 学术性调查
3、按调查时间:一次性调查 经常性调查 跟踪性调查
4、按状态不同:动态调查 静态调查
5、按调查对象内容:综合调查 专题调查
普查:为某一特定目的而专门组织的一次性全面调查 (人口普查、工业普查等)
●特点:(1)通常是周期性的或一次性的,涉及面广、耗时、费力,一般需间隔较长时间;
(2)一般需要规定统一的标准调查时间,以避免调查数据的重复或遗漏;
(3)准确性一般较高,较规范;
(4)适用的对象较窄,只能调查一些最基本、最一般的现象。
●原则:
(1)规定统一的标准时间
(2)尽可能在短期内完成登记工作
(3)普查尽可能按一定周期进行
(4)统一规定调查项目
统计报表:以原始数据为依据,按照国家统一规定的表格形式、统一规定的指标内容、统一的
报送程序和报送时间,由基层单位自下而上逐级向上级和国家定期提供统计资料的一种报告制
度。
●特点 :统一性、全面性、经常性和相对可靠性
抽样调查:从调查对象的总体中随机抽取一部分单位作为样本进行调查,并根据样本调查结果推断总体数量特征。
●特点/优点:经济性强、时效性高、适应面广、准确性高
作用:能够解决全面调查无法或难以解决的问题。可以补充和订正全面调查的结果。可以用于对总体的某种假设进行检验。
重点调查(反映总体基本情况)(个别现象----一般性情况)
从调查对象的全部单位中选择少数重点单位进行调查(适用于“同类”中的“大户”)。
典型调查(推算总体的数量特征)(个别表象-----一般性结论)
从调查对象的全部单位中选择一个或几个有代表性的单位进行调查。(不一定针对“大户”)
统计调查方案的基本内容
1确定调查目的和内容
2确定调查对象、调查单位和报告单位
(1)调查对象就是我们需要进行研究的总体范围,即调查总体。它是由性质相同的许多调查单位所组成的。(2)调查单位是进行研究的总体单位,也即登记的标志表现的直接承担者。
(3)报告单位是指负责报告调查内容的单位
注意:调查单位与填报单位的区别调查单位是调查项目的承担者;填报单位是负责上报调查资料的单位。
3确定调查项目拟定调查表
1)确定调查项目
2)拟定调查表
(1)表头、表体和表脚
(2)单一表和一览表
4确定调查时间和期限
5制定调查的组织实施计划/
6 选择调查方法
统计数据的质量评价标准
精度、准确性、关联性、及时性、一致性、最低成本
第三章 统计数据的整理和管理统计整理的概念和作用
1概念:根据统计研究的目的,将统计调查所获得的大量原始资料,进行科学的分类汇总,使之条理化、系统化,得出能反映现象总体特征的综合资料的过程。
2作用:统计整理是统计调查的继续,是统计分析的前提,它实现了统计资料从个别单位标志值向总体综合指标的过度,在统计研究中起着承前启后重要的作用
统计整理的步骤
1.制定整理方案(分类(分组)和汇总方案)
2.对调查资料进行审核和订正
3.进行统计分组(分类)并进行编码
4.进行统计汇总
5.编制统计表、绘制统计图,显示统计结果。
统计分组的概念和作用:
1概念:根据现象总体内在特点和统计研究任务的要求,将总体按照一定标准划分为若干性质不同又有联系的组成部分的一种统计方法。
2作用:1划分现象的类型
2说明社会经济现象的内部结构
3研究总体各部分之间的依存关系
选择分组标志的原则 :根据研究问题的目的来选择
要选择最能反映被研究现象本质特征的标志
要结合现象所处的具体历史条件或经济条件来选择
分组标志的种类:品质标志分组 —— 反映事物属性差异(简单 复杂)
数量标志分组 —— 反映事物数量差异(单项式 组距式)简单分组 —— 按一个标志对总体进行分组复合分组 —— 按两个或两个以上标志对同
统计分组的分类
[图片]
分布数列 1概念:在统计分组的基础上,将总体的所有单位按组归类,并按顺序排序,形成总体中各单位在个组件的分布,称为分布数列,又可称次数分配,或次数分布。分布在各组的个体单位数叫次数,又称频数;各组次数与总次数之比叫比率,又称频率。
2分布数列的构成要素:
总体按某一标志所分成的各个组
各组次数或频率。(次数即分布在各组的单位数,频率是各组的次数与次数的总和相比求得的比重)
分布数列分类:品质分布数列(这种数列一般比较稳定,只要分组标准定的比较恰当,通常能准确地反映总体的分布特征)
变量分布数列 单项式分布数列
组距分布数列(等距数列 异距数列)
组距数列的编制组限:组距两端的数值。分为上限和下限。
组距:某一组的上限和下限的距离,分等距和异距( 组距=上限-下限)
1、组距计算公式
①连续组距式分组:组距=本组上限-本组下限
②间断组距式分组:组距=本组上限-本组下限+1
全距:分组数列中最大值的上限与最小值的下限之差
组中值: 组的上限和下限的中间值
2、组中值的计算
①同时有上限、下限的组:组中值=(上限+下限)/ 2
②缺下限最小组:组中值=上限-相邻组组距 / 2
③缺上限最大组:组中值=下限+相邻组组距 / 2
等距数列 等组距=全距/组数
异距数列 次数密度=各组次数/各组组距
频数密度=各组频率/各组组距
统计表
1概念:把大量的统计数字资料,按一定顺序和格式列在表上,该表就是统计表。包括调查表、汇总表、计算表以及各种各样容纳资料的统计表。
2构成:
从构成要素看:统计表由总标题、分标题(横行标题、纵栏标题)、数字资料构成。
从内容上看:统计表由主词和宾词两部分构成。主词是统计表所要说明的总体及其主要分组情况;宾词是说明总体的统计指标
统计表的种类简单表
简单分组表
复合分组表
统计表的编制原则
1、统计表的各种标题,特别是总标题的表达,应该十分简明确切,概括地反映出表的基本内容。
2、表的主词各行和宾词各栏,一般应按先局部后整体的原则排列,即先列各个项目,后列总计。
3、如果统计表的栏数较多,通常要编号
4、表中数字应该填写整齐,对准位数
5、统计表中必须注明数字资料的计量单位
6、统计表的表式,通常是左右开口的
7、必要时,统计表应家注说明或解释
第四章 综合指标
综合指标从它的作用和方法特点的角度可概括为三类:总量指标、相对指标、平均指标
总量指标(绝对指标)
总量指标是反映社会经济现象一定时间、地点、条件下总的规模、水平的统计指标。总量指标表现形式是绝对数,不是抽象的绝对数,是有名数。
作用:1总量指标能反映一个国家的基本国情和国力,反映某部门或单位等人、财、物的基本数据 。2总量指标是制定政策、编制计划、实行社会经济管理的依据之一 。
3 总量指标是计算相对指标和平均指标的基础。
种类:(一)按其反应的内容不同可分为:
总体单位总量——说明总体的单位总数。(例:企业数、学校数、职工人数、学生人数)
总体标志总量——说明总体中某个标志值总和。(例:总产量、总产值、工资总额、税金总额。)
(二)按其反映的时间状况不同可分为:
时期指标——反应现象在某一时期发展过程的总数量(可连续计数,与时间长短无关,是累计结果)
时点指标——反应现象在某一时刻(瞬间)的状况。(间断技术,与时间间隔无关,不能累计)
总体指标的计算:注意现象的同类、明确每项总量指标的统计含义、对计量单位熟悉
自然单位 度量衡单位 双重或多重单位 复合单位 货币单位 劳动单位等
实物单位:是根据现象的属性和特点而采用的计量单位
价值计量单位:是用货币来度量社会财富或劳动成果的一种计量单位
劳动单位:是用劳动时间表示的计量单位。
相对指标
是两个有联系的指标数值之比,泳衣反映现象的发展程度、结构、强度、普遍程度或比例关系。
作用:相对指标能具体表明社会经济现象之间的比例关系。
相对指标能使一些不能直接对比的事物找出共同比较的基础。
相对指标便于记忆、易于保密。 相对指标的数值有两种表现形式:有名数(有单位的) 无名数(系数 百分数 倍数等)
常用相对指标类型:计划完成相对指标;结构相对指标;比例相对指标;比较相对指标;
强度相对指标;动态相对指标计划完成相对数:用来检查、监督计划执行情况的相对指标。一般用百分数表示。结构相对指标:以部分数值与总体全体数值对比而得出比重或比率,来反映总体内部组成状况的综合指标。
比例相对指标:总体中不同部分数量对比计算的相对数
比较相对指标:两个同类总体的同类指标在不同国家、地区、部门、单位之间的对比计算结果可以用百分比、系数或倍数表示
强度相对指标:是由两个性质不同但有一定联系的总量指标对比计算的相对数。用来表明一种现象与另一种现象对比中发展的强度、密度和普遍程度。描述发展密度的强度相对指标可分为正指标(越大越好)和逆指标(越小越好)
强度相对数的两种表示方法:(1)一般用复名数表示。(2)少数用百分数或千分数表示。
动态相对指标:两个不同时期或不同时点现象发展水平对比计算的相对指标。
[图片]作为对比标准的时间叫做基期,而同基期比较的时期叫做报告期,有时也称为计算期。常用的相对指标有发展速度和增长速度。动态相对数的计算结果用百分数或倍数表示
平均指标平均指标的概念:又称平均数,平均指标是说明同质总体内某一数量标志在一定历史条件下一般水平的综合指标。特点:1、将数量差异抽象化(数量标志)2、只能就同类现象计算3、能反映总体变量值的集中趋势
集中趋势:是指一组数据向某一中心值靠拢的程度,它反映了一组数据中心点的位置所在
平均数的类型:数值平均数(算术平均数、调和平均数、几何平均数) 位置平均数(众数、中位数、四分位数)算术平均数的基本公式=总体标志总量÷总体单位总数[图片]
算数平均数的数学性质(P59-60)
①算术平均数 与 标志值个数的乘积等于各标志值总和;②各标志值与算术平均数离差之和等于零;③各标志值与算术平均数离差的平方和为最小值
调和平均数
调和平均数又称“倒数平均数”,它是各个变量值倒数的算术平均数的倒数。 [图片]由相对数求平均数
(1)明确相对数的分子、分母指标是什么,即相对数由哪两个指标对比形成。
(2)已知相对数的分子、分母指标时,用分子指标总数除以分母指标总数即为相对数的平均数。
(3)已知相对数的分子指标时,以分子指标为权数,采用加权调和平均数计算相对数的平均数;已知相对数的分母指标时,以分母指标位为权数,采用加权算术平均数计算相对数的平均数
(4)加权平均所采用的权数必须是相对数本身的分子或分母指标。
几何平均数
(1)几何平均数是N个变量值乘积的N次方根[图片]
几均。
几何平均主要用于计算比率或速度的平均
①应用条件
a.变量值是相对数据,如比率或发展速度。
b.变量值的连乘积等于总比率或总发展速度。
②特点
a.如果数列中有一个标志值等于零或负值,则无法计算。
b.受极端值影响较小,故较稳健。
位置平均数(是根据标志值的位置来确定的):①众数;②中位数
中位数(Median)中位数是一组数据按大小排序后,处于中间位置上的变量值。
中位数的求法
1、由未分组资料确定中位数:①先将总体各单位的标志值按照大小顺序排列。②然后找出中位数。当总体单位数N为奇数时,中位数位置=(N+1)/2;为偶数时,中位数位置=处于中间位置的两个单位标志值的算术平均数。(P67例3-9)
2、由单项式分组资料确定中位数(P67例3-10)
3、由组距式分组资料确定中位数(P68例3-11)
众数(Mode)
众数是一组数据中出现次数最多的变量值。
众数的求法
1、由单项式分配数列确定众数:出现次数最多的标志值就是众数。(P64例3-6)
2、由组距式分配数列确定众数:①先确定众数组。等距分组条件下,次数最多的那一组为众数组;不等距分组条件下,频数密度 或 频率密度最高的那一组为众数组。②通过公式计算众数的近似值。(P65、66例3-7、3-8)
测定标志变动度的方法:全距、平均差、标准差
极差(又称全距,Range)是总体各单位标志的最大值和最小值之差,用以说明标志值变动范围的大小
[图片](例3-15)
平均差(average deviation):①未分组A.D =[图片] ; ②已分组A.D =[图片]
平均差概括了所有单位的标志值变异情况,比极差和四位分差更具有综合性
方差 与 标准差
(1)总体数量标志的方差与标准差
②方差与标准差是测定标志变异程度最常用、最灵敏的指标
③总方差[图片]、组间方差[图片]、组内方差[图片]:[图片]
④方差与标准差的五个重要性质
(2)是非标志的方差与标准差:例3-18
第四章 抽样估计和假设检验
抽样估计:按照随机抽样的原则,从总体中抽出一部分单位作为样本,并利用样本的实际资料计算样本指标值,然后根据样本指标对总体的数量特征(总体指标)做出具有一定可靠程度的估计和判断的一种统计分析方法。
抽样误差的概念
抽样误差即指随机误差,是指由于随机抽样的偶然因素使样本各单位的结构不足以代表总体各单位的结构,而引起抽样指标和全及指标之间的绝对离差。
抽样平均误差
1抽样平均误差是反映抽样误差的一般水平的指标。
2用抽样平均数的标准差或抽样成数的标准差来作为衡量其抽样误差一般水平的尺度。
影响抽样误差大小的因素:
1总体各单位标志值的差异程度。(差异程度越大,抽样误差越大)
2样本的单位数(样本单位数越多,抽样误差越小)
3抽样方法(重复抽样的误差比不重复抽样的误差要大些)
4抽样调查的组织形式(简单随机抽样、类型抽样、等距抽样、整群抽样)
抽样极限误差
1概念:在做抽样估计时,应根据所研究现象的变异程度和分析任务的要求确定可允许的误差范围,在这个范围内的数字都算有效,这种可允许的误差范围称为抽样极限误差。
[图片]抽样极限误差等于样本指标可允许变动的上限或下限与总体指标之差的绝对值。
抽样误差的概率度
用抽样误差概率度 t表示误差范围为抽样平均误差的 t倍。
[图片]
抽样估计的置信度:
抽样估计置信度就是表明抽样指标和总体指标的误差,不超过一定范围的概率保证程度。
抽样估计的概率保证程度就是指抽样误差不超过一定范围的概率大小,用字母F(t)表示。
当t=1时,F(t)=68.27%
当t=2时, F(t)=95.45%
当t=3时, F(t)=99.73%
总体参数的点估计
参数点估计的特点:根据总体指标的结构形式设计样本指标(称统计量)作为总体参数的估计量,并以样本指标的实际值直接作为相应总体参数的估计值。
[图片][图片]公式:以样本的平均数 作为总体平均数 的估计值。
以样本的成数p作为总体成数P的估计值。
成为优良估计的标准
1无偏性:即以抽样指标估计总体指标要求抽样指标值的平均数等于被估计的总体指标值本身。
抽样平均数的平均数等于总体平均数。
抽样成数的平均数等于总体成数。
2一致性:要求当样本的单位数充分大时,抽样指标也充分地靠近总体指标。
有效性:以抽样指标估计总体指标要求作为优良估计量的方差比其他估计量的方差小。
总体参数点估计的特点:
优点:简便、易行、原理直观
缺点:这中估计没有表明抽样估计的误差,更没有指出误差在一定范围内的概率保证程度有多大。
总体参数的区间估计
[图片]总体参数区间估计是根据给定的概率保证程度的需求,利用实际抽样资料,指出总体被估计值的上限和下限,即指出总体参数可能存在的区间范围,而不是直接给出总体参数的估计值。
进行总体参数区间估计应具备的要素:
估计值、抽样误差范围、概率保证程度
抽样误差范围决定估计的准确性,概率保证程度决定估计的可靠性。
抽样误差范围越大,准确性越低,反之就越高;
概率保证程度越大,可靠性越高,反之就越低。
在抽样估计时,希望准确性高些,可靠性大些,但两者同时实现是有矛盾的。
[图片]
总体参数区间估计的方法:
(一)根据已经给定的抽样误差范围,求概率保证程度。
步骤:抽取样本——计算抽样指标(作为总体指标估计值)——计算标准差、抽样平均误差——计算估计区间的上、下限——求出t ,查表得Ft对总体参数作区间估计。
(二)根据给定的置信度要求,来推算抽样极限误差的可能范围:
步骤:抽取样本,计算抽样指标——计算标准差,抽样平均误差——根据Ft查出t值——计算极限误差——求出估计总体指标的上下限,作区间估计
区间估计注意
1首先确定被估计总体指标的种类,是平均数还是成数;
2其次取定抽样方法,是重置抽样还是不重置抽样;
3然后再根据给定的样本资料和抽样条件(给定概率保证程度还是给定抽样极限误差),确定计算步骤,进行计算。
第六章 变量间关系分析
相关分析的概念
相关分析就是对总体中确实具有联系的标志进行分析,其主体是对总体中具有因果关系标志的分析。
相关系数(着重研究线性的单相关系数)
定义:是按积差方法计算,同样以两变量与各自平均值的离差为基础,通过两个离差相乘来反映两变量之间相关程度。
公式:总体相关系数(P185)
[图片]
协方差[图片]
方差[图片],[图片]
样本相关系数(P185)
[图片]
相关系数[图片]的特点
r具有对称性
r数值大小与x和y的原点和尺度无关
[图片]
相关分析的特点:1、用于相关分析的两个变量是对等的关系,它不分自变量和因变量
2、用于相关分析的两个变量均是随机变量,因此相关系数只有一个
3、相关系数大于0,表示两个变量正相关,相关系数小于0,表示两个变量负相关
简单线性回归方程:
简单线性方程式:y=a+bx
回归方程:yc=a+bx
yc—y的估计值 a—纵轴截距
b—回归系数,代表自变量增加一个单位时因变量的平均增加值。
计算a、b值
当实际值y与估计值yc的离差平方和为最小值时,则此直线为最优的理想直线。
[图片]即:
[图片]当出现权数时:
回归分析特点
回归分析是研究两变量之间的因果关系,所以必须通过定性分析来确定哪个是自变量,哪个是因变量。 回归分析是研究两变量具有因果关系的数学形式
对于回归方程进行预测估计时,只能根据x估计yc,不能根据yc估计x
第七章 时间序列分析
时间序列,也称时间数列或动态数列,指社会经济现象在不同时间上的系列指标值按时间先后顺序加以排列后形成的数列,
时间序列组成:一是反映时间顺序变化的数列,二是反映各个时间下指标值变化的数列。
动态数列的种类
按指标表现形式的不同分为总量指标(时期数列、时点数列)、相对指标、平均指标动态数列
1总量指标动态数列:把总量指标在不同时间上的数值按时间先后顺序排列形成总量指标动态数列。
(1)时期数列:在总量指标动态数列中,如果每一指标是反映某现象在一段时间发展过程的总量称时期数列
特点:(1)时期数列中各指标值可以相加。
(2)时期数列中各指标值大小与时间间隔正相关。
(3)时期数列通过连续登记获取数据。
(2)时点数列:在总量动态数列中,若每一个指标值所反映的是现象在某一时刻上的总量
特点:①数列不具有连续统计的特点
②数列中各个指标数值不具有可加性
③数列中每个指标值的大小与其时间间隔长短没有直接联系。
2相对指标动态数列:把一系列同类相对指标按时间先后顺序排列而形成的时间数列
特点:1.由两个绝对数数列相比形成。2.不同时期的相对指标数值不可直接相加。
3平均指标动态数列:把一系列平均指标按时间先后顺序排列形成的动态数列
特点:不同时期的平均指标数值不可直接相加。
时间序列的编制原则
基本原则——可比性原则 具体原则1.时间长短应当一致。 2.总体范围保持一致。
3.指标的经济内容保持一致。4.指标的计算方法和计量单位保持一致。
时间序列分析指标
分类:现象发展的水平分析指标(发展水平、平均发展水平、增长量、平均增长量)、现象发
展的速度分析指标(发展速度、增长速度、平均发展速度、平均增长速度)。
水平分析是速度分析的基础,速度分析是水平分析的深入和继续。
一、发展水平
1、定义:是动态数列中的每一项具体指标数值,又称发展量,它反映社会经济现象在各个时期所达到的规模和发展的速度。(可以是总量指标,也可以是相对指标或平均指标)
二、平均发展水平
动态平均数(序时平均数):平均发展水平所平均的是现象总体在不同时期上的数量表现,从
动态上说明其在某一时期内发展的一般水平。
一般平均数:是将总体各单位同一时间的变量值差异抽象化,用以反映总体在具体历史条件下
的一般水平,不体现时间的变动,又称静态平均数。
序时平均数的计算方法:由时期数列计算序时平均数
[图片]
按时点数列计算
①、以天为间隔的连续时点数列:
①、以天为间隔的连续时点数列:
[图片]
②间断时点数列
当时点数列间隔相等,采用“首末折半法”计算
[图片]
[图片]
当时点数列间隔不相等时:
2、相对指标动态数列或平均指标动态数列计算序时平均数
[图片]
三、增长量是以绝对数形式表示的速度分析指标(称现象发展的绝对速度)
2、公式:增长量=报告期水平-基期水平
3、累积增长量:按固定的基期水平计算的增长量
a1-a0、a2-a0……..an-a0
逐期增长量:以前一期水平为基期计算的增长量
a1-a0,a2-a1,…,an-an-1
四、平均增长量 [图片]
动态数列速度分析指标
发展速度
1、概念:发展速度是以相对数形式表现的动态分析指标,它是两个不同时期发展水平指标对比的结果。
2、公式:发展速度=报告期水平/基期水平
发展速度可分为定基发展速度(总速度)和环比发展速度(年速度)。
定基发展速度:各报告期水平同某一固定基期水平对比计算。
[图片]
环比发展速度:报告期水平与前一期水平对比计算
[图片]
定基发展速度和环比发展速度的关系:1、定基发展速度等于环比发展速度的连乘积。2、两个相邻时期的定基发展速度之比,等于它们的环比发展速度。
增长速度
增长速度是反映现象数量增长方向和程度的动态相对指标,由增长量对比基期水平而得
[图片]2、公式:
增长速度也分为定基增长速度和环比增长速度。
定基增长速度=定基发展速度-1(或100%)
环比增长速度=环比发展速度-1(或100%) 环比增长速度的连乘积不等于定基增长速度
平均发展速度和平均增长速度:平均发展速度和平均增长速度统称平均速度,是指各个时期环比速度的平均数,说明社会经济现象在较长时期内速度变化的平均速度。
平均发展速度表示现象逐期发展的平均速度
平均增长速度则是反映现象递增的平均速度
2、平均增长速度=平均发展速度-1
平均发展速度总是正值,而平均增长速度可为正值也可为负值
计算平均发展速度的方法:
几何平均法:
[图片]
[图片]
[图片]
3)、一段时期的定基发展速度为现象总速度,用R表示
4)、如果现象发展过程为几个时期,又具有各时期平均发展速度,求全过程平均发展速度,
现象变动的趋势分析
影响时间序列各项发展水平变化的因素
1、长期趋势:指现象在一段较长时间内,由于普遍的、持续的、决定性的基本因素的作用,使发展水平沿着一个方向,逐渐向上或向下变动的趋势。
2、季节变动:指现象受季节的影响而发生的变动,其变动的特点是:在一年或更短的时间内随着时序的更换,使现象呈周期重复的变化。
循环变动:指现象发生周期比较长的涨落起伏的变动
不规则变动:指现象除了受以上各种变动的影响以外,还受临时的,偶然因素或不明原因而引起的非周期性、非趋势性的随机变动。
现象变动趋势分析就是要把动态数列受各类因素的影响状况分别测定出来,搞清研究对象发展变换的原因及其规律,为预测未来和决策提供依据。
测定长期趋势的方法:移动平均法,最小平方法,随手画线法
移动平均法:是采用逐期递推移动的方法计算一系列扩大时距的序时平均数,并以这一系列移动平均作为对应时期的趋势值。
最小平方法
用一定的数学模型对原有的动态数列配合一条适当的趋势线来进行修匀。这条趋势线必须满足最基本的要求,即原有数列的实际数值与趋势线的估计数值的离差平方之和为最小。(公式P145页7-14,7-15)季节变动的测定
目的:在于掌握季节变动的周期、数量界限及其规律,以便预测未来,及时采取措施,克服它对人们经济生活所导致的不良影响,更好地组织生产和销售,提高经济效益和安排好人民生活。
主要方法:计算季节比率(按月平均法、移动平均趋势剔除法)
第八章 统计指数
一、统计指数的概念
广义指数是指同类事物变动程度的相对数,包括动态相对数、比较相对数、计划完成相对数,即所有的动态比较指标。
狭义指数是综合反映多种不同事物在不同时间上的总变动的特殊的相对数。即专门用来综合说明那些不能直接相加和对比的复杂社会经济现象的变动情况。
二、统计指数的作用
1综合反映多种不同事物的总的变动程度;
2测定复杂经济现象的总变动中,各个因素变化的影响
3测定平均指标中各因素变动对平均指标变动的影响程度
4研究事物在长时间内的变动趋势
指数的种类
1、按反映的对象范围的不同:
个体指数:是反映个别现象变动的相对数(个别产品的产量指数、个别商品的价格指数)
总指数:是综合表明全部现象总体数量变动的相对数。(工业产品总产值指数、商品零售物价总指数居民消费价格指数等)
2、按其所表明的指标性质的不同:
数量指标指数:反映着研究现象总体总规模的变动程度
质量指标指数:说明生产经营所取得效益状态,说明生产工作质量的提高程度。
3、指数按采用基期的不同:
定基指数:各个时期指数都是采用同一固定时期为基期。
环比指数:是依次以前一期为基期计算的指数。
一、综合指数的编制:
1、编制的特点:
从现象联系关系分析中,来确定与我们所要研究的现象(指数化指标)相联系的因素,从而加入这个因素(同度量因素),使各种商品或产品的不同使用价值量,改变为价值量。
①、研究各种产品产量变动时,将产量乘以其价格(同度量因素)计算其总销售量。
②、研究各种产品单位成本变动时,将各单位成本乘以其产量(同度量因素)计算其总成本
③、同指数化指标相联系的同度量因素又叫指数权数,权数乘以指数化指标的过程又称加权。
对复杂现象总体所包括的两个因素,把其中一个因素,即同度量因素或权数加以固定,以便消除其变化,来测定我们所要研究的哪个因素即指数化指标的变动。
①采用同一时期的价格或单位成本作同度量因素来计算两个时期生产总值或总成本,进行对比,以测定各种产品的产量动态。
②采用同一时期的产量作同度量因素来计算两个时期生产总值、总成本,进行对比,反映各种产品价格、单位成本的综合变动。
数量指标综合指数的编制
商品销售量总指数
选择价格作为同度量因素,则:
销售量综合指数的编制方法是:
以基期价格分别计算报告期的销售额和基期销售额
[图片]同过对比,以销售额的变动来定量表示销售量总指数
结论:编制数量指标指数,应以基期质量指标作为同度量因素
数量指标指数的实际意义(以销售量指数为例)反映多种商品销售量总(综合)的变动方向和相对变动程度;(商品销售量增长多少)
反映商品销售量变动对商品销售额的相对影响程度;(销售量的增长使销售额增长)
反映由于商品销售量变动对销售额影响的绝对影响(分子分母相减的差额)(多销售了商品使销售额增加)
在维持基期生活水平的情况下,报告期与基期比较支出情况
在维持基期生活水平的情况下,由于物价上涨(下跌),多(少)支出
质量指标指数的编制
(1)编制质量指标指数应解决两个问题:
要找出现象总体能够直接相加的同度量因素
要选择同度量因素的所属时期。
(2)编制多种商品的销售价格指数,因各种商品使用价值不同,销售价格不能直接相加,即不能同度量。
[图片]编制价格指数:应将各种商品的价格p分别乘以相应的销售量q得销售额pq,再累计相加、对比(销售量成了同度量因素)
物价综合指数的编制方法:
以报告期销售量为同度量因素,分别计算报告期和基期销售额
[图片]物价总指数的公式
结论:编制质量指标指数,应以报告期数量指标作为同度量因素。
因素分析
1、定义:因素分析就是借助于指数体系来分析社会经济现象变动中各种因素变动发生作用的影响程度。
2分类:(1)总量指标的两因素分析 (2)总量指标的多因素分析 (3)平均指标的两因素分析(4)含平均指标的多因素分析
总量指标的两因素分析(P167页)