欢迎光临散文网 会员登陆 & 注册

数据的类型

2023-07-24 11:53 作者:漫步毛毛雨  | 我要投稿


据测量尺度划分,根据变量测量精度不同,可把变量由低到高分为四种尺度:定类变量、定序变量、定距变量和定比变量。

定类变量 定类变量又称为名义(nominal)变量。

是定性数据

这是一种测量精确度最低、最粗略的变量,它的取值只代表观测对象的不同类别,例如“性别”变量、“职业”变量等。定类变量的取值称为定类数据或名义数据。

特点:

1、同一组内各单位是等价的,同时若更换各不同组的符号并不会改变数据原有的基本信息。

2、不能比较大小。

3、定类变量必须是离散变量

4、使用的时候要注意:相互独立、完全穷尽。

常用统计量有频数、比率或百分比等。

定序变量 定序变量又称为有序(ordinal)变量、顺序变量。

是定性数据

它的取值的大小能够表示类别和次序信息。例如,“最高学历” 变量的取值是:1—小学及以下、2—初中、3—高中、中专、技校、4—大学专科、5—大学 本科、6—研究生以上。由小到大的取值能够代表学历由低到高。定序变量的取值称为定序 数据或有序数据。

特点:

1、同一组内各单位是等价的,相邻组之间的单位是不等价的,它们存在“大于”或“小 于”的关系。

2、只能排序,不能比较大小。

3、可以是离散变量或连续变量

常用统计量是中位数,频率、累计频率等。

定距变量 定距变量又称为间隔(interval)变量。

是定量数据

它的取值之间可以比较大小,可以用加减法计算出差异的大小。定距变量的取值称为定距数据或间隔数据。定距数据是一些真实的数值,具有公共的、不变的测定单位,如温度。

特点:

1、两个相同间隔的数值的差异相等,例如,年龄的 60 岁与 50 岁之差等于 40 岁与 30 岁之差。 

2、可以进行正线性变换,并不影响定距数据原有的基本信息。

3、0 不表示没有。例如,在测定温的摄氏表中, 0 并不表示没有温度,因为还有在零点以下的温度。

4、可以是离散变量或连续变量

常用的统计量如均值、 标准差、相关系数等。

定比变量 定比变量又称为比率(ratio)变量。

是定量数据

它与定距变量意义相近。

特点:

1、定比数据也可进行算术运算和线性变换等。

2、可加减乘除计算。

3、0 表示没有。例如,人的身高就是一个定比变量,如果身高值为“0”米,则表示这个人不存在。

通常对定距变量和定比变量不需再加以区别,两者统称为定距变量或间隔变量。


一个变量在不同分析中可当作不同尺度的变量。例如,“年龄” 在某些分析中(如回归分析)当作定距变量,而在另外一些分析中(如方差分析)可通过分 组作为定类变量处理。


数据的类型的评论 (共 条)

分享到微博请遵守国家法律