六西格玛统计学中的变量类型
关于一个产品、服务、过程、个体或者项目的数字信息我们称为数据。因为没有两个事物是完全相同的,因此数据也不同。我们把每一个我们感兴趣的特征叫做变量。在六西格玛中,术语CTQ用来作为产品、服务或者过程的关键质量特性(critical-to-quality)的缩写词。另外,CTP用来表示产品或者服务设计的关键流程特性(critical-to-process)。

数据类型分为两种:品质数据和测度数据。
1.品质数据
可以被分类或是用来记录某一现象发生的次数的变量是品质数据(也称为分类数据或计数数据)。品质数据把一个项目或者一个人归为两类或者多种类型中的一种。例如,性别只有两种类型。在其他一些情况下,有些变量可以被分为多种类型。例如,产品和服务的缺陷可能源自许多原因。品质数据包含某一特定类别中的项目的数目或者频数,而不管类别的个数,它可能是样本中倾向于选举中某一候选人的选民个数,也可能是某种产品或服务某种缺陷出现的次数。计数数据包括一个项目或者个人某种现象出现的次数。例如,一码布的瑕疵数目,或者高速公路上某一地段某一时刻通过的汽车数量。

2.测度数据
测度数据(也被称为连续或可变数据)是对某个项目或个人的度量。理论上任何值都有可能产生,仅仅受到测量过程精确性的限制。测度数据的例子有:高度、重量、温度以及周期时间。
变量也可以用度量的等级水平来描述。度量有四个等级:名义级、顺序级、间距级、比率级。品质数据被归为名义级数据,例如,合格与不合格、开与关、男性与女性。这些数据不表示序次关系。名义级数据是度量的最低级形式。顺序级用于可以排序、但不能测量具体大小的数据,例如,态度分为1~5五个等级:1=非常不满意,2=不满意,3=不确定,4=满意,5=非常满意。顺序级数据的可度量性要比品质数据强。当然,顺序级数据类与类之间的差别无法测量。

测度数据可以被分为间距级数据和比率级数据。对于间距级数据,不同的测量值之间的差别是一个有意义的量,但是不存在真任的零值点。对于比率级数据,数据间的差异不仅有实际意义,而且有一个真正的零值点。华氏温度和摄氏温度是间距级数据,因为30度和32度之间的差别同38度和40度之间的差别是相同的,但是没有真正的零点(0华氏温度和0摄氏度是不同的)。重量和时间是比率级变量,它们有真正的零值点:如0磅和0克是相同的,和0英石也是相同的。20分钟是10分钟的2倍,10分钟是5分钟的2倍。