927~928文献与统计学学习
①算数平均数的某些性质 样本的每个数加上c,算数平均数也加上c。这个方法可以用来减少计算。 如果样本值都在100~200之间,都减去100的话,可以减小计算量。 样本的每个数乘以c,算数平均数也乘以c。 比如单位的换算,一盎司等于28. 35g。以为单位的样本算出来的算数平均数只要都除以28. 35就可以算出样本以盎司为单位的算术平均数了。 ②离散型测度 极差:需要样本按大小排列好顺序,用最大值减去最小值。缺点是对极端值太过敏感。而且样本数量大的话,极差也通常会变大。
新知识:分位数
5
奇数个样本直接向上取整,偶数个要与后面一位取平均值。 方差与标准差,这里有一个新知识: 在生物统计学中标准差的使用更多,因为标准差和算数平均值一样,因为经常出现的正态分布可以直接由这两个参数决定。 如果样本乘以尺度因子c,那么方差要乘以 c²,而标准差乘乘以c即可。 ③变异系数CV 样本的单位不一样,变异系数是相同的。但是变异系数要求样本的算数平均数尽量准确,如果误差大的话不宜使用。而且数据的算数平均数差距大也不好使用这个。 ④条形图和直方图: 条形图间隔相等,宽度相同,用高度来显示频数。x轴一般是 吃早饭/没吃早饭 这种非数字区间。 直方图紧密相连,分为两种,x轴一般是连续的数字区间,右侧数字属于下一个区间。如果x轴宽度相同,就用高度表示频数大小(此时高度与面积成正比);如果x轴宽度不同,用面积表示频数大小。 ⑤茎叶图: 如果有些样本区间里的数据缺失(比如体重,八十几斤的就是没有,但是有七十几斤和九十几斤),就可以使用茎叶图。
这里有个概念是乘数因子,这使得茎叶图可以用于表示有小数点的数据,图上是6丨4,乘数因子是10¹那么得知,6. 4×10¹=64。 ⑥分组数据: 数据/频数/相对频率/累加频数/累加百分数 也可以是连续数据分组