第二十二章 数据特征的测度
第一节 集中趋势的测度
集中趋势是指一组数据向某一中心值靠拢的倾向,测度集中趋势也就是寻找数据一般水平的代表值或中心值。
集中趋势的测度,主要包括:
位置平均数----众数、中位数等
数值平均数----算术平均数和几何平均数等
(一)、众数
1、涵义:众数是一组数据中出现频数最多的那个数值,用M0表示。
2、用众数反映集中趋势,非常直观,不仅适用于品质数据,也适用于数值型数据。众数是一个位置代表值,不受极端值的影响,抗干扰性强。
(二)中位数
1、涵义:把一组数据按从小到大的顺序进行排列,位置居中的数值叫做中位数,用Me表示。中位数将数据分为两部分,其中一半的数据小于中位数,另一半数据大于中位数。
2、中位数计算:
根据未分组数据计算中位数时,要先对数据进行排序,然后确定中位数的位置,n为数据的个数,其公式为:
n为奇数:中位数位置是 ,该位置所对应的数值就是中位数数值。
n为偶数:中位数位置是介于 和( +1)之间,中位数数值就是 所对数值和( +1)所对应数值的算术平均数。
具体计算见教材例题:
3、中位数主要用于顺序数据,也适用于数值型数据,但不适用于分类数据,中位数也是一
(三)算术平均数
1、涵义:算术平均数是全部数据的算术平均,又称均值,用 表示。是集中趋势中最主要的测度值。主要适用于数值型数据,但不适用于品质数据。
2、计算公式
(1)简单算术平均数
简单算术平均数主要用于处理未分组的原始数据。
简单算术平均数的计算公式为:
(2)加权算术平均数
加权算术平均数主要用于处理经分组整理的数据。
加权算术平均数的计算公式为:
Xi——各组的组中值
fi——各组的频数
3、计算和运用算术平均数注意事项:
(1)算术平均数同时受到两个因素的影响:各组数值的大小、各组分布频数的多少。频数在算术平均数中起着权衡轻重的作用。
(2)算术平均数易受极端值的影响。极端值的出现,会使平均数的真实性受到干扰。
(四)几何平均数
1、涵义: n个观察值连乘积的n次方根就是几何平均数。
2、计算公式:
公式为:几何平均数
-----连乘积符号
3、主要用途:
(1)对比率、指数等进行平均
(2)计算平均发展速度。