质量数据的特征值:
描述数据分布集中趋势的:算术平均数、中位数;
描述数据分布离中趋势的:极差、标准偏差、变异系数等。
集中 趋势 | (1) 算术 平均数 | 又称均值,是消除了个体之间个别偶然的差异,显示出所有个体共性和数据一般水平的统计指标,它由所有数据计算得到,是数据的分布中心,对数据的代表性好。 |
(2) 样本 中位数 | 样本中位数是将样本数据按数值大小有序排列后,位置居中的数值。 • 当样本数n为奇数时,数列居中的一位数即为中位数; • 当样本数n为偶数时,取居中两个数的平均值作为中位数。 |
离中 趋势 | (1) 极差 | 极差是数据中最大值与最小值之差,是用数据变动的幅度来反映其分散状况的特征值。 • 极差计算简单、使用方便,但粗略,数值仅受两个极端值的影响,损失的质量信息多,不能反映中间数据的分布和波动规律,仅适用于小样本。 |
(2) 标准 偏差 | 标准偏差简称标准差或均方差,是个体数据与均值离差平方和的算术平均数的算术根,是大于0的正数。 • 标准差值小说明分布集中程度高,离散程度小,均值对总体(样本)的代表性好; | |
(3)变异系数 | 变异系数又称离散系数,是用标准差除以算术平均数得到的相对数。它表示数据的相对离散波动程度。 |
插入模块