二、数值型数据的整理与显示
(一)数据的分组
分组的方法
分类方法 |
定义 |
适用范围 |
单变量值分组 |
把每一个变量值作为一组 |
通常只适合于离散变量且变量值较少的情况。 |
组距分组 |
将全部变量值依次划分为若干个区间,并将这一区间的变量值作为一组。 |
连续变量或变量值较多的情况 |
采用组距分组的步骤:
第一步,确定分组组数
确定分组组数的要求是:(1)划分的组数,既不应太多也不应太少;(2)组数的确定,要尽量保证组间资料的差异性与组内资料的同质性;(3)采用的分组办法,要能够充分显示客观现象本身存在的状态。
关于统计分组组数问题,斯特基给出的计算公式为:(了解即可)
确定组限时应注意:(1)第一组的下限值应比最小的观察值小一点,最后一组的上限值应比最大的观察值大一点;(2)特别需要或不得已的情况除外,最好不要使用开口组;(3)组限应取得美观些,按数字偏好,组限值应能被5除尽,且一般要用整数表示。
第六步,确定各组观察值出现的频数
凡观察值落在某一区间的,就计发生一次,最后统计各组观察值发生的总次数。采用组距分组时,需要遵循“不重不漏”的原则。
为解决“不重”的问题,统计分组时习惯上规定“上组限不在内”,即当相邻两组的上下限重叠时,恰好等于某一组上限的观察值不算在本组内,而计算在下一组内。
第七步,制作频数分布表,并填上相关的内容,以及其他需要说明的事项。