第一步,确定分组组数。
确定分组组数的要求是:
①划分的组数,既不应太多也不应太少量组数过多。
②组数的确定,要尽量保证组间资料的差异性与组内资料的同质性。
③采用的分组办法,要能够充分显示客观现象本身存在的状态。
第二步,对原始资料进行排序。
结果如下:
第三步,求极差。
将最大的观察值与最小的观察值相减便得到极差。
此例中,极差值为112-50=62。
第四步,确定各组组距。
在实行等距分组的情况下,组距的确定办法为:
组距=极差/组数。
根据上式计算出来的组距,可能带有小数,为了编表和计算方便,也是审美习惯使然,最好把它取成接近于能被5除尽的一个数。本例中,组距=62/7≈8.9,组距可取10。
组距:某组的上限值-该组的下限值
组数越多,组距越小,组数越少,组距越大。
第五步,确定组限。
组限是组与组之间的界限,或者说是每组观察值变化的范围。
组限有上限与下限之分,在组距分组中,一个组的最小值称为下限,最大值称为上限;上限与下限的差值称为组距;上限值与下限值的平均数称为组中值。
组中值的代表性如何,取决于组中观察值的变化是否呈对称分布状态。
组中值=(上限值+下限值)/2
确定组限时应注意:
①第一组的下限值应比最小的观察值小一点,最后一组的上限值应比最大的观察值大一点。
②特别需要或不得已的情况除外,最好不要使用开口组。
③组限应取得美观些,按数字偏好,组限值应能被5除尽,且一般要用整数表示。
本例中,我们把第一组的下限值定为50,那么各组的组限依次为:
50~60,60~70,70~80,80~90,90~100,100~110,110~120。
第六步,确定各组观察值出现的频数。
遵循“不重不漏”的原则。“不重”是指一项观察值只能分在其中的某一组,不能在其他组重复出现;“不漏”是指组别能够穷尽,即在所分的全部组别中每项数据都能分在其中的某一组,不能遗漏。
为解决“不重”的问题,统计分组时习惯上规定“上组限不在内”,即当相邻两组的上下限重叠时,恰好等于某一组上限的观察值不算在本组内,而计算在下一组内。在本例中,70这一数值不计算在“60~70”这一组中,而计算在“70~80”这一组中。
第七步,制作频数分布表,并填上相关的内容,以及其他需要说明的事项。