二、数值型数据的整理与显示
(一)数据的分组
数据分组就是根据统计研究的需要,将数据按照某种标准划分成不同的组别。分组后再计算出各组中出现的次数或频数,形成一张频数分布表。分组的方法有单变量值分组和组距分组两种:(1)单变量值分组是把每一个变量值作为一组,这种分组方法通常只适合于离散变量且变量值较少的情况。在连续变量或变量值较多的情况下,通常采用组距分组。(2)组距分组是将全部变量值依次划分为若干个区间,并将这一区间的变量值作为一组。
例如,某高中一年级一班共有55名学生,高一语文中成绩分别为:
59 73 87 65 89 85 77 94 69 97
56 80 68 95 96 50 63 88 91 90
96 92 93 79 74 65 74 89 83 51
74 79 94 67 92 92 93 70 87 86
54 87 86 54 62 76 86 73 86 70
100 110 108 102 112
采用组距分组的步骤:
第一步,确定分组组数
确定分组组数的要求是:(1)划分的组数,既不应太多也不应太少;(2)组数的确定,要尽量保证组间资料的差异性与组内资料的同质性;(3)采用的分组办法,要能够充分显示客观现象本身存在的状态。
关于统计分组组数问题,斯特基给出的计算公式为:(了解即可)
第七步,制作频数分布表,并填上相关的内容,以及其他需要说明的事项。
观察值区间 |
组中值 |
频数 |
频率 |
50~60 |
55 |
6 |
10.9 |
合计 |
- |
55 |
100.0 |
【例题1·多选题】组距分组适用于下列情况( )。
A.离散变量 B.变量值较少 C.连续变量
D.变量值较多 E.分类数据
[答案]CD
【例题2·单选题】上限值与下限值的平均数称为( )。
A.组中值 B.组平均数 C.组距 D.组数
[答案]A
【例题3·多选题】在组距分组中,确定分组组数须考虑( )。
A.组数尽可能少
B.组数尽可能多
C.尽量保证组间资料的差异性
D.尽量保证组内资料的同质性
E.组数应能被5除尽
[答案]CD
【例题4·单选题】(2006年、2008年)在对数据实行等距分组的情况下,组距与组数的关系是( )。
A.无任何关系 B.反比关系
C.正比关系 D.组距总是组数的5倍
[答案]B
【例题5·单选题】为解决“不重”的问题,统计分组时习惯上规定( )。
A.“不重不漏” B.“组限值应能被 5除尽”
C.“下组限不在内” D.“上组限不在内”
[答案]D
【例题6·单选题】(2007年)对一组数据进行分组,各组的组限依次是“10~20”、“20~30”、“30~40”、“40~50”、“50~60”、“60~70”。在以上这组数据中,50这一数值( )。
A.由于恰好等于组限,不需要分在某一组中
B.分在“50~60”一组中
C.分在“40~50”一组中
D.分在“40~50”或“50~60”任意一组中都可以
[答案]B
【例题7·单选题】(2008年)将一批数据进行分组,各组的组限依次是“110~120”、“120~130”、“130~140” 、“140~150” 、“150~160”,按统计分组的规定,140这一数值( )。
A.不计算在任何一组
B.分在“140~150”这一组中
C.分组“130~140”这一组中
D.分在“130~140”或“140~150”均可
[答案]B