第四部分 统计
1. 按照所采用的计量尺度,可以将统计数据分为分类数据、顺序数据和数值型数据
2. 在统计中,把说明现象某种特征的概念称为变量,变量的具体表现为变量值。变量可以分为分类变量、顺序变量、数值型变量。
3. 数值型变量根据其取值的不同,可以分为离散变量和连续变量。离散变量可以取有限个值,而且其取值都以整位数断开,可以一一列举;连续变量可以取无穷多个值,其取值是连续不断的,不能一一列举。在社会经济问题研究中,当离散变量的取值很多时,也可以将离散变量当作连续变量来处理。
4. 普查是为某一特定目的而专门组织的一次性全面调查,如人口普查、经济普查等。普查是适合特定目的、特定对象的一种调查方式,主要用于收集处于某一时点状态上的社会经济现象的基本全貌,为国家制定有关政策提供依据。
5. 普查是为某一特定目的而专门组织的一次性全面调查,如人口普查、经济普查等。普查是适合特定目的、特定对象的一种调查方式,主要用于收集处于某一时点状态上的社会经济现象的基本全貌,为国家制定有关政策提供依据。
6. 统计报表是我国目前收集统计数据的一种重要方式,统计报表是按照国家有关法规的规定,自上而下地统一布置、自下而上地逐级提供基本统计数据的一种调查方式。统计报表要以一定的原始数据为基础,按照统一的表式、统一的指标、统一的报送时间和报送程序进行填报。
7. 登记性误差是调查过程中由于调查者或被调查者的人为因素所造成的误差。从理论上讲,登记性误差是可以消除的。
8. 代表性误差主要是指在用样本数据进行推断时所产生的随机误差。其产生的原因主要有:(1)抽取样本时没有遵循随机原则;(2)样本结构与总体结构存在差异;(3)样本容量不足等。这类误差通常是无法消除的,但事先可以进行控制或计算。
9. 集中趋势的测度,主要包括位置平均数和数值平均数。位置平均数是指按数据的大小顺序或出现频数的多少确定的集中趋势的代表值,主要有众数、中位数等;数值平均数是指根据全部数据计算出来的平均数,主要有算术平均数、几何平均数等。
10. 众数是一组数据中出现频数最多的那个数值,用M0表示。用众数反映集中趋势,不仅适用于品质数据,也适用于数值型数据。众数是一个位置代表值,不受极端值的影响,抗干扰性强。
11. 把一组数据按从小到大的顺序进行排列,位置居中的数值叫做中位数,用Me表示。中位数主要用于顺序数据,也适用于数值型数据,但不适用于分类数据。中位数也是一个位置代表值,不受极端值的影响,抗干扰性强。
12. 算术平均数是全部数据的算术平均,又称均值,用表示。算术平均数是集中趋势最主要的测度值。它主要适用于数值型数据,但不适用于品质数据。
13. 简单算术平均数主要用于处理未分组的原始数据。
14. 加权算术平均数主要用于处理经分组整理的数据。
15. 计算和运用算术平均数须注意:(1)算术平均数同时受到两个因素的影响,一个是各组数值的大小,另一个是各组分布频数的多少。(2)算术平均数易受极端的影响。
16. n个观察值连乘积的n次方根就是几何平均数。简单的几何平均数的计算公式:
17. 几何平均数的主要用途:(1)对比率、指数等进行平均;(2)计算平均发展速度。
18. 离散程度是指数据之间的差异程度或频数分布的分散程度。离散程度的测度,主要包括极差、方差和标准差、离散系数等。
19. 极差是最简单的变异指标,是总体或分布中最大的标志值与最小的标志值之差,又称全距,用R表示。
20. 极差反映的是变量分布的变异范围或离散幅度,在总体中任何两个单位的标志值之差都不可能超过极差。极差仅仅取决于两个极端值的水平,不能反映其间的变量分布情况,同时易受极端值的影响。
21. 极差、标准差和方差等都是反映数据分散程度的绝对值。离散系数也称标准差系数,它是一组数据的标准差与其相应的算术平均数之比,是测度数据离散程度的相对指标,用 νσ表示,其计算公式为:
22. 离散系数主要是用于比较不同组别数据的离散程度。离散系数大的说明数据的离散程度也就大,离散系数小的说明数据的离散程度也就小。
23. 时间序列由两个基本因素构成:(1)被研究现象所属时间,(2)反映该现象一定时间条件下数量特征的指标值。同一时间序列中,各指标值的时间单位一般要求相等。
24. 时间序列按照其构成要素中统计指标值的表现形式,分为绝对数时间序列、相对数时间序列和平均数时间序列三种类型。
25. 绝对数时间序列是由绝对数指标值按时间先后顺序排列后形成的序列。依据指标值的时间特点,绝对数时间序列又分为时期序列和时点序列
26. 发展水平是时间序列中对应于具体时间的指标数值。在绝对数时间序列中,发展水平就是绝对数;在相对数和平均数时间序列中,发展水平表现为相对数或平均数。
27. 根据各期指标值在计算动态分析指标时的作用来划分,又可以分为基期水平和报告期水平。
28. 平均发展水平也称序时平均数或动态平均数,是对时间序列中各时期发展水平计算的平均数,它可以概括性描述现象在一段时期内所达到的一般水平。时间序列类型不同,计算方法也不同。
29. 权数是每一指标值的持续天数。计算公式为:
30. 相对数或平均数时间序列是派生数列,要计算相对数或平均数时间序列的序时平均数,不能就序列中的相对数或平均数直接进行平均计算;而必须分别求出分子指标和分母指标时间序列的序时平均数,然后再进行对比。
31. 增长量是报告期发展水平与基期发展水平之差,反映报告期比基期增加(减少)的绝对数量。
32. 根据基期的不同确定方法,增长量可分为逐期增长量和累计增长量。
33. 逐期增长量是报告期水平与前一期水平之差。它表明现象逐期增加(减少)的绝对数量
34. 累计增长量是报告期水平与某一固定时期水平(通常是时间序列最初水平)之差,它表明报告期比该固定时期增加(减少)的绝对数量。同一时间序列中,累计增长量等于相应时期逐期增长量之和。
35. 平均增长量是时间序列中逐期增长量的序时平均数,它表明现象在一定时段内平均每期增加(减少)的数量。其计算公式为:
(i=1,2……n)
36. 发展速度是以相对数形式表示的两个不同时期发展水平的比值。计算公式为:发展速度=报告期水平/基期水平