2.计数资料
定义:将全体观测单位按照某种性质或特征分组,然后再分别清点各组观察单位的个数。
特点:没有度量衡单位、通过枚举或记数得来、多为间断l生资料。
3.等级资料
定义:介于计量资料和计数资料之间的一种资料,通过半定量方法测量得到。
特点:每一个观察单位没有确切值,各组之间有性质上的差别或程度上的不同。
(二)统计学中的重要概念
1.变量
研究者对每个观察单位的某项特征进行观察和测量,这种特征称为变量,变量的测得值叫变量值(也叫观察值)。
2.变异
变异是指同质事物个体间的差异。变异来源于一些未加控制或无法控制的甚至不明原因的因素,变异是统计学存在的基础,从本质上说,统计学就是研究变异的科学。
3.总体与样本
总体:根据研究目的确定的研究对象的全体。当研究有具体而明确的指标时,总体是指该项变量值的全体。
样本:是总体中有代表性的一部分。
现实研究中,直接研究总体的情况是很困难或者不可能的,因此实际工作中往往从总体中抽取部分样本,目的是通过样本信息来推断总体的特征。
4.随机抽样
是指按随机的原则从总体中获取样本的方法,以避免研究者有意或无意地选择样本而带来偏性。随机抽样是统计工作中常用的抽样方法。
5.概率
概率是描述随机事件发生的可能性大小的数值,常用P来表示。概率的大小在0和1之间,越接近1,说明发生的可能性越大,越接近0,说明发生的可能性越小。统计学中的许多结论是带有概率性质的,通常一个事件的发生小于5%,就叫小概率事件。
6.误差
统计上所说的误差泛指测量值与真值之差,样本指标与总体指标之差。主要有以下两种:
(1)系统误差
指数据搜集和测量过程中由于仪器不准确、标准不规范等原因,造成观察结果呈倾向性的偏大或偏小,这种误差称为系统误差。
特点:具有累加性。
(2)随机误差
由于一些非人为的偶然因素使得结果或大或小,是不确定、不可预知的。
特点:随测量次数的增加而减小。
随机误差包括随机测量误差和抽样误差。
1)随机测量误差。在消除了系统误差的前提下,由于非人为的偶然因素,对于同一样本多次测定结果不完全一样,结果有时偏大有时偏小,没有倾向性,这种误差叫随机测量误差。其特点:没有倾向性,多次测量计算平均值可以减小甚至消除随机测量误差。
2)抽样误差。是由于抽样原因造成的样本指标与总体指标之间的差别。其特点:抽样误差不可避免。统计上可以估计抽样误差,并在一定范围内控制抽样误差。
通常可以通过改进抽样方法和增加样本量等方法来减少抽样误差。