导读
第二十四章描述统计需理解数据特征测度,掌握集中趋势的测度指标、离散趋势的测度指标、分布形态的测度指标以及变量间关系的测度指标的计算方法,辨别常用测度数据。
加学霸君微信领取PDF版
一、考情分析
本章每年考试分值在4-5分。
学习要求:
①理解数据特征测度
②掌握集中趋势的测度指标、离散趋势的测度指标、分布形态的测度指标以及变量间相关关系的测度指标的计算方法
③辨别常用测度数据。
二、核心考点梳理
考点1:中位数
定义:把一组数据按从小到大或从大到小的顺序进行排列,位置居中的数值叫作中位数,用Me表示。
不适于分类变量,适于顺序变量和定量变量,特别是分布不对称的数据。
①优点是不受极端值的影响;
②缺点是没有充分利用数据的全部信息,稳定性差于均值,优于众数。
【2023年真题·单选题】在某企业中随机抽取 7 名员工,以了解该企业 2022 年员工参加志愿服务情况。 这 7 名员工 2022 年参加志愿服务天数(单位:天)分别为:0、4、4、6、7、8、13,这组数据的中位数是( )。
A. 4
B. 6
C. 7
D. 8
把一组数据按从小到大或从大到小的顺序进行排列,位置居中的数值叫作中位数。本题是奇数,取中间值=6
考点2:标准分数
标准分数也称为Z分数,是统计上常用的一种标准化方法,转变后的标准分数并没有改变数值在原分布中的位置,也没有改变数据原分布的偏度。标准分数的平均数为0,标准差为1。
在实际应用中,当数据服从对称的钟形分布时,可以运用经验法则来判断与均值的距离在特定倍数标准差之内的数据项所占比例。
(1)经验法则表明:
①约有68%的数据与平均数的距离在1个标准差之内;
②约有95%的数据与平均数的距离在2个标准差之内;
③约有99%的数据与平均数的距离在3个标准差之内。
(2)对于服从对称的钟形分布的标准分数,68%的标准分数在[-1,+1]范围内,约有95%的标准分数在[-2,+2]范围之内,约有99%的标准分数在[-3,+3]范围之内。
【2023年真题·单选题】对于服从对称钟形分布的标准分数,根据经验法则,68%的标准分数在( )范围内。
A. [-2,+2]
B. [-3,+3]
C. [-6,+6]
D. [-1,+1)
经验法则表明:
选项D正确;①约有68%的数据与平均数的距离在1个标准差之内;
选项A错误;②约有95%的数据与平均数的距离在2个标准差之内;
选项B错误;③约有99%的数据与平均数的距离在3个标准差之内。
选项C为干扰项
考点3:偏态系数
定义:测度数据分布偏度的统计量称为偏态系数。
(1)偏态系数取决于离差三次方的平均数与标准差三次方的比值。
①如果偏态系数等于0,说明数据的分布是对称的;
②如果偏态系数为正值,说明分布为右偏的,取值在0和0.5之间说明轻度右偏,取值在0.5和1之间说明中度右偏,取值大于1说明严重右偏;
③如果偏态系数为负值,说明分布为左偏,取值在0和-0.5之间说明轻度左偏,取值在-0.5和-1之间说明中度左偏,取值小于-1说明严重左偏。
(2)偏态系数的绝对值越大,说明数据分布的偏斜程度越大。
(正右负左0不偏)
【2023年真题·单选题】一组数据的偏态系数为 0.85,则该组数据的分布为()。
A. 中度左偏
B. 中度右偏
C. 严重左偏
D. 严重右偏
如果偏态系数为正值,说明分布为右偏的。
取值在0和0.5之间说明轻度右偏;选项B正确;
取值在0.5和1之间说明中度右偏;选项D错误
取值大于1说明严重右偏。如果偏态系数为负值,说明分布为左偏。
取值在0和-0.5之间说明轻度左偏;选项A错误;
取值在-0.5和-1之间说明中度左偏;
选项C错误;(3)取值小于-1说明严重左偏。
考点4:均值
适于定量变量,不适用于分类和顺序变量。
①优点是能够充分利用数据的全部信息,均值大小受每个观测值的影响,比较稳定;
②缺点是易受极端值的影响,如果观测值中有明显的极端值,则均值的代表性较差。
【2023年真题·多选题】下列变量的观测数据中,可以用方差测度集中趋势的有()
A. 性别
B. 企业登记注册类型
C. 产品销额
D. 体重
E. 身高
集中趋势是指一组数据向某一中心值靠拢的程度,它反映了一组数据中心点的位置所在。标准差与方差只适用于数值型数据。
本题干中AB属于定性数据,不适用方差测度 ‘
综上所述本题选CDE。
考点5:相关系数
1、定义:相关系数是度量两个变量间相关关系的统计量。最常用的相关系数是Pearson相关系数,它度量的是两个变量间的线性相关关系。
2、Pearson相关系数 -1≤r≤1
①若0<r≤1,表明存在正线性相关关系。
②若-1≤r<0,表明存在负线性相关关系。
③r=1,完全正线性相关,r=-1,完全负线性相关。
④r=0,不存在线性相关关系。
当,高度相关;0.5≤,中度相关,0.3≤|r|<0.5,低度相关,当|r|<0.3时,说明两个变量之间的相关程度极弱,可视为无线性相关关系。
注:Pearson相关系数只适用于线性相关关系的判断。
(1)r=0只表示两个变量之间不存在线性相关关系,并不说明变量之间没有任何关系,比如它们之间可能存在非线性相关关系。
(2)变量之间的非线性相关程度较大时,就可能会导致r=0。
(3)因此,当r=0或很小时,不能轻易得出两个变量之间不存在相关关系的结论,而应结合散点图做出合理的解释。
【2023年真题·多选题】如果两个变量观测值的 Pearson相关系数为-0.9, 则这两个变量之间的关系为( )
A. 高度相关
B. 负相关
C. 因果关系
D. 线性相关
E. 不相关
根据实际数据计算出的r,其取值范围一般为-1<r<1。在说明两个变量之间的线性关系的强弱时,根据经验可将相关程度分为以下几种情况:
当|r|≥0.8时,可视为高度相关;
当0.5≤|r|<0.8时,可视为中度相关;
当0.3≤|r|<0.5时,可视为低度相关;
当|rl<0.3时,说明两个变量之间的相关程度极弱,可视为无线性相关关系。
温馨提示:文章由作者233网校-oyjl独立创作完成,未经著作权人同意禁止转载。