在数理方法这章,我们可以将其可以分为四个部分:概率基础、统计基础、回归分析和时间序列分析。目前股票投资分析的方法主要有三种,基本分析法、技术分析法和量化分析法,而数理方法是分析师进行量化分析的基础。
本文导航 | ||
收藏知识结构图,自我检测 | 学习笔记 | 真题演练,现在开始做 |
一、收藏知识结构图,现在开始做
二、学习笔记
(一)概率基础
1、概率与随机变量的含义、计算和原理
概率含义:概率是对随机事件发生的可能性的度量,范围为0<P<1;
计算和原理:
条件概率 | 给定事件B已经发生的条件下,事件A发生的概率为条件概率,记为P(A∣B) | P(A∣B)=P(A∩B)/P(B) |
联合概率 | 联合概率表示两个事件共同发生的概率,表示为P(AB)或P(A,B)或P(A∩B) | A、B互斥,P(A∩B)=0 A、B为独立事件, P(A∩B)=P(A)P(B) |
边缘概率 | 某个事件发生的概率 | A的边缘概率为P(A) |
随机变量的含义:一个能取得多个可能的数值变量X称为随机变量。若X最多只能取可数的不同值,则为离散型随机变量;若X可以取遍某个期间的任意数值,取值无法一一列出,则我们称之为连续型随机变量。
2、多元分布函数及其数字特征
期望(均值):衡量X取值的平均水平,它是对X所有可能的取值按照其发生概率(P)的大小加权后得到的平均值。E(X)=P1X1+P2X2+...+PnXn。
方差与标准差:衡量数据分布的离散程度,分布越散,其波动性和不可预测性也就越强。应用到投资中,可以计算实际收益率相对预期收益率可能有多大的偏差,即投资回报的风险水平。
协方差:协方差用于描述两个随机变量之间的相关程度,
cov(X,Y)=E(XY)-E(X)E(Y)
相关关系:X和Y之间的相关系数记为ρxy:
,var(X),var(Y)分别代表X和Y的标准差。
相关系数性质:①ρxy一定在-1和1之间;
②若X和Y相互独立,则ρxy=0;
③如果Y=aX+b(a,b≠0),那么∣ρxy∣=1,此时称X和Y是完全相关的。X和Y的值越接近线性关系,∣ρxy∣越大。
(二)统计基础
1、总体、样本和统计量
总体:研究对象的全体称为总体X,把构成总体的每个成员称为个体;
样本:为了了解总体的分布,我们从总体中随机抽取n个个体,记其指标值为X1,X2,...,Xn,则X1,X2,...,Xn称为总体的一个样本,n称为样本容量,样本中的个体称为样品。
统计量:由样本加工得到的量(样本的一个函数)称为统计量,记为f(X1,X2,...,Xn)。
2、统计推断的参数估计
点估计:以样本的统计量(数轴上的一个点)作为总体参数的估计值称为点估计。
区间估计:以一个统计量的区间来估计相应的总体,它要求按照一定的概率要求,根据样本统计量来估计总体参数可能落入的数值范围。区间估计中有三个重要概念,置信区间、置信系数和置信限。
置信区间 | 在特定的可靠性要求下估计总体参数所落的区间范围; |
置信系数 | 被估计的总体参数落在置信区间内的概率P; |
置信限 | 置信界限是对单侧置信区间中的界限以及双侧置信区间的上、下限的统称。 |
(三)回归分析
1、回归模型常见问题和处理方法
多重共线性:对于解释变量X2,...,XK,如果存在不全为0的数λ1,,λ2,...,λn,能使得λ1+λ2X2i+λ3X3i+...+λkXki=0,i=1,2,...n则成解释变量X2,X3,...,XK之间存在着完全的多重共线性。
多重共线性的补救措施:①剔除变量法,删除引起多重共线性的不重要的解释变量;
②变换模型形式,将原设定的模型的形式作适当变换,消除或减弱原模型中解释变量的相关关系;
③利用非样本先验信息;
④横截面数据与时间数据序列并用;
⑤逐步回归法。
异方差性:对于不同的样本点,随机误差项的方差互不相同,就是异方差性。
修正方法:①加权最小二乘法;②重新设定模型
(四)协整分析和误差修正模型
1、协整概念
协整是指某些回见序列是非平稳时间序列,但它们的线性组合却存在长期的均衡关系。虽然两个经济变量有各自的长期波动规律,但是如果它们是协整的,那么它们之间存在一个长期稳定的比例关系。
2、误差修正模型
若变量之间存在协整关系,则表明这些变量间存在着长期均衡关系,而这种长期均衡关系是在短期波动过程的不断调整下得以实现的。
3、常用统计软件:Excel、SPSS、SAS、Minitab、Statistica、Eviews
三、真题演练,现在开始做
1、对回归模型存在异方差问题的主要处理方法有( )。
Ⅰ.加权最小二乘法
Ⅱ.差分法
Ⅲ.改变模型的数学形式
Ⅳ.移动平均法
A.Ⅰ、Ⅱ
B.Ⅰ、Ⅲ
C.Ⅱ、Ⅲ
D.Ⅱ、Ⅳ
【233网校解析】异方差性:对于不同的样本点,随机误差项的方差互不相同,就是异方差性。其修正方法:①加权最小二乘法;②重新设定模型
2、下列关于区间预测的说法中,正确的有( )。
Ⅰ.样本容量n越大,预测精度越高
Ⅱ.样本容量n越小,预测精度越高
Ⅲ.置信区间的宽度在x均值处最小
Ⅳ.预测点X0离x均值越大精度越高
A.Ⅰ、Ⅱ、Ⅲ
B.Ⅱ、Ⅳ
C.Ⅰ、Ⅲ
D.Ⅱ、Ⅲ、Ⅳ
【233网校解析】样本容量n越大,预测精度越高,反之预测精度越低。样本容量一定时,置信区间的宽度在x均值处最小,预测点X0离X均值越小精度越高,越远精度越低。