我们将一个能取得多个可 能值的数值变量X称为随机变量。比如,规定对于某A公司发行的债券定义违约变量:那么Default就是一个随机变量。又如,A公司发行的普通股股价在未来某一天
的收盘价S可以是5元,
很多情况下,我们不仅需要了解数据的期望值和平均水平,还要了解这组数据分布的离散程度。分布越散,其波动性和不可预测性也就越强。尤其对于投资者而言,不仅关心投资的期望收益率,也关心实际收益率相对预期的收益
方差和标准差除了应用于分析投资收益率,还可以用来研究价格指数、股指等的波动情况。例如,我们选取上证指数(Index) 2014年4月每日收盘价后,可以依次计算出其样本均值= 2026.25, 样本方差
分位数通常被用来研究随机变量X以特定概率(或者一组数据以特定比例)取得大于等于(或小于等于)某个值的情况。直接计算X的分位数比较困难,尤其是X分布未知时,所以我们用样本
X1,···,Xn来估计分位数
中位数是用来衡量数据取值的中等水平或一般水平的数值。 对于随机变量X来说,它的中位数就是上50%分位数X50%,这意味着X的取值大于其中位数和小于其
中位数的概率各为50%。对于一组数据来说,中位数就
正是由于中位数能够代表一般水平,在基金投资管理领域中,经常应用中位数
来作为评价基金经理业绩的基准。基金经理的个人回报也往往取决千其管理基金
的表现相对于中位数基准有多好。与另一个经常用来反映数据一般
如果X是离散型的,X最多可能取n个值 X1,X2,...,Xn,并且记pi=P{X=Xi}
是X取Xi的概率,所有概率的总和如果X是一个连续型随机变量,由于无法列出X取每个特定值的概率,我们改用概率密
知道随机变量的分布后,需要进一步研究分布的特点和规律,如取值的平均水平、离散程度等。用来衡量这些分布特点的数值统称为数字特征,如均值、方差等。
在现实世界中我们面对的随机变量通常是未知分布的,无法直接求得其数字特征,因而采取抽样的方法来估计它们,即选择X的一组样本Xi, …, Xn , 然后构造适当的函数g(X1, … , Xn )来作为X分
随机变量X的期望(或称均值,记做E(X))衡量了X取值的平均水平,它是对X所有可能取值按照其发生概率大小加权后得到的平均值。在X的分布未知时,用抽取样本X1,…,Xn的算术平均数(也称样本均值)作为E