资源简介 (共55张PPT)第四章 数字特征4.1 数学期望4.2 方差4.3 协方差、相关系数及矩前面讨论了随机变量及其分布。 如果我们知道了随机变量 X 的概率分布,那么,关于 X 的全部概率特征也就知道了。然而,在实际问题中,概率分布是较难确定的。且有时在实际应用中,我们并不需要知道随机变量的所有性质,只要知道其一些数字特征就够了。因此,在对随机变量的研究中,确定随机变量的某些数字特征是非常重要的。最常用的数字特征是:期望和方差。第四章 数字特征4.1.1 数学期望的概念4.1 数学期望案例4.1.1 某地区步手枪射击队需要从甲、乙两名射击选手中选拔一名选手参赛。队里决定对两名选手进行 100 次射击测试,并记录他们在 100 次射击中的命中环数与次数,如下所示:如何根据测试的数据对甲、乙两名选手的技术进行评价呢?分析:很难直接从命中环数与次数对选手的技术进行评价,根据这些测试数据计算的平均命中环数显然可以作为其中一个评判标准,这种评判标准也比较公平合理。4.1.1 数学期望的概念4.1 数学期望案例4.1.1解:甲平均命中的环数为乙平均命中的环数为因此从平均命中的环数来看,甲的射击技术水平高于乙。定义4.1.1 设X是离散型随机变量, 概率分布为P{X=ai}=pi , i=1,2, …。也就是说:离散型随机变量的数学期望是一个绝对收敛的级数和。如果收敛, 即 绝对收敛,则称为X 的数学期望(或均值)。4.1 数学期望例4.1.1 某种产品表面疵点数服从参数为 λ=0.8 的泊松分布,规定疵点数不超过 1 个为一等品,价值为 10 元;疵点数大于 1 个、不多于 4 个为二等品,价值为 8 元;疵点数超过 4个为废品。求:(1)每件产品的废品率;(2)每件产品的平均价值。解:(1)设 X 为某种产品表面疵点数,则 X~P(0.8),因为P(X>4)=1-P(X≤4)=所以每件产品的废品率为 0.0014。4.1 例题例4.1.1 某种产品表面疵点数服从参数为 λ=0.8 的泊松分布,规定疵点数不超过 1 个为一等品,价值为 10 元;疵点数大于 1 个、不多于 4 个为二等品,价值为 8 元;疵点数超过 4个为废品。求:(1)每件产品的废品率;(2)每件产品的平均价值。解:(2)设 Y 代表每件产品的价值,那么 Y 的分布律如下:4.1 例题显然E(Y) = 10 × 0.8088 + 8 × 0.1898 + 0 × 0.0014 ≈ 9.61(元)4.1.2 连续型随机变量的数学期望设X是连续型随机变量,密度函数 f(x) 在数轴上取很密的点 x0< x1< x2<…, 则X 落在小区间 [xi , xi+1) 的概率是在小区间[xi, xi+1)上阴影面积≈小区间[Xi, Xi+1)由于xi与xi+1很接近, 所以区间[xi, xi+1)中的值可用 xi 来近似地替代。这正是的渐近和式。阴影面积≈因此, X与以概率取值 xi 的离散型r.v近似,该离散型r.v 的数学期望是定义4.1.2 设X是连续型随机变量,概率密度为f (x), 如果 绝对收敛,则称为X的数学期望。也就是说:连续型随机变量的数学期望是一个绝对收敛的积分值。4.1.2 连续型随机变量的数学期望例 4.1.2 已知随机变量 X 的分布函数为求 E(X) 。解:随机变量 X 的分布密度为故1. 两点分布:X B(1, p), E(X)=p.常用随机变量的数学期望2. 二项分布:X B(n, p),3. 泊松分布: X P( ) ,则 E(X)= .4. 均匀分布 若X ~ U[a, b], 即X服从[a, b]上的均匀分布, 则5. 指数分布 若X 服从参数为 λ 的指数分布,则6. 标准正态分布 若X 服从 ,则4.1.2 随机变量函数的数学期望I. 问题的提出:设随机变量X的分布已知,需要计算的量并非X的期望,而是X的某个函数的期望,比如说是 g(X) 的期望。那么,如何计算呢?一种方法是:由于g(X) 也是随机变量,故应有概率分布,其分布可以由X的分布求出。一旦知道了g(X) 的分布, 就可以按照期望的定义把 E[g(X)] 计算出来。但使用该方法 必须先求出g(X)的分布。一般说来,这是比较复杂的事。那么, 可否不求g(X)的分布,而只根据X的分布来计算 E[g(X)] 呢?答案是肯定的。且有如下公式:定理4.1.1 设X是一个随机变量,Y=g(X),则当X为离散型时, P(X= xk)=pk ;当X为连续型时, X 的密度函数为 f(x)。该公式的重要性在于:当我们求 E[g(X)]时, 不必求g(X)的分布,而只需知道X的分布足矣。这对求 g(X) 的期望带来了极大方便。定理4.1.2 设(X,Y)是二维随机变量,Z = g(X,Y),且 E(Z)存在,于是定理4.1.1可推广到二维随机变量以上的情形:若二维离散型随机向量 (X, Y) 的概率分布为 P(X=ai,Y=bj)=pij, i=1, 2, , j=1, 2, . 则:若二维连续型随机向量(X,Y)的密度函数为 f (x, y), 则:例4.1.3 设(X,Y)的联合概率分布表如下:解:求E(X),E(Y),E(XY)。依题意,X 和 Y 的边缘概率分布如下:得+例4.1.4 设 X P(λ),求 E()。解:(根据泊松分布的期望)例4.1.5 设 X N(0 , 1),求 E()。解:案例 4.1.3 设国际市场上每年对我国某种出口商品的需求量是随机变量 X(单位:吨),它服从区间[2000,4000]上的均匀分布。若售出这种商品1吨,可赚3万元,但若销售不出去,则每吨需付仓储费1万元,问出口多少吨商品才可使平均收益最大?解:设组织货源 t 吨。显然,应要求2000≤t ≤4000。收益Y(单位:万元)是X 的函数Y=g(X)。表达式为由已知条件, 知X的概率密度函为可算得当 t = 3500 时,E(Y)=-2t2 + 14000t-8000000达到最大值 1.55×106。因此,应组织3500吨货源。4.1.3 期望的性质(1). 设C是常数,则E(C)=C;(3). 设 X, Y 相互独立,则 E(XY)=E(X)E(Y);(2). 若a,b是常数,则E(aX+bY)=aE(X)+bE(Y);注意:由E(XY)=E(X)E(Y)不一定能推出X,Y独立推广:推广:(诸Xi 独立时)。例4.1.6 设 ,求 E(X)。解:由常用随机变量的期望可知E(Y)=0因此由期望的蛋白质 可知例4.1.7 设 ,求 E(X)。解:这是求解二项分布期望的一种更加简便的方法。例 4.1.8 设20 个人在第一层进入电梯,楼上有 10 层,每个乘客在任意一层下电梯的可能性是相同的。若某层无乘客下电梯,则电梯不停,求直到乘客下完时电梯停的次数 X 的数学期望。解:设 Xi表示在第i层电梯停的次数,则由于每人在任意一层下电梯的概率均为, 故 20 个人同时不在第i 层下电梯的概率为, Xi的分布律为Xi 0 1pi 1-得E(X)=1-所以有小结例4.1.7和例4.1.8中都是首先把一个比较复杂的随机变量 X 分解成比较简单的随机变量Xi 的叠加,然后根据数学期望的性质通过这些比较简单的随机变量的数学期望,得到 X 的数学期望。在概率论中遇到复杂问题常采用这种分解的方法。前面介绍了随机变量的数学期望。数学体现了随机变量取值的平均水平,是随机变量的重要的数字特征。但在某些场合,仅仅知道平均值是不够的,还需了解其他数字特征。4.2 方差案例 4.2.1 甲、乙两部机床生产同一种机轴,轴的直径为10mm,公差为 0.2mm,即直径 9.8mm~10.2mm 的为合格品,超出范围的均为废品。现从甲、乙两部机床的产品中随机抽取 6 件进行测试,机轴的直径的测试尺寸(单位:mm)如下:分析:从数据看,两部机床产品直径的均值都为 10.0mm,单纯从均值的角度无法比较其优劣。然而,两部机床的生产质量显然差异很大,甲组全为合格品,乙组全为废品,原因在于甲组的离散程度小,质量较稳定,乙组的离散程度大,质量不稳定,这就要用到随机变量取值的稳定性进行判断。请问如何判断这两部机床生产质量的优劣?案例 4.2.2 在股票市场中常用正态分布估计风险资产的收益率。假设某两只标的股票的收益率X和Y分别服从和问该投资者应该投资哪只股票,其依据是什么?分析:从根据数学期望的定义直接计算两只股票的平均收益率都为 0.1。因此从平均收益这个指标无法决定应该选择投资哪只股票。从图 2.4.7 的正态分布概率密度的图形可以看出, 应该选择投资收益率的股票。在许多实际问题中,随机变量的取值对其数学期望的偏离程度是十分重要的,接下来介绍度量偏离程度的数字特征——方差。方差的概念注: 有的书上也将D(X)记成 Var(X)。定义4.2.1 设 X 是一随机变量,若E[X-E(X)]2 存在, 则称其为X 的方差,记成 D(X),即D(X)= E{[X-E(X)]2 };并称 为X的标准差。采用平方是为了保证一切差值[X-E(X)]都起正的作用若X 的取值比较分散,则方差较大。若方差D(X)=0,则 X 以概率1取常数。方差刻划了随机变量的取值对于其数学期望的偏离程度 。若X 的取值比较集中,则方差较小;均值E(X)X为离散型,P{X=xk}=pk由定义知,方差是随机变量X的函数g(X)=[X-E(X)]2的数学期望 。利用定理4.1.1X为连续型,f (x)为密度。方差的计算计算方差的一个简化公式D(X)=E(X2)-[E(X)]2 .展开证:D(X)=E[X-E(X)]2=E{X2-2X E(X)+[E(X)]2}=E(X2)-2[E(X)]2+[E(X)]2=E(X2)-[E(X)]2.利用期望性质例 4.2.1 设 X~B(1,p),求DX 。:解:例 4.2.2 设 X~P(λ),求 DX。解:由4.1节可知,EX=λ,且例 4.2.3 设 X~U(a,b),求DX 。:解:X 的概率密度函数为由4.1 节可知而所以例 4.2.4 设 X~E(λ),求DX 。:解:由4.1 节可知而所以例 4.2.5 设 ,求DX 。:解:由定义可知令 有例 4.2.6 设随机变量X和Y的联合分布在以点(0,1)、(1,0)、(1,1)为顶点的三角形区域上且服从均匀分布,试求随机变量Z=X+Y的期望与方差。解:如图所示的三角形区域 G 的面积是1/2,所以(X,Y)的联合概率密度为于是4.2.2 方差的性质(1). 设C是常数, 则D(C)=0;(2). 若a,b是常数,则D(aX+b)=a2 D(X);(3). 设 X 和 Y 为两个随机变量,则有特别地,若X和Y相互独立,则此式可推广到 n 维随机变量的情形。例4.2.7 设X~B(n,p),q=1-p,求DX。解:4.2.3 常用分布的期望与方差小结本讲介绍了随机变量方差的概念、性质及计算,给出了几种常用随机变量的方差。4.3 协方差、相关系数及矩对于二维随机向量(X,Y), 除了其分量X和Y 的期望与方差之外, 还有一些数字特征, 用以刻画X与Y之间的相关程度,其中最主要的就是下面要讨论的协方差和相关系数。定义4.3.1 若 E{[ X-E(X)][Y-E(Y)]} 存在,则称其为X 与Y 的协方差,记为Cov(X,Y), 即4.3.1 协方差Cov(X, Y) = E{[ X-E(X)][Y-E(Y) ]}. (4.3.1)(3)Cov(X1+X2, Y)= Cov(X1, Y) + Cov(X2, Y);(1)Cov(X, Y) = Cov(Y, X);协方差性质(2)设 a, b, c, d 是常数,则Cov( aX+b, cY+d ) = ac Cov(X, Y) ;(4)Cov(X, Y) =E(XY)-[E(X)][E(Y)] ,(5)D(X+Y)=D(X)+D(Y)+2Cov(X, Y) .当 X 和 Y 相互独立时,Cov(X, Y)=0;例 4.3.1 设二维随机变量(X,Y)的概率密度函数为解:由(X,Y)的联合概率密度函数可得于是求cov(X,Y)。同理可得协方差的大小在一定程度上反映了X 和Y相互间的关系,但它还受X 和Y 本身度量单位的影响。 例如:Cov(aX, bY) = ab Cov(X, Y).为了克服这一缺点,对协方差进行标准化,这就引入了相关系数 。4.3.2 相关系数4.3.2 相关系数为随机变量X 和Y 的相关系数 。定义4.3.2 设D(X) > 0, D(Y) > 0, 则称在不致引起混淆时,记 为 。相关系数性质由于当 X 和 Y 独立时,Cov(X, Y)= 0 .请看下例:(3). X 和Y 独立时, ρ=0,但其逆不真;但ρ=0 并不一定能推出 X 和 Y 独立。定义4.3.3 若ρ=0,称X和Y互不相关。所以,存在常数a, b(b≠0),使 P{ Y = a+bX } = 1 ,即 X 和 Y 以概率 1 线性相关。(2). |ρ|=1例 4.3.2 设θ服从区间[-π,π]上的均匀分布,且X = sinθ,Y = cosθ,判断 X 与 Y 是否不相关及是否相互独立?解:由于于是从而 X 与 Y 不相关,但由于 X 与 Y 满足关系所以 X 与 Y 不独立。例 4.3.3 设二维随机变量, , 求相关系数ρ。解:根据二维正态分布的边缘概率密度可知于是定义4.3.4 设X是随机变量, 若E(Xk) 存在(k =1, 2, …), 则称其为X 的 k 阶原点矩;若 E{[X-E(X)]k} 存在(k = 2,3,…), 则称其为X的 k 阶中心矩。4.3.3 矩与协方差矩阵易知:X 的期望 E(X) 是 X 的一阶原点矩,方差D(X) 是 X 的二阶中心矩。定义4.3.5 设X和Y是随机变量, 若 E(XkYl) 存在(k, l=1, 2,…), 则称其为X与Y的 k+l 阶混合原点矩;若 E{[X-E(X)]k [Y-E(Y)]l}存在(k, l=1,2, …, 则称其为X与Y的 k+l 阶混合中心矩。4.3.3 矩与协方差矩阵矩实际上是随机变量某些函数的数学期望,其计算方法与随机变量函数的数学期望计算方法一样。将随机向量 (X1, X2) 的四个二阶中心矩排成一个2×2矩阵 ,则称此矩阵为(X1, X2)的方差与协方差矩阵,简称协方差阵。4.3.3 矩与协方差矩阵都存在为(X1, X2, …, Xn) 的协方差阵。则称矩阵定义4.3.5 若n维随机变量( X1,X2,…,Xn)的 1+1 阶混合中心矩由协方差的性质可知是一个对称矩阵,它给出了 n 维随机变量的全部方差及协方差,对于研究 n 维随机变量的统计规律具有重要意义。小结本讲首先介绍二维随机向量 (X,Y) 的分量X与Y 的协方差及相关系数的概念、性质和计算;然后介绍随机变量的各种矩(k 阶原点矩、 k 阶中心矩、k+m 阶混合原点矩、k+m 阶混合中心矩),n 维随机向量的协方差阵的概念、性质和计算。六种常用随机变量的期望与方差小结 展开更多...... 收起↑ 资源预览