资源简介 (共26张PPT)第四章 随机变量的数字特征4.3 协方差、相关系数及矩第四章 随机变量的数字特征内容摘要: 对于二维随机变量(X, Y), 我们除了讨论X与Y的数学期望和方差以外, 还需研究描述X与Y之间相互关系的数字特征.有关这方面的数字特征有协方差、相关系数和各阶矩.4.3 协方差、相关系数及矩4.3.1 提出问题1. 如何分析两个随机变量之间的相互关系呢 2. 如何刻画两个随机变量之间线性相关的程度呢 4.3.2 预备知识1. 数学期望, 方差, 标准差;2. 线性函数, 矩阵及对称矩阵.定义1 量E{[X-E(X)][Y-E(Y)]}称为随机变量X与Y的协方差. 记为Cov(X, Y), 即Cov(X, Y)= E{[X-E(X)][Y-E(Y)]}. (3.1)而称为随机变量X与Y的相关系数.注意: ρXY是一个无量纲的量.4.3.3 提出概念证证明: (1) ρX*Y*=Cov(X*,Y*); (2) ρX*Y*=ρXY .例4.3.1 设X *, Y *为X与Y的标准化随机变量, 即由对称性得到 E(Y*)=0, D(Y*)=1.先证(1):再证(2):=E{[X*-E(X*)][ Y*-E(Y*)]}=E(X*Y*)=ρXY .4.3.4 分析性质定理1 对于任意两个随机变量X和Y, 下列等式成立(设协方差存在):(1) Cov(X, X)=D(X).(2) Cov(X, Y)=Cov(Y, X).(3) 若X与Y相互独立, 则Cov (X,Y)=0.(4) Cov(X, a)=0, a为常数.利用数学期望的性质知, 结论(1),(2),(3)和结论(4)成立.1. 协方差的性质(8) D(X±Y)=D(X)+D(Y)±2Cov(X, Y). (3.4)(5) Cov(X, Y)=E(X Y)-E(X)E(Y). (3.3)(6) Cov(aX, bY)=abCov(X, Y), a, b是常数.(7) Cov(X+Y, Z)=Cov(X, Z)+Cov(Y, Z).证 证明(5): Cov(X,Y)=E{[X-E (X)][Y-E(Y)]}=E[XY-YE(X)-XE(Y)+E(X)E(Y)]=E(XY)-E(X)E(Y)-E(Y)E(X)+E(X)E(Y)=E(XY)-E(X)E(Y).利用协方差和数学期望的性质, 易证结论(6),结论(7)和结论(8)成立.定理2 设随机变量X与Y的相关系数ρXY存在, 则有(1) ρXY = ρYX ;(2) |ρXY |≤1;(3) |ρXY |=1的充分必要条件是: 存在常数a (a≠0), b, 使P{Y=aX+b}=1.2. 相关系数的性质及实际意义讲评 我们常利用结论(5) 计算协方差.证结论(1)可由协方差的性质(2)推知.现证结论(2). 设X *, Y *为X与Y的标准化随机变量, 由例4.3.1和定理1中性质(8)得到0≤D(X *±Y *)=D(X *)+D(Y *)±2Cov(X *, Y *)=D(X*)+D(Y*)±2ρX*Y*= 1+1±2ρXY=2(1±ρXY).由此可得由(2)可知D(X *±Y *)=2(1±ρXY),可见,ρXY =±1的充分必要条件是取可知上式又等价于P{Y=aX+b}=1.再由质(5)知, 上式等价于及方差的性再证结论(3).(1) 从这个证明我们还知道, 若a > 0,有ρXY =1, 这时称X与Y正线性相关; 若a < 0, 有ρXY =-1, 这时称X与Y负线性相关. 一般地, 若ρXY >0, 则称X与Y正相关; 若ρXY <0, 则称X与Y负相关. 当ρXY =0时, 我们称X与Y不相关. 显然, 它等价于X与Y的协方差为零.讲评相关系数的实际意义是:|ρXY|的 大小 反映了X与Y的线性相关程度. 当 |ρXY| 较大时, 则X与Y的线性相关程度 较好;当|ρXY|较小时, 则X与Y的线性相关程度较差.(2) 对于标准化随机变量 和有相关系数等于协方差, 即ρXY =ρX*Y* =Cov(X*, Y*).(5) 对于正态分布, 若(X, Y)服从正态分布, 那么X 和Y相互独立的充要条件是相关系数ρXY = 0.(4) 当X与Y相互独立时, X与Y不相关. 但是, 若X与Y不相关, X与Y不一定相互独立.(3) 相关系数ρXY刻划的是X与Y之间的线性关系的强弱.例4.3.2 再继续解读例3.3.1和例4.2.2:设二维随机变量(X, Y)的分布律为XY 0 1 p.j12pi. 1(1) 计算X与Y的协方差以及相关系数;(2) 问随机变量X与Y是否独立,是否不相关呢?(1) 已知X的数学期望为解而于是,随机变量X与Y的协方差为随机变量X与Y的相关系数为(2) 由例3.3.1知, 随机变量X与Y相互独立. 随机变量X与Y的相关系数ρXY=0, 即随机变量X与Y不相关.应注意:随机变量X与Y“不相关”与“独立”并不等价. 参见下例.由例4.1.2知, 随机变量X和Y的数学期望 E(X)=0和E(Y)=0.例4.3.3再继续解读例3.3.2和例4.1.2:设二维随机变量(X, Y)的概率密度为解已知随机变量X与Y不相互独立, 再问连续型随机变量X与Y是否不相关 从而得到Cov(X,Y)=0, 即有 =0.这表明随机变量X和Y是不相关的, 虽然随机变量X与Y不相互独立.分析上述例题, 得到如下的两个问题:问题1是, 为什么随机变量X与Y不相互独立呢?感性上可以这样来理解: 随机点(X,Y)落入单位圆x2+y2≤1内, X与Y之间存在着制约关系X2+Y2≤1. 因此随机变量X与Y不相互独立.问题2是,既然随机变量X与Y不相互独立,也就是存在着制约关系,为什么它们又不相关呢 要注意,现在的制约关系是X2+Y2≤1, 而不是说“存在线性关系”. X和Y不相关只是说明二者之间没有线性关系, 是否有其他(如平方关系)关系并没有回答.例4.3.4 设二维随机变量 (X, Y)服从二维正态分布, 即(X, Y)~N (μ1, μ2,σ12,σ22, ρ).试分析各个参数的意义.结果是:E(X)=μ1, E(Y)=μ2,D(X)=σ12, D(Y)=σ22,ρXY=ρ.定理3 若(X, Y)服从二维正态分布, 那么X与Y相互独立的充要条件是X与Y不相关.4.3.5矩的概念这里再介绍随机变量的另外的几个数字特征, 它们在后面的数理统计学习中经常用到.定义2 设X和Y是随机变量, 若 E(Xk ) ( k=1,2,…)存在, 称它为X的k阶原点矩, 简称k阶矩.若 E{[X-E(X)]k} ( k =2,3,…)存在, 称它为X的k阶中心矩.若 E(X kY l) ( k ,l=1,2,…)存在, 称它为X和Y的k+l阶混合矩.若 E{[X-E(X)]k[Y-E(Y)]l } ( k , l =1,2,…)存在, 称它为X和Y的k+l阶混合中心矩.显然, X的数学期望E(X)是X的一阶原点矩,方差D(X)是X的二阶中心矩, 协方差Cov(X, Y)是X和Y的二阶混合中心矩.下面介绍n维随机变量的协方差矩阵.cij=Cov(Xi, Xj)=E{[ Xi-E(Xi)][Xj-E(Xj)]}, i, j=1,2,…, n都存在, 则称矩阵为n维随机变量(X1, X2,…, Xn )的协方差矩阵.由于cij=cji(i≠j, i, j=1,2,…,n), 因而上述矩阵是一个对称矩阵.讲评 一般情况下, n维随机变量的分布是不知道的, 或者是太复杂, 以致在数学上不容易处理, 因此在实际应用中协方差矩阵就显得重要了.4.3.6 内容小结方差D(X)=E{[X-E(X)]2}描述随机变量X与它的数学期望E(X)的偏离程度, 我们常用公式D(X)=E(X2)-[E(X)]2计算方差, 注意E(X2)和[E(X)]2的区别. 计算协方差常用公式Cov(X,Y)=E(XY)-E(X)E(Y).思考题:(1) 当X与Y相互独立时, X与Y是否不相关? 若X与Y不相关, X与Y是否一定相互独立 (2) 对于正态分布, 若(X, Y)服从正态分布, 那么X和Y相互独立的充要条件是X与Y不相关吗 展开更多...... 收起↑ 资源预览