Ch4-3协方差、相关系数及矩 课件(共26张PPT)- 《概率论与数理统计》同步教学(大连理工·第三版)

资源下载
  1. 二一教育资源

Ch4-3协方差、相关系数及矩 课件(共26张PPT)- 《概率论与数理统计》同步教学(大连理工·第三版)

资源简介

(共26张PPT)
第四章 随机变量的数字特征
4.3 协方差、相关系数及矩
第四章 随机变量的数字特征
内容摘要: 对于二维随机变量(X, Y), 我们除了讨论X与Y的数学期望和方差以外, 还需研究描述X与Y之间相互关系的数字特征.
有关这方面的数字特征有协方差、相关系数和各阶矩.
4.3 协方差、相关系数及矩
4.3.1 提出问题
1. 如何分析两个随机变量之间的
相互关系呢
2. 如何刻画两个随机变量之间线性相关的程度呢
4.3.2 预备知识
1. 数学期望, 方差, 标准差;
2. 线性函数, 矩阵及对称矩阵.
定义1 量E{[X-E(X)][Y-E(Y)]}称为
随机变量X与Y的协方差. 记为Cov(X, Y), 即
Cov(X, Y)= E{[X-E(X)][Y-E(Y)]}. (3.1)

称为随机变量X与Y的相关系数.
注意: ρXY是一个无量纲的量.
4.3.3 提出概念

证明: (1) ρX*Y*=Cov(X*,Y*); (2) ρX*Y*=ρXY .
例4.3.1 设X *, Y *为X与Y的标准化
随机变量, 即
由对称性得到 E(Y*)=0, D(Y*)=1.
先证(1):
再证(2):
=E{[X*-E(X*)][ Y*-E(Y*)]}=E(X*Y*)
=ρXY .
4.3.4 分析性质
定理1 对于任意两个随机变量X和Y, 下列等式成立(设协方差存在):
(1) Cov(X, X)=D(X).
(2) Cov(X, Y)=Cov(Y, X).
(3) 若X与Y相互独立, 则Cov (X,Y)=0.
(4) Cov(X, a)=0, a为常数.
利用数学期望的性质知, 结论(1),(2),(3)和结论(4)成立.
1. 协方差的性质
(8) D(X±Y)=D(X)+D(Y)±2Cov(X, Y). (3.4)
(5) Cov(X, Y)=E(X Y)-E(X)E(Y). (3.3)
(6) Cov(aX, bY)=abCov(X, Y), a, b是常数.
(7) Cov(X+Y, Z)=Cov(X, Z)+Cov(Y, Z).
证 证明(5): Cov(X,Y)=E{[X-E (X)][Y-E(Y)]}
=E[XY-YE(X)-XE(Y)+E(X)E(Y)]
=E(XY)-E(X)E(Y)-E(Y)E(X)+E(X)E(Y)
=E(XY)-E(X)E(Y).
利用协方差和数学期望的性质, 易证结论(6),结论(7)和结论(8)成立.
定理2 设随机变量X与Y的相关系数ρXY
存在, 则有
(1) ρXY = ρYX ;
(2) |ρXY |≤1;
(3) |ρXY |=1的充分必要条件是: 存在常数
a (a≠0), b, 使P{Y=aX+b}=1.
2. 相关系数的性质及实际意义
讲评 我们常利用结论(5) 计算协方差.

结论(1)可由协方差的性质(2)推知.
现证结论(2). 设X *, Y *为X与Y的
标准化随机变量, 由例4.3.1和定理1中性质(8)得到
0≤D(X *±Y *)=D(X *)+D(Y *)±2Cov(X *, Y *)
=D(X*)+D(Y*)±2ρX*Y*
= 1+1±2ρXY
=2(1±ρXY).
由此可得
由(2)可知D(X *±Y *)=2(1±ρXY),
可见,ρXY =±1的充分必要条件是

可知上式又等价于
P{Y=aX+b}=1.
再由
质(5)知, 上式等价于
及方差的性
再证结论(3).
(1) 从这个证明我们还知道, 若a > 0,
有ρXY =1, 这时称X与Y正线性相关; 若a < 0, 有ρXY =-1, 这时称X与Y负线性相关. 一般地, 若ρXY >0, 则称X与Y正相关; 若ρXY <0, 则称X与Y负相关. 当ρXY =0时, 我们称X与Y不相关. 显然, 它等价于X与Y的协方差为零.
讲评
相关系数的实际意义是:|ρXY|的 大小 反映了X与Y的线性相关程度. 当 |ρXY| 较大时, 则X与Y的线性相关程度 较好;当|ρXY|较小时, 则X与Y的线性相关程度较差.
(2) 对于标准化随机变量 和
有相关系数等于协方差, 即
ρXY =ρX*Y* =Cov(X*, Y*).
(5) 对于正态分布, 若(X, Y)服从正态分布, 那么X 和Y相互独立的充要条件是相关系数
ρXY = 0.
(4) 当X与Y相互独立时, X与Y不相关. 但
是, 若X与Y不相关, X与Y不一定相互独立.
(3) 相关系数ρXY刻划的是X与Y之间的
线性关系的强弱.
例4.3.2 再继续解读例3.3.1和例4.2.2:
设二维随机变量(X, Y)的分布律为
X
Y 0 1 p.j
1
2
pi. 1
(1) 计算X与Y的协方差以及相关系数;
(2) 问随机变量X与Y是否独立,
是否不相关呢?
(1) 已知X的数学期望为


于是,随机变量X与Y的协方差为
随机变量X与Y的相关系数为
(2) 由例3.3.1知, 随机变量X与Y相互独立. 随机变量X与Y的相关系数ρXY=0, 即随机变量X与Y不相关.
应注意:随机变量X与Y“不相关”与“独立”并不等价. 参见下例.
由例4.1.2知, 随机变量X和Y的数学期望 E(X)=0和E(Y)=0.
例4.3.3再继续解读例3.3.2和例4.1.2:
设二维随机变量(X, Y)的概率密度为

已知随机变量X与Y不相互独立, 再问连续型随机变量X与Y是否不相关
从而得到Cov(X,Y)=0, 即有 =0.这表明随机变量X和Y是不相关的, 虽然随机变量X与Y不相互独立.
分析上述例题, 得到如下的两个问题:
问题1是, 为什么随机变量X与Y不相互独立呢?
感性上可以这样来理解: 随机点(X,Y)落入单位圆x2+y2≤1内, X与Y之间存在着制约关系X2+Y2≤1. 因此随机变量X与Y不相互独立.
问题2是,既然随机变量X与Y
不相互独立,也就是存在着制约关系,
为什么它们又不相关呢
要注意,现在的制约关系是X2+Y2≤1, 而不是说“存在线性关系”. X和Y不相关只是说明二者之间没有线性关系, 是否有其他(如平方关系)关系并没有回答.
例4.3.4 设二维随机变量 (X, Y)服从二维正态分布, 即
(X, Y)~N (μ1, μ2,σ12,σ22, ρ).
试分析各个参数的意义.
结果是:E(X)=μ1, E(Y)=μ2,
D(X)=σ12, D(Y)=σ22,
ρXY=ρ.
定理3 若(X, Y)服从二维正态分布, 那么X与Y相互独立的充要条件是X与Y不相关.
4.3.5矩的概念
这里再介绍随机变量的另外的几个
数字特征, 它们在后面的数理统计学习中
经常用到.
定义2 设X和Y是随机变量, 若 E(Xk ) ( k=1,2,…)存在, 称它为X的k阶原点矩, 简称
k阶矩.
若 E{[X-E(X)]k} ( k =2,3,…)存在, 称它为X的k阶中心矩.
若 E(X kY l) ( k ,l=1,2,…)存在, 称它为X和
Y的k+l阶混合矩.
若 E{[X-E(X)]k[Y-E(Y)]l } ( k , l =1,2,…)存在, 称它为X和Y的k+l阶混合中心矩.
显然, X的数学期望E(X)是X的一阶原点
矩,方差D(X)是X的二阶中心矩, 协方差Cov
(X, Y)是X和Y的二阶混合中心矩.
下面介绍n维随机变量的协方差矩阵.
cij=Cov(Xi, Xj)
=E{[ Xi-E(Xi)][Xj-E(Xj)]}, i, j=1,2,…, n
都存在, 则称矩阵
为n维随机变量(X1, X2,…, Xn )的协方差矩阵.
由于cij=cji(i≠j, i, j=1,2,…,n), 因而上述矩阵
是一个对称矩阵.
讲评 一般情况下, n维随机变量的
分布是不知道的, 或者是太复杂, 以致在数
学上不容易处理, 因此在实际应用中协方差
矩阵就显得重要了.
4.3.6 内容小结
方差D(X)=E{[X-E(X)]2}描述随机变量X与它的数学期望E(X)的偏离程度, 我们常用公式
D(X)=E(X2)-[E(X)]2
计算方差, 注意E(X2)和[E(X)]2的区别. 计算协方差常用公式
Cov(X,Y)=E(XY)-E(X)E(Y).
思考题:
(1) 当X与Y相互独立时, X与Y是否
不相关? 若X与Y不相关, X与Y是否一定相互独立
(2) 对于正态分布, 若(X, Y)服从正态分布, 那么X和Y相互独立的充要条件是X与Y不相关吗

展开更多......

收起↑

资源预览