4.3协方差与相关系数 课件(共28张PPT)- 《概率论与数理统计(第3版)》同步教学(机工版)

资源下载
  1. 二一教育资源

4.3协方差与相关系数 课件(共28张PPT)- 《概率论与数理统计(第3版)》同步教学(机工版)

资源简介

(共28张PPT)
第四章知识结构图
随机变量的数字特征
数学期望
方差
矩与协方差矩阵
一维随机变量的数学期望
二维随机变量的数学期望
一维随
机变量的方差
二维随
机变量的方差
离散型
连续型
连续型
离散型
相关系数与协方差
机变量的某一方面的特征,
随机变量的数学期望及方差都只刻画了一个随
第三节 协方差与相关系数
问题的引出
多维随机变量分量之间关系的数字特征.
如果两个随机变量 X,Y 相互独立 ,
这就意味着若:
X, Y 不相互独立, 而是存在着一定的关系.
则:

数是刻画两个随机变量之间关系的数字特征.
而协方差与相关系
协方差与相关系数
注意到:
一. 协方差
1.定义1.

称为随机变量
X 与 Y 的协方差,记为:
即:
协方差中当 X = Y 时即为方差的定义,即:
故方差是协方差的特例。
2. 协方差的简单性质
是常数

显然,若 X 与 Y 相互独立则:
3. 计算协方差的一个简单公式
由协方差的定义及期望的性质,可得:
证明:
4. 随机变量和的方差与协方差的关系
Cov(X, Y)= 0

若 X1, X2, …, Xn 两两独立,上式化为:
协方差的大小在一定程度上反映了X 和 Y 相互间的关系,但它还受 X与Y 本身度量单位的影响.
为了克服这一缺点,对协方差进行标准化,
这就引出了相关系数的概念。
问题:
例如:
称为随机变量
二. 相关系数
1.定义2.
量(无量纲)
X, Y 的相关系数,记为:
即:
2. 相关系数的简单性质
存在常数
使得:
X 和 Y 以概率 1 线性相关

则上式为:
证明:
由方差的性质和协方差的定义知,对任意实数
有:
由于方差D(Y)是正的,故必有:
所以证得:
由方差与协方差协关系有:
因此有:
证明:
存在常数
使得:

是标准化随机变量,
故其均值为 0,方差为 1
由方差的性质,可知:
整理得 :

时有:
为常数
其中:
同理,当 时也可推出此结论。因此得证。

所以:
协方差定义
于是得:
所以:
即:
当 X 和 Y 相互独立时, 但其逆不真.
由于当 X 和Y 独立时,Cov(X, Y)= 0,故

并不一定能推出 X 和 Y 相互独立。

例1.
设 在 上服从均匀分布,即:
验证: 与 是不相关的,但不是相互独立的。
证明:
由已知,X, Y 的边缘概率密度为:

又因为:
显然,
所以:

是不相关的
所以:
从而有:
于是得:
故得:
是不相互独立的。
奇函数在对称区间上的积分为 0
当 时,称 X与 Y不相关。
一般:
故有:
若 X 与 Y 相互独立,则 X
与 Y不相关;但反之不真
但对下述情形,独立与不相关等价
若 ( X, Y ) 服从二维正态分布,则
X 与 Y 相互独立
X 与 Y 不相关
1.
2.
相关系数刻划了X 和 Y 间“线性相关”的程度.
若考虑以 X 的线性函数 a + bX 来近似表示 Y;
以均方误差
来衡量用
a + bX 近似表示 Y 的好坏程度。

则e 值越小表示 a + bX 与 Y 的近似程度越好.
现用微积分中求极值的方法,求出使 e 达到最小时的 a,b :
e = E {[ Y- ( a + bX ) ]2 }
= E( Y 2 ) + b 2 E( X 2 )+ a 2- 2b E( XY )
令:
+ 2ab E( X ) - 2a E( Y )
数学期望性质
解得:
这样求出的
最佳逼近为:
L(X)=a0+b0X
这一逼近的剩余是:
则 Y 与 X 有严格线性关系;
可见:
则 Y 与 X 无线性关系;
的值越接近于1,Y 与 X 的线性相关程度越高;



则当:
的值越接近于0, Y 与 X 的线性相关程度越弱.
例2.
设 (X, Y) 服从二维正态分布,它的概率密度为:
求:X 与 Y 的相关系数
解:
由已知,X, Y 的边缘概率密度为:
其数学期望与方差分别为:
而:
于是:
结论:
其积分过程见教材P130
二维正态分布的概率密度函数中的五个参
数的意义分别为:X 的数学期望与方差;
Y 的数学期望与方差;X 与Y 的相关系数。
二维正态分布完全由这五个参数所确定。
第四章知识结构图
随机变量的数字特征
数学期望
方差
矩与协方差矩阵
一维随机变量的数学期望
二维随机变量的数学期望
一维随
机变量的方差
二维随
机变量的方差
离散型
连续型
连续型
离散型
相关系数与协方差
矩是随机变量的更为广泛的一种数字特征,
前面介绍的数学期望及方差都是某种矩.
第四节 矩与协方差矩阵
一. 矩
定义:
设 和 是随机变量
则称它为 的 阶原点
(1).
(2).
若 存在,
简称 阶矩。
矩,
若 存在,
则称它为 的 阶中心矩。
(3).
若 存在,
则称它为
和 的 阶混合矩。
(4).
若 存在,
则称它为
和 的 阶
混合中心矩。
数学期望 是随机变量 的一阶原点矩;
方差 是随机变量 的二阶中心矩;
二阶混合中心矩。
协方差 是随机变量



二. 协方差矩阵
将它们排成矩阵的形式:
称此矩阵为(X1, X2)的协方差矩阵.
这是
一个
对称
矩阵
定义:
若二维随机变量(X1, X2)的四个二阶中心矩
都存在,分别记为:
类似可定义 n 维随机变量( X1, X2, …, Xn )
的协方差矩阵.
为( X1, X2, …, Xn ) 的协方差矩阵
都存在.
i, j = 1, 2,…, n


则称矩阵:

f ( x1, x2, …, xn )
则称 X 服从 n 元正态分布.
C 是( X1, X2, …, Xn ) 的协方差矩阵.
|C| 是它的行列式, 表示 C 的逆矩阵.
X 和 是 n 维列向量, 表示 X 的转置.
设 =( X1, X2, …, Xn )是一个 n 维随机向量,若
它的概率密度为:
n 维正态分布的概率密度的定义.

其中:
推导过程见浙大教材P135
n 元正态分布的四条重要性质
X = ( X1, X2, …, Xn ) 服从 n 维正态分布的充
分必要条件是:对一切不全为零的实数:
a1, a2, …, an , ( X1, X2, …, Xn ) 的任意线性组
合:a1X1+ a2 X2+ …+ an Xn 均服从一维正态
分布.

(1).
(2).
若 X = ( X1, X2, …, Xn ) 服从 n 维正态分布,
Y1, Y2, …,Yk 是 Xj(j = 1, 2,…, n)的线性
函数,则 ( Y1, Y2, …,Yk ) 也服从多维正态
分布.
这一性质称为正态变量的线性变换不变性.
若 X = ( X1, X2, …, Xn ) 服从 n 维正态分布,
则它的每一个分量 Xj(j = 1, 2,…, n)都服从
(3).
正态分布;
设 ( X1, X2, …, Xn ) 服从 n 维正态分布,则:
(4).
“ X1, X2, …, Xn 相互独立 ” 与
“ X1, X2, …, Xn 两两不相关 ”
是等价的。
上述的四条性质在后续的“随机过程”
与“数理统计”课程中会经常用到。
反之,若 都服从
X1, X2, …, Xn
正态分布,且相互独立,
则 (X1, X2, …, Xn )
服从 n 维正态分布。
设随机变量 X 和 Y 相互独立,且 X ~ N ( 1, 2 ),
Y ~ N (0, 1 ).
故: X 和 Y 的联合分布为正态分布,
X 和 Y 的任意线性组合是正态分布.
X ~ N ( 1, 2 ), Y ~ N ( 0, 1 ),且 X 与 Y 独立
D( Z ) = 4D( X ) + D( Y ) = 8 + 1 = 9
E( Z ) = 2E( X ) - E( Y ) + 3 = 2 + 3 = 5
即: Z ~ N ( E(Z),D(Z) )

试求:Z = 2X – Y + 3 的概率密度
解:
因为:
而:
故: Z 的概率密度为:
Z ~ N ( 5, 32 )
所以:

展开更多......

收起↑

资源预览