第4章随机变量的数字特征课件(共77张PPT)- 《概率论与数理统计》同步教学（哈工程版）

资源简介

(共77张PPT)
随机变量的数字特征
4.1
数学期望
4.3
协方差与相关系数矩与协方差矩阵
4.2
方差
目录
在第2章和第3章中，我们研究了一维随机变量及多维随机变量的分布，全面地描述了随机变量的各种特性.但在很多实际问题中，往往不需要或者很难求出随机变量的所有统计规律，而只需要知道随机变量的某些特征就可以了.例如，要出厂一批灯泡，我们只关心它们的平均使用寿命及与平均使用寿命的偏离程度.再如，在研究某地居民的年收入时，我们只感兴趣于该地居民的年平均收入及与平均收入的偏离程度，等等.这些与随机变量有关的数值，称之为随机变量的数字特征.本章将介绍随机变量的数学期望和方差，以及两个随即变量之间的协方差和相关系数.
4.1 数学期望
4.1.1 数学期望的定义
数学期望是随机变量重要的数字特征之一，简单地说，数学期望就是随机变量可能取值的“平均值”，但这种平均不是大家所熟悉的算术平均，而是一种“加权平均”.
例如，在大学中每一学年结束都要考查每个学生的总评成绩，假设一个学生在这一学年中一共学习了n门课程，且
记，则该生这一学年的总评成绩为
.
这就是成绩的加权平均值，其中是成绩的权，且数列满足分布列的两条性质，即非负性和规范性.由此我们引入离散型随机变量的数学期望.
定义4.1 设离散型随机变量X的分布列为
如果级数绝对收敛，则称级数的和为随机变量X的数学期望，即
.
若级数不绝对收敛，则称随机变量X的数学期望不存在.
数学期望一般简称为期望或均值，即以概率为权的随机变量取值的加权平均值.
若X为连续型随机变量，其概率密度为，则X落在区间内的概率可近似地表示为，它与离散型随机变量分布列中的类似，再利用无穷限广义积分的定义，可以给出下面的定义：
4.1.1 数学期望的定义
定义4.2 设连续型随机变量X的概率密度为，若广义积分绝对收敛，则称积分的值为随机变量X的数学期望.即
.
若广义积分不绝对收敛，则称随机变量X的期望不存在.
4.1.1 数学期望的定义
例4-1 某商场进行有奖销售，摇箱中有红、黄、蓝、白、黑5种颜色的球，其对应的奖金额分别为10 000元、1 000元、100元、10元、1元.假定摇箱中红、黄、蓝、白、黑5种颜色球的比例分别为0.01%，0.15%，1.34%，10%，88.5%.求每次摇奖摇出的奖金额X的数学期望.
解由题意X的分布列为
所以
.
可见，平均起来每次摇奖的奖金额不足6元.这个值对商场的预算是很重要的.
4.1.1 数学期望的定义
例4-2 设随机变量X的取值，，则
.
但由于级数不收敛，因此X的数学期望不存在.
例4-3 设随机变量X的概率密度为
求X的数学期望 .
解
下面来计算常见分布的数学期望.
4.1.1 数学期望的定义
4.1.2 常见分布的数学期望
1.（0-1）分布
设随机变量X的分布列为
.
则
.
2.二项分布
设随机变量，其分布列为
.
则
3. 泊松分布
设随机变量，其分布列为
则
4. 几何分布
设随机变量X ，其分布列为
其中，则
4.1.2 常见分布的数学期望
5.超几何分布
设随机变量，其分布列为
则，具体计算过程见例4-10.
6.均匀分布
设随机变量，其密度函数为
所以
.
4.1.2 常见分布的数学期望
7.指数分布
设随机变量，其密度函数为
则
4.1.2 常见分布的数学期望
8. 正态分布
设随机变量，其密度函数为
，
则
，
令，则，代入得
,
其中
，，
故此时
4.1.2 常见分布的数学期望
在实际问题与理论研究中，我们经常需要求随机变量函数的数学期望.例如，我们后面要学习的方差、协方差等都是函数的数学期望.下列定理给出具体的做法.
4.1.3 随机变量函数的数学期望
定理4.1 设Y是随机变量X的函数，其中是连续函数.
（1）设X是离散型随机变量，其分布列为如果级数绝对收敛，则
.
（2）设X是连续型随机变量，其概率密度为，若广义积分绝对收敛，则
.
上述定理中离散型的结论很容易证明，只要利用2.4节的内容求出Y的分布列，再利用定义4.1即可得到（1）中的结论.连续型情况的证明超出本书范围，这里不予证明.
通过定理4.1可以看出，要求函数Y的数学期望，并不需要求出Y的分布，只要根据X的分布即可求出.
上述定理还可以推广到两个或两个以上随机变量的情形.
4.1.3 随机变量函数的数学期望
定理4.2 设Z是随机变量的函数，其中是连续函数.
（1）若是离散型随机变量，其分布列为如果级数绝对收敛，则
.
（2）设是连续型随机变量，其概率密度为，若积分绝对收敛，则
.
特别地，有
；
.
4.1.3 随机变量函数的数学期望
例4-4 设随机变量X的分布列为
若，，求， .
解由定理4.1得
，
.
4.1.3 随机变量函数的数学期望
例4-5 设某商场对一种家电的销售采用先使用后付款的方式，并规定凡使用寿命在1年以内的，付款1 500元；在年的付款2 000元；在年的付款2 500元；在3年以上的付款3 000元.若该家电的使用寿命 .试写出商场对这种家电每台收款数Y的分布列，并求出Y的数学期望.
解由题意知，X的分布函数为
并且事件等价于，所以
.
类似可得
；
；
.
综上，Y的分布列为
4.1.3 随机变量函数的数学期望
则其数学期望为
例4-6 对球的直径X做测量，设其服从区间上的均匀分布，求球的体积的数学期望.
解设球的体积为Y，则，由题意知X的密度函数为
所以
.
4.1.3 随机变量函数的数学期望
例4-7 设国际市场对我国某种出口商品的需求量X服从上的均匀分布.已知该商品每售出1吨，可得外汇3万美元，但若销售不出去，则每1吨要花费1万元的储存费.试问每年要准备多少货源，才能使平均收益最大.
解设准备的货源为N吨，也就是供货量，显然N是上的某个常数.设收益为随机变量Y，Y与需求量X及货源量N有关，其关系式为
这是因为供不应求时，销售量即为货源量；而供过于求时，销售量即为需求量.
由定理4.1知
即当时达到最大.所以每年应准备3 500吨该商品，才能使平均收益最大.
4.1.3 随机变量函数的数学期望
例4-8 设随机变量的概率密度为
求和 .
解由定理4.2知
4.1.3 随机变量函数的数学期望
4.1.4 数学期望的性质
下面讨论数学期望的几条重要性质.
设以下所涉及的随机变量的数学期望都存在.
性质1 ，其中C为任意常数.
性质2 ，其中C为任意常数.
性质3 任意随机变量X和Y，有 .
推论1 ，a，b为任意常数.
推论2 ,a，b为任意常数.
推论3 任意随机变量 ,常数，有
.
性质4 若随机变量X和Y相互独立，则 .
推论4 若随机变量相互独立，则
.
性质5 若随机变量，则 .
推论5 若，则 .
推论6 对任意随机变量有 .
4.1.4 数学期望的性质
证仅就连续型的情况来证明性质3和性质4.其他情况留给读者自行证明.
（3）设随机变量的概率密度为，则
同理可以得到推论1、推论2和推论3.
（4）设X的密度函数为，Y的密度函数为，则
由上述证明过程可见推论4成立.
至于性质5，利用期望的定义及级数和积分的保号性可以得到.
4.1.4 数学期望的性质
例4-9 设随机变量，，，并且它们相互独立，求 .
解由于相互独立随机变量的函数仍然独立，所以
其中， , ，故
.
4.1.4 数学期望的性质
例4-10 设N件产品中有M件次品，其余为正品.现从中无放回地取出n件产品，随机变量X表示取出的次品数,求X的数学期望.
解由题意知X服从的是超几何分布，故可利用性质来求其期望.首先将每次试验的结果假设为随机变量
,
且的分布列为 ,则 .
显然，故
.
所以超几何分布的数学期望为 .
4.1.4 数学期望的性质
例4-11 某生产线上生产出一个不合格品的概率为p，当生产出k个不合格品时,就要停工检修一次，求两次检修之间产品总数X的数学期望.
解设随机变量表示第个不合格品出现后到第i个不合格品出现为止所生产的产品数， .则
， .
而，故
.
4.1.4 数学期望的性质
4.2 方差
在4.1节中引入了描述随机变量取值的“平均值”－－数学期望这一概念，但在很多情况下仅知道这个数字特征还不够，通常还需要知道随机变量取值对于期望的平均离散程度.例如，用机器包装某种食品，不仅要知道各袋重量X的平均值EX的大小，还要知道各袋重量对EX的平均偏离程度.在平均重量合格的情况下，平均偏离程度较小，表示机器工作稳定，否则认为机器工作不正常.再如，随机变量，，虽然，但显然Y对其期望的平均偏离远远大于X对其期望的平均偏离.
如何来衡量随机变量对其期望的平均偏离程度呢？人们自然想到考查的平均值，但，因为的正负值相互抵消了，所以没有什么意义.若考虑的平均值，则会带来数学计算上的诸多不便，故综合各方面的因素，采用指标来描述随机变量X对其期望EX的平均偏离程度.
4.2.1 方差的定义
定义4.3 设X是一个随机变量，若存在，则称其为X的方差(variance),记为，即
.
称为随机变量X的标准差或均方差.
随机变量的方差反映了随机变量X的取值与期望EX的偏离程度.若越小，则X的取值越集中；反之，越大，则X的取值比较分散.
由方差的定义可以看出，方差实际就是函数的期望，根据函数数学期望的求法可知：
若离散型随机变量X的分布列为则
.
若连续型随机变量X的概率密度为，则
.
由此可见，方差和期望一样是一个常数，它由随机变量的分布唯一决定.
01
02
根据期望的性质，可以得到计算方差的另一个简便公式：
.
事实上，
类似也可得，等，在不同的题目中可以选择不同的公式来简化计算.
4.2.1 方差的定义
例4-12 有甲、乙两名射手，他们每次射击命中的环数分别为X，Y，已知X，Y的分布列为
问谁的射击技术更高.
解首先利用期望的定义可以得到
（环），
（环）.
因为，所以从期望的角度无法分出谁的射击水平更高，故此时需要通过方差的大小来比较，而
，
.
显然，由此可见乙的技术更高，更稳定些.
4.2.1 方差的定义
例4-13 求例4-3中随机变量X的方差DX.
解已经求得EX=1，利用公式DX ，只需求出即可.
于是，DX .
4.2.1 方差的定义
4.2.2 常见分布的方差
1.（0-1）分布
随机变量X的分布列为 .期望，
.
所以DX .
2.二项分布
随机变量，其期望，利用公式，其中
所以 .
3.泊松分布
设随机变量，期望，利用公式，其中
所以 .
4.几何分布
设随机变量X ，期望，利用公式，其中
所以 .
4.2.2 常见分布的方差
5.超几何分布
随机变量，期望，方差，这个需要利用方差的性质，计算从略.
6.均匀分布
随机变量，期望，
.
所以 .
4.2.2 常见分布的方差
7.指数分布
随机变量，期望，
所以DX .
4.2.2 常见分布的方差
8.正态分布
随机变量，期望，利用定义，
，
令，则，代入得
,
利用分部积分的计算得
.
特别地，如果，由边缘分布知其中，所以 .
对于这些常见分布的期望和方差一定要记住，在后面的计算中经常会用到.
4.2.2 常见分布的方差
4.2.3 切比雪夫不等式
定理4.3 设随机变量X的期望EX与方差DX都存在，则对任意，有
,
等价形式为
.
证这里仅对连续型随机变量的情况进行证明.设随机变量X的密度函数为，则
，
因为在该积分范围内，所以，利用积分的保号性得
对于切比雪夫不等式，要注意以下几点：
只有当时，切比雪夫不等式才有实际意义.
显然由不等式可以得到，当固定时，DX越小,事件的概率就越大，即X的取值就越集中在EX附近；而DX越大，事件的概率就越小，即X的取值就越分散.说明，方差刻画了随机变量取值的离散程度.
切比雪夫不等式利用随机变量的期望EX和方差DX给出了事件的概率的一个大致估计，在理论研究和实际应用中很有价值.
01
02
03
4.2.3 切比雪夫不等式
4.2.4 方差的性质
设下面所涉及的随机变量的方差都存在，则方差具有以下几点性质：
性质1 对任意随机变量X，有 ,且的充分必要条件是存在常数C，使得 .
性质2 对任意常数a，b有 .
性质3 对任意的随机变量X，Y，任意常数a，b有
.
特别地，当X与Y相互独立时，
.
推论若随机变量相互独立，则
.
性质4 对任意的常数C有不等式 .
证性质1 显然 .当时，由切别雪夫不等式知，对任意的，有
，
由的任意性可知
，
所以 .反之，若，则， ,从而DX=0.
性质2 .
4.2.4 方差的性质
性质3 当X与Y独立时，也相互独立，所以
，
于是
.
性质4 对任意的常数C，有
因为，所以 .
性质4说明随机变量X的取值与期望EX的偏离是所有偏离中最小的，也说明X的取值集中EX附近.
4.2.4 方差的性质
例4-14 设有随机变量X，，称为X的标准化，证明 .
证，
.
例4-15 设随机变量独立同分布，，，令，求的期望和方差.
解，
.
4.2.4 方差的性质
例4-16 设活塞的直径，气缸的直径 .X与Y相互独立，任取一只活塞和气缸，求活塞能装入气缸内的概率.
解按题意要求，令，由3.5节可知，Z仍然服从正态分布，且
，
.
即
.
故有
4.2.4 方差的性质
4.3 协方差与相关系数矩与协方差矩阵
对于二维随机变量，期望反映了两个变量X，Y各自的平均值，方差反映了X，Y对于各自平均值的离散程度，它们虽然对于了解的分布有一定帮助，但是并没有反映X和Y之间的关系.在很多实际问题中，每对随机变量之间往往相互影响、相互联系.本节将引入协方差和相关系数两个数字特征来描述两个随机变量之间的联系.
4.3.1 协方差
从方差的性质3中可以看到，如果两个随机变量X和Y相互独立，则有
.
这表明，当时，X与Y不相互独立，存在一定的关系.
定义4.4 设随机变量X，Y，若存在，则称之为随机变量X和Y的协方差，记作，即
.
显然，方差是协方差的特例， .
容易验证
.
4.3.1 协方差
这是计算协方差的常用公式.
根据协方差的定义，容易得到具有以下性质：
（1）若X，Y相互独立，则；
（2） ,其中C为任意常数；
（3）；
（4），其中为任意常数；
（5） .
（6） .
（7）设为随机变量，为任意常数，则
.
例4-17 已知X，Y的协方差存在，求：
（1），其中的常数；
（2），，其中为相应随机变量的标准化.
解（1）利用性质（4）得
.
（2）；
由于，同理，所以
4.3.1 协方差
随机变量的协方差虽然反映了随机变量之间的联系，但是由例4-17可以看出它的数值会受到计量单位的影响.如例4-1中， .但是如果对于例4-17中的问题（2），先将随机变量标准化，再取其协方差，则可克服这一缺陷.由此引入了两个随机变量相关系数的概念.
4.3.2 相关系数
定义4.5 设随机变量X，Y，若，协方差存在，则称
为随机变量X与Y的相关系数.在不致混淆时，也简记为.
显然，相关系数与协方差之间的关系除了上述定义外，还有以下几点需要注意：
（1）；
（2）；
（3）相关系数与协方差具有相同的正负号.
例4-18 已知随机变量的分布列为
求， .
4.3.2 相关系数
解由公式，，其中
；
；
；
；
；
所以，
；
；
代入公式，可得
，
.
4.3.2 相关系数
例4-19 设，求， .
解已知，由得
令，得
4.3.2 相关系数
根据正态分布的期望可知
，
所以
由于是标准正态分布的密度函数，所以按照函数期望的定义可知，积分
，
故
.
由公式，易得
上述例子中，若二维正态分布为，则两分量的相关系数为参数.若，则 .
下面来看一下相关系数的两个性质：
4.3.2 相关系数
定理4.4 设是随机变量X和Y的相关系数，则
（1）；
（2）是存在常数，使得 .
证（1）对任意随机变量X，Y及任意常数t，有
，
即
，
由t的任意性，上式是以t为变量的二次函数，故其判别式 .于是可得到
，
即
，
故 .
4.3.2 相关系数
（2）若等价于上述二次函数的判别式，而的等价条件为二次函数有唯一解，不妨设为a,即 .由方差的性质1可知，存在常数b使得 .故是存在常数使得 .
由此可见，随机变量的相关系数实质上表示随机变量之间的线性相关性.当时，X与Y之间存在概率为1的线性关系.当较大时，就说X与Y线性相关程度较好；当较小时，就说X与Y线性相关程度较差.当时，称X和Y正相关，这时其中一个量增加，另一个量也有增加的趋势；当时，称X和Y负相关，这时其中一个量的值增加，另一个量的值则有减少的趋势.特别地，当时，我们有如下定义：
4.3.2 相关系数
定义4.6 若随机变量X与Y的相关系数，则称X与Y不相关.
根据相关系数的意义可知，所谓的不相关只是说明X与Y不存在线性关系，但可以存在其他形式的线性关系.
例4-20 设，，，这里是常数，求 .
解；；
；
；
.
所以
，
.
4.3.2 相关系数
当时，，此时Y与Z之间存在线性关系：；
当时，，此时Y与Z之间存在线性关系：；
当时，，此时，，显然Y与Z不相关，但 .
在具体的计算中，对于不相关除了定义外，还有下列的这些等价条件.读者要熟练掌握，灵活运用.
4.3.2 相关系数
定理4.5 对随机变量X与Y，下列事实是等价的：
（1）X与Y不相关；
（2）；
（3）；
（4） .
4.3.2 相关系数
例4-21 设随机变量X与Y不相关，且， .求随机变量与的相关系数.
解由于X与Y不相关，所以
；
；
.
故相关系数
.
注意到，当X与Y独立时，定理4.5的结论也都成立，所以X与Y相互独立，则X与Y一定不相关；但反之，若X与Y不相关，X与Y不一定相互独立.
4.3.2 相关系数
例4-22 设随机变量服从区域上的均匀分布.
（1）求相关系数；
（2）说明X与Y是否独立.
解的联合密度函数为
，
，
由于被积函数为奇函数，且积分域为对称区域，所以 .同理， .
,
4.3.2 相关系数
因此 .显然存在且不等于零，故有 ,即X与Y不相关.
而
类似可得
可见，所以X与Y不独立.
一般情况下，由不相关不能推出相互独立，但对最常用的正态分布，不相关和相互独立是一致的.
4.3.2 相关系数
例4-23 设，试证明X与Y相互独立的充分必要条件为X与Y不相关.
证由例3.14 知X与Y相互独立的充分必要条件为 .而 ,所以也表示X与Y不相关.故对于二维正态分布，两个分量独立与不相关是等价的.
4.3.2 相关系数
4.3.3 矩与协方差矩阵
数学期望、方差和协方差都是随机变量最常用的数字特征，把它们推广到更一般的情况就有如下矩的定义.矩是统计学中最基本也是最重要的概念之一.
定义4.7 设是随机变量，则有以下定义：
（1）若存在，称之为随机变量X的k阶原点矩.
（2）若存在，称之为随机变量X的k阶中心矩.
（3）若存在，称之为随机变量X和Y的的阶混合矩.
（4）若存在,称之为随机变量X和Y的阶混合中心矩.
显然，数学期望EX为X的一阶原点矩，方差DX为X的二阶中心矩，而协方差为X和Y的二阶混合中心矩..
例4-24 设随机变量，求X的二阶原点矩 .
解 .
定义4.8 设n维随机变量的二阶混合中心矩
都存在，则矩阵
称为的协方差矩阵.
由于所以协方差矩阵是一个对称矩阵.
4.3.3 矩与协方差矩阵
例4-25 设，写出的协方差矩阵.
解由第3章的讨论知，，因此
；，
又由例4-19知
.
所以的协方差矩阵是
.
4.3.3 矩与协方差矩阵
习题 4
1.变量X的分布列为，求 .
2.设随机某商店出售一种小商品，每销售一件可赚15元，每天的销售量X为一个随机变量.根据以往的经验，X取值为0，1，2，3件的概率分别为0.4，0.3，0.2，0.1.求一天的平均利润.
3.某保险公司规定，如果在一年内顾客投保的事件发生，保险公司就赔偿顾客a（元），若一年内事件发生的概率为p，为使公司在每位投保顾客身上收益的期望值等于a的10%，问该公司应该要求顾客交多少保险费.
4.一批零件中有9个合格品与3个废品，在安装机器时，从这批零件中任取一个，如果取出的是废品就不再放回去.求在取得合格品前已取出的废品数的数学期望和方差.
习题 4
5.设随机变量X的密度函数为
求及 .
6.二维随机变量的密度函数为
求：
（1）EY；
（2） .
习题 4
7.设随机变量X的密度函数为
已知，求：
（1）的值；
（2）的期望和方差.
8.设X，Y相互独立，概率密度分别为
.
求EX， .
习题 4
9.已知的联合分布列为
（1）试求，；
（2）问X，Y是否相关？是否独立
10.某公司经销某种原料，根据以前的资料可知这种原料的市场需求量X（单位：t）服从上的均匀分布.每售出1 t该原料，公司可获利1.5千元；若积压1t，则公司损失0.5千元. 问公司应组织多少货源，可使平均收益最大.
习题 4
11.一客车载有20位旅客，沿途有10个停车点，如果到达一个停车点没有人下车就不停车，设每位旅客在各个停车点下车是等可能的，且旅客是否下车相互独立.以X表示停车次数，求 .
12.设二维随机变量的联合密度函数为
求， .
13.设随机变量有，求 .
14.设随机变量X，Y独立且都服从，求 .
习题 4
15.设离散型随机变量X的概率分布列为
求的数学期望.
16.已知X服从参数为1的指数分布，且，求EY和DY.
习题 4
17.已知， .设随机变量，求：
（1）EZ，DZ；
（2）求X与Z的相关系数 .
18.已知是n个独立同分布且方差有限（不为零）的随机变量，记，证明与的相关系数为 .
谢谢观看

展开更多......

收起↑

请用微信扫码

第4章随机变量的数字特征 课件(共77张PPT)- 《概率论与数理统计》同步教学（哈工程版）

第4章随机变量的数字特征 课件(共77张PPT)- 《概率论与数理统计》同步教学（哈工程版）

第4章随机变量的数字特征课件(共77张PPT)- 《概率论与数理统计》同步教学（哈工程版）

第4章随机变量的数字特征课件(共77张PPT)- 《概率论与数理统计》同步教学（哈工程版）