4 大数定律与中心极限定理 课件(共64张PPT)-《概率论与数理统计(第三版)》同步教学(人民大学)

资源下载
  1. 二一教育资源

4 大数定律与中心极限定理 课件(共64张PPT)-《概率论与数理统计(第三版)》同步教学(人民大学)

资源简介

(共64张PPT)
第四章
大数定律
及中心极限定理
1
在数学中大家都注意到这样的现象:有时候一个有限的和很难求, 但一经取极限由有限过渡到无限, 则问题反而好办. 例如, 若对某一x,要计算和
而一经取极限,则有
简单的结果
2
事实证明这是可能的,而且在一般情况下和的极限分布就是正态分布,由此可见正态分布的重要性。对和的分布收敛于正态分布的这一类极限定理的研究,在长达两个世纪的时期内成了概率论研究的中心课题,因此得到了“中心极限定理”的名称。本章将列述这类定理中最简单,然而也是最重要的情况。
3
在概率论中,另一类重要的极限定理是所谓“大数定律”。
在第一章中我们已经讨论了“频率的稳定性”。
大量的重复试验中,事件A发生的频率接近某个常数,这个常数实际上就是事件发生的概率。“大数”的意思,就是指试验数目是大量的。
4
§1 切比雪夫不等式
随机变量的方差是刻画它围绕其期望值的离散程度的,因此我们希望用方差来估计随机变量与其期望值之间的偏差大于某一给定正数的概率的上界。
定理
5

设X是连续型随机变量,其概率密度为f(x),则
定理
6
上式可改写为
切比雪夫不等式具体地估算了随机变量X取值时,以数学期望E(X)为中心的分散程度。不难看出,方差D(X)越小,则随机变量X的取值越集中在数学期望E(X)的附近,由此可以进一步体会到方差的概率意义,它刻划了随机变量的分散程度。
如取
7
例 已知正常男性成人血液中,每一毫升白细胞数平均是7300,均方差是700 . 利用切比雪夫不等式估计每毫升白细胞数在5200 ~ 9400之间的概率 .
设每毫升白细胞数为X ,
依题意,E(X) = 7300, D(X) = 7002 ,

由切比雪夫不等式,
8
例 根据过去统计资料,某产品的次品率为p=0.05,试用切比雪夫不等式估计1000件产品中,次品数在40~60之间的概率.

设X表示1000件产品中的次品数,则
由切比雪夫不等式,
9
该数值是非常保守的估计,事实上,由中心极限定理可知,概率约为
注:
10


11


12
§2 大数定律
记作
13
几个常见的大数定律
定理1(切比雪夫大数定律)
设 X1,X2, …是相互独立的随机变量序列,它们都有有限的方差,并且方差有共同的上界,即 D(Xi) ≤C,i = 1,2, …,
则对任意的 有

依概率收敛
14

两边夹,即得结论.
15
解释:
取值接近于其数学期望的概率接近于1.
当n充分大时,
差不多不再是随机的了,
16
定理2(伯努利大数定律)

下面给出的伯努利大数定律,是定理1的一种特例。
设nA是n重伯努利试验中事件A发生的次数,p是事件A发生的概率,则对任给的 ,有
17
引入
i =1,2,…,n


由切比雪夫大数定律,
18
是事件A发生的频率,
伯努里大数定律表明,当重复试验次数n充分大时,事件A发生的频率nA/n与事件A的概率p有较大偏差的概率很小。
这就是频率稳定性的理论解释。
历史上,伯努利第一个研究了这种类型的极限定理,在1713年发表的论文中(这是概率论的第一篇论文!),他建立了以上定理。所以有人认为,概率论的真正历史应从出现伯努利大数定律的时刻算起。
19
下面给出的独立同分布下的大数定律,不要求随机变量的方差存在。
设随机变量序列X1,X2, …独立同分布,具有有限的数学期望 E(Xi) =μ, i=1,2,…,
定理3(辛钦大数定律)
辛钦
辛钦大数定律为寻找随机变量的期望值提供了一条实际可行的途径.
20
例如要估计某地区的平均亩产量,要收割某些有代表性的地块,例如n 块. 计算其平均亩产量,则当n 较大时,可用它作为整个地区平均亩产量的一个估计.
21


其共同的数学期望为
将一枚均匀对称的骰子重复掷n次,则当n 时,求n次掷出点数的算术平均值依概率收敛的极限.
22
§3 中心极限定理
中心极限定理从理论上证明,对于大量的独立随机变量来说,只要每个随机变量在总和中所占比重很小,那么不论其中各个随机变量的分布函数是什么形状,也不论它们是已知还是未知,而它们的和的分布函数必然和正态分布函数很近似。这就是为什么实际中遇到的随机变量很多都服从正态分布的原因,也正因如此,正态分布在概率论和数理统计中占有极其重要的地位。
下面介绍两个常用的中心极限定理。
23
由于无穷个随机变量之和可能趋于∞,故我们不直接研究n个随机变量之和,本身而考虑它的标准化的随机变量
的分布函数的极限.
24
列维一林德伯格中心极限定理
25
(证略)
26
此定理说明,当n充分大时,有

27
例 一生产线生产的产品成箱包装,每箱的重量是随机的,假设每箱的平均重50千克,标准差5千克. 若用最大载重量为5吨的汽车承运,试利用中心极限定理说明每辆车最多可以装多少箱,才能保证不超载的概率大于 0.977.

由列维-林德伯格中心极限定理,有
总重量
28
所以n必须满足
即最多可以装98箱.
29
例 将n个观测数据相加时,首先对小数部分按“四舍五入”舍去小数位后化为整数.试利用中心极限定理估计,

(1) 当n = 1500时, 舍入误差之和的绝对值大于15的概率;
(2) n满足何条件时,能以不小于0.90的概率使舍入误差
之和的绝对值小于10.
根据列维-林德伯格中心极限定理,当 n 充分大时
30
(1)
31
(2)
数据个数 n 应满足条件:
即当 时,才能使误差之和的绝对值小于10的概率不小于0.90.
32
下面给出上述定理的一个重要特例。
33
棣莫弗-拉普拉斯中心极限定理

由列维一林德伯格定理可知,
34
由列维一林德伯格定理可知,
35

即有近似计算公式
36
例 设在某保险公司有1万个人参加投保,每人每年付120元保险费。在一年内一个人死亡的概率为0.006,死亡时其家属可向保险公司领得1万元,问:(1) 该保险公司亏本的概率为多少 (2) 该保险公司一年的利润不少于40, 60, 80万元的概率各是多少

设一年内死亡的人数为X,则
由D-L中心极限定理,
即该保险公司亏本的概率几乎为 0。
37
38
例 (供电问题) 某车间有200台车床,在生产期间由于需要检修、调换刀具、变换位置及调换零件等常需停车。设开工率为0.6,并设每台车床的工作是独立的,且在开工时需电力1千瓦。问应供应多少瓦电力就能以99.9%的概率保证该车间不会因供电不足而影响生产

某一时刻开动的车床数
要求最小的 k, 使
由D-L定理,
39
查表得
所以若供电141.5千瓦,那么由于供电不足而影响生产的可能性不到0.001,相当于8小时内约有半分钟受影响,这一般是允许的。
由D-L定理,
40
例 历史上皮尔逊曾进行过掷硬币的试验,当年皮尔逊掷硬币12000次,正面出现6019次。现在如果我们重复皮尔逊的试验,求正面出现的频率与概率之差的绝对值不大于皮尔逊试验中所发生的偏差的概率。

将一枚均匀硬币抛掷12000次正面出现的次数
由D-L定理,
41
练习:
P105 习题四
1. 2. 3. …
42
End
43
补充题:
3.某射手打靶,得10分、9分、8分、7分、6分的概率分别为0.5,0.3,0.1,0.05,0.05. 现独立射击100次,求总分在900分与930分之间的概率 .
44

由中心极限定理知,
设 X 为100台彩电中出故障的台数,则
45

由中心极限定理知,
46

由中心极限定理,
3.某射手打靶,得10分、9分、8分、7分、6分的概率分别为0.5,0.3,0.1,0.05,0.05. 现独立射击100次,求总分在900分与930分之间的概率 .
47
习题课
48
1、将一枚硬币抛掷10000次,出现正面5800次,是否有理由认为这枚硬币不均匀
解: 设X为10000次试验中出现正面的次数,
若硬币是均匀的, 则
X~B(10000, 0.5),
由D-L定理,
此概率接近于0,故认为这枚硬币不均匀是合理的 .
49
2、假设生产线组装每件成品的时间服从指数分布,统计资料表明每件成品的组装时间平均为10分钟.设各件产品的组装时间相互独立.
(1)试求组装100件成品需要15到20小时的概率;
(2)以95%的概率在16小时内最多可以组装多少件成品

设第i件组装的时间为Xi分钟,i=1,…,100.
利用独立同分布中心极限定理.
(1)
50
(2)
查表得
解得
故最多可组装81件成品。
51
诸Xk 独立同分布,且期望存在,故能使用大数定律,

k=1,2, …
E(Xk)=0.1,
在一个罐子中,装有10个编号为0-9的同样的球, 从罐中有放回地抽取若干次,每次抽一个,并记下号码.
3.
问对序列{Xk},能否应用大数定律?
(1)设
k = 1,2, …
52
(2) 至少应取球多少次才能使“0”出现的频率在0.09-0.11之间的概率至少是0.95
设应取球n次,0出现频率为
由中心极限定理,

53
查表得
54
(3) 用中心极限定理计算在100次抽取中, 数码“0”出现次数在7和13之间的概率.
在100次抽取中, 数码“0”出现次数为
由中心极限定理,

E(Xk)=0.1, D(Xk)=0.09,

55
即在100次抽取中,数码“0”出现次数在7和13之间的概率为0.6826.
56
END
END
57
习题选解
58

8. 某保险公司多年的统计资料表明,在索赔户中被盗户占20%,设X表示在随机抽查的100个索赔户中因被盗向保险公司索赔的户数。
(1)写出X的分布;
(2)利用棣莫弗—拉普拉斯定理,求被盗索赔户不少于14户且不多于30户的概率的近似值。
59
由棣莫弗—拉普拉斯定理,
60

所以
选(D).
61
10. 将n个观测数据相加时,首先对小数部分按“四舍五入”舍去小数位后化为整数.试利用中心极限定理估计,当n = 1500时, 舍入误差之和的绝对值大于15的概率。

根据列维-林德伯格中心极限定理,当 n 充分大时
62
63
本章常用公式
当n充分大时,有
64

展开更多......

收起↑

资源预览