资源简介 (共26张PPT)第五章 大数定律和中心极限定理5.2 中心极限定理5.2 中心极限定理第五章 大数定律和中心极限定理内容摘要:中心极限定理是概率论中最著名的结果之一, 它不仅提供了计算独立随机变量之和的近似概率的方法, 而且有助于解释为什么很多自然现象的统计规律服从正态分布这一值得注意的重大事实.(1) 为什么正态分布在概率论中占有极其重要的地位?(3) 大样本统计推断的理论基础是什么?5.2.2 预备知识(2) 随机变量之和的分布是什么?5.2.1 提出问题随机事件的概率,随机变量的均值、方差. 在实际问题中, 常常需要考虑许多随机因素所产生的总影响. 这些随机因素是相互独立的, 而其中每一个个别因素所起的作用都是微小的.这种量一般都服从或近似服从正态分布.5.2.3 分析问题例如, 炮弹射击的落弹着点与目标的偏差, 就受着许多随机因素的影响. 如瞄准时的误差,空气阻力所产生的误差,炮弹或炮身结构所引起的误差等.例如,开展物理试验实验所出现的测量误差,等等.对我们来说重要的是这些随机因素的总影响.现在我们就来研究独立随机变量之和所特有的规律性问题,解决“总影响”的概率分布问题. 一般情况下, 很难求出 X1 + X2 + … + Xn分布的确切形式 , 但当 n 很大时, 可以求出这个和的近似分布. 当n无限增大时, 这个和的极限分布是什么呢?一般情况下它服从正态分布.在什么条件下极限分布会是正态 分布的呢? 我们把在一定条件下, 随机变量和的分布收敛于正态分布这一类定理都叫做中心极限定理.本节只介绍三个常用的中心极限定理.5.2.4 建立理论 的标准化变量则随机变量之和设 X1,X2, …,Xn是独立同分布的随机变量 序列,且 E(Xi)= , D(Xi)= , i=1,2,…,n,1. 独立同分布中心极限定理定理1(独立同分布中心极限定理) 这个定理通常也称为列维-林德伯格(Levy-Lindeberg)中心极限定理.的分布函数 ,对于任意x满足证明略.(2.1)这个定理说明了以下4种概率分布形式:(2.2)(1) 对于均值为μ , 方差为 的独立同分布(不管服从什么分布)的随机变量的和 的标准化随机变量,当充分大时, 近似成立:(2) 对上式变形得到,随机变量和(即随机变量的总影响)近似成立:(2.3)将(5.2.2)式左端改写成这样,上述结果可写成另外两种常用的形式:(3) 随机变量的算术平均 的标准化近似成立:(2.4)(4) 对上式变形得到,随机变量的算术平均 近似成立:(2.5)这是独立同分布中心极限定理结果的另一个形式. 这一结果是数理统计中大样本统计推断的理论基础.5.2.5 方法应用例5.2.1 设各零件的重量都是随机变量, 它们相互独立, 且服从相同的分布,其数学期望为0.5kg, 均方差为0.1kg, 问5000只零件的总重量超过2510kg的概率是多少?解 设Xi表示第i只零件的重量, 则E(Xi)=0.5, D(Xi)=0.1. 于是5000只零件的总重量X= .例5.2.2 一生产线生产的产品成箱包装, 每箱的重量是随机的. 假设每箱平均重50千克, 标准差为5千克. 若用最大载重量为5吨的汽车承运, 试利用中心极限定理说明: 每辆车最多可以装多少箱, 才能保证不超载的概率大于0.977(已知Φ(2)=0.977).所以由独立同分布中心极限定理知,解n 是所求箱数. 由条件可以把X1,X2,…,Xn视为独立同分布随机变量, 而n箱的总重量以 装运的第i箱的重量(单位:千克),Tn=X1+X2+…+Xn是独立同分布随机变量之和.由条件知E(Xi)=50, =5,根据独立同分布中心极限定理(2.3)式, Tn近似服从正态分布N(50n,25n). 由题设条件, 应满足得E(Tn)=50n, =5 .解得n<98.0199, 即每辆车最多可以装98箱.根据分布函数Φ(x)的单调递增性, 有讲评 上述例题均是从不同角度考察独立同分布中心极限定理的应用问题, 如在例5.2.3中将各箱重量视为独立同分布的随机变量, 利用独立同分布中心极限定理作随机变量和的正态分布近似计算.下面介绍另一个中心极限定理, 它是定理1的特殊情况.定理2(棣莫佛-拉普拉斯定理)独立同分布中心极限定理的特例设随机变量ηn 服从参数为n, p(0正态分布是二项分布的极限分布2. 棣莫佛-拉普拉斯定理(2.7)棣莫佛-拉普拉斯资料可分解成为n个相互独立且都服从同一0-1分布的随机变量之和,证即有由于由定理1得其中Xk的分布律为此定理的常用形式是:ηn~B(n, p),(2.8)若则讲评(1) 这个定理表明, 正态分布是二项分布的极限分布, 当n充分大时, 我们可以利用(5.2.7)式来计算二项分布的概率.(2) 注意,二项分布也以泊松分布为极限分布. 但当n较大p较小时, 泊松定理比中心极限定理更精确一些.例5.2.3 用中心极限定理再计算例2.2.3问题(1):在次品率为0.04的 100件产品中,求这批产品中不少于4件次品的概率.用X表示100件产品中的次品数,则解利用二项分布概率公式计算得到P{4≤X≤100}≈0.570 5.用泊松定理计算 P{4≤X≤100}≈0.566 9.由棣莫弗-拉普拉斯中心极限定理得例5.2.4 某药厂试制了一种新药, 声称对贫血患者的治疗有效率达到80%. 医药监管部门准备对100个贫血患者进行此药的疗效试验, 若这100人中至少有75人用药有效, 就批准此药生产. 如果该药的有效率确实达到80%, 此药被批准生产的概率是多少 解 用Sn表示这n=100个患者中用药后有效的人数.如果该药的有效率确实是p=80%, 则Sn~B(n, p). 由定理2,得到该新药被批准的概率为5.2.5 内容小结(1)为何正态分布在概率论中占有极其重要的地位?由中心极限定理即可明确这一点.(3) 大样本统计推断的理论基础:随机变量和服从正态分布, 算术均值服从正态分布.(2) 随机变量之和的分布是什么?是服从正态分布.棣莫弗(A.dé movie,1667—1754), 法国著名数学家,最早发现(1721或更早)正态分布是二项分布的极限形式者,并且最早(1730)对于成功的概率为0.5的情形证明了上述事实.拉普拉斯(P. S. M. de Laplace, 1749—1827),著名法国数学家、天文学家和物理学家, 在概率论、天体力学和势函数理论方面有重要贡献. 他在概率论方面的主要著作是《概率分析理论》,给出了古典型概率的定义,最早阐明了正态分布理论,并对一般情形证明了棣莫弗-拉普拉斯定理(1812);建立了误差理论,奠定了最小二乘法的理论基础. 展开更多...... 收起↑ 资源预览