资源简介 (共94张PPT)第6章参数估计1在数理统计的许多问题中,总体的分布类型往往假定是已知的,例如,大批灯泡的寿命服从正态分布,纺织厂细纱机上的断头次数服从普阿松分布,抽检若干件产品中所含的次品数服从二项分布,等等。但仅仅知道分布的类型是不够的,还需确定分布函数中的未知参数,才能求得所要求的概率。这就提出了参数估计的问题。参数估计分为点估计和区间估计两种。2§1 点估计3一、矩法(The Method of Moments)其基本思想是用样本矩估计总体矩 .它是基于一种简单的“替换”思想建立起来的一种估计方法 .是英国统计学家 K.皮尔逊最早提出的 .矩法估计的理论基础是:辛钦大数定律.4记总体 k 阶矩为样本 k 阶矩为用相应的样本矩去估计总体矩的估计方法就称为矩估计法。记总体 k 阶中心矩为样本 k 阶中心矩为5比较:样本方差6例解例所以θ的矩估计量为7例解8例解9二、最大似然估计法最大似然法,也叫极大似然法,它最早是由高斯所提出的,后来由英国统计学家费歇(R·A·Fisher)于1912年在其一篇文章中重新提出,并且证明了这个方法的一些性质.最大似然估计这一名称也是费歇给的.它是建立在最大似然原理的基础上的一个统计方法.为了对最大似然原理有一个直观的认识,我们先来看几个例子.(The Method of Maximum Likelihood)10最大似然法的基本思想先看一个简单例子:一只野兔从前方窜过。是谁打中的呢?某位同学与一位猎人一起外出打猎。如果要你推测,你会如何想呢 只听一声枪响,野兔应声倒下。11下面我们再看一个例子,进一步体会最大似然法的基本思想 .你就会想,只发一枪便打中,猎人命中的概率一般大于这位同学命中的概率。看来这一枪是猎人射中的 .这个例子所作的推断已经体现了最大似然法的基本思想。12设有外形完全相同的两个箱子,甲箱有99个白球1个黑球,乙箱有1个白球99个黑球。今随机地抽取一箱,然后再从这箱中任取一球,结果发现是白球。问这球是从哪一个箱子中取出的 分析 导致结果是白球的原因有两个,一个是这球从甲箱取的,另一个就是这球从乙箱取的。如果是从甲箱取的,则取得白球的概率为99%;如果是从乙箱取的,则取得白球的概率为1%,由此看到,这球是从甲箱中取出的概率比从乙箱中取出的概率要大得多,因此很自然的,我们认为结论“这球是从甲箱中取出的”比结论“这球是从乙箱中取出的”要合理得多。最后我们作出推断,这球是从甲箱取出的。13最大似然估计法的基本思想:根据样本值来选择参数,使该样本发生的概率最大。具体做法如下:为“似然函数”。14求最大似然估计(MLE)的一般步骤是:取对数,求得驻点,即得θ的最大似然估计量。15例解令16令解得17解例 设一批产品中含有次品,从中随机抽取85件,发现次品10件,试用最大似然估计法估计这批产品的次品率。似然函数为18解似然函数为解得 p 的最大似然估计值为19解例 设总体 X 服从指数分布,其密度函数为(1)(2)20(2)得21解例 设总体 X 的概率密度为总体 X 的数学期望为得θ的矩估计量为22似然函数为23解得θ的最大似然估计量为比较:θ的矩估计量为24例解的密度函数为似然函数为25比较:θ的矩法估计量为26由上例,我们看到对于同一个未知参数,由不同的方法可以得到不同的估计量。在本例中,如果X表示乘客的候车时间,随机抽样得到的5位乘客的候车时间为 0.5, 1, 2, 3.5, 8,则其矩估计值为6,而其最大似然估计值为 8。27例解下面再举两个离散型总体的例子。概率函数为似然函数为28解得 p 的最大似然估计量为29例如,设一批产品中含有次品,且从中随机抽取85件,发现次品10件,则这批产品的次品率的最大似然估计值为30解X 服从几何分布,所以 p 的矩估计量为例 设总体 X 的概率密度为(1) 矩估计法:31解得 p 的最大似然估计量为解(2) 最大似然估计法:32练习:P143 习题六3. 5.33第二节估计量的评价标准34对于同一个参数,用不同的方法可以得到不同的估计量。现在的问题是,当同一参数出现多个估计量时,究竟哪一个更好呢?这就涉及到用什么标准来评价估计量的问题。确定估计量好坏的标准必须是整体性的,说得明确一点就是,必须在大量观察的基础上从统计的意义上来评价估计量的好坏。也就是说。估计的好坏取决于估计量的统计性质。一般认为,一个“好”的估计量应该具有如下的条件:35一、无偏性 (Unbiasedness)估计量是随机变量,对于不同的样本值就会得到不同的估计值,希望估计值在未知参数真值左右波动,最好它的数学期望等于未知参数的真值,这就导致了无偏性这个标准。定义36样本方差37证所以而3839例证例证40解由正态分布的性质以及样本的独立性可知所以例41二、有效性 (Efficiency)一般来说,一个参数往往有多个无偏估计量。若 有两个无偏估计量:, 则当a+b=1时也是 的无偏估计量。估计量的无偏性只保证了估计量的取值在参数真值周围波动,但是波动的幅度有多大呢?自然地,我们希望估计量波动的幅度越小越好,幅度越小,则估计量取值与参数真值有较大偏差的可能性越小,而衡量随机变量波动幅度的量就是方差。这样就有了我们下面要介绍的有效性的概念。42定义43证例44解45例4证46解47可以证明,若则当时,达到最小。48解例549用拉格朗日乘数法,50定理此定理说明,增加样本容量可提高估计量的有效性。51三、一致性 (Consistency)定义时,即当依概率收敛于直观上看,当 n 增大时,样本信息增多,当然希望估计量越来越靠近真值的概率也越来越大,这种想法就引出了上面的一致性概念。一致估计量一般当样本容量很大时,才能显示其优点。52由辛钦大数定理可以证明,是 DX 的相合估计量。53练习:P143 习题六6.(B) 3.54§3 区间估计假如 是未知参数 的一个点估计,那么一旦获得样本值 ,估计值 就给出了一个确定的数,这个数给我们一个关于该参数的明确的数量概念.但是,我们必须注意到,点估计值只是 的一个近似值,它本身并没有反映这种近似值的精度,也就是说它并没有给出近似值的误差范围.更进一步的,在数理统计学中仅仅知道误差范围也是不够的,由于样本的随机性,这个误差范围是一个随机区间,于是就连它是否包含 的真值都成了疑问.因此,我们还必须建立一种统计推断的方法,希望通过它能确定这个区间包含 真值的概率.55为了弥补点估计的不足,本节讨论区间估计的概念。区间估计是一种重要的统计推断方法,它是由奈曼(J.Neyman)在1934年开始的一系列工作中引入的,这种思想从确立之日起就引起了众多统计学家的重视。点估计是用一个点(即一个数)去估计未知参数,而区间估计,就是用一个区间去估计未知参数。56则称区间 为 的置信水平为的置信区间.定义确定两个统计量57置信区间的含义:固定样本容量n,然后进行多次抽样,每次抽样得到一个区间, 由大数定律,当抽样的次数足够多时,包含 的真值的区间大约占 . 即我们能以概率 的可信程度保证,由样本值代入中所得的区间包含 的真值.根据给定的置信水平,确定未知参数θ的置信区间,称为参数θ的区间估计。58寻找未知参数θ的置信区间的基本步骤:(1) 选取一个样本的函数(2) 对于给定的置信度 1-α , 定出常数 a, b,使得一般利用所服从分布的分位点它只含待估参数θ,而不含其它未知参数,它的分布已知且不依赖于任何未知参数(当然也不包含参数θ本身);来确定;(3) 利用不等式变形, 求得未知参数θ的置信区间,若则区间即为所求置信区间.59§4 正态总体均值与方差的区间估计一、单个正态总体 的情形1. 已知时 的区间估计此时选取样本的函数为对给定的置信水平按标准正态分布的上 分位点的定义,查正态分布表得601. 已知时 的置信区间于是所求 的置信区间为有时简记为61例解62例1解63解例2 对50名大学生的午餐费进行调查,得样本均值为10.10元,假如总体的标准差为1.75元,求大学生的午餐费 的0.95的置信区间。64解例3置信区间的长度是0.82, 比较短.65注:662. 未知时 的置信区间上一章已证得67注有时简记为68例解69例4解703. 未知时 的置信区间考虑随机变量71其中72例解73例5解74二、两个正态总体与的情形下面介绍两个正态总体均值差和方差比的区间估计。1. 与 已知时 的置信区间由上一章知,751. 与 已知时 的置信区间由上一章知,76例解772. 未知时 的置信区间由上一章知,其中78例解79解80例6 某工厂一条生产灯泡的流水线,在工艺改变前后分别抽检若干件产品的寿命,得数据为解改变前:改变后:假定灯泡寿命服从正态分布, 且工艺改变前后方差不变, 试求工艺改变前后平均寿命之差的95%的置信区间.8182例7 某大学从A、B两市招收新生中分别抽5名、6名男生,测得身高解所求置信区间为833. 两个总体方差比 的置信区间由上一章知,记由84由得85例解86解87例8解88例9 某大学从A、B两市招收新生中分别抽5名、6名男生,测得身高解所求置信区间为89例10 用两种工艺(或原料)A和B生产同一种橡胶制品.为比较两种工艺下产品的耐磨性,从两种工艺的产品中各随意抽取了若干件,测得如下数据:工艺A:185.82, 175.10, 217.30, 213.86, 198.40工艺B:152.10, 139.89, 121.50, 129.96, 154.82, 165.60假设两种工艺下产品的耐磨性X和Y都服从正态分布:解经计算,得90(1) 查表得91经计算,得查表得算得92练习:P143 习题六7.93ENDEND94 展开更多...... 收起↑ 资源预览