资源简介 (共25张PPT)第七章 参数估计7.3 区间估计7.3 区间估计内容摘要:根据事先给定的置信水平, 通过构造样本的函数来确定未知参数的置信区间, 得到未知参数的估计范围和估计精度,尤其是当总体服从正态分布时, 我们可对总体的均值和方差进行区间估计.7.3.1 提出问题在使用点估计时, 对估计量 是否能“接近”真正的参数 的考察是通过建立种种评价标准, 然后依照这些标准进行评价, 这些标准一般都是由数字特征来描绘大量重复试验时的(利用了数学期望)平均效果, 而对于估计值的可信度与精度却没有回答.7.3.2 预备知识统计量;分位点;样本与样本值;总体均值与方差.问题: 怎样考察估计量的可信度 与精确度呢?怎样求未知参数的区 间估计呢 范围通常以区间的形式给出, 同时还给出此区间包含参数估计称为区间估计, 这样的区间就是所谓的置信区间.若对于未知参数估计 外,还希望估计出一个范围, 并希望知道真值的可信程度, 这样的这个范围包含参数q, 除了求出它的点真值的可信程度. 这种形式的7.3.3 方法建立则称随机区间( , )是 的置信水平为1-α的置信区间, 和 分别称为置信水平为 的双侧置信区间的置信下限和置信上限,称为置信水平,也叫置信度.定义 设总体X的分布函数 含有一个未知参数 , 对于给定 值, 确定的两个统计量满足2. 表示随机区间( , )包含的概率不低于 , 而不能解释为落在随机区间( , )内的概率.讲评的可靠程度越大;但这个区间也就越宽, 从而估计的误差也就越大,也就是估计的精度越低.1. 通常取很小的概率, 比如等. 一般来说, 如果越小,)包含则(例如, 若 , 可理解为: 若从总体中取100个容量为n的样本观察值, 我们得到100个确定的区间( , ), 其中平均有95个区间包含了未知参数θ的真值, 大约有5个区间不包含θ的真值.例7.3.1 设总体 为已知, 为未知, 是来自总体X的样本, 求 的置信水平为 的置信区间.解因为 是μ的无偏估计, 且有服从的标准正态分布N(0, 1)不依赖于任何未知参数.7.3.4 方法应用及指标分析参见图7-1, 按标准正态分布上α分位点的定义,我们可取图7-1 标准正态分布双侧置信区间即得到这样, 我们得到了μ的置信水平为1-α的一个置信区间(见图7-1)这样的置信区间也常写成如果我们取σ=4,n=25, 同时取α=0.01,查表得则得到了μ的置信水平为0.99的一个置信区间即讲评 (1) 此题在处理方法上具有普遍性,提示读者要自己分解解题过程;因为样本均值 是一个随机变量, 故是一个随机区间. 若由一组样本值算得样本均值的观察值 , 则我们有区间(1.56, 5.68),该区间包含μ的可信程度为1-0.01=0.99=99%.(2) (7.3.1)式作为结论使用,前提是:正态总体的方差已知.(3) 在相同的置信水平1-α=0.99下, 所得置信区间并不唯一.事实上, 如果我们又令(参见图7-1)即得到区间这个区间也是μ的置信水平1-α=0.99的一个置信区间.我们分析一下这两个置信区间的估计误差:第一个置信区间长度为而第二个置信区间的长度为很明显, 前面给出的置信区间短一些, 即估计误差小,或说估计精确程度高, 所以前一个置信区间更优.例7.3.2 深入解读上例:考察置信区间(1) 求置信区间的长度L.(2) 估计使置信区间的长度不大于L的样本容量n.解(1) 置信区间的长度为(2)当限定置信区间的长度不大于L时,样本容量n应满足这样,若取置信水平为 为使置信区间的长度不大于0.5,应当使样本容量n≥62.讲评 置信区间的长度可以刻画估计的精确程度;给定标准差,可设计试验次数.求未知参数的置信区间的具体做法:(1) 寻求一个样本的函数,而不含,它包含待估参数其它未知参数,并且的分布已知且不依赖于任何未知参数(当然也不依赖于待估参数常数 ,使(2)对于给定的置信水平,定出两个那么就是的一个置信水平为的置信区间.都是统计量,(3) 若能从得到等价不等式,其中区间估计,粗略地说,是用两个统计量 , ( )所决定的区间( , )作为参数θ取值范围的估计.显然,这样说法是没有多大的意义的.首先,这个估计必须要有一定的精度.就是说, 不能太小或太大,太小或太大则不能说明任何问题;7.3.4 内容小结第二, 这个估计还必须有一定的可信程度. 因此, , 又不能太大或太小,太大或太小则难以保证这一要求. 例如,用区间(0,1000)去估计某人的岁数, 虽然绝对可信, 却不能带来任何有用的信息; 反之, 若用区间(30,31)去估计某人的岁数, 虽然提供了关于此人年龄的信息, 却很难使人相信这一结果的正确性.所以, 评价θ的一个置信区间( , )的优劣有两个要素:一是精度,可用区间长度来刻画. 区间长度与精度成反比, 或者说,置信区间长度越短,估计的精度越高.二是可信度,可用概率 来衡量.我们希望既能得到较高的精度,又能得到较高的可信度.但在获得的信息一定(如样本容量 固定)的情况下,这两者显然是不可 能同时达到最理想的状态. 通常是 采取将可信程度固定在某一需要的水平上,求得精度尽可能高的估计区间.思考题 怎样求未知参数的区间估计 怎样考察估计量的可信度与精确度?解决问题:求法有三步;事前给定小概率α,用1- α来刻画可信度;置信区间长度越短精确度越好.存在问题:若总体服从正态分布, σ2未知,此时它的未知参数μ的区间估计如何解决? 展开更多...... 收起↑ 资源预览