Ch7-3区间估计 课件(共25张PPT)- 《概率论与数理统计》同步教学(大连理工·第三版)

资源下载
  1. 二一教育资源

Ch7-3区间估计 课件(共25张PPT)- 《概率论与数理统计》同步教学(大连理工·第三版)

资源简介

(共25张PPT)
第七章 参数估计
7.3 区间估计
7.3 区间估计
内容摘要:根据事先给定的置信水平, 通过构造样本的函数来确定未知参数的置信区间, 得到未知参数的估计范围和估计精度,尤其是当总体服从正态分布时, 我们可对总体的均值和方差进行区间估计.
7.3.1 提出问题
在使用点估计时, 对估计量 是否
能“接近”真正的参数 的考察是通过建立种种评价标准, 然后依照这些标准进行评价, 这些标准一般都是由数字特征来描绘大量重复试验时的(利用了数学期望)平均效果, 而对于估计值的可信度与精度却没有回答.
7.3.2 预备知识
统计量;分位点;样本与样本值;总体
均值与方差.
问题: 怎样考察估计量的可信度 与精确度呢?怎样求未知参数的区 间估计呢
范围通常以区间的形式给出, 同时还给出此区间包含参数
估计称为区间估计, 这样的区间就是所谓的置信区间.
若对于未知参数
估计 外,还希望估计出一个范围, 并希望知道
真值的可信程度, 这样的
这个范围包含参数
q
, 除了求出它的点
真值的可信程度. 这种形式的
7.3.3 方法建立
则称随机区间( , )是 的置信水平为1-α的置信区间, 和 分别称为置信水平为 的双侧置信区间的置信下限和置信上限,
称为置信水平,也叫置信度.
定义 设总体X的分布函数 含有一个未知参数 , 对于给定 值, 确定的两个统计量满足
2. 表示随机区间( , )包含的概率不低于 , 而不能解释为落在随机区间( , )内的概率.
讲评
的可靠程度越大;但这个区间也就越宽, 从而估计的误差也就越大,也就是估计的精度越低.
1. 通常
取很小的概率, 比如
等. 一般来说, 如果
越小,
)包含
则(
例如, 若 , 可理解为: 若从总体中取100个容量为n的样本观察值, 我们得到100个确定的区间( , ), 其中平均有95个区间包含了未知参数θ的真值, 大约有5个区间不包含θ的真值.
例7.3.1 设总体 为已知, 为未知, 是来自总体X的样本, 求 的置信水平为 的置信区间.

因为 是μ的无偏估计, 且有
服从的标准正态分布N(0, 1)不依赖于任何未知参数.
7.3.4 方法应用及指标分析
参见图7-1, 按标准正态分布上α分位点的定义,
我们可取
图7-1 标准正态分布双侧置信区间
即得到
这样, 我们得到了μ的置信水平为1-α的一个置信区间(见图7-1)
这样的置信区间也常写成
如果我们取σ=4,n=25, 同时取α=0.01,
查表得
则得到了μ的置信水平为0.99的一个置信区间

讲评 (1) 此题在处理方法上具有普遍性,提示读者要自己分解解题过程;
因为样本均值 是一个随机变量, 故
是一个随机区间. 若由一组样本值算得样本均值的观察值 , 则我们有区间(1.56, 5.68),该区间包含μ的可信程度为
1-0.01=0.99=99%.
(2) (7.3.1)式作为结论使用,前提是:正
态总体的方差已知.
(3) 在相同的置信水平1-α=0.99下, 所得置信区间并不唯一.
事实上, 如果我们又令(参见图7-1)

得到区间
这个区间也是μ的置信水平1-α=0.99的一个置信区间.
我们分析一下这两个置信区间的估计误差:
第一个置信区间长度为
而第二个置信区间的长度为
很明显, 前面给出的置信区间短一些, 即估计误差小,或说估计精确程度高, 所以前一个置信区间更优.
例7.3.2 深入解读上例:考察置信区间
(1) 求置信区间的长度L.
(2) 估计使置信区间的长度不大于L的样本容量n.

(1) 置信区间的长度为
(2)当限定置信区间的长度不大于
L时,样本容量n应满足
这样,若取置信水平为 为使置信区间的长度不大于0.5,应当使样本容量n≥62.
讲评 置信区间的长度可以刻画估计的精确程度;给定标准差,可设计试验次数.
求未知参数
的置信区间的具体做法:
(1) 寻求一个样本
的函数
,而不含
,它包含待估参数
其它未知参数,并且
的分布已知且不依赖于
任何未知参数(当然也不依赖于待估参数
常数 ,使
(2)对于给定的置信水平
,定出两个
那么
就是
的一个置信水平为
的置信区间.
都是统计量,
(3) 若能从
得到
等价不等式
,其中
区间估计,粗略地说,是用两个统计量 , ( )所决定的区间( , )作为参数θ取值范围的估计.显然,这样说法是没有多大的意义的.
首先,这个估计必须要有一定的精度.就是说
, 不能太小或太大,太小或太大则不能说明任何问题;
7.3.4 内容小结
第二, 这个估计还必须有一定的可信程度. 因此, , 又不能太大或太小,太大或太小则难以保证这一要求. 例如,用区间(0,1000)去估计某人的岁数, 虽然绝对可信, 却不能带来任何有用的信息; 反之, 若用区间(30,31)去估计某人的岁数, 虽然提供了关于此人年龄的信息, 却很难使人相信这一结果的正确性.
所以, 评价θ的一个置信区间( , )的优劣有两个要素:一是精度,可用区间长度
来刻画. 区间长度与精度成反比, 或者说,置信区间长度越短,估计的精度越高.
二是可信度,可用概率 来衡量.我们希望既能得到较高的精度,又能得到较高的可信度.
但在获得的信息一定(如样本容量 固定)的情况下,这两者显然是不可 能同时达到最理想的状态. 通常是 采取将可信程度固定在某一需要的水平上,求得精度尽可能高的估计区间.
思考题 怎样求未知参数的区间估计 怎样考察估计量的可信度与精确度?
解决问题:
求法有三步;事前给定小概率α,用
1- α来刻画可信度;置信区间长度越短精确度越好.
存在问题:
若总体服从正态分布, σ2未知,此时它的未知参数μ的区间估计如何解决?

展开更多......

收起↑

资源预览