ch7 参数估计 课件(共66张PPT)- 《概率论与数理统计》同步教学(电工版·2023)

资源下载
  1. 二一教育资源

ch7 参数估计 课件(共66张PPT)- 《概率论与数理统计》同步教学(电工版·2023)

资源简介

(共66张PPT)
第七章 参数估计
7.1 点估计
7.2 估计量的评价标准
7.3 区间估计
什么是参数估计?
案例7.1.2 如果健康研究机构根据多年的经验,认为某地区25~30岁成年男性群体的BMI值 (kg/)和甘油三酯指标 (单位:mmol/L)服从二维正态分布,即,,利用从该群体中随机抽查的120份样本数据能对参数做出估计吗?
案例7.1.1 回顾案例 6.1.1,假设研究人员已经发现某个特定职业的满意度得分X符合下面的一般分布律, 未知,如何估计?
点估计 — 估计未知参数的值
区间估计 — 估计未知参数的取值范围,
使得这个范围包含未知参数
真值的概率为给定的值。
参数估计的类型
点估计法
设总体X 的分布函数的形式已知,但它含有一个或多个未知参数: , 设 为总体的一个样本
构造 k 个统计量:
做为未知参数 的估计,称为估计量。
当测得一组样本值()时,代入上述统计量,
数值
称数 为未知参数 的估计值。
这种用构造统计量以估计未知参数的方法称为点估计法。
Ch7-6
频率代替法
矩估计法 (常用)
估计方法
最大似然估计法(常用)
常用的点估计方法
7.1.1 频率替换法
利用事件 在 次试验中发生频率
作为事件A 发生的概率 p 的估计量
频率替换法举例
案例7.1.1(续) 职业满意度调查问题,( 未知) ,用频率法估计。
解 下表是某大企业人力资源部随机抽查的100个该职业从业人员的答案
得3分的从业人员42人
记 .42, 称为 的估计值。
那么 , 所以.42,
7.1.2 矩估计法
Ch7-9
矩估计法,顾名思义,是用样本矩估计总体矩,从而得到总体分布中的参数的一种估计方法。矩估计法的优点是简单易行,不需要事先知道总体分布,但其缺点是当总体类型已知时,没有充分利用分布提供的信息。
基本原理:
用样本的 阶矩作为总体的 阶矩的估计量,建立含有待估计参数的方程,从而可解出待估计参数.
设总体待估计的参数为 , 的 阶原点矩存在,
设 为一样本,样本的 r 阶原点矩:
则可得含未知参数 的方程组。

矩估计法的一般步骤
则称该解为未知参数 的矩估计量(统计量)
称为未知参数的矩估计值
代入一组样本值得个数:
若方程组有解
例7.1.1 设 X 是一个总体,且存在二阶矩,记,但是和未知。是来自总体X的一个样本,求的矩估计量与矩估计值。
解 由 ,
例子
由矩估计法原理,可得
解得的矩估计量为
若是样本的一组样本值,则代入上式得到 的矩估计值为
例7.1.2 设灯泡制造公司的质量监控部门研究发现,该公司生产的某品牌灯泡的寿命服从参数为的指数分布,其概率密度为
对该品牌灯泡随机抽样测试得到54个观测值
(单位:千小时)如下:
求的矩估计值。
例子
解 :易知,,由矩估计原理,令,由此可得到的矩估计量,代入样本数据得=3.61,从而得到的矩估计值
例7.1.3 设总体X在[a,b]上服从均匀分布,a和b未知。是总体X的一个样本,试求a和b的矩估计量。
例子
解 由矩法原理,
解得
一般地,不论总体服从什么分布,总体期望与方差 存在,则它们的矩估计量分别为:
如果 是样本的一组样本值,代入上式得与的矩估计值为,
小结
事实上,按矩法原理,令

7.1.3 最大似然估计法
最大似然估计法是未知参数点估计的另一种重要方法,其基本想法是:
随机事件的若干个可能结果A,B,C,...,若在一次试验中,某结果出现了,如A,则有理由认为试验条件有利于结果A的产生,换句话说,概率P(A)最大,生活中也常用“概率最大的随机事件在一次试验中最可能发生”作为实际推断的依据,这也是最大似然估计法的理论依据。
案例7.1.1(续)职业满意度调查问题,假设研究人员已经发现某特定职业的满意度得分X概率分布符合下面的一般分布律
下表是某大企业人力资源部随机抽查的100个该职业从业人员的答案
所以
最大似然估计法认为,既然这些数据已经发生了,就应该尊重数据,为此有理由要求可使 L()达到最大,这是因为概率最大的随机事件在一次试验中最有可能发生。使得最大值,问题化为求最大值点,即求驻点
得.45
案例 7.1.1 解(最大似然估计法)
根据本案例中随机抽取的容量为 100 的样本数据,在满足总体分布的条件下,这些数据出现的概率为
一般地,设 为离散型随机变量,其分布律为
为总体X 的样本, 为总体 X 的样本值,
选择 , 使 ( ) 取最大值,
则称这样得到的
为参数 的 最大似然估计值

似然函数
似然函数
最大似然估计法的步骤
对应于
的统计量,
的 最大似然估计量.
若 为连续型随机变量, 密度函数(或概率密度)为
为总体X 的样本, 为总体 X 的样本值,
选择 , 使 ( ) 取最大值,
则称这样得到的
为参数 的 最大似然估计值

似然函数
似然函数
若 是的可微函数, 可解似然方程

求得未知参数的 最大似然估计值
对应的统计量为 最大似然估计量
例7.1.4 设 X 服从指数分布,概率密度为
为X的一组样本观测值,
求参数的最大似然估计。
例子
解 似然函数为
两边求对数得

解得的最大似然估计值为
对应的最大似然估计量为
例7.1.5 设是正态总体的一个样本,求和的最大似然估计量。
例子

求驻点得:
— 的最大似然估计量
— 的最大似然估计值,代入具体样本观测值可得

例7.1.6 设总体 X 服从 0-1 分布 (0例子

求 p 的最大似然估计量。
由于P(X=1)=p,P(X=0)=1-p,即
对于样本的一组观测值有
故似然函数为
取对数则有


7.2.1 无偏性
若存在, 且,则称是的无偏估计量
7.2 估计量的评价标准
一些无偏估计常用的结论
设总体X 的 k 阶矩存在, 记 存在, 特别是总体 的样本,
是 的无偏估计量.
是总体方差 的无偏估计量
注: 不是总体方差 的无偏估计量,
是总体方差 的无偏估计量;
简单证明: 不论 X 服从什么分布,

的无偏估计量.
证:
因而
由于
前已证
因而

7.2.2 有效性

都是总体参数 的无偏估计量, 且
7.2 估计量的评价标准
例7.2.2 设是正态总体的一个样本,其中未知,记
例子
易见,这些都是的无偏估计,因为
下面来比较它们的方差,由于
因此 k 越大,方差越小,从而在这 n 个无偏估计中,所以最有效。
7.2.3 一致性

是总体参数 的估计量.

是总体参数 的一致性估计量


注1: 一致估计不要求无偏性,而有效性比较是建立在无偏性基础上。
注2: 如果是无偏估计,方差趋于零,也就满足一致性。
注3:样本的k阶矩
Mk 是E(X k )的一致性估计量.
7.2 估计量的评价标准
例7.2.4 设有一批产品,为估计其废品率p,随机抽取一样本, 其中
例子
令 为 p的估计,问是否为废品率 p 的一致无偏估计量。

因为 ,所以是废品率 p 的无偏估计量,又因为 相互独立,且服从相同的分布,因此
所以由大数定律可知,依概率收敛于 p ,所以 是废品率 p 的一致无偏估计量。
7.3.1 区间估计的概念
案例7.3.1
某大型连锁超市为合理地确定区域分店的商品进货量,需要了解商品销售量的分布,根据以往经验可知某商品每周的销售量服从正态分布,假设,能否根据最近最近 54 周该商品的销售量,给出参数的估计区间,并且这个区间能达到要求的可信度?
7.3 区间估计
分析:根据上节的内容,可用样本数据给出的估计值,=28.96,但这种估计值既没有误差范围,也没有置信度的信息。
置信区间的定义
ch7-36
定义7.3.1 设 是一个待估计的参数, 是一个样本
对于一给定的数 (0 < < 1), 若能构造两个统计量
则称随机区间为参数 的置信度为1 的置信区间,
分别称为置信下限,与置信上限, 1 称为置信度或置信水平.
使得 .
7.3 区间估计
案例中,可计算,若令置信度,则 (查表)
易知

数据代入,得置信区间(27.63,30.29)
案例7.3.1解 构造
置信区间的求解步骤置信区间的步骤:
寻找一个样本的函数
含有待估参数, 不含其它未知参数, 其分布已知, 且分布不依赖于待估参数.
— 称为枢轴量
给定置信度 1 , 定出两个常数 使得

解出
, , 得置信区间
---可靠程度, 越小, 越可靠.
置信区间的长度 ------精度
确定后, 置信区间的选取方法常不唯一 , 常选最小的一个
几点说明:
求参数的置信区间时, 先保证可靠性。在此基础上, 再提高精度.
ch7-40
单个正态总体 的情形
为样本,分别为样本均值、样本方差
设置信度为
求置信区间举例 (重点:单正态总体)
(1)正态总体 的方差已知 , 的置信区间
ch7-41
确定
选取枢轴量

对不等式变形,得 的置信区间为
(2)总体 方差未知, 的置信区间
选取枢轴量
确定
故 的置信区间为
(3)总体 当 未知时, 方差的置信区间
ch7-43
选取
故 的置信区间为

(4)当已知时, 方差 的置信区间
ch7-44
选取
枢轴量取
故 的置信区间为
ch7-45
案例 7.3.2 为了对某文字扫描识别软件的文字识别性能进行测试,我们从图书市场中随机抽取 20 本不同类别的图书,用该软件扫描进行文字识别的准确率数据如下:
假设识别准确率服从 ,请按以下条件估计参数(置信度) .
(1) 若方差为, 求 的置信区间;
(2) 若方差未知,求的置信区间;
(3) 求的置信区间.
案例
ch7-46
的置信区间为
解 (1)选取枢轴量
由给定数据算得 的置信区间为(93.68,94.90)
的置信区间为
(2)选取枢轴量
由给定数据算得 的置信区间为(93.43,95.15)
ch7-47
的置信区间为
(3)选取枢轴量
由给定数据算得的置信区间为(1.95,7.21)
ch7-48
案例6.1.2(续) 假设学院I和学院II的高等数学成绩和都服从正态分布,并记为,,通过一定的方法可知,请按照样本数据估计两个学院的高等数学平均成绩,并给出两个学院高等数学成绩均值差的95%的置信区间.
双正态总体的置信区间举例
解 关键是寻找枢轴量,由第六章正态总体抽样分布
得 的置信区间为
等相关数据代入得置信区间
ch7-51
设 , 为取自总体 样本;
设 , 为取自总体 样本;
设置信度为.
设 ; ;
两个正态总体的置信区间举例
且 相互独立,
(1), 已知,的置信区间
相互独立,
的置信区间为
(2)未知,但 ,求的置信区间
ch7-53
枢轴量选:
的置信区间为
(3)均未知且不一定相等,但
ch7-54
其中
的置信区间为
方差比 的置信区间 (未知)
ch7-55
取枢轴量
因此, 方差比的 置信区间为
ch7-56
案例 7.3.5 某智能手机制造商对某款手机使用了自主研发的芯片,使用自主研发芯片的手机为型号Ⅰ,使用进口芯片的手机为型号Ⅱ,为了考察使用不同芯片手机的效果,对两种型号手机的综合性能指标(跑分)进行了随机检测,测得的跑分(单位:万分)如下:
根据对各方面综合因素的评估,认为两种型号手机的跑分都服从正态分布,并且假设型号I的跑分 ,型号II的跑分 ,请根据下列要求为该企业估计其中的参数.
若,求均值差的置信度为0.95 的置信区间;
方差未知,求的置信度为0.95 的置信区间.
ch7-57
的置信区间为
解 (1)取枢轴量
ch7-58
(2)枢轴量为
方差比 的置信区间为
单侧置信区间
*7.3.4单侧置信区间
ch7-60
定义7.3.2 对于给定的, 是待估参数
是总体 的样本, 若能确定一个统计量
, 使得
则称为置信度为 的单侧置信区间,单侧置信下限为
若能确定一个统计量
称 为置信度为 的单侧置信区间,单侧置信上限为
, 使得
ch7-61
案例7.3.6 药物的半衰期是药物代谢动力学中一个十分重要且基本的参数,它表示药物在体内的时间与血药浓度之间的关系,它是决定给药剂量和次数的主要依据. 现在假定某种药物在65岁以上的人群中的半衰期 ,下面是10名65岁以上的患者的测试结果(单位:h):
12.3 12.7 11.1 12.4 11.4 13.0 11.8 13.5 12.2 11.0
(1)请根据该抽样结果估计的置信度为95%的单侧置信下限;,
(2)请估计 的置信度为95%的单侧置信上限.
(1) 选取枢轴量
,单侧置信区间是(11.67,+)
(2) 选取枢轴量
单侧置信区间是(,1.82)
7.3.4非正态总体的情形
ch7-64
若总体 X 的分布未知, 但样本容量很大, 由中心极限定理, 可近似地认为
则 的置信度为1 的置信区间可取为
非正态总体的情形
案例7.3.7 酒店管理常常需要关注订单的取消数目,假设某五星级酒店每周订单取消的数目记为 ,据经验 ,酒店客房部需要给出其中参数的估计,为此,他们翻阅了最近100周的订单取消记录,为的估计提供参照样本,下面是具体的样本数据:
请给出的置信度为95%的置信区间.
对, ,利用上述一般结果,得 的置信区间为
代入样本数据的置信区间是(3.51,4.37)

展开更多......

收起↑

资源预览