资源简介 (共66张PPT)第七章 参数估计7.1 点估计7.2 估计量的评价标准7.3 区间估计什么是参数估计?案例7.1.2 如果健康研究机构根据多年的经验,认为某地区25~30岁成年男性群体的BMI值 (kg/)和甘油三酯指标 (单位:mmol/L)服从二维正态分布,即,,利用从该群体中随机抽查的120份样本数据能对参数做出估计吗?案例7.1.1 回顾案例 6.1.1,假设研究人员已经发现某个特定职业的满意度得分X符合下面的一般分布律, 未知,如何估计?点估计 — 估计未知参数的值区间估计 — 估计未知参数的取值范围,使得这个范围包含未知参数真值的概率为给定的值。参数估计的类型点估计法设总体X 的分布函数的形式已知,但它含有一个或多个未知参数: , 设 为总体的一个样本构造 k 个统计量:做为未知参数 的估计,称为估计量。当测得一组样本值()时,代入上述统计量,数值称数 为未知参数 的估计值。这种用构造统计量以估计未知参数的方法称为点估计法。Ch7-6频率代替法矩估计法 (常用)估计方法最大似然估计法(常用)常用的点估计方法7.1.1 频率替换法利用事件 在 次试验中发生频率作为事件A 发生的概率 p 的估计量频率替换法举例案例7.1.1(续) 职业满意度调查问题,( 未知) ,用频率法估计。解 下表是某大企业人力资源部随机抽查的100个该职业从业人员的答案得3分的从业人员42人记 .42, 称为 的估计值。那么 , 所以.42,7.1.2 矩估计法Ch7-9矩估计法,顾名思义,是用样本矩估计总体矩,从而得到总体分布中的参数的一种估计方法。矩估计法的优点是简单易行,不需要事先知道总体分布,但其缺点是当总体类型已知时,没有充分利用分布提供的信息。基本原理:用样本的 阶矩作为总体的 阶矩的估计量,建立含有待估计参数的方程,从而可解出待估计参数.设总体待估计的参数为 , 的 阶原点矩存在,设 为一样本,样本的 r 阶原点矩:则可得含未知参数 的方程组。令矩估计法的一般步骤则称该解为未知参数 的矩估计量(统计量)称为未知参数的矩估计值代入一组样本值得个数:若方程组有解例7.1.1 设 X 是一个总体,且存在二阶矩,记,但是和未知。是来自总体X的一个样本,求的矩估计量与矩估计值。解 由 ,例子由矩估计法原理,可得解得的矩估计量为若是样本的一组样本值,则代入上式得到 的矩估计值为例7.1.2 设灯泡制造公司的质量监控部门研究发现,该公司生产的某品牌灯泡的寿命服从参数为的指数分布,其概率密度为对该品牌灯泡随机抽样测试得到54个观测值(单位:千小时)如下:求的矩估计值。例子解 :易知,,由矩估计原理,令,由此可得到的矩估计量,代入样本数据得=3.61,从而得到的矩估计值例7.1.3 设总体X在[a,b]上服从均匀分布,a和b未知。是总体X的一个样本,试求a和b的矩估计量。例子解 由矩法原理,解得一般地,不论总体服从什么分布,总体期望与方差 存在,则它们的矩估计量分别为:如果 是样本的一组样本值,代入上式得与的矩估计值为,小结事实上,按矩法原理,令因7.1.3 最大似然估计法最大似然估计法是未知参数点估计的另一种重要方法,其基本想法是:随机事件的若干个可能结果A,B,C,...,若在一次试验中,某结果出现了,如A,则有理由认为试验条件有利于结果A的产生,换句话说,概率P(A)最大,生活中也常用“概率最大的随机事件在一次试验中最可能发生”作为实际推断的依据,这也是最大似然估计法的理论依据。案例7.1.1(续)职业满意度调查问题,假设研究人员已经发现某特定职业的满意度得分X概率分布符合下面的一般分布律下表是某大企业人力资源部随机抽查的100个该职业从业人员的答案所以最大似然估计法认为,既然这些数据已经发生了,就应该尊重数据,为此有理由要求可使 L()达到最大,这是因为概率最大的随机事件在一次试验中最有可能发生。使得最大值,问题化为求最大值点,即求驻点得.45案例 7.1.1 解(最大似然估计法)根据本案例中随机抽取的容量为 100 的样本数据,在满足总体分布的条件下,这些数据出现的概率为一般地,设 为离散型随机变量,其分布律为为总体X 的样本, 为总体 X 的样本值,选择 , 使 ( ) 取最大值,则称这样得到的为参数 的 最大似然估计值记似然函数似然函数最大似然估计法的步骤对应于的统计量,的 最大似然估计量.若 为连续型随机变量, 密度函数(或概率密度)为为总体X 的样本, 为总体 X 的样本值,选择 , 使 ( ) 取最大值,则称这样得到的为参数 的 最大似然估计值记似然函数似然函数若 是的可微函数, 可解似然方程或求得未知参数的 最大似然估计值对应的统计量为 最大似然估计量例7.1.4 设 X 服从指数分布,概率密度为为X的一组样本观测值,求参数的最大似然估计。例子解 似然函数为两边求对数得令解得的最大似然估计值为对应的最大似然估计量为例7.1.5 设是正态总体的一个样本,求和的最大似然估计量。例子解求驻点得:— 的最大似然估计量— 的最大似然估计值,代入具体样本观测值可得,例7.1.6 设总体 X 服从 0-1 分布 (0例子解求 p 的最大似然估计量。由于P(X=1)=p,P(X=0)=1-p,即对于样本的一组观测值有故似然函数为取对数则有令得7.2.1 无偏性若存在, 且,则称是的无偏估计量7.2 估计量的评价标准一些无偏估计常用的结论设总体X 的 k 阶矩存在, 记 存在, 特别是总体 的样本,是 的无偏估计量.是总体方差 的无偏估计量注: 不是总体方差 的无偏估计量,是总体方差 的无偏估计量;简单证明: 不论 X 服从什么分布,是的无偏估计量.证:因而由于前已证因而故7.2.2 有效性若都是总体参数 的无偏估计量, 且7.2 估计量的评价标准例7.2.2 设是正态总体的一个样本,其中未知,记例子易见,这些都是的无偏估计,因为下面来比较它们的方差,由于因此 k 越大,方差越小,从而在这 n 个无偏估计中,所以最有效。7.2.3 一致性设是总体参数 的估计量.称是总体参数 的一致性估计量若即注1: 一致估计不要求无偏性,而有效性比较是建立在无偏性基础上。注2: 如果是无偏估计,方差趋于零,也就满足一致性。注3:样本的k阶矩Mk 是E(X k )的一致性估计量.7.2 估计量的评价标准例7.2.4 设有一批产品,为估计其废品率p,随机抽取一样本, 其中例子令 为 p的估计,问是否为废品率 p 的一致无偏估计量。解因为 ,所以是废品率 p 的无偏估计量,又因为 相互独立,且服从相同的分布,因此所以由大数定律可知,依概率收敛于 p ,所以 是废品率 p 的一致无偏估计量。7.3.1 区间估计的概念案例7.3.1某大型连锁超市为合理地确定区域分店的商品进货量,需要了解商品销售量的分布,根据以往经验可知某商品每周的销售量服从正态分布,假设,能否根据最近最近 54 周该商品的销售量,给出参数的估计区间,并且这个区间能达到要求的可信度?7.3 区间估计分析:根据上节的内容,可用样本数据给出的估计值,=28.96,但这种估计值既没有误差范围,也没有置信度的信息。置信区间的定义ch7-36定义7.3.1 设 是一个待估计的参数, 是一个样本对于一给定的数 (0 < < 1), 若能构造两个统计量则称随机区间为参数 的置信度为1 的置信区间,分别称为置信下限,与置信上限, 1 称为置信度或置信水平.使得 .7.3 区间估计案例中,可计算,若令置信度,则 (查表)易知得数据代入,得置信区间(27.63,30.29)案例7.3.1解 构造置信区间的求解步骤置信区间的步骤:寻找一个样本的函数含有待估参数, 不含其它未知参数, 其分布已知, 且分布不依赖于待估参数.— 称为枢轴量给定置信度 1 , 定出两个常数 使得由解出, , 得置信区间 ---可靠程度, 越小, 越可靠.置信区间的长度 ------精度 确定后, 置信区间的选取方法常不唯一 , 常选最小的一个几点说明:求参数的置信区间时, 先保证可靠性。在此基础上, 再提高精度.ch7-40单个正态总体 的情形为样本,分别为样本均值、样本方差设置信度为求置信区间举例 (重点:单正态总体)(1)正态总体 的方差已知 , 的置信区间ch7-41确定选取枢轴量由对不等式变形,得 的置信区间为(2)总体 方差未知, 的置信区间选取枢轴量确定故 的置信区间为(3)总体 当 未知时, 方差的置信区间ch7-43选取故 的置信区间为则(4)当已知时, 方差 的置信区间ch7-44选取枢轴量取故 的置信区间为ch7-45案例 7.3.2 为了对某文字扫描识别软件的文字识别性能进行测试,我们从图书市场中随机抽取 20 本不同类别的图书,用该软件扫描进行文字识别的准确率数据如下:假设识别准确率服从 ,请按以下条件估计参数(置信度) .(1) 若方差为, 求 的置信区间;(2) 若方差未知,求的置信区间;(3) 求的置信区间.案例ch7-46的置信区间为解 (1)选取枢轴量由给定数据算得 的置信区间为(93.68,94.90)的置信区间为(2)选取枢轴量由给定数据算得 的置信区间为(93.43,95.15)ch7-47的置信区间为(3)选取枢轴量由给定数据算得的置信区间为(1.95,7.21)ch7-48案例6.1.2(续) 假设学院I和学院II的高等数学成绩和都服从正态分布,并记为,,通过一定的方法可知,请按照样本数据估计两个学院的高等数学平均成绩,并给出两个学院高等数学成绩均值差的95%的置信区间.双正态总体的置信区间举例解 关键是寻找枢轴量,由第六章正态总体抽样分布得 的置信区间为等相关数据代入得置信区间ch7-51设 , 为取自总体 样本;设 , 为取自总体 样本;设置信度为.设 ; ;两个正态总体的置信区间举例且 相互独立,(1), 已知,的置信区间相互独立,的置信区间为(2)未知,但 ,求的置信区间ch7-53枢轴量选:的置信区间为(3)均未知且不一定相等,但ch7-54其中的置信区间为方差比 的置信区间 (未知)ch7-55取枢轴量因此, 方差比的 置信区间为ch7-56案例 7.3.5 某智能手机制造商对某款手机使用了自主研发的芯片,使用自主研发芯片的手机为型号Ⅰ,使用进口芯片的手机为型号Ⅱ,为了考察使用不同芯片手机的效果,对两种型号手机的综合性能指标(跑分)进行了随机检测,测得的跑分(单位:万分)如下:根据对各方面综合因素的评估,认为两种型号手机的跑分都服从正态分布,并且假设型号I的跑分 ,型号II的跑分 ,请根据下列要求为该企业估计其中的参数.若,求均值差的置信度为0.95 的置信区间;方差未知,求的置信度为0.95 的置信区间.ch7-57的置信区间为解 (1)取枢轴量ch7-58(2)枢轴量为方差比 的置信区间为单侧置信区间*7.3.4单侧置信区间ch7-60定义7.3.2 对于给定的, 是待估参数是总体 的样本, 若能确定一个统计量, 使得则称为置信度为 的单侧置信区间,单侧置信下限为若能确定一个统计量称 为置信度为 的单侧置信区间,单侧置信上限为, 使得ch7-61案例7.3.6 药物的半衰期是药物代谢动力学中一个十分重要且基本的参数,它表示药物在体内的时间与血药浓度之间的关系,它是决定给药剂量和次数的主要依据. 现在假定某种药物在65岁以上的人群中的半衰期 ,下面是10名65岁以上的患者的测试结果(单位:h):12.3 12.7 11.1 12.4 11.4 13.0 11.8 13.5 12.2 11.0(1)请根据该抽样结果估计的置信度为95%的单侧置信下限;,(2)请估计 的置信度为95%的单侧置信上限.(1) 选取枢轴量,单侧置信区间是(11.67,+)(2) 选取枢轴量单侧置信区间是(,1.82)7.3.4非正态总体的情形ch7-64若总体 X 的分布未知, 但样本容量很大, 由中心极限定理, 可近似地认为则 的置信度为1 的置信区间可取为非正态总体的情形案例7.3.7 酒店管理常常需要关注订单的取消数目,假设某五星级酒店每周订单取消的数目记为 ,据经验 ,酒店客房部需要给出其中参数的估计,为此,他们翻阅了最近100周的订单取消记录,为的估计提供参照样本,下面是具体的样本数据:请给出的置信度为95%的置信区间.对, ,利用上述一般结果,得 的置信区间为代入样本数据的置信区间是(3.51,4.37) 展开更多...... 收起↑ 资源预览