资源简介 (共33张PPT)第六章----第八章知识结构图数理统计抽样分布统计推断常用的统计量四个重要分布参数估计假设检验正态总体的样本均值与方差的分布(重要统计量的分布)矩估计法点估计区间估计极大似然估计法均值的区间估计方差的区间估计均值的检验方差的检验单个总体两个总体正态总体问题的引出第三节 区间估计在参数的点估计中用样本构造一个估计量 ,用 去估计 ,这仅仅是解决了一个求未知参数的一个 “近似值”问题,而没有解决“近似值”的精确程度问题,即没有给出这个近似值的误差范围和估计的可信程度。在参数的区间估计中则要用样本去给出未知参数 的一个大致的范围,并使未知参数 在其中有指定的概率。具体:若估计参数为 ,要考虑估计量 落在的可能性有多大。即求 .在估计湖中鱼数的问题中,若已知得到鱼数N 的极大似然估计为1000条。而实际上N 的真值可能大于1000条,也可能小于1000条。例如:若给定了可能的值,则就可以求出它的可能范围则在区间估计中就可以给出一个区间,在此区间内合理地相信 N 的真值位于其中。这样就可对鱼数的估计更有把握.希望确定一个区间,使得在该区间内能以比较高的可靠程度相信它包含未知参数的真值。[ ]而这“可靠程度”是用概率来度量的,习惯上把置信水平记作是一个很小的正数。湖中鱼数的真值故所讨论的问题是:称为置信概率、置信度或置信水平.称该区间为置信区间。一. 置信区间定义:设总体 X 的分布函数 含有一个未知参数 ,和满足: ,对于给定的值若由样本确定的两个统计量:是 的置信度为 的置信区间;和为置信度为的双侧置信区间的置信下限和置信上限.称为置信度或 置信概率。则称随机区间在反复抽样多次(各种得到的样本容量相等,均为 n ),每个样本值确定一个区间 ,▲▲对置信区间 有两个要求:很大的可能被包含在该区间内,即要求:一是要求 以尽可能大.二是要求估计的精度要尽可能的高,注定义的含义:每个这样的区间要么包含 的真值,要么不包含 的真值.按贝努力大数定理可知:在这么多的区间中包含 真值的约占不包含 真值的仅占尽可能短。即要求区间可靠度与精度是一对矛盾,一般是在保证可靠度的条件下尽可能提高精度.正态随机变量情形的区间估计.给定置信度 ,求置信区间.讨论的问题:讨论的对象:二. 正态总体均值的区间估计1. 单个正态总体 情形问题:设 X1,… Xn 是取自 的样本,求:参数 的置信度为 的置信区间.解:(1). 当方差 已知的情形选 的点估计(无偏估计)为寻找未知参数的一个良好估计~ N ( 0, 1 ),且统计量而且是样本的均值与方差,给定置信度U 不依赖于任何未知参数。现对于给定的置信水平 (大概率), 根据 U 的分布,确定一个区间,使得U 取值于该区间的概率为故对于给定的置信水平,按照标准正态分布的分位点的定义有:从中解得:于是所求 的置信度为 置信区间为:也可简记为:例1.某实验室测量铝的比重 16 次,得平均值,设总体(高斯已证明测量误差是服从正态分布)求: 的 95% 的置信区间.解:由已知:查正态分布表得:得:取统计量:(2). 方差 未知的情形用 去代替 得统计量:它是不依赖于任何未知参数的.从而 的 的置信区间为:未知,但考虑到样本方差是 的无偏估计,的区间范围是 (2.691, 2.719)即用 来估计 值的可靠程度达到 95%即:从中解得:于是所求 的置信度为 置信区间为:例2.确定某种溶液的化学浓度,现任取4个样品,测得样本均值为样本标准方差为:现溶液的化学浓度近似求: 的置信度为 95% 的置信区间解:由已知:查 t 分布表得:得:从而 的 的置信区间为:取统计量:服从正态分布2. 两个正态总体 的情形问题:是来自第一个总体的样本,是来自第二个总体的样本,它们相互独立,又设分别是两个总体的样本均值;求:两个总体均值差 的置信区间.分别是两个总体的样本方差。给定置信度为解:均为已知时故有:所以得统计量:分别为 的无偏估计是的无偏估计又由 的独立性以及已知条件可得:(2). 均为未知时同单个总体在方差未知的情形下用 代替 的构思相同,可以得到当 均很大时( 一般大于50 )的一个置信度为 的近似置信区间:于是所求 的置信度为 置信区间为:未知时同单个总体方差未知的情形类似(又因 )其中得统计量:于是所求 的置信度为 置信区间为:例3.分别用金球和铂球测定引力常数(单位: )设测定值总体为 均为未知.(1) 用金球测定观察值为:6.683, 6.681, 6.676, 6.678, 6.679, 6.672(2) 用铂球测定观察值为:6.661, 6.661, 6.667, 6.667, 6.667, 6.6641.分别就(1),(2)两种情况求 的置信度为0.9的置信区间2.若设用金球和用铂球测定时测定值总体的方差相等,求两个测定值总体均值差的置信度为0.9的置信区间.解:在(1)中:用6.678作为引力常数的估计值的可靠程度为 90%的区间是(6.675,6.681)1.又即:于是所求 的置信度为 90% 置信区间为:取统计量:在(2)中于是所求 的置信度为 90% 置信区间为:用6.664作为引力常数的估计值的可靠程度为 90%的区间是(6.661,6.667)两个测定值总体的方差相等但又未知,现要求 的置信区间,可依公式计算:2.于是所求 的置信度为 0.9 的置信区间为:一般,若 的置信区间包含零,则可认为这两个总体的均值没有显著差别;若下限大于零,则可认为 比 大。即用 0.014 作为 的估计值的可靠程度达到90% 的区间是注问题:求:方差 的置信区间.解:是不依赖于任何未知参数的。三. 正态总体方差的区间估计1. 单个正态总体 的情形设总体 未知。本方差,给定置信度是总体 X 的一个样本,是样是 的无偏估计,且统计量:从中解得:于是所求 的置信度为 置信区间为:故对于给定的置信水平,按照 分布的上 分位点的定义有:标准差 的一个置信度为 的置信区间:于是所求 的置信度为 置信区间为:例4.求 例3 中的 (1), (2)两种情况下, 的置信度为0.9 的置信区间.解:在(1)中的置信度为0.9的置信区间为:(1) 用金球测定观察值为:6. 683, 6. 681, 6. 676,6. 678, 6. 679, 6. 672取统计量:在(2)中的置信度为0.9的置信区间为:(2) 用铂球测定观察值为:6.661, 6.661, 6.667,6.667, 6.667, 6.664取统计量:2. 两个正态总体 的情形问题:来自 的样本,来自 的样本,它们相互独立。求:两个总体方差比 的置信区间.解题思路同单个总体情况类似分别是两个总体的样本方差与样本均值,且样本均值均为未知,给定置信度解:且这两个统计量是相互独立的。由 F 分布的定义得统计量:是不依赖于任何未知参数的。故对于给定的置信水平,按照 F 分布的上分位点的定义有:a从中解得:例5.在例3 中若测定值总体的方差分别为 ,解:于是所求 的置信度为 置信区间为:求:这两个测定值总体方差比的置信度为 0.9的置信区间.这两个测定值总体方差比 的置信度为 0.9的置信区间为:如果 即表明正态总体 的波动较小如果 即表明正态总体 的波动较小一般,但若 的置信区间包含 1 ,则可认为:与除了两种情况外,其它情况都不能判断出中谁的波动性大还是小。两者没有显著差别。与注 展开更多...... 收起↑ 资源预览