第6章 置信区间估计 课件(共32张PPT)- 《应用统计学》同步教学(清华大学版)

资源下载
  1. 二一教育资源

第6章 置信区间估计 课件(共32张PPT)- 《应用统计学》同步教学(清华大学版)

资源简介

(共32张PPT)
本章教学目标:(1)单个正态总体均值和方差的区间估计。(2)总体比例的区间估计。(3)均值和比例置信区间估计中的样本容量确定。(4)两个正态总体的均值差和方差比的区间估计。(5)单侧置信区间估计。第6章 置信区间估计由于点估计存在误差,因此仅对总体参数作出点估计是不够的,还需要了解估计的精度及其误差。参数的区间估计就是在给定的可信度下,估计未知参数的可能取值范围。设 为总体分布的未知参数,若由样本确定的两个统计量和对给定的概率 (0< <1),满足则称随机区间为 的置信度为1- 的置信区间。§6.1基本概念准备一.总体方差 的区间估计 2已知§6.2单个正态总体均值和方差的区间估计由正态分布的性质可得对给定的置信度1- ,0f(x)x~N(0,1)由此可得从而 的置信度为1- 的置信区间为为便于记忆和理解,将 的置信区间表示为如下形式:其中d称为估计的允许误差。2. 2未知~t(n-1)设总体X~N(μ,σ2),和S2分别为样本均值和样本方差。由此可得 的置信度为1- 的置信区间为因此,对给定的置信度1- ,有即X1,X2,···,Xn为X的容量为n的样本,可以证明:故所求 的95%置信区间为解: /2=0.025,=1423.1,S=196.5, =1-0.95=0.05,n=10,查表得t0.025(9)=2.2622可用Excel的【工具】→“数据分析”→“描述统计”求解正态总体均值 的置信区间。【例1】设某元件的寿命X~N( , 2),其中 , 2未知,现随机测得10台压缩机的寿命如下(小时)1502, 1453, 1367, 1108, 16501213, 1208, 1480, 1550, 1700试求元件平均寿命 的95%置信区间课堂练习2:某车床加工的缸套外径尺寸X~N(μ,σ2),下面是随机测得的10个加工后的缸套外径尺寸(mm),90.01,90.01,90.02,90.03,89.9989.98,89.97,90.00,90.01,89.99( , )求μ的置信度为95%的置信区间;二.总体方差 2的区间估计设总体X~N(μ,σ2), /2 /21- f(x)x0从而 2的置信度为1- 的置信区间为:由~和S2分别为样本均值和样本方差。可得X1,X2,···,Xn为X的容量为n的样本,可以证明,【例2】求例1中元件寿命方差 2的95%置信区间。解:由例1,S2=196.52,n=10, /2=0.025,1- /2=0.975,故所求 2的置信区间为(135.22,358.82)(n-1)S2/(n-1)S2/= 9 196.52/19.023= 9 196.52/2.7= 135.22= 358.82课堂练习1某车床加工的缸套外径尺寸X~N(μ,σ2),现随机测得的10个加工后的某种缸套外径尺寸(mm)如下:90.01,90.01,90.02,90.03,89.9989.98,89.97,90.00,90.01,89.99( )求σ2的置信度为95%的置信区间。用样本比例代替总体比例,设总体比例为P,则当nP和n(1-P)都大于5时,样本比例p近似服从均值为P,方差为P(1-P)/n的正态分布。从而对给定的置信度1- ,由可得总体比例P的置信度为1- 的置信区间为§6.3总体比例的区间估计【例3】某厂为了解产品的质量情况,随机抽取了300件产品进行检验,其中有5件次品,求该厂产品次品率的置信度为95%的置信区间。解:产品次品率为比例, =1-0.95=0.05, /2=0.025,n=300,,查表得Z0.025=1.96,样本成数该厂产品次品率的置信度为95%的置信区间为案例思考题国外民意调查机构在进行民意调查时,通常要求在95%的置信度下将调查的允许误差(即置信区间的d值)控制在3%以内。⑴问为满足该调查精度要求,至少需要多大的样本?⑵如果要求置信度达到99%,调查误差仍为3%,此时至少需要多大的样本?案例思考题解答(1)本案例中,故需要的样本容量至少为案例思考题解答(2)如果要求置信度达到99%,则Z /2=Z0.005=2.575,§6.4样本容量确定前面的分析都是在给定的样本容量和样本数据下求置信区间。但在实际应用中,应当在随机抽样前就确定所需抽取的样本容量。抽取的样本容量过大,虽然可以提高统计推断的精度,但将增加不必要的人力、物力、费用和时间开支;如果抽取的样本容量过小,则又会使统计推断的误差过大,推断结果就达不到必要的精度要求。确定样本容量的原则——在满足所需的置信度和允许误差条件(置信区间的d值)下,确定所需的最低样本容量。1.单个正态总体均值的样本容量确定当 2已知时,置信度为1- 时的置信区间为加上或减去的量等于半个区间的长度,表示的是因为抽样误差产生的估计不准确的量。抽样误差(或误差限),e定义为则样本容量n等于值的平方乘上方差 的平方,除以抽样误差e的平方,即【例4】假设某个咨询公司进行某种产品销售数据抽样时建议,抽样误差不能大于5美元,置信度为95%。以往的数据显示销售金额数量的标准差大约为25美元,请问需要多大的样本容量才能实现上述抽样结论。解:可知美元, , ,则通常选择的样本容量要稍微地高于求出值,即选择大于计算值的整数,所以选择样本容量为100。2.总体比例区间估计时样本容量的确定其中样本比例p同样可先通过小规模抽样作出估计,也可根据其他信息估计,或取0.5。【例5】某企业要重新制定产品抽样检验的规范。已知过去检验的次品率在3.6%左右,现要求允许误差不超过2%,置信度为95%。问每次至少应抽查多少产品?解:由题意,要推断的是总体成数,p=0.036,1-p= 0.964,d= 0.02,α= 0.05,zα/2=z0.025= 1.96故每次至少应抽查334件产品。由此可知,在总体比例的区间估计问题中,要达到一定的精度要求,样本容量至少要在几百以上。3.总体均值区间估计时样本容量的确定在给定置信度和允许误差d的条件下,由可得其中总体标准差或样本标准差也是未知的,通常可以先通过小规模抽样作出估计。由于使用的是近似公式,可知实际采用的最低样本容量应比计算结果稍大。【例6】在例1元件平均寿命的区间估计问题中,要求⑴在95%的置信度下,使估计的允许误差不超过其平均寿命的10%,并设已得到例1的先期抽样数据。求所需的最低样本容量。⑵其他条件不变,在99%的置信度下求所需最低样本容量。解:⑴由例1,S=196.5,d= 1423/10 =142.3可知取n=10已能满足所给精度要求。⑵可知此时取n=20就能满足所给精度要求。在总体均值的区间估计中,通常n=30就称为大样本。在大样本时,无论总体服从什么分布,都可用前述公式进行区间估计。§6.5两个正态总体的均值差和方差比的区间估计1.两个正态总体均值差 1- 2的区间估计1).、 都已知不难证明,随机变量于是,同理可推得 1- 2的置信度为1- 的置信区间为,2).两总体是同方差的,但方差未知实际问题中大多数是这种情况,此时可以证明,随机变量其中于是同理可推得 1- 2的置信度为1- 的置信区间为,3).两总体的方差不等且未知当两个样本容量都较大(≥30)时,由中心极限定理可知,这时无论两总体服从何种分布,随机变量就近似服从N(0, 1),故可得 1- 2的置信度为1- 的置信区间为,两个正态总体均值差的置信区间的意义是:若 1- 2的置信下限大于零,就能以1- 的置信度判定 1> 2;若置信上限小于零,则能以1- 的置信度判定 1< 2;若置信区间包含零,则在1- 的置信度下不能判定哪个总体的均值大。2.两正态总体方差比 的区间估计随机变量于是对给定的置信度1- ,有则 的置信度为1- 的置信区间为【例7】(1)求例1中元件平均寿命的95%置信下限。(2)求元件寿命方差的95%置信上限。解:(1)从而 的单侧1- 置信下限为本例中,t0.05(9)=1.8331,故所求置信下限为14231-1.8331 1965/该在95%的置信度下,该元件的平均寿命大于13092小时。=13902可得由§6.6单侧置信限的区间估计同理可得 2的置信度为1- 的单侧置信上限为本例中,故所求 2的95%置信上限为9 19652/3.325 = 32332(小时2)由以上分析可知,求单侧置信限与求双侧置信限的差别仅在于用相应分布的右侧 分位点代替双侧区间估计公式中的右侧 /2分位点。解(2): 2的置信上限区间估计小结μPσ2σ2已知σ2未知双侧双侧双侧双侧单侧上限单侧上限单侧下限单侧下限§6.5其他软件实现1. SPSS实现求单个总体均值的置信区间:选择菜单栏的分析→描述统计→探索,进入探索对话框,从左边的源变量表中选择分析变量进入到因变量列表中,点击【统计量】,进入探索:统计量对话框,选择描述性,并设置均值的置信区间,点击【继续】、【确定】,则得到总体均值的置信区间。求两个总体均值差的置信区间:若两个样本相互独立,则选择菜单栏的分析→比较均值→独立样本T检验,进入独立样本T检验对话框,在源变量框中选择要进行检验的变量将其送入检验变量框,将分组变量送入分组变量框,点击【定义组】,进入定义组对话框,点击【继续】,返回主对话框,点击【选项】,设置置信区间百分比,点击【继续】、【确定】,即可得到两总体均值差的置信区间。若两个样本为配对样本,则需选择菜单栏的分析→比较均值→配对样本T检验。2. JMP实现求单个总体均值和标准差的置信区间:点击菜单栏的分析→分布,进入分布对话框,从选择列下选择变量进入右边的Y,列框,点击【确定】,得到输出结果。点击结果输出表中变量名左侧的【】,出现下拉菜单,点击置信区间,有多个置信度可供选择,若直接点击置信度0.90、0.95或0.99,则出现标准差未知情况下的均值和标准差的双侧置信区间;若需改变置信度或只需求单侧置信区间或求标准差已知条件下的置信区间,则点击其他,出现置信区间设置对话框,进行相关设置后,点击【确定】,即可输出结果。求两个总体均值差的置信区间:若两个样本相互独立,选择菜单栏的分析→以X拟合Y,进入变量设置窗口,在选择列列表中点击Y(成绩),点击【Y,响应】以将其指定为分析的响应,在选择列表中点击X(班级),点击【X,因子】以将其指定为分析的分组变量,点击【确定】,得到初始分析结果。点击左上角的【】,在出现的下拉菜单中选择均值/方差分析/合并的t或t检验,即可得到默认置信度的置信区间。若需要改变α,则通过下拉菜单中的设置α水平进行设置。若两个样本为配对样本,则需选择菜单栏的分析→配对命令。

展开更多......

收起↑

资源预览