资源简介 (共48张PPT)第六章 抽样与参数估计高等教育出版社学习目标知识目标:理解抽样与估计的基本原理;掌握抽样推断、抽样分布、统计量和参数估计的基本概念和计算方法。能力目标:能够根据统计研究目的和统计对象的特点组织抽样调查,计算样本指标(样本均值和样本方差),并依据样本对总体的数量特征(总体均值和总体比例)作出估计。第六章 抽样与参数估计第一节 抽样与抽样分布第二节 参数估计第三节 样本容量的确定第四节 EXCEL抽样与估计中的应用 第一节 抽样与抽样分布一、抽样推断的基本概念二、常用的抽样分布三、关于抽样组织形式第六章 抽样与参数估计 一、抽样推断的基本概念(一)总体和样本 统计总体,简称为总体,它是指所要研究的客观现象的全体,组成总体的每一个元素称为个体。为了推断总体的某些数量特征,我们一般是从总体中抽取一部分个体进行观察,即随机抽样。随机抽样就是按照机会均等的原则(即随机原则)从总体中抽取一部分个体的过程。假如我们抽取了个个体,且这个个体的某一指标为我们称这个个体的指标为一个子样或样本,并且一般称为简单随机样本(即子样的每个分量都机会均等的来自同一总体,各个分量之间是相互独立的),称作子样的容量。在一次抽样之后,观察到子样的一组确定的值,称为容量为的子样的观察值(或数据)。抽样推断就是按随机原则从总体中抽取一部分个体,即一个样本,进行观察,并依据所获得的数据,对总体的数量特征作出具有一定可靠程度的估计和推算,以达到对总体认识的一种统计方法。第六章 抽样与参数估计 (二)重复抽样和不重复抽样重复抽样又称为有放回抽样或回置抽样。它是指从总体N个个体中随机抽取一个容量为n的子样,每次从总体中抽取一个个体视为一次试验,连续进行n次试验构成一个子样。每次抽出一个个体,把数据记录后,又重新放回总体中参加下一次的抽选。因此重复抽样的子样是由次相互独立的试验构成的,也就是一个简单随机样本。 一般来说,从总体N个个体中,随机重复抽取容量为n的子样,总共可以抽取个Nn子样。 不重复抽样又称为无放回抽样或不回置抽样。它是从总体n个个体中抽取一个容量为n的子样,连续n次抽取构成一个子样。但每次抽出一个个体记录数据后,不再放回总体参加下一次的抽选。因此连续次抽选的结果不是相互独立的。一般来说,从总体N个个体中,随机不重复抽取容量为n的一个子样,总共可以抽取ANn个子样[ ANn是选排列的种数, ANn =N(N-1)(N-2) ……(N-n+1)]。不重复抽样比重复抽样的子样可能数目要少得多。第六章 抽样与参数估计 (三)参数和统计量 说明总体数量特征的指标称为总体参数,简称为参数。譬如,总体均值μ和总体方差σ2等。应当知道,当总体确定之后,总体参数是唯一确定的。在概率论的问题中,概率分布通常总是已知的,或者假设为已知,也就是说,总体参数是已知的,而一切计算与推理就是在这已知的基础上进行的。然而,在实际问题中,情况往往并非如此。总体的分布是什么概型可能完全不知道,或者由于现象的某些事实而知道其概型,但不知其分布函数中所含的参数。那么怎样才能知道一个随机变量的分布或其参数呢?这正是统计推断所要解决的问题之一。统计量是子样的一个函数,如果子样容量为n,它就是n个随机变量的函数,并且这个函数是不依赖于任何未知参数的随机变量。因为子样是随机的,随机变量的函数仍然是随机变量,因此统计量是随机变量。第六章 抽样与参数估计第六章 抽样与参数估计例如,(X1,X2,…Xn)是一个来自总体的容量N为的子样,那么,样本均值 就是一个统计量,它是子样的一个函数,且是不依赖于任何未知参数的随机变量。但当μ, σ2未知时, 就不是统计量。必须指出的是,尽管一个统计量不依赖任何未知参数,但是它的分布可能是依赖于未知参数的。常用的统计量还有:样本方差:样本标准差:样本阶(原点)矩:以及样本阶中心矩:等。第六章 抽样与参数估计 二、常用的抽样分布 统计量的分布称为抽样分布。在运用统计量进行统计推断时,需要知道它的分布。当总体的分布函数已知时,抽样分布是确定的,然而要求出统计量的精确分布,一般来说比较困难。下面给出来自正态总体的几个常用的抽样分布。 (一) -分布 设(X1.X2….Xn)是来自总体 的子样,则统计量服从自由度为n的 分布记为 ~ (n)。其中n为自由度,表示 中独立随机变量的个数。 分布为不对称分布,一般为正偏分布。但随着自由度n的增大逐渐向于正态分布。其数学期望μ=n,方差σ2=2n。 可用于方差估计与检验、拟合优度检验和独立性检验等。 这里,自由度是指子样中独立变量的个数。第六章 抽样与参数估计(二)正态总体N(μ,σ2)的子样均值与子样方差的分布设(X1,X2,…,Xn)是正态总体N(μ,σ2)的一个子样,其子样均值与子样方差分别为和则(1) ;(2) 与 相互独立;(3) 服从自由度为 的 分布。(三)t-分布设(X1,X2,…,Xn)是正态总体N(μ,σ2)的一个子样, 与 分别为子样均值和子样方差,则是服从自由度为n-1的t-分布。 t分布曲线与标准正态分布曲线相似,随着自由度n的增大,t分布越来越接近正态分布,并以正态分布为极限。其数学期望μ=0,方差σ2=n/(n-2)(n﹥2)。 t分布可用于总体方差未知时正态总体平均值的估计和检验。第六章 抽样与参数估计 设(X1.X2….Xn)是来自总体 的子样, (y1.y2….yn)是来自总体的子样,并且这两个子样相互独立。则统计量服从自由度n1+n2-2的t-分布,其中 与 分别为这两个子样的子样均值,与 分别为这两个子样的子样方差,且注意,这里的两个正态总体的方差相等。第六章 抽样与参数估计四、F分布服从自由度为(n1,n2) 的F分布,记为F~F(n1,n2)。 F分布一般为正偏分布,其数学期望μ= n2/(n2-2),方差为σ2=2 n2(n1+n2 -2)/n1(n2-2)2(n2-4) (n2>4)。 F分布可用于两个正态总体方差的比较检验、方差分析和线性回归模型的检验等。第六章 抽样与参数估计 三、关于抽样组织形式 在统计推断中,为了保证样本数据对总体参数的代表性,主要采用概率抽样。概率抽样有以下几种形式。 1.简单随机抽样。简单随机抽样又称纯随机抽样,它是按随机原则直接从总体中抽取个个体作为样本。在有抽样框的条件下,可用抽签的方式。更经常的是利用《随机数表》来抽取个个体。 2.分层抽样。又称类型抽样,它首先按照主要标志将总体所有个体分为若干“层”,然后在每一层内进行抽样。把总体中标志值比较接近的个体归为一层,使各层内个体的分布比较均匀,而且保证各层都有中选的机会,因此具有较好的抽样效果。 3.整群抽样。整群抽样是将总体所有个体分为若干群,然后以群为单位从中随机抽取一些群,抽中的群的所有个体构成一个子样。 4.等距抽样。又称系统抽样,它是事先将总体所有个体按某一标志排列,然后依固定顺序和间隔来抽取子样。这一方法比较常用,有时还可以与分层抽样和整群抽样结合,形成多阶段抽样等。第六章 抽样与参数估计第二节 参数估计一、点估计二、区间估计三、单个总体均值的区间估计四、单个总体比例的区间估计五、两个总体均值之差的区间估计六、两个总体比例之差的区间估计第六章 抽样与参数估计 参数估计就是指利用抽样调查得到的样本统计量去估计相应的总体指标的数值。由于总体指标是表明总体数量特征的参数,故称为参数估计。参数估计的方法有点估计和区间估计两种。 一、点估计 (一)点估计的含义 用样本统计量直接作为总体参数的估计值,称为参数的点估计。比如,用样本平均数的值直接作为总体平均数的估计值,用样本比例直接作为总体比例的估计值,等等。例6.1 对某学院一教学班学生考试成绩进行抽样调查,随机抽取5名学生组成样本,测得平均成绩为85分。我们用85分作为该班全体学生该次考试平均成绩,这就是点估计。第六章 抽样与参数估计 对于同一参数,用不同方法估计,可能得到不同的估计量一般而言,任何统计量都可以作为未知参数的估计量。但究竟采用哪一种为好呢?这就涉及到用什么标准来评价估计量的问题。对于一个好的估计量通常要求满足以下几个常用标准。 1.一致性。设 为参数θ的估计量,若对任意的 ,当n→∞时, 依概率收敛于θ ,则称 为θ的一致估计量。 样本均值 作为总体期望μ的一个估计量就满足一致性标准的要求。 一致性标准的要求是从极限性质来说的,因此只有对于样本容量较大时才起作用。 2.无偏性。若估计量 的数学期望 存在,且对任意的 有则称 是θ 的无偏估计,否则称为有偏的。例6.2 证明子样均值是总体均值的一个无偏估计,但子样方差不是总体方差的无偏估计。第六章 抽样与参数估计 解:因为子样(X1,X2,…,Xn)是总体X独立同分布的n个随机变量,从而有相同的数学期望和方差。故E(X1)=E(X2)= … E(Xn)=μD(X1)=D(X2)= … D(Xn)=σ2则所以,子样均值 是总体均值μ的一个无偏估计量。又因为第六章 抽样与参数估计由于 所以sn2不是σ2 无偏估计量,但所以通常用作为总体方差的无偏估计量。第六章 抽样与参数估计 3.有效性。设 与 都是θ的无偏估计量,若有则称 较 有效。一般来说,一个未知参数θ可以有不同的无偏估计量。如果 和 是未知参数θ的两个无偏估计量。如果在子样容量n相同的情况下, 的观察值较 更密集在真值的附近,即 的方差较小,我们就认为 比 有效。第六章 抽样与参数估计(三)抽样误差抽样误差就是样本统计量与被估计的总体未知参数之差。要指出的是,我们在这里所讨论的抽样误差不是指那种由人为因素所造成的所谓登记性误差,而是指随机抽样本身所固有的一种代表性误差。1.因为总体参数是未知的,所以这种误差在每一次实际的抽样中是不知道的;2.这种误差是不可避免的,但可以用大数定律的数学公式确定它的界限,并通过抽样设计加以控制;3.这种误差是一随机变量,它不是固定的一个数,而是随着样本而可大可小的变量,现以子样均值为例,当用子样均值 去估计总体均值的时候,即为,但是,由上面已经知道,这个误差是一个随机变量,不是固定的一个数。很自然就会引出抽样平均误差这一指标,以反映抽样误差的一般水平。又因为子样均值和子样比例分别是总体体均值和总体比例的无偏估计,所以可将所有子样的抽样误差用求标准差的方法来处理。第六章 抽样与参数估计抽样平均误差就是子样均值(或子样比例)的标准差,用以反映子样均值(或子样比例)与总体均值(或总体比例)的平均误差程度。子样均值的平均误差记为 。子样比例的平均误差记为 。可以证明,在重复抽样条件下,子样均值的平均误差为:子样比例的平均误差为:其中σ表示总体的标准差,p为总体比例,n为子样容量。 抽样平均误差,并不等同于子样均值与总体均值,或子样比例与总体比例的实际误差,它只是衡量可能误差范围的一种尺度。我们无法计算,也不必要计算实际误差,我们只能把抽样误差控制在一定的范围内,这就是下面要给出的抽样极限误差。抽样极限误差是指抽样估计量和总体参数之间抽样误差的可能范围,记为或 ,分别表示子样均值的极限误差或子样比例的极限误差。即或。第六章 抽样与参数估计 二、区间估计 区间估计则是估计未知总体参数所在的一个范围 ,即一个区间。这样的区间估计同时涉及到估计的可靠性和估计的精确性两个方面的问题。 (一)置信区间与估计的精确性 设总体 的密度函数为 , 为未知参数。对于给定的α,若由子样所确定的两个统计量 和 满足则称随机区间 是 的置信度为 的置信区间,称 为显著性水平。 随机区间 可以表示为与其等价的形式 。其中 为待估计的未知参数, 为相应的估计量。 称为估计的极限误差,它是概率度 与抽样平均误差 之积。极限误差 的大小,就是反映估计的精确性的,同时它又是与估计的置信度相联系的。当我们要求以较高的可靠性(即置信度)进行区间估计的时候,概率度就大一些。概率度 大,对应的极限误差 就大(对于一次抽样来说,抽样平均误差 是确定不变的),极限误差大,那么估计的精确性就差。反之,当以较低的可靠性作区间估计的时候,概率度 就小一些。概率度小,对应的极限误差 也就小,极限误差越小,那么估计的精确性就越好。所以置信区间一方面是给出了估计值的一个区间范围,另一方面它反映了区间估计的精确性。第六章 抽样与参数估计 (二)置信区间与估计的可靠性 置信区间 是一随机区间,一般而言,这种估计只能具有一定的可靠性,置信度就是反映估计的可靠性的。当给定置信度为 时,其含意是指在重复取样下,将得到许多不同的区间 ,根据贝努利大数定律,这些区间中大约有 的区间包含未知参数。对于一次抽样所得到的一个区间,决不是说“ 不等式成立的概率为 ”。 区间估计的可靠性和估计的精确性是一对矛盾,一般来说,作区间估计,我们不可能既要求有较高的可靠性,同时又要求有较高的精确性。只能针对具体的研究目的,在这两者之间选择其一。第六章 抽样与参数估计三、单个总体均值的区间估计(一)正态总体 和 已知时,总体均值μ的区间估计当 ,由第一节已知,子样均值 ,则统计量对于给定的显著性水平α ,令即有从而有即在给定显著性水平下,总体均值在的置信水平下的置信区间为:第六章 抽样与参数估计 例6.3 某种零件的厚度服从正态分布,从该批产品中随机抽取9件,测得平均长度为23.4mm。已知总体的标准差σ=0.15mm,试估计该批零件厚度的区间范围,给定置信水平为95﹪。解:已知总体 , , , , 。总体均值 的置信区间为:即为(23.302,23.498)。我们可以 95﹪ 的概率保证程度估计该批零件的平均厚 度 在23.302mm~23.498mm之间。当总体为非正态总体时,可以证明,当子样容量足够大时,子样均值近似地服从期望为μ,方差为 的正态分布。经验上一般规定大样本(n>30)时,就认为子样容量已足够大了。第六章 抽样与参数估计(二) 未知时总体均值的区间估计当总体X服从正态分布,但总体方差σ2未知时,要用方差的无偏估计代替总体方差σ2 ,这时我们构造的子样函数为它服从自由度为n-1的t分布不依赖任何未知参数。对于给定的置信度1-α,我们有这里 可查自由度为n-1的t分布表得到。经过不等式的等价变换,得到μ的置信度为n-1的置信区间 例6.5 某灯泡厂生产一种新型灯泡,为了了解灯泡的使用寿命,在生产线上随机抽取9只灯泡进行测试,得到下列数据(小时):5100,5100,5400,5260,5400,5100,5320,5180,4940。若灯泡的使用寿命服从正态分布,现以95﹪的可靠性估计该批新型灯泡平均使用寿命的区间范围。 解:这是一个方差未知的正态总体均值的区间估计问题。现已知子样观察值及, (查分布表),经计算得:所以该批灯泡平均使用寿命置信度为95﹪的置信区间是(5079,5321)。第六章 抽样与参数估计四、单个总体比例的区间估计总体比例也是常见的参数之一,它是指总体中具有某种特征的个体占总体全部个体的比例,记为 。实践中研究这样的问题是很多的,例如,一批种子的发芽率;全部产品的合格率;某地区义务教育阶段适龄儿童的入学率;全部职工中女职工所占的比例等。子样中具有某种特征的个体占子样全部个体的比例称为子样比例,记为 。可以证明,在大样本的情况下,若 则可以把二项分布问题变换为正态分布问题近似地去求解。因而有即子样比例 服从期望值为 ,方差为 的正态分布。因而,可以用统计量U来构造总体比例 的置信区间,即在估计总体比例 时,由于 未知 ,那么在上式中就用子样比例 代替。因而在给定的置信水平 下,总体比例 的置信区间为第六章 抽样与参数估计 例6.6 某地区调查下岗职工中女性的比例,随机抽取了36个下岗职工,其中20人为女性。现以95﹪的置信度估计该地区全部下岗职工中女性比例的区间范围。 解:首先求下岗职工中女性的子样比例 再求 给定置信度 ,查正态分布表 。因而置信区间为即可以95﹪的可靠性估计该地区全部下岗职工中女职工所占的比例在40%~72%之间。第六章 抽样与参数估计五、两个总体均值之差的区间估计 在实际中,人们经常需要比较两个总体均值的问题。例如,研究社会发展时,要比较两个地区居民的人均年收入;某化工厂要比较两种催化剂对化学生产过程的得率的影响;兵器厂要比较两种型号步枪子弹的枪口速度等等。这通常要对两个总体均值之差作区间估计。 (一)两个总体的方差 、 已知时的估计 这里包括两种情形,一是两个总体均服从正态分布,它们的方差 、 已知;二是两个总体的分布未知,但来自两个总体的两个子样为大样本,且它们的方差 、 已知。这时可以证明:或即得 的一个置信度为 的置信区间第六章 抽样与参数估计例6.7 一家银行的负责人要了解储户存入两家银行的储蓄存款,从两家银行的储户中各任抽25户,计算得到子样均值: 元, 元。设两个总体均服从正态分布,且已知它们的方差分别为 和 。试以95﹪的置信度,求 的置信区间。如果提高估计的置信度为99﹪,此时估计区间将怎样变化?解:由题意可知: ,从而 的置信度为95﹪的置信区间是:即, 查正态分布表, 。 如果置信度提高到99﹪,此时查表 ,那么置 信 区 间 为。比较这两个区间,我们可以看到置信度越高的,其估计区间越长,估计区间越长,其实质就是允许误差越大,那么估计的精确性越差。这正是我们在前面“置信区间与估计的精确性”的一段论述中所谈到的。第六章 抽样与参数估计(二)两个总体方差 、 未知时的估计已知 ,但 未知,此时,由第六章第一节抽样与抽样分布知从而可得置信度为 的置信区间是其中例6.8 某军工厂为比较两种型号步枪子弹的枪口速度,随机抽取Ⅰ型步枪子弹10发,得到枪口速度的均值为 ,标准差为 。随机抽取Ⅱ型步枪子弹20发,得到枪口速度的均值 ,标准差,设两总体近似服从正态分布,且它们的方差相等。试以95﹪的置信度估计两总体均值之差 的区间范围。第六章 抽样与参数估计解:由题意知,两总体服从正态分布,且它们的方差相等,但方差未知。故适用两总体方差未知时两总体均值之差 的区间估计。已知 ,查表得 。 故置信度为95﹪的两总体均值之差 的区间范围是即(3.21,4.79)。第六章 抽样与参数估计六、两个总体比例之差的区间估计设两个总体比例分别为 和 ,为了估计两个总体比例之差 ,于是分别从两个总体中各自随机抽取容量为n1和n2两个子样,子样比例分别为 和 。可以证明,当两个子样均为大样本,且 时,子样比例之差 的抽样分布近似服从正态分布,并且从而 的置信度为 置信区间是:但因总体比例 与 均未知,在上式中要分别用子样比例 和 代替,因此, 的置信度为 的置信区间为第六章 抽样与参数估计 例6.9 在某个节目的电视收视率的问卷调查中,城市随机调查了500人,有36﹪的人收看了该节目,在乡村调查了400人,有30﹪的人收看了该节目。现以95﹪的可靠性估计城市与乡村收视率差别的区间范围。 解:由题意知, , , 又 查表 ,故得收视率差别的区间范围是即某个节目城市与乡村的电视收视率差别的区间范围是零到12﹪左右(-0.001,0.121)。这种估计大致有95﹪的可信度,还是比较符合实际情况的。第六章 抽样与参数估计第三节 样本容量的确定一、确定样本容量应考虑的主要因素二、估计总体均值时样本容量的确定三、估计总体比例时样本容量的确定第六章 抽样与参数估计 一、确定样本容量应考虑的主要因素 在前面的讨论中,我们都是假定样本容量n是已知的,但是在实际问题中,往往需要设计调查方案,确定样本容量。如果n选得过大,会增加调查费用;如果选得过小,会使估计的精确性降低,误差增大。确定适当的样本容量是抽样估计的一个重要问题。一般来说确定样本容量,应当考虑以下几个因素: 1.对某项估计要求什么样的精确度,即我们希望估计值与总体参数之间的允许误差控制在什么样的范围以内。换句话说,我们想构造多宽的置信区间。在其它条件一定的情况下,如果要求的置信区间较宽,样本容量可以小一些,反之则需要较大的样本容量。 2.对于我们要求的置信区间来说,想要多大的置信度,也就是说,估计总体参数包含在置信区间内要求有多大的可靠性。一般来说,在其它条件一定的情况下,如果要求的置信度较大,需要较大的样本容量。反之样本容量可小一些。 3.对于该项抽样估计所能承担的费用。第六章 抽样与参数估计二、估计总体均值时样本容量的确定(一)重复抽样条件下样本容量的确定作总体均值的区间估计时,或在大样本的情况下,样本均值的抽样分布服从正态分布。因此总体均值μ的置信区间由下式确定为:这一公式表示在置信度为1-α时,总体参数μ与样本均值 的绝对离差不超过 ,称之为抽样极限误差(又称允许误差),一般表示为 。其中是相对于置信度1-α在正态分布下的置信系数,又称为概率度。它是由置信度和抽样分布所决定的一个值,在概率分布表上可以查到,所以通常又称临界值。σ是总体变量的标准差。由上式得到:这一公式指出样本容量取决于置信度1-α ,即相应的 ,还取决于总体方差σ2和估计时的抽样允许误差Δ。第六章 抽样与参数估计样本容量n与置信度1-α 总体方差σ2和估计时的抽样允许误差Δ有以下关系:1.置信度与样本容量成正比,当σ和Δ保持不变时,置信度愈高,则样本容量愈大;2.总体方差与样本容量成正比,总体变量差异愈大,样本容量也愈大;3.抽样允许误差与样本容量成反比,允许误差愈大,样本容量愈小。或者说,估计的精确度要求愈低,必要的样本容量就越少。例6.10 一家广告公司想要估计批发类商店在一年里所开支的平均广告费用,根据以往的资料,总体方差约为1500000元。若给定置信度为95﹪,允许误差控制在500元的范围以内,这家广告公司要设计多大容量的样本?解:已知即这家广告公司应设计抽选23个批发类商店作调查样本。第六章 抽样与参数估计(二)有限总体不重复抽样条件下的样本容量在实际抽样问题中,总体一般是有限的,当采用不重复抽样时,总体均值μ的置信区间为:当抽样比n/N<0.05时,上式近似为:因此允许误差为:于是得到:第六章 抽样与参数估计三、估计总体比例时样本容量的确定(一)重复抽样条件下的样本容量作总体比例的区间估计时,总体比例P的置信区间为:于是允许误差为:由此得到:在作总体比例估计时,有时使用相对误差的概念,估计的相对误差记为Δp/p,则允许相对误差r= Δp/p 。那么,样本容量为第六章 抽样与参数估计例6.11 某市作一项人口出生率的社会调查,根据以往的资料,该市的人口出生率约为12‰,现要求相对误差不超过10﹪,置信水平为95﹪,在重复抽样条件下,应设计多大容量的样本?解:题目给出的是允许相对误差r=10﹪,α=0.05,所以应设计的样本容量为31959人。(二)有限总体不重复抽样条件下的样本容量当有限总体不重复抽样时,由同样的道理可以得到允许误差为:于是有:第六章 抽样与参数估计第四节 EXCEL抽样与估计中的应用 用Excel的函数工具以及自己输入公式等组合方式,可以进行抽样与估计分析计算。下面我们用Excel求置信区间的例子来说明具体操作步骤和过程。 例6.12 某车间生产了一批零件,从这批零件中随机抽取12个,测得其长度(单位:mm)数据如附表6.1中A列所示。假定零件长度遵从正态分布,试以95%的置信水平估计这批零件平均长度的置信区间。 首先,打开Excel工作表,然后在表格中输入下列内容:A列输入样本数据,B列输入变量名称,D列存放变量值。具体操作是: D2 输入“=COUNT(A2:A13)”,得到数字12;D3输入“=AVERAGE(A2:A13)”得到11.07167;D4输入“=STDEV(A2:A13)”得到0.274352;D5输入“=D4/SQRT(12)”得到0.079199;D6输入0.95;D7输入“D2-1”得到11;D8输入“=TINV(1-D6,D7)”得到2.20985;D9输入“=D8*D5”得到0.174316;D10输入“=D3-D9”得到10.89735;D11输入“=D3+D9”得到11.24599。由以上结果,我们有95%的把握认为该车间生产的这批零件的平均长度在10.89735㎜~11.24599㎜之间。第六章 抽样与参数估计表6.1 总体均值置信区间的计算表第六章 抽样与参数估计本章小结 本章阐述了抽样与估计的基本理论与方法,其主要内容包括抽样及抽样分布原理、参数估计理论与方法及样本容量的确定。 抽样推断就是按随机原则从总体中抽取一部分个体组成样本进行观察,并依据所获得的数据,对总体的数量特征作出具有一定可靠程度的估计和推算,以达到对总体认识的一种统计方法。 在抽样推断中,我们称根据总体数据计算的总体指标(总体均值和总体成数)为参数,根据样本数据计算的样本指标(样本均值和样本成数)为统计量。统计量的分布称为抽样分布,常用的抽样分布主要有正态分布、分布、分布、分布等。 参数估计包括点估计和区间估计。 样本容量的计算主要有重复抽样下样本容量的计算和有限总体不重复抽样下的样本容量计算两种情况。第六章 抽样与参数估计同步训练一、单项选择题1.在估计总体参数θ时,构造一个置信区间(1-α)(α=0.05) ,其置信水平为95%,下面哪一种说法最准确( )。A.落在该区间的概率为95%; B.不落在该区间的风险为5%;C.有95%的随机区间会包括; D.这一估计的误差不超过5%2.置信水平表示是区间估计的( )。A.精确性; B.准确性; C.显著性; D.可靠性3.设一正态总体 ,抽取容量为n=16的随机样本,其样本均值的抽样平均误差是( )。A.10; B. ; C.2.9; D.3.84.估计量的抽样平均误差大小反映了估计的( )A.精确性; B.准确性; C.显著性; D.可靠性5.在参数估计中利用t分布构造置信区间的条件是( )A.正态总体,且方差已知; B.正态总体,且方差未知;C.总体不一定为正态分布,但是大样本;D.总体不一定为正态分布,但方差已知第六章 抽样与参数估计二、填空题1.在正态分布条件下,所谓“3σ”原则是指:总体均值μ左右1σ范围内的概率是( ),2σ范围内的概率是( ),3σ范围内的概率是( )。当置信水平为90%时,双侧检验的临界值 为( ),置信水平为95%时, 为( ),置信水平为99%时, 为( )。2.设正态总体,总体单位数为N,已知总体方差σ2,抽取样本容量为n,对总体均值μ作估计时,其无偏估计量( ),在重复抽样条件下,构造置信区间的抽样平均误差( ),在不重复抽样条件下的抽样平均误差( )。3.有一总体,单位数为N,抽取大样本n,对总体比例进行估计,无偏估计量为( ),在重复抽样条件下,构造置信区间的抽样平均误差( ),在不重复抽样条件下,其抽样平均误差( )。4.设两总体,均值分别为μ1和μ2 ,估计两总体均值之差μ1-μ2 。抽取容量分别为n1和n2的两样本,则两总体均值之差的无偏估计量( ),若两总体的方差相等且已知为σ2 ,估计量的抽样平均误差( ),若两总体方差相等但未知时,估计量的抽样平均误差( )。5.区间估计时,置信区间的大小可以反映估计的( ),置信水平的大小反映估计的( ),若置信水平为1-α时,α表示( )。第六章 抽样与参数估计三、案例分析某大学在三年级4500名学生中,随机抽取20%,调查每周上网次数,获得如下资料:表6.2 某大学三年级学生每周上网次数统计表试求在95.45%的概率保证下:1.学生每周上网次数;2.确定每周上网4次以上的学生比重,要求误差不超过3%。第六章 抽样与参数估计上网次数 0-2 2-4 4-6 6-8 8-10学生比重(%) 8 22 40 25 5阅读、讨论与思考 阅读袁卫、庞皓、曾五一主编《统计学》(高等教育出版社2000年7月第1版)、黄良文主编《统计学原理》(中国统计出版社2000年6月第1版)、贾俊平主编《统计学》(中国人民大学出版社2003年6月第1版)等文献的相关内容,通过讨论,指出抽样调查中的抽样组织方式有哪些,各种抽样方式下抽样平均误差应如何计算(写出计算公式,并能解释公式中各指标的含义和计算方法)。第六章 抽样与参数估计主编:……撰稿教师:……(以姓氏为序)制作:……责任编辑:……电子编辑:……中国高等教育出版社 展开更多...... 收起↑ 资源预览