项目八 统计推断 教案(表格式)《统计基础》(高教版)

资源下载
  1. 二一教育资源

项目八 统计推断 教案(表格式)《统计基础》(高教版)

资源简介

项目八统计推断
教学项目与任务 项目八统计推断 任务1抽样推断概述
教学目标 知识目标 抽样推断的含义、作用、内容 抽样推断的基本概念 抽样方法、抽样组织形式
能力目标 理解抽样推断的定义和作用,掌握抽样推断的基本概念、抽样方法、抽样的组织形式
教学重点 抽样推断的含义、内容、基本概念
教学难点 抽样推断的内容、方法以及组织形式
教学方法与手段 教学媒体及课件、案例教学
授课内容与过程 第一步:导入新课 前面我们一起学习了综合指标、时间数列、统计指数等分析方法,但在具体的统计工作中,对某些社会经济现象总体数量特征的认识,如果运用全面调查方法以取得数据资料、计算总体指标可能会遇到很多困难。因为有些现象具有破坏性或消耗性,不可能进行全面调查,像对电视机显像管使用寿命的调查、食品的卫生检查等;有些现象虽然从理论上可以进行全面调查,但由于其总体规模太大,实际操作困难,例如对城市居民家庭收支情况的调查,对城市居民某一节目的电视收视率的调查等。此时,由于数据无法或很难采集,也就无法计算总体的有关指标以描述其数量特征了。在统计实务中,为了解决上述问题,多采用抽样推断的方法。 第二步:授新课 一、抽样推断的的含义和特点 所谓抽样推断,是指按照随机原则从总体中抽取一部分单位进行观察,了解其数量特征,并以此为基础,对总体的数量特征作出推断的一种统计分析方法。抽样推断是认识现象总体的一种重要方法,在统计工作中广为应用。它具有以下特点: 1.抽样推断是一种由部分推算整体的研究方法。 2.抽样推断建立在随机抽样的基础上。 3.抽样推断的理论依据是大数定律。 4.抽样误差虽不可避免,但可以进行计算和控制。 二、抽样推断的作用 随着抽样理论和技术的不断发展,抽样推断发挥着日益重要的作用,具体表现在以下几个方面。 1.对那些不可能进行全面调查或很难进行全面调查的问题,可采用抽样推断的方法解决。 2.对那些不便于、不需要采用全面调查的问题可以采用抽样推断的方法。 3.抽样推断可以用来检验和修正全面调查资料。 4.抽样推断方法可以用于工业生产过程中的质量控制。 5.利用抽样推断的方法,可以对某种总体的假设进行检验,来判断这种假设的真实性。 总之,抽样推断是一种科学实用的统计方法,在自然科学与社会科学领域都有着广泛的应用。 三、抽样推断的内容 (一)参数估计 根据所获得的样本资料,对所研究现象总体的数量特征(如总体的水平、结构、规摸等数量特征)进行估计,这种推断方法称为总体参数的估计,例如粮食产量抽样调查、居民家计抽样调查、产品质量抽样调查、民意抽样测验等都属于参数估计的推断方法。 参数估计包括许多内容,如确定估计值,确定估计的优良标准并加以判别,求估计值和被估计参数之间的误差范围,计算在一定误差范围内所作推断的可靠程度,等等。 (二)假设检验 假设检验亦称显著性检验,是用来判断样本与样本,样本与总体的差异是由抽样误差引起还是本质差别造成的统计推断方法。其基本原理是先对总体的特作出某种设,然后通过抽样研究的统计推理,对此假设应该被拒绝还是被接受作出推断。 四、抽样推断的几个基本概念 (一)全及总体和样本总体 1.全及总体 全及总体,简称总体,是指所要认识对象的全体,它根据统计研究的目的而确定。 2.样本总体,简称样本,就是从全及总体中随机抽取出来,代表全及总体部分单位的集合体。样本总体的单位数通常用小写英文字母表示,也称为样本容量。一般说来,样本单位数时称为大样本,时称为小样本。 全及总体是由统计研究的目的而唯一确定,但是,样本总体却完全不同。一个全及总体中可以抽取很多个样本总体,至于可能抽得的样本的数量,则与抽样的样本容量有关,也与抽样的方法和组织形式有关。 (二)全及指标和样本指标 1.全及指标 根据全及总体各个单位的标志值或标志表现计算得到的反映总体某种特征的指标,就是全及指标,也称作总体参数。由于全及总体是唯一确定的,因而全及指标也是唯一确定的。 根据需要,我们可以计算不同的全及指标。常见的全及指标是平均数和标准差(或方差)。 如果是根据全及总体中各单位的数量标志值计算全及指标,那么相关的公式为: 或 或 或 如果是根据全及总体中各单位的品质标志表现计算全及指标,那么我们一般计算总体成数的平均数与标准差(方差)。所谓总体成数,就是一种结构相对指标,用来说明总体中具有某种属性的单位数在总体中所占的比重,用大写英文字母表示。 设全及总体个单位中,有个单位具有某种属性,个单位不具有某种属性,,为全及总体中具有某种属性的单位数所占的比重,为全及总体中不具有某种属性的单位数所占的比重,则总体成数为: 此时,因为品质标志表现只有是与非两种,例如产品质量标志表现为合格品和不合格品,性别标志表现为男性和女性,则可以把“是”(即具有某种属性)的标志表现表示为1,而“非”(即不具有某种属性)的标志表现表示为0,那么,成数P就可以视为(0,1)分布的平均数,并可以求相应的方差()和标准差()。 总体成数的平均数: 总体成数的方差: 总体成数的标准差: 最后,需要说明的是,在抽样推断中,全及指标的具体数值是事先未知的,需要用样本指标来估计它。 2.样本指标 根据样本总体各个单位的标志值或标志表现计算的综合指标称为样本指标,也称作统计量。与全及指标相对应,样本指标有样本平均数、样本成数p、样本标准差s和样本方差等等。和p用小写英文字母表示,以示区别。 抽样(样本)平均数为: 或 其样本方差和样本标准差分别为: 或 或 设样本总体中有个单位具有某种属性,个单位不具有某种属性, ,为样本中具有某种属性的单位数所占的比重,为不具有某种属性的单位数所占的比重,则抽样成数(样本成数)为: 则样本成数的平均数: 样本方差: 样本标准差: 由于一个全及总体可以抽取许多个样本,样本不同,样本指标的数值也就不同,所以样本指标的数值不是唯一确定的。实际上样本指标是样本变量的函数,它本身也是随机变量。 (三)抽样方法 从抽样的方法来看,抽样可以分为重复抽样和不重复抽样两种。 1.重复抽样 重复抽样,也称为回置抽样,是从总体中抽取样本时,随机抽取一个样本单位,记录该单位有关标志表现以后,把它放回到总体中去,然后,再从总体中随机抽取第二个样本单位,记录它的有关标志表现以后,也把它放回总体中去,照此下去直到抽选出预定的样本单位数为止。 可见,该方法之所以被称为重复抽样,就是因为总体各单位都有被重复抽中的可能。 从总体个单位中,运用重复抽样的方法,随机抽取个单位构成一个样本,根据排列组合原理,共可抽取个可能的样本。 2.不重复抽样 不重复抽样,也称为不回置抽样,即在总体中随机抽选出第一个样本单位,记录该单位有关标志表现后,这个样本单位不再放回总体中参加下一次抽选,然后,再从剩余的总体单位中随机抽取第二个样本单位,照此下去直到抽选出预定的样本单位数为止。 可见,该方法之所以被称为不重复抽样,也是因为总体各单位都没有被重复抽中的可能。 从总体个单位中,用不重复抽样的方法,抽取个单位构成一个样本,根据排列组合原理,共可抽取…个可能的样本。 因此,在样本容量相同的情况下,重复抽样抽取的可能的样本个数总是大于不重复抽样抽取的可能的样本个数。 (四)抽样调查的组织形式 按抽样时对总体的加工整理形式不同,抽样的组织方式可分为简单随机抽样、类型抽样、等距抽样和整群抽样等。 1.简单随机抽样 (1)简单随机抽样的含义 简单随机抽样,是指不对总体做任何加工整理,按照随机原则直接从总体中抽取调查单位的抽样调查方式。简单随机抽样是最常用的抽样方式,在此种抽样方式下,可以保证每个总体单位的入样概率相同,所以也称为纯随机抽样。它适用于均匀总体,即具有某种特征的单位均匀地分布于总体的各个部分。 (2)简单随机抽样的方法 从总体中按简单随机抽样方式组成单位以构成样本,有许多种方法,最常用的方法是抽签法和随机数表法。 ①抽签法 ②随机数表法 2.分层抽样 分层抽样,是指将总体的单位按某种特征分为若干组(层),然后再对每一层进行单纯随机抽样的方法,也称为分类抽样或类型抽样。具体抽样方法为:将总体的N个单位分成互不交叉、互不重复的k个部分(即层);然后在每个层内分别抽选个样本单位,构成一个容量为(++…+)的样本的一种抽样方式。 实际上,分层抽样是科学分组与抽样原理的有机结合,分组是划分出性质比较接近的层,以减少标志值之间的变异程度;进一步在层内按照随机抽样原理抽选样本。因此,分层抽样一般比简单随机抽样更为精确,能够通过对较少的样本进行调查,得到比较准确的推断结果,特别是当总体数目较大、内部结构复杂时,分层抽样常能取得令人满意的效果。 3.系统抽样 系统抽样是指将总体中各单位按一定顺序排列后,根据样本容量要求确定抽选间隔,然后随机确定起点,每隔一定的间隔抽取一个单位的一种抽样方式,也称为等距抽样或机械抽样。具体抽样方法为:先将总体从1到N编号,并计算抽样距离k=,其中,N为总体单位总数,n为样本容量。然后在1到k的编号中抽一随机数s,作为样本的第一个单位,接着取s+k,s+2k,…,直至抽够n个单位为止。其中,将总体单位排序的标志,可以是无关标志,也可以是有关标志。 系统抽样的最主要的优点是简便易行,且当对总体结构有一定了解时,充分利用已有信息对总体单位进行排队后再抽样,则可提高抽样效率。 4.整群抽样 整群抽样,是根据总体的特征,将总体中各单位归并成若干个互不交叉和重复的集合(群),并以群为抽样单位抽取样本的一种抽样方式,也称为聚类抽样。具体抽样方法为:根据研究的目的选择分群的标准,把容量为N的总体划分为互不交叉的k个群,然后根据样本量从k个群中随机抽取若干个群,对这些群内所有的个体均进行调查。 整群抽样特别适用于缺乏总体单位的抽样框。 整群抽样的优点是实施方便、节省经费,但实际过程中不同群之间的差异可能较大,此而引起的抽样误差往往大于简单随机抽样。在同样条件下,要取得与简单随机抽样相同的精度,应适当增加样本单位数。 5.多阶段抽样 很多时候,由于总体单位很多,且分布范围较广,几乎不可能直接从总体中抽取样本单位,可考虑多阶段抽样。所谓多阶段抽样,是指将抽取样本单位的过程分阶段进行。即首先从总体中抽出一个大群体,再在这个大群体中抽取较小的群体,这样一层一层地向下进行,直至抽取到构成样本总体的最基本单位为止。不过,在多阶段抽样的最后一步中,我们要采取简单随机抽样、分层抽样或等距抽样抽取样本单位。 多阶段抽样十分类似于整群抽样,具有整群抽样的优点,即保证了样本的相对集中,节约了调查成本,也不需要将总体编成抽样框,但缺点也很明显,即调查结果的精度不是很高,且推算复杂。因此,它较适合作大规模的抽样调查。 第三步:巩固新课,课堂小结 我们学习了抽样推断的定义、作用以及分类。
作业练习 完成学习通随堂测
教学总结 本节课是讲述“抽样推断”的第一堂课,授课中应力求简明易懂、深入浅出。通过案例让同学们掌握抽样推断的定义、作用、基本概念及方法。
教学项目与任务 项目八统计推断 任务2抽样误差
教学目标 知识目标 抽样误差
能力目标 理解统计误差,掌握抽样误差、抽样平均误差、抽样极限误差
教学重点 抽样误差、抽样平均误差、抽样极限误差
教学难点 抽样平均误差的计算
教学方法与手段 教学媒体及课件、案例教学
授课内容与过程 第一步:导入新课 上一讲我们抽样推断的概述,同学们掌握了抽样推断的含义、作用、内容以及一些基本概念。今天我们要学习抽样误差,它有哪些种类,是如何计算的。 第二步:授新课 一、统计误差 统计误差是统计过程中真实值与观测值之间的偏差,具体表现如:样本均值与总体均值的差异,样本方差与总体方差的差异。如某企业的库存额统计结果为50万元,而真实库存额为49.8万元,则统计调查误差就是0.2万元。统计误差根据来源不同,可分为登记性误差和代表性误差。 (一)登记性误差,是指在统计调查、整理和推算过程中,由于人为过错产生的误差,也称调查误差或工作误差。实际过程中,登记性误差有:调查方案中有关规定或解释不明确导致的填报错误;由于工作失误造成的计量错误、计算错误、抄录错误和汇总错误;以及调查者或被调查者有意弄虚作假,虚报瞒报等。一般而言,登记性误差在抽样调查和非抽样调查中都会产生,且调查范围和规模越大,产生登记误差的可能性就越大。 (二)代表性误差,是指在抽样调查中,用部分资料得到的数据去推断总体所产生的误差,只出现在抽样调查过程中。代表性误差具体有两种:①系统性误差,由于违反了抽样调查的随机原则而导致的代表性误差。如有意识选择好的单位或较差的单位进行调查而造成的误差。②随机性误差,指遵循了随机原则,可能抽到各种不同的样本而产生的随机性误差。随机性误差在抽样推断中是不可避免的,是偶然的代表性误差。 二、抽样误差 抽样误差就是指随机性误差,是指在遵循了随机原则的前提下,由于样本结构与总体结构的差异所引起的样本指标和总体指标之间的数量差异。因此,抽样误差是指由于抽样的随机性而产生的那一部分代表性误差,不包括登记误差,也不包括可能发生的系统性误差。随机误差是不可避免的,但可以进行计算,并设法加以控制。 从总体中随机地抽取样本,据此得到的样本指标值与总体真实指标值之间存在一定的偏差,这种偏差称为实际抽样误差。如样本均值与总体均值的偏差,样本成数与总体成数的偏差等。由于样本均值、样本成数是随机变量,因而抽样误差也是一个随机变量。一般而言,抽样误差越小,说明样本的代表性越高;反之,样本的代表性越低。 抽样误差的影响因素 为了计算和控制抽样误差,需要分析影响抽样误差的因素。抽样误差大小主要受以下三个因素的影响。 (一)总体标志的变异度 在其他条件一定的情况下,总体标志变动度越大,抽样得到的样本结构与总体结构的差异就越大,抽样误差也就越大;反之,总体标志变动度越小,抽样得到的样本结构与总体结构的差异就越小,抽样误差也就越小。 (二)抽样单位数的多少 在其他条件一定的情况下,抽取的单位数越少,抽样得到的样本结构与总体结构的差异就越大,抽样误差也就越大;样本单位数越多,抽样得到的样本结构与总体结构的差异就越小,则抽样误差也就越小。当抽样单位数扩大到与总体单位数相同时,抽样调查就变成全面调查,样本指标等于全及指标,也就不存在抽样误差了。 (三)抽样方法与组织的方式 由于不同的抽样方法与不同的抽样组织方式,会形成不同的样本结构,所以,抽样方法与组织的方式也是影响抽样误差的因素。 三、抽样平均误差 (一)抽样平均误差的含义 由于样本是根据随机原则确定的,而总体则是唯一确定的,因此,由随机的样本统计量与确定的总体参数之间产生的抽样误差也是随机的。面对抽样误差的随机性,我们在进行推断时,就很关心样本指标与总体指标之间误差的一般水平,也就是抽样误差的平均数,即抽样平均误差。 抽样平均误差是指所有可能的样本指标的标准差,它反映抽样误差的一般水平,可以计算。在讨论抽样误差时通常指的是抽样平均误差。正因为抽样平均误差概括了所有抽样总体的误差,因而可用它作为一个尺度来衡量样本指标代表性大小和误差的可能范围。某一次抽样所得的样本指标与总体指标的误差可能大一些,也可能小一些,但用抽样平均误差来衡量就比较恰当。同时应当指出,抽样平均误差只是衡量抽样指标与总体指标之间可能发生误差的一种尺度,并不是抽样指标与总体指标间的真实误差。 (二)抽样平均误差的计算 抽样平均误差通常用符号来表示。为便于区别,分别用表示样本均值的抽样平均误差,用表示样本成数的抽样平均误差。 抽样平均误差的计算公式有两种,即理论公式和实际应用公式。 1.抽样平均误差的理论公式 按照抽样平均误差的含义,它是可能产生的抽样误差的平均数,类似于我们前面学过的离差,抽样误差在其取值上也是可正可负的,所以利用算术平均数计算抽样平均误差显然不够合理(这样计算,其结果总是0),因此,我们仿效标准差的计算方法来计算抽样平均误差就会得到抽样平均误差计算的理论公式,即: 式中:表示样本均值,表示样本成数; 表示总体平均数,表示总体成数; M表示可能的样本个数。 上述公式只具有理论意义,原因是它在实际工作中无法采用。首先,在实际工作中一般只抽取一个样本,不可能抽取所有可能的样本并计算它们的平均数;其次,在进行抽样推断的整个过程中,总体平均数(或总体成数)始终是未知的,因而上述抽样平均误差的公式也就不能应用了。 2.抽样平均误差的实际应用公式 抽样平均误差的公式只是为了说明抽样平均误差的实质,在实际分析中一般不用此公式。 实际中常用下面的方法估计抽样平均误差,考虑到重复抽样误差和不重复抽样误差存在差异,接下来将分别进行说明。 以表示样本均值的抽样平均误差,表示总体的标准差。根据抽样平均误差的定义可知: (1)重复抽样的抽样平均误差 样本标志值, ,…, 是相互独立的,样本变量与总体变量X同分布。根据数理统计知识,可得样本平均数的抽样平均误差为:
即抽样平均误差为: 这一公式说明,在重复抽样条件下,抽样平均误差与总体的标准差成正比关系,与样本容量的平方根成反比关系。 当研究的是成数总体,如合格率、收视率等问题时,总体平均数用成数P表示,标准差。则此时样本成数的抽样平均误差为 上述公式中的总体标准差和总体成数都是总体参数,总体参数在统计推断中都是未知的,那么,这个问题该如何解决呢?实务中,可以采用下面方法: ①查阅相关的历史资料,用历史数据进行替代。 ②展开小规模的调查,利用小规模调查中取得的数据来代替公式中的未知数据。 ③利用本次抽样的样本方差来代替总体方差,利用样本成数代替总体成数。 (2)不重复抽样的抽样平均误差 如果抽样方法是不重复抽样,根据数理统计知识可知,样本均值的抽样平均误差公式为: 当总体单位数很大时,上式中的可用来代替。因而实际工作中不重复抽样的抽样平均误差,可改为下式: 显然,不重复抽样的抽样误差一定小于重复抽样的抽样误差。在一般情况下,总体单位数很大,抽样比例很小,则接近于1,因此与的数值是接近的。实际工作中,在没有掌握总体单位数的情况下或者总体单位数N很大时,一般用重复抽样的抽样平均误差公式来计算不重复抽样的抽样平均误差。 四、抽样极限误差 抽样极限误差,也叫抽样误差范围。由于抽样误差是一个随机变量,因此,用样本指标对总体指标进行估计时希望得到抽样误差的精确数值是不可能的,但可以把抽样误差控制在一定的范围之内。抽样极限误差就是样本指标与总体指标之间误差的最大允许范围,在数量上等于样本指标可允许变动的上限(或下限)与总体指标之差的绝对值。 设和分别表示样本均值与样本成数的抽样极限误差,则有: 将上面等式进行变换,可以得到下列不等式: 由上式我们不难看出,抽样误差范围的实际意义是配合抽样得到的样本指标对总体指标进行区间估计。那么,抽样误差范围又是如何确定或计算呢?一般地,我们用抽样平均误差()的倍数()来表示抽样误差范围,即: 式中的,称为概率度。根据数理统计原理,总体指标,落入区间(,),(,)的概率保证程度是概率度的函数。具体的对应关系,读者可以查阅标准正态分布概率表,其中,较为常见的对应关系如下。 表8—1 常用的标准正态分布概率表 10.68271.960.95002 30.9545 0.9973
由于抽样误差范围是若干倍的抽样平均误差,所以,在抽样平均误差一定的条件下,概率度越大,抽样误差范围就越大,样本指标落在误差范围内的概率也就越大,抽样推断的可靠程度也就越高;反之,当越小,则越小,样本指标落在误差范围内的概率也就越小,从而抽样推断的可靠程度也就越低。 第三步:巩固新课,课堂小结 这一讲我们介绍了抽样误差、抽样平均误差、抽样极限误差。
作业练习 完成学习通随堂测
教学总结 本节课是讲述抽样误差,授课中应力求简明易懂、深入浅出。
教学项目与任务 项目八统计推断 任务3参数估计
教学目标 知识目标 参数估计
能力目标 掌握区间估计的方法
教学重点 区间估计
教学难点 区间估计
教学方法与手段 教学媒体及课件、案例教学
授课内容与过程 第一步:导入新课 不论是社会经济活动还是科学实验,人们做出某种决策之前总是要对许多情况进行估计。例如,汽车生产商要估计新款轿车可能为消费者所爱好的程度,房地产开发商要估计附近居民的购买能力,政府要估计某项新政策的支持率,疫苗在正式生产前科研人员要估计其安全性和有效性,等等。这些估计通常是在信息不完全、结果不确定的情况下作出的。尽管样本中的信息并不完全,而且来自样本的结果一般不等于总体真实值,我们还是经常采用样本数据。之所以需要用样本代替总体进行研究,原因在于在通常情况下,对总体进行全面调查是不可行的,例如,针对无限总体的调查,如气象调查,新工艺、新配方、新材料的功能检验;或者具有破坏性的产品质量检验,如轮胎的里程试验,玻璃的抗震强度试验等;或者进行全面调查是没必要的,例如,城乡居民家计调查,民意测验等;又或者受时间或其他条件的限制,无法进行全面调查,例如,战备物资调查,矿产资源的调查等。参数估计为我们提供一套在满足一定精确度要求下根据部分信息来估计总体参数的真值,并作出同这个估计相适应的误差说明的科学方法。 第二步:授新课 一、点估计 (一)点估计方法 点估计也称定值估计,就是直接用样本指标作为相应的总体指标的估计值。例如,直接利用样本均值估计总体平均数,直接用样本成数来估计总体成数。 点估计的优点在于它能够提供总体参数的具体估计值,可以作为行动决策的数量依据。例如,销售部门对某产品估计出全年的销售额数值,并分出每月销售额,便可传递给生产部门作为制订生产计划的依据,生产部门将各月产量计划传递给采购部门可作为制订原材料、采购计划的依据等。点估计也有不足之处,任何点估计不是对就是错,并不能提供误差情况如何,误差程度有多大等信息。估计总体参数,未必只能用一个统计量,例如,估计总体平均数,可以用样本平均数,也可以用样本中位数、众数等,以哪一种统计量作为总体参数的估计量才是最优的呢 这就有评价统计量优良与否的问题。 (二)评价点估计量优劣的标准 在对总体指标进行点估计时,并非所有估计量都是优良的。例如,对总体平均数的估计,我们可以选用的估计量有样本均值,也有样本中位数,哪个估计量更好,就需要我们按照一定的标准来评定。一般地,点估计量的评价标准主要有三个: 1.无偏性 如果作为估计量的样本指标的数学期望值等于其所估计的总体参数,那么,这个样本指标就叫做该总体参数的无偏估计量。如样本均值的数学期望是总体平均数,则样本均值就是总体均值的无偏估计量。 2.有效性 如果两个估计量都满足于无偏性和有效性的要求,那么它们是不是都是最优估计量呢?此时,还要比较这两个估计量的有效性。所谓有效性是指无偏估计量中方差最小的估计量。无偏估计量只考虑估计值的数学期望是否等于待估计参数的真值,并没有考虑每个样本指标与总体指标之间离差的大小和分布情况。我们在解决实际问题时,不仅希望估计量是无偏的,更希望这些估计值与总体指标之间的离差尽可能的小。 3.一致性 如果随着样本容量的增大,估计量的取值越来越接近总体参数的真值时,则称该估计量是被估计参数的一致估计量。估计量的一致性是从极限意义上定义的,它适用于大样本的情况。如果一个估计量是一致性估计量,那么采用大样本就更加可靠。 点估计方法并未考虑抽样误差,也没有指出误差在一定范围内的概率保证程度,因而不够严谨,但方法简单、易行,原理直观,在统计实务中也有较多的应用。 二、区间估计 从上节可以看出,点估计结果直观、计算简单,但是在实际估计中,总是存在一定误差,而点估计无法知道估计值与真实值的差距和可靠性程度。我们需要在点估计的基础上,借助统计量的分布,根据给定的概率保证程度和样本资料,计算出抽样误差范围进而求出被估计的总体参数的上限和下限,即总体参数可能存在的区间范围。 区间估计就是以一定的概率保证估计包含总体参数的一个值域,即根据样本指标和抽样平均误差推断总体指标的可能范围。换句话说,对于总体的被估计指标,找出样本的两个估计量和,使区间(,)包含被估计指标的概率是()。其中 是给定的或者说是事先要求的。我们称区间(,)为总体指标的置信区间,为置信水平,为显著性水平,是置信下限,是置信上限。 它包括两部分内容:一是这一可能范围的大小:二是总体指标落在这个可能范围内的概率。区间估计既说清估计结果的调查的准确程度,又同时表明这个估计结果的可靠程度,所以区间估计是比较科学的,它是本节阐述的重点。 用样本指标来估计总体指标,要达到100%的准确而没有任何误差,几乎是不可能的,所以在估计总体指标时就必须同时考虑估计误差的大小。从人们的主观愿望上看,总是希望花较少的钱取得较好的效果,也就是说希望调查费用和调查误差越小越好。但是,在其他条件不变的情况下,缩小抽样误差就意味着增加调查费用,它们是一对矛盾。因此,在进行抽样调查时,应该根据研究目的和任务以及研究对象的标志变异程度,科学确定允许的误差范围。 区间估计必须同时具备三个要素,即具备点估计值、抽样极限误差和概率保证程度三个基本要素。抽样误差范围决定抽样估计的准确性,概率保证程度决定抽样估计的可靠性,二者密切联系,但同时又是一对矛盾,所以,对估计的精确度和可靠性的要求应慎重考虑。在实际抽样调查中,区间估计根据给定的条件不同,有两种估计方法:①给定概率保证程度,要求对总体指标做出区间估计;②给定极限误差,要求对总体指标做出区间估计。 (一)总体均值的区间估计 以下介绍总体均值的区间估计,在对总体均值进行区间估计时,需要考虑总体是否为正态总体,总体方差是否已知,用于估计的样本是大样本还是小样本等多种情形。本章仅考虑样本来自正态总体且为大样本的情况。 假设, ,…, 为总体X,根据数理统计知识可知,利用标准正态分布变换, 给定置信水平,寻找总体均值的置信区间。 根据正态分布的特征: 有 在置信水平确定的情况下,这样的区间有很多,但我们应寻找区间长度尽可能小的那个。根据标准正态分布密度函数的特点,区间上限和下限关于y轴对称时区间长度最小。即-时。因此 根据置信水平,通过正态分布表可确定概率度的具体数值, 我们可以将该区间变形为:,因此根据上一讲抽样误差中的内容,极限误差,即:
该区间表明样本均值落在的概率为,但在实际估计中,样本均值已知,总体均值未知,我们可以用样本均值构造的置信区间:
因此我们可以反过来认为,约有的样本均值所构造的这一区间会包括总体均值,这里需要注意的是,对于一个已经抽取的样本,以此计算的置信区间,要么包含真实值,要么不包含真实值,不存在的概率包含真实值。以=95%为例来说明。置信水平为95%的置信区间的意思为:构造出100个这样的区间,其中有95个包含真实值,有5个不包含真实值。我们希望这个区间是95个包含真实值的其中一个,但也可能是5个中的一个,只不过概率非常小而已。 总体平均数的区间估计公式为: 即置信区间为: 或 其中 我们在此处仅考虑正态分布大样本的情形,若总体方差未知,可用样本方差或历史资料计算的方差替代总体方差。 (二)总体成数的区间估计 实际工作中,成数的估计问题也很常见。例如,在产品的质量检验中,要了解某产品的合格品或废品所占的比重;在商品服务质量的评比中,要知道对其服务满意或不满意的顾客的比重,等等。 成数的区间估计跟均值区间估计类似。根据中心极限定理可知,样本成数, 总体成数的区间估计公式为: 式中:,总体成数P未知,用样本成数近似代替。 第三步:巩固新课,课堂小结 这一讲我们介绍了参数估计的方法。
作业练习 完成学习通随堂测
教学总结 本节课是讲述参数估计,授课中应力求简明易懂、深入浅出。通过案例让同学们掌握区间估计的原理和方法。
教学项目与任务 项目八统计推断 任务4样本容量的确定
教学目标 知识目标 指数体系的定义和形式 指数体系的作用
能力目标 掌握指数体系的形式
教学重点 指数体系的形式
教学难点 指数体系的形式
教学方法与手段 教学媒体及课件、案例教学
授课内容与过程 第一步:导入新课 上一讲我们学习了参数估计的方法,大家知道 通过参数估计,我们可以推断总体的数量特征。实践中 在进行参数估计之前我们还需要确定样本容量的大小。这一讲我们就要学习样本容量的确定。 第二步:授新课 一、确定样本容量的必要性 所谓样本容量,也就是抽样单位数。在抽样推断中,样本容量的确定是一个抽样调查方案中的重点问题,合理地确定样本容量具有极其重要的意义。一方面,样本容量越大,样本的结构就越接近于总体,样本对总体的代表性就越好,抽样误差也就越小,但过大的样本容量却失去了抽样调查的意义,也会增加调查工作量,浪费人力、物力和财力;另一方面,如果样本容量太小,样本对总体的代表性就不强,抽样误差就会很大,不能达到抽样调查的目的。因此,合理地确定样本容量既可以在一定的调查成本的前提下,尽量减小抽样误差,保证估计结果的可靠性和精确度,又可以在一定的可靠性和精确度的要求下,控制抽样调查的费用。 二、影响样本容量大小的因素 (一)总体标志变动度。由于总体的标志变动度与抽样误差成正比例关系,因此,在相同质量要求的情况下,总体的标志度大,样本容量就应大些,反之,则样本容量就可小些。 (二)推断的精确程度。推断的精确程度与抽样误差范围有关。如果允许的误差范围较大,即要求的精确度低,就可以抽取较少的样本单位;反之,则应抽取较多的样本单位。 (三)推断的可靠程度。抽样推断要求的可靠程度越高,则应抽取的样本单位越多;要求的可靠程度越低,则应抽取的样本单位数越少。 (四)抽样方法和抽样组织形式。不同的抽样方法和抽样组织形式会产生不同的抽样误差,因此,样本容量也有所不同。 除此之外,在统计实务中,具体的抽样单位数的确定,还要结合调查的人力、物力和财力的许可情况加以适当调整,才能作出最后的确定。 三、样本容量的确定方法 根据上面影响样本容量的四个因素,把抽样极限误差(△)的公式加以推导,就可以得出不同抽样组织方式,不同的抽样方法下确定样本容量的计算公式。我们这里仅介绍最基本的简单随机抽样方式下样本容量的确定方法。 (一)推断总体平均数时,样本容量的确定方法 1.重复抽样时: 在重复抽样条件下,由于 将等式两边平方,再移项整理得: 2.不重复抽样时: 在不重复抽样条件下,由于 将等式两边平方,再移项整理可得: (二)推断总体成数时,样本容量的确定方法 推断总体成数时,样本容量的确定方法与推断总体平均数时所需的样本容量的确定方法相同,只需要将公式中总体变量值的方差换成总体成数的方差即可。 1.重复抽样时: 2.不重复抽样时: 需要注意的是,上面例题中的计算结果都是小数,而在对小数取整时采用的是圆整法而非四舍五入法,因为只有圆整法才能保证精确度与可靠性的要求。 此外,当推断总体成数所需的样本单位数与推断总体平均数所需的样本单位数不等时,应取其较大者,因为只有取其大者才能保证两方面推断的需要。 第三步:巩固新课,课堂小结 这一讲我们介绍了样本容量的确定。
作业练习 完成学习通随堂测
教学总结 本节课讲述的是样本容量的确定,授课中应力求简明易懂、深入浅出,让同学们掌握确定样本容量的方法。

展开更多......

收起↑

资源预览