7.3抽样组织与误差控制 课件(共27张PPT)-《基础统计第六版》同步教学(高教版)

资源下载
  1. 二一教育资源

7.3抽样组织与误差控制 课件(共27张PPT)-《基础统计第六版》同步教学(高教版)

资源简介

(共27张PPT)
第七章 抽样推断
《基础统计》
第三节 抽样组织与误差控制
01
抽样设计的几个问题
02
抽样误差的计算
03
误差分析与样本容量确定
第三节
一、抽样设计的几个问题
(一)抽样框的编制
抽样框
的形式
名录抽样框
区域抽样框
时间抽样框
是将总体中的所有单位,按名称或名称代号排列组成的集合框,其中以代码或编号最为常见。
是按自然地理位置排序组成的集合框,如农产量抽样调查以地块为基本调查单位编号组成抽样框。
是将一个较长的被调查过程,划分为若干个小的时间单位(即调查的基本单位)所组成的抽样框。
抽样框
是指由现象总体的所有单位组成的一个框架,是实施抽样推断的基础条件之一。
第三节
一、抽样设计的几个问题
(二)抽样的基本方法
1. 重复抽样与不重复抽样
又叫重置抽样或放回抽样,是指统计抽样时对每次被抽到的单位登记后再放回总体,重新参与下一次抽选的抽样方式。
重复抽样
又叫不重置抽样或不放回抽样,是指统计抽样时每个单位只能被抽到一次,即每次被抽到的单位记录后不再放回总体,这样每次抽选都使下一次待抽选的总体减少一个单位。
不重复抽样
注意:
第三节
一、抽样设计的几个问题
(二)抽样的基本方法
2. 等概率抽样与不等概率抽样
是指按照随机原则使每一单位有同等机会被抽取的方法。
等概率抽样
主要有直接抽选法、抽签法、随机数字生成法等三种方法。
等概率抽样调查
的具体方法
等概率抽样调查
运用等概率原理,从总体中抽取一部分单位组成样本进行调查,并用计算出的样本指标去推断总体特征的调查方法(也可称为无限制抽样或简单随机抽样)。
第三节
一、抽样设计的几个问题
(二)抽样的基本方法
2. 等概率抽样与不等概率抽样
是指总体中各单位被抽中的概率与这些单位的某一辅助变量大小成正比例。换言之,如果某一单位的辅助变量越大,则该单位被抽中的概率就越大。
不等概率抽样
根本区别: 在不等概率抽样中要用有关的辅助标志进行抽样,而运用等概率抽样时则不需要这类辅助资料。在许多问题中,不等概率抽样可能比等概率抽样更为有效。
等概率抽样与
不等概率抽样
第三节
一、抽样设计的几个问题
(三)抽样的组织方式
简单随机抽样
类型抽样
等距抽样
整群抽样
多阶段抽样
课程
标准
抽样组
织方式
第三节
一、抽样设计的几个问题
(三)抽样的组织方式
1. 简单随机抽样
又称纯随机抽样,这是对总体不作任何加工整理,直接从总体中抽取调查单位进行调查的抽样组织形式。
简单随机抽样
两个基本条件
一是代表性,即要求样本分布与总体分布相同;
简单随机抽样
最基本的
样本抽选方法
抽签法
随机数字生成法

二是独立性,即要求样本各单位是相互独立的。
第三节
一、抽样设计的几个问题
(三)抽样的组织方式
2. 类型抽样
类型抽样
应用对象
又称分层抽样或分类抽样,是在总体各单位先按一定标志分组基础上,从各组中随机抽取不同类型的样本单位,再将各类型样本单位综合为一个样本进行调查的组织方式。
适用于总体内各单位在被研究标志上有明显差别的事物。如研究农作物产量时,耕地有平原、丘陵和山地等;研究职工的工资水平时,各行业之间存在较大的差别。
类型抽样
显著特点
把统计分组和抽样原理有机结合。即通过分组,使组中具有同质性,组间具有差异性;然后从各组随机抽样,保证样本对总体具有更高的代表性,尽可能减少抽样误差。
第三节
一、抽样设计的几个问题
(三)抽样的组织方式
又称机械抽样或系统抽样,是先将总体单位按某一标志排序,然后按照固定的顺序和相同的间隔来抽选单位组成样本进行调查的抽样组织方式。
3. 等距抽样
无关标志
排序抽样
有关标志
排序抽样
是指排序的标志与研究的标志无关。如观察学生考试成绩,用姓氏笔划排序;观察产品的质量,按生产的先后顺序等。无关标志排序实质上相当于简单随机抽样。
是指排序的标志与被研究标志相关。如农产品产量调查按过去年份的亩产排序。它可提高抽样估计的准确性,但必须注意抽样间隔与排序标志的周期性变化的重合。
第三节
一、抽样设计的几个问题
(三)抽样的组织方式
又称分群抽样或集团抽样,是将总体划分为若干群,然后以群为单位从中随机抽样取部分群组成样本进行调查的组织方式。这样,在被选中的群内就是全面调查。
4. 整群抽样
整群抽样
应用对象
适用于大规模的抽样调查,总体单位多,分布区域广,且缺少进行抽样的配套抽样框,或按经济效益原则不宜编制相适应的抽样框。
如果对某市居民的家庭收入进行调查,采用整群抽样,就可以按行政区域分为街道,然后随机抽取一些街道,进行全面调查,相对于以上的三种抽样更加适宜。
整群抽样
应用举例
第三节
一、抽样设计的几个问题
(三)抽样的组织方式
在抽样调查中,抽出的样本单位直接就是总体单位,如简单随机抽样,等距抽样,类型比例抽样。
单阶段抽样
二阶段抽样
在抽样调查中,先将总体进行分组,从中随机抽出一些组,然后再从中选的组中随机抽取总体单位。
多阶段抽样
在抽样调查中,将总体进行多层次分组,然后多轮依次在各层中随机抽组,直至抽到总体单位。
我国农产量调查就是采用多阶段抽样调查,即先从省中抽县,然后从中选的县抽乡,乡中抽村,再由中选的村中抽地块,最后从中选的地块中抽取小面积的样本单位。
多阶段抽样
举 例
第三节
二、抽样误差的计算
抽样误差
是指样本统计量与总体真值之间的差距,是用样本统计量估计总体指标真值时产生的代表性误差。在总体真值未知的情况下,一次抽样不可能计算出该抽样的具体误差。
根据均值分布等定理,简单随机抽样的抽样平均数的平均误差为:
抽样平均误差 是在一定概率条件下进行区间估计的重要依据
第三节
二、抽样误差的计算
(一)简单随机抽样的抽样平均误差
1. 重复抽样的抽样平均误差
2. 不重复抽样的抽样平均误差
简单随机抽样中的重复抽样,是抽样理论中最一般的情况,它能够保证总体中的每个单位在每次抽选时,都具有相同的被选概率。若以 代表样本平均数的抽样平均误差,则有:
简单随机抽样中不重复抽样与重复抽样的抽样平均误差的内容基本相同,两者之间相差一个系数 ,在总体很大或无限总体中,该系数可表示为 。即:
第三节
二、抽样误差的计算
(二)类型抽样的抽样平均误差
类型抽样中不存在各类(组)之间的误差,只存在各类(组)内部的代表性误差。因此,在计算抽样平均误差时要考虑各组内方差的平均水平。其计算公式如下:
1. 重复抽样的抽样平均误差
2. 不重复抽样的抽样平均误差
第三节
二、抽样误差的计算
(二)类型抽样的抽样平均误差(举例)
例6 某乡某种农作物全部播种面积5 000亩,按平原和山区面积等比例抽取630亩组成样本,各组单产和方差如下表所示:
类型 播种面积/亩 抽样面积/亩 抽样单产/千克 单产
方差
平原 4000 504 480 10000
山区 1000 126 375 40000
合计 5000 630 459 16000
以95%的置信度估计全部播种面积平均亩产。计算过程见右:
第三节
二、抽样误差的计算
(三)等距抽样的抽样平均误差
等距抽样的误差一般较简单随机抽样的误差小。特别是当被研究现象的标志变异程度较大时,更能显示出等距抽样的优越性。等距抽样均为不重复抽样,其平均误差的计算可分为两类:
按无关标志排序,相当于简单随机不重复抽样。因此,它可以使用简单随机抽样中不重复抽样的平均误差公式计算。
按有关标志排序,相当于按该标志分组,并从各组内不重复抽取样本单位。这时可用类型抽样中不重复抽样的平均误差公式计算。
按无关标志排序
的抽样平均误差
1.
按有关标志排序
的抽样平均误差
2.
第三节
二、抽样误差的计算
(四)整群抽样的抽样平均误差
整群抽样一般是不重复抽样,由于在群内进行全面调查而不存在代表性误差,但群间存在着代表性误差。
设总体中的全部单位为R群,每群中所包含的单位数为m,现从总体中随机抽取r群组成样本,其抽样平均误差的有关计算公式见右:
各群平均数:
样本平均数:
群间方差:
在同样的条件下,整群抽样的样本比简单随机抽样的代表性差。要提高估计精确度,应适当增加样本群数。
抽样平
均误差

第三节
二、抽样误差的计算
成数的抽样误差
“成数”可以看作是平均数的特例。如果要计算成数的抽样平均误差,只要将公式中 和 就可以求得相关值。
类型抽样条件下
成数的抽样误差
简单随机抽样条件下的
不重复抽样的成数抽样误差
简单随机抽样条件下的
重复抽样的成数抽样误差
第三节
三、误差分析与样本容量确定
(一)抽样误差分析
抽样推断涉及两类误差
抽样误差
非抽样误差
是在遵循随机原则的前提下用样本特征推断总体特征而产生的代表性误差。它是抽样方法本身所引起的,是不可避免的客观存在。
是工作中的一种责任误差,如记录笔误、计算差错、观察和计量中由于偶然原因而产生。它不能计算和控制,只能通过强化工作责任心等克服。
第三节
三、误差分析与样本容量确定
(一)抽样误差分析
产生抽样误差
的主要因素
1. 样本估计量的选择问题
3. 样本容量的大小
2. 现象的标志变异程度
4. 不同的抽样组织方式
第三节
三、误差分析与样本容量确定
正确选择统计估计量
抽样误差
控制要点
正确选择抽样组织方式
科学确定样本容量
(一)抽样误差分析
第三节
三、误差分析与样本容量确定
(二)样本容量确定
现象的标志变异程度
抽样推断的允许误差
抽样推断的可靠程度
样本抽取的组织方式
样本容量的
主要影响因素
确定样本容量应考虑的因素
第三节
三、误差分析与样本容量确定
(二)样本容量确定
1. 确定样本容量的基本公式
由允许误差的计算公式推导而来
(1)重复抽样的样本容量
(2)不重复抽样的样本容量
也由允许误差的计算公式推导而来
第三节
三、误差分析与样本容量确定
例7 某企业对某批10 000件产品进行抽查,按重复抽样方式抽取300件,其中不合格品为9件。要求:以95%的概率保证程度估计这批产品不合格率的可能范围;若要做到不合格率估计的允许误差不超过1.5%,确定应抽取多少件产品。
(二)样本容量确定(举例)
以95%的概率估计,该产品不合格率的可能范围:
若要做到不合格率估计的允许误差不超过1.5%,则抽样数目为:
第三节
三、误差分析与样本容量确定
(二)样本容量确定
2. 样本容量的其他公式
(1)类型抽样的必要抽样数目
在重复抽样时:
在不重复抽样时:
(2)等距抽样的必要抽样数目
按无关标志排序,采用简单随机不重复抽样的公式确定;
(3)整群抽样的必要抽样数目
注:
按有关标志排序,采用类型随机不重复抽样公式确定。
谢 谢
同学们的聆听
7-03
抽样组织
与误差控制
讲授完毕

展开更多......

收起↑

资源预览