第11章 抽样技术与试验设计 课件(共53张PPT)-《统计学教程》同步教学(北京交大版)

资源下载
  1. 二一教育资源

第11章 抽样技术与试验设计 课件(共53张PPT)-《统计学教程》同步教学(北京交大版)

资源简介

(共53张PPT)
《统计学教程》
第11章 抽样技术与试验设计
*/*
《统计学》第11章 抽样技术与试验设计
11.1 抽样技术
11.1.1 抽样技术的几个基本概念
11.1.2 简单随机抽样
11.1.3 系统抽样
11.1.4 分层抽样
11.1.5 整群抽样
11.1.6 必要样本容量
11.1.7 根据费用函数确定样本容量
11.2 试验设计
11.2.1 一种简单的试验设计
11.2.2 随机化区组设计
11.2.3 拉丁方设计
第11章 抽样技术与试验设计
11.1 抽样技术
《统计学教程》
*/*
《统计学》
第11章 抽样技术与试验设计
11.1 抽样技术
11.1.1 抽样技术的几个基本概念
目标总体(The Target Population)是指所要了解和研究的客观对象的全体构成的集合。目标总体是客观存在的现实,所以也称为客观总体。构成目标总体的个体称为总体单位(Population Units)。
抽样总体(The Sampling Population)是指从中抽取样本进行数据采集的具体对象的全体构成的集合,抽样总体由已经搜集的数据构成,抽样总体是对客观存在的现实映射。构成抽样总体的个体称为抽样单位(Sampling Units)。
系统性偏误(Systematic Bias)是指与抽样的随机性误差无关的,不会随着抽样的样本容量增大而减小的常数项偏误。
*/*
《统计学》
第11章 抽样技术与试验设计
11.1 抽样技术
抽样框(Sampling Frame)是按照抽样的目的和抽样方法的要求,为了实施样本的抽取而专门构造的,对抽样总体数据进行编码和排序,所构成的有序的数据库。
首先,构造抽样框的前提是必须从统计研究和抽样目的出发。
其次,构造一个有效的抽样框,要与具体抽样设计中所采取的抽样技术相适应。
第三、构造一个有效的抽样框的基础是拥有能够如实反映目标总体现实状况的抽样总体数据。
第四、在构造抽样框,还要防止在采取系统抽样方法时,发生抽样的频率与抽样框资料中样本单位的调查标志的变动周期恰好吻合的现象,避免由此而引起的系统性偏误。
在抽样技术中,抽样总体和目标总体存在差别而产生系统性偏误,往往通过抽样框有偏的形式反映出来。通常将这种由于抽样总体和目标总体存在差别而产生系统性偏误,以及构造抽样框过程中由于其它失误新产生的系统性偏误统称为“抽样框偏误”。
*/*
《统计学》
第11章 抽样技术与试验设计
11.1 抽样技术
从抽样框抽取部分的抽样单位的观测值所构成的集合称为样本(Sample)。根据样本计算的统计量推断总体参数时产生的随机误差,称为抽样平均误差。
抽样平均误差(Sampling Error)是样本统计量与总体参数真值之间误差的测度,通常用样本估计量的标准差来度量,一般也简称为抽样误差。样本估计量的标准差反映了使用样本数据来推断总体参数时,统计量与总体参数真值之间误差的平均水平。
*/*
《统计学》
第11章 抽样技术与试验设计
11.1 抽样技术
11.1.2 简单随机抽样
简单随机抽样(Simple Random Sampling)也叫纯随机抽样,是指没有利用任何辅助资料,对抽样总体不作任何分组或分类,直接从抽样总体的个抽样单位中随机抽取抽样个单位构成样本,并以这个抽样单位组成的样本数据对总体参数进行推断的抽样方法和过程。
等概抽样(Equal Probability Sampling)是按照每个抽样单位具有同等的被抽中的概率进行的一种抽样方法,等概抽样又称之为自加权抽样(Self-Weighting Sampling),由等概抽样样本计算出来的估计量称为自加权估计量(Self-Weighting Estimator)。
等概抽样的抽样框不仅仅提供了一个进行样本抽取的条件,同时它还是一个计算抽样统计量的加权结构。一旦抽样框有偏,直接导致参数估计的加权结构有偏,进而引起统计量的系统偏误。
*/*
《统计学》
第11章 抽样技术与试验设计
11.1 抽样技术
1.简单随机抽样的参数估计
在简单随机抽样场合,假设从抽样总体中随机抽取一个样本,其样本均值为总体均值的无偏估计量,计算公式为
(11.1)
样本均值的方差为
(11.2)
*/*
《统计学》
第11章 抽样技术与试验设计
11.1 抽样技术
当式(11.2)中的总体方差未知时,需要采用样本方差作为它的估计量,即
(11.3)
则有简单随机抽样的样本均值的标准差,即简单随机抽样的抽样平均误差为
(11.4)
*/*
《统计学》
第11章 抽样技术与试验设计
11.1 抽样技术
2.不重复抽样的简单随机抽样
重复抽样(Sampling With Replacement)是不受所抽取的样本的影响,在相同的抽样框中重复进行样本抽取的一种抽样设计。
不重复抽样(Sampling Without Replacement)是不将已经抽取的抽样单位放回抽样框中的一种抽样设计。
有限总体校正系数(Finite Population Corrections, fpc)为不重复抽样的统计量方差与重复抽样统计量方差所相差的一个数量测度,反映了与重复抽样相比不重复抽样效率提高的程度。对于有限总体而言,抽样率是一个正数,因此有限总体校正系数总是小于1,不重复抽样的抽样平均误差总是小于重复抽样。
重复抽样的样本均值方差的计算公式为不重复抽样的样本均值方差计算公式乘以有限总体校正系数,即
(11.5)
*/*
《统计学》
第11章 抽样技术与试验设计
11.1 抽样技术
则有重复抽样的样本均值标准差为
(11.6)
为了计算简便,当抽样率很小时,可以将有限总体校正系数忽略不计,采用重复抽样的抽样平均误差计算公式来近似计算不重复抽样的抽样平均误差。
*/*
《统计学》
第11章 抽样技术与试验设计
11.1 抽样技术
11.1.3 系统抽样
系统抽样(Systematic Sampling)又称为机械抽样、或等距抽样,它是将抽样总体中的所有抽样单位按照一定的顺序排列,每隔一定的间隔抽取一个抽样单位的一种抽样框设计和样本抽取的抽样技术。
1.系统抽样的步骤
首先,将调查总体中的所有单位按照一定的顺序排列,构造抽样框。
其次,计算抽样距离。
(11.7)
第三,随机起点,或半距起点,按照抽样距离抽取随机样本。
第四,要防止抽样距离与总体某种周期性波动相吻合,导致样本包含系统性偏误。为了防止出现此类情况,可以采用对称等距方式抽取系统抽样的随机样本。
*/*
《统计学》
第11章 抽样技术与试验设计
11.1 抽样技术
2.系统抽样的排序
依据有排序的标志不同,系统抽样分为按照有关标志排序和按照无关标志排序两大类。
所谓按照有关标志排序是指利用与抽样目的有联系的标志对抽样框中的所有抽样单位进行排序。
按照有关标志排序的系统抽样,由于利用了相关的辅助信息,具有较高的抽样效率。通过这样的排序,赋予抽样框某种有序性,使得从中抽取的样本相对调查标志而言具有更强的均匀性和代表性,从而提高抽样的效率。
按照无关标志排序是指利用与抽样目的没有任何联系的标志对抽样框中的所有抽样单位进行排序。这时的系统抽样具有类似简单随机抽样的特征,一般可用简单随机抽样的抽样平均误差计算公式来计算按照无关标志排序系统抽样的抽样平均误差。
*/*
《统计学》
第11章 抽样技术与试验设计
11.1 抽样技术
3.系统抽样的特点
(1)简便易行,便于操作,基层调查员能够较快地掌握运用。因此在实际工作中,系统抽样方法得到了广泛地应用;
(2)有利于保证样本的随机性。由于这一方法在抽样框、抽样距离和第一个样本的抽取起点确定之后,整个样本的抽取过程就是一个简单和机械的操作,从而有效地避免了具体抽样人员为了简单了事,采取随意方式抽取样本,从而破坏样本的随机性;以及防止人为地有意识选择样本,破坏样本随机性的问题发生。
(3)系统抽样可以使所抽取的抽样单位在抽样总体中分布均匀,提高样本的代表性。若采用与调查指标有着较高相关关系的标志进行排队,还会显著地提高这种抽样方法的抽样效率。
(4)便于利用计算机数据库资料构造样本框,以及使用计算机进行样本的抽取。
*/*
《统计学》
第11章 抽样技术与试验设计
11.1 抽样技术
11.1.4 分层抽样
分层抽样(Stratified Sampling)也称为分类抽样或类型抽样,是将抽样总体按某一标志分层(或分类),然后从每层中抽取样本单位构成样本进行数据采集和参数估计的方法和过程。
1.分层抽样的特点
分层抽样将抽样总体的个抽样单位划分为没有遗漏和互不重叠的L层,其中第h层有nh个抽样单位.
分层抽样是常用的抽样技术,它具有如下的特点。
(1)分层抽样按层(类)进行调查,便于操作、方便管理;
(2)分层抽样中各层(类)的抽样相对独立,可以分别估计出各层总体参数数值;
(3)当抽样总体各层之中各单位标志变异程度较小,且各层之间的标志变异程度较大时,分层抽样可以显著提高抽样效率。
*/*
《统计学》
第11章 抽样技术与试验设计
11.1 抽样技术
抽样总体的总离差可以分解为层间离差和层内离差两个部分。
在分层抽样场合,每层都抽取样本进行调查,即在各层之间进行的是全面调查,不存在层间抽样误差,只存在层内抽样误差。
当层间离差大,层内离差小时,分层抽样具有较好的抽样效率。
因此,在采用分层抽样方法进行抽样时,应通过抽样框的分层设计,应尽量扩大抽样框中各层之间的层间离差,相应减小层内离差,以获得理想的抽样效率。
(11.8)
*/*
《统计学》
第11章 抽样技术与试验设计
11.1 抽样技术
2.分层抽样的参数估计
分层抽样样本均值的计算公式为
(11.9)
分层抽样需要总体在各层的单位数,或者总体单位数在各层中的分布结构作为各层样本估计量的权数作为辅助资料,来计算样本估计量。
分层抽样样本均值方差的计算公式为
(11.10)
*/*
《统计学》
第11章 抽样技术与试验设计
11.1 抽样技术
总体方差未知时,需要采用样本方差作为它的估计量,即
(11.11)
在这里,假定在各层层内采用简单随机抽样,式(11.11)中第h层样本方差为
(11.12)
式(11.11)中表示第层有限总体校正系数,其中为第层抽样率。
由分层抽样估计量方差的计算公式可知,分层抽样样本均值的方差仅由层内方差组成,当组间方差不为零时,分层抽样总是具有比简单随机抽样更高的抽样效率。并且,当各层估计量之间的差异越大,其组间方差的取值也就越大,分层抽样的优越性也就越显著。
*/*
《统计学》
第11章 抽样技术与试验设计
11.1 抽样技术
3.分层抽样的样本配置
在分层抽样中,不仅抽样总体的分层关系到抽样效率,样本容量在各层之间的分配也影响到抽样的效率,因此需要在抽样总体分为若干层之后,再按照某一样本配置原则,将样本容量合理地分配到各层之中。
(1)比例配置
按第h层总体单位数占总体单位总数的比重,来确定第h层样本容量的样本配置方法称为比例配置,其样本容量配置公式为
(11.15)
由分层抽样比例配置公式可知,分层抽样的样本配置需要总体在各层的单位数,或者总体单位数在各层中的分布结构作为辅助数据,来实施样本在各层中的分配。
*/*
《统计学》
第11章 抽样技术与试验设计
11.1 抽样技术
(2)Neyman最佳配置
Neyman最佳配置是既考虑各层单位数占总体单位数的比重大小,又同时考虑各层的总体标准差差异的分层抽样技术。Neyman最佳配置的样本容量的分配公式为
(11.16)
由式(11.16)可知,分层抽样的Neyman最佳配置不仅需要总体在各层的单位数,还需要各层的总体标准差作为必要的辅助数据,来进行样本在各层中的分配。
当各层的总体方差都相等时,Neyman最佳配置退化为比例配置。当各层的总体方差不等,通过Neyman最佳配置总可以获得优于比例配置的抽样效率。
*/*
《统计学》
第11章 抽样技术与试验设计
11.1 抽样技术
例11.1 某市准备对全市人均收入水平进行一次抽样调查,现进行抽样设计和抽样误差的试算,对各种抽样方法的效率进行分析。若已知总体的有关数据如表11.1所示。
表11.1 某市人均收入水平情况表

要求 取样本容量为250,试算
(1)分层抽样的样本均值;
(2)比例配置分层抽样的抽样平均误差;
(3)Neyman最佳配置分层抽样的抽样平均误差;
(4)简单随机抽样的抽样平均误差。
*/*
《统计学》
第11章 抽样技术与试验设计
11.1 抽样技术
(1)试算分层抽样的样本均值。由式(11.9),有
(2)试算比例配置分层抽样的抽样平均误差。由于抽样率趋于0,有限总体校正系数可以忽略不计,所以先采用式(11.15)配置样本,然后根据式(11.14)计算抽样平均误差。
表11.3 某市人均收入水平比例配置分层抽样的抽样平均误差计算表
得比例配置分层抽样的抽样平均误差为11.25元。
*/*
《统计学》
第11章 抽样技术与试验设计
11.1 抽样技术
(3)Neyman最佳配置分层抽样的抽样平均误差。先采用式(11.16)配置样本。然后采用式(11.14)计算抽样平均误差。
表11.4 某市人均收入水平最佳配置分层抽样的抽样平均误差计算表
得Neyman最佳配置分层抽样的抽样平均误差为10.82元。
*/*
《统计学》
第11章 抽样技术与试验设计
11.1 抽样技术
(4)计算简单随机抽样的抽样平均误差。首先要根据式(11.8)计算出总体方差,然后再按照式(11.2)计算出简单随机抽样下的样本均值的方差。
表11.5 某市人均收入水平总体方差计算表
可得简单随机抽样的抽样平均误差为30.44元。约为分层抽样的3倍。
*/*
11.1 抽样技术
11.1.5 整群抽样
整群抽样(Custer Sampling) 先将总体划分为由抽样单位组成的若干群,以群为单元进行样本的抽取,然后对抽中群中的全部抽样单位进行观测和登记,并用以推断总体参数的一种抽样方法。
整群抽样中对所抽中的群中的全部单位进行全面调查,所以整群抽样的抽样平均误差只与群间的差异有关,整群抽样中“群”的划分,需要体现出“群内的差异性,群间的同质性”,才能提高抽样效率。
假定每群的抽样单位数皆为M,共抽取r群,则有
(11.17)
(11.18)
《统计学》
第11章 抽样技术与试验设计
*/*
11.1 抽样技术
在整群抽样中,由于抽样总体所划分的群数和构成样本的群数都较小,需要采用不重复抽样方法抽取样本,以提高抽样效率。并且,整群抽样的有限总体校正系数明显地不趋于1,不能忽略不计,必须加以考虑。所以,整群抽样的抽样平均误差计算公式为
(11.19)
由于整群抽样比较方便和节省调查登记费用,它也是实际中常用的组织形式。但由于其样本单位相对集中,降低了样本的代表性,其抽样效率一般低于同等样本容量的简单随机抽样。
《统计学》
第11章 抽样技术与试验设计
*/*
11.1 抽样技术
11.1.6 必要样本容量
必要样本容量(Necessary Sample Size)是指将样本统计量估计总体参数时的误差程度控制在一定范围以内的所必须抽取的最小的样本容量。
1.决定某一抽样精确程度的四个因素。
(1)总体方差;
(2)样本容量;
(3)采用的抽样技术;
(4)抽样推断的概率度。
因此,当已知总体方差、所采用的抽样技术、以及要求的概率度时,就可以计算出实施这一抽样所必须的最小的样本容量,即必要样本容量。
《统计学》
第11章 抽样技术与试验设计
*/*
11.1 抽样技术
2.允许误差
在抽样技术中,一般将预先提出的抽样估计量精确程度用“允许误差”来表述。允许误差的计算公式为
(11.20)
在式(11.20)中有有三个因素,一个是允许误差,一个是概率度,这两个因素都是按照抽样的目的和要求人为确定的;还有一个就是抽样平均误差的平方,即样本统计量的方差,通常为样本均值的方差。因此,依据事先确定的允许误差和概率度的水平,以及构成统计量的方差数值水平的总体方差和具体的抽样方法,可以推导出在不同的抽样方法下的必要样本容量计算公式。
《统计学》
第11章 抽样技术与试验设计
*/*
11.1 抽样技术
3.必要样本容量的计算
(1)简单随机抽样
由式(11.20)出发,将重复抽样的简单随机抽样样本均值的方差计算公式代入到允许误差的计算公式中,即可解出在重复抽样的简单随机抽样场合的必要样本容量的计算公式,有
(11.21)
同样,可以得到在不重复抽样场合的简单随机抽样的必要样本容量的计算公式,有
(11.22)
《统计学》
第11章 抽样技术与试验设计
*/*
11.1 抽样技术
(2)分层抽样
在分层抽样场合,当各层有限总体校正系数均趋向于1,可以忽略不计时,有
(11.23)
在比例配置时,各层的抽样率一致,则可得到在比例配置下,并且将有限总体校正系数忽略不计时的必要样本容量计算公式,为
(11.24)
《统计学》
第11章 抽样技术与试验设计
*/*
11.1 抽样技术
(3)整群抽样
各群的单位数(即群的大小)相等的情况下,并且采用简单随机抽样抽群的整群抽样时,先要计算出必要的抽取群数
(11.25)
然后再计算出必要样本容量,有
(11.26)
《统计学》
第11章 抽样技术与试验设计
*/*
11.1 抽样技术
例11.2 仍然采用例11.1中,表11.1所示的某市对全市人均收入水平进行一次抽样调查的有关数据。
要求 试计算在允许误差为20元,置信程度为95.45%的必要样本容量
(1)计算重复抽样场合的简单随机抽样的必要样本容量。根据式(11.21)和总体方差为231650 ,有
(2)计算不重复抽样场合的简单随机抽样的必要样本容量。根据式(11.22)和总体方差为231650,有
由于式(11.22)的分母中包含不具有以万人为量纲的数据,所以总体单位数中的万人不能约去,必须计入公式之中。
《统计学》
第11章 抽样技术与试验设计
*/*
11.1 抽样技术
(3)计算比例配置分层抽样的必要样本容量。根据式(11.24)以及在表11.6中计算得到的层内方差数值为15825000,有
式(11.24)的分子和分母中均包含以万人为量纲的数据,所以总体单位数中的万人可以约去。
结果表明,分层抽样明显优越于简单随机抽样。
《统计学》
第11章 抽样技术与试验设计
*/*
11.1 抽样技术
11.1.7 根据费用函数确定样本容量
根据费用函数确定样本容量是在总费用一定的前提下,计算出能够抽取的最大的样本容量。
我们用C表示抽样的总费用,它由抽样的固定费用和可变费用两部分组成。
1.简单随机抽样
在简单随机抽样场合,费用函数的计算公式为
(11.27)
根据费用函数确定样本容量的计算公式为
(11.28)
《统计学》
第11章 抽样技术与试验设计
*/*
11.1 抽样技术
2.分层抽样
分层抽样的费用函数计算公式为
(11.29)
在采用样本比例配置的场合,由于有各层的抽样率一致,有
(11.30)
所以,比例配置分层抽样根据费用函数确定样本容量的计算公式为
(11.31)
若每层的单位变动成本都相等时,比例配置分层抽样根据费用函数确定样本容量的计算公式与简单随机抽样相同。
《统计学》
第11章 抽样技术与试验设计
*/*
3.整群抽样
整群抽样的费用函数计算公式为
(11.32)
在各群的单位数(即群的大小)相等的情况下,有
(11.33)
每群的单位变动成本都相等时,可以计算能够抽取的最大群数
(11.34)
其样本容量为
(11.35)
11.1 抽样技术
《统计学》
第11章 抽样技术与试验设计
*/*
11.1 抽样技术
4.样本容量的确定
(1)根据允许误差计算出来的必要样本容量是保证抽样数据精确程度所必须的最小样本容量,是进行抽样必须抽取的样本容量的下限。
(2)根据费用函数计算出来的样本容量是在抽样总费用一定的情况下,能够抽取的最大样本容量,是进行抽样可以抽取的样本容量的上限。
(3)为了保证抽样数据在空间上和时间上的可比性,同时尽量节省调查费用,一般只需要按照允许误差计算出来的必要样本容量进行抽样。
(4)当出现根据费用函数计算出来的样本容量小于根据允许误差计算出来的必要样本容量时,说明调查总费用不能满足此次抽样的需要。
(5)在计算样本容量时,公式中所采用的总体方差资料大多为历史数据,在具体计算时应适当地增大样本容量。
(6)在进行抽样费用预算时,要留有一定的余地,要考虑不可预见的费用支出。
《统计学》
第11章 抽样技术与试验设计
第11章 抽样技术与试验设计
11.2 试验设计
《统计学教程》
*/*
11.2 试验设计
11.2.1 一种简单的试验设计
1.试验设计的基本概念
试验(Experiment)是指收集样本数据的过程。
试验设计(Experiment Design)是指收集样本数据的计划安排,以及分析和判断影响因素显著程度的方法和过程。
测度(Measure)是指试验设计的分析和判断的标准,也称为试验测度。
因素(Factor)是指可能影响测度,引起测度数值变动的来源或条件,也称为因子。
水平(Level)是指对试验因素划定的具体数值,水平也称为处理。
试验单元(Experiment Unit)是指按照具体的因素及其水平某一组合进行的一次试验。
《统计学》
第11章 抽样技术与试验设计
*/*
11.2 试验设计
例11.3 假定某化工企业W产品在反应釜中的加热温度是影响产品收率的一个因素,现选定了反应过程加热温度的3个水平数值85℃、90℃和95℃,将其随机地分配给该企业生产车间的1、2、3号反应釜进行实验,并且在同等的原料纯度、反应时间和其它生产条件下,重复进行了4次试验,有关收率数据见表
表11.6 某企业W产品反应过程加热温度与收率试验数据表 %
要求 试运用单因素方差分析方法,在显著性水平下,检验该企业W产品反应过程加热温度与收率是否存在显著影响。
《统计学》
第11章 抽样技术与试验设计
*/*
11.2 试验设计
解 运用第8章中介绍的单因素方差分析方法,利用Excel 的“方差分析:单因素方差分析”工具,可以得出以下结果。
表11.7 某企业W产品反应过程加热温度与收率方差分析表
显然,P-value为0.00868小于显著性水平0.05,说明该企业W产品反应过程加热温度与收率之间存在显著影响。由表11.6可以计算出反应过程加热温度为85℃时,4次试验的平均收率为90.38%;加热温度为90℃,平均收率为95.90%;加热温度为95℃,平均收率为87.56%。即通过试验得出反应过程最佳的加热温度为90℃。
《统计学》
第11章 抽样技术与试验设计
*/*
11.2 试验设计
11.2.2 随机化区组设计
完全随机化试验的局限性在于不能保证不同水平之间的试验条件或环境完全相同,不存在系统性偏误影响。因此,提出了随机化区组设计来检验和消除试验条件或环境差异对试验结果的影响。
区组(Block)是指按照一定规则将试验单元划分成的同质组。通常为环境、条件基本相同,时间、空间相距较近的范围。
随机化区组设计(Randomized Block Design)是指在比较一个因素的个水平之间差异时,将试验单元随机地配置到个区组中,每一区组含有个试验单元,个区组完成次重复试验。
随机化区组设计与完全随机化试验的根本区别就在于个水平不再与个试验条件固定不变,而是采用随机的方法随机地确定某个水平在某个条件或场所进行试验。并且将时间上,或空间上相近,或者具有某一个共同特征的个水平的试验构成一个区组。
随机化区组设计采用双因素方差方法来判断研究因素的不同水平对测度是否存在显著影响。
《统计学》
第11章 抽样技术与试验设计
*/*
11.2 试验设计
例11.4 仍然利用例11.3中表11.6的有关数据,并假定该数据是该化工企业研究W产品在反应釜中的加热温度对产品收率影响的随机化区组设计的试验结果。
表11.8 某企业W产品加热温度与收率随机化区组设计试验 %

要求 试运用双因素方差分析方法,在显著性水平下,检验该企业W产品反应过程加热温度与收率是否存在显著影响。
《统计学》
第11章 抽样技术与试验设计
*/*
11.2 试验设计
解 由于每一水平在每个区组只进行一次试验,运用第8章中介绍的无交互作用的双因素方差分析方法进行分析。
表11.9 某企业W产品反应过程加热温度与收率方差分析表

显然,行(加热温度)的P-value为0.000227小于显著性水平0.05,说明该企业W产品反应过程加热温度与收率之间存在显著影响,并且由表11.8可知反应过程最佳的加热温度为90℃。
当列(区组)的差异也是显著的,说明区组也是影响所研究的测度的一个不可忽略的因素。因此,随机化区组设计可以在不增加试验次数的前提下,增加对另一个因素的显著性分析,有着同时分析两个因素对于所研究的测度是否存在显著影响的功能。
《统计学》
第11章 抽样技术与试验设计
*/*
11.2 试验设计
11.2.3 拉丁方设计
随机化区组设计只能考虑某一方面的条件或环境的差异,并通过随机化处理来检验和消除其影响;而拉丁方设计可以容许同时存在两个方面的条件或环境的差异,考察这两个方面对测度的影响。
拉丁方(Latin Square)是指由个不同的字母或不同的数字排列成的一个方块,使这个字母或数字在每一行和每一列中恰好出现一次。因为最开始使用这类方块时是用拉丁字母排列的,所以称之为拉丁方。构成拉丁方的字母或数字的个数称为拉丁方的阶数。
《统计学》
第11章 抽样技术与试验设计
*/*
11.2 试验设计
拉丁方设计(Latin Square Design)是指让试验因素的每一水平与拉丁方的字母建立对应关系的一种试验设计。
当水平为a项时,则全部试验配置在拉丁方上共为a2次。
拉丁方上的每一字母代表某一个因素的一个水平,这一因素的所有水平在每一行和每一列上都有出现,而且仅仅出现一次。从而,该不论是在行的方向上,还是在列的方向上出现条件差异时,拉丁方设计都可以克服这两个方面的干扰,突出水平之间的差异,有效地进行显著性检验,得出正确的判断。
拉丁方设计可以在不增加试验次数的前提下,采用类似于随机化区组设计中的双因素方差分析方法,运用三因素方差分析方法来观测三个因素对试验结果的影响。拉丁方设计具有同时分析三个因素对于所研究的测度是否存在显著关系的功能。
《统计学》
第11章 抽样技术与试验设计
*/*
11.2 试验设计
例11.5 再次借用某化工企业W产品收率的案例。这次采用了拉丁方设计方法来进行试验设计。假定在本次试验设计中有反应釜、反应过程加热温度和加热反应时间3个因素,将其中反应釜和反应过程加热时间因素作为实验条件,反应过程加热温度作为拉丁方设计分配因素。
表11.10 某企业W产品收率拉丁方设计试验数据表 %
要求 采用三因素方差分析方法,就拉丁方设计中的3个因素对W产品收率的影响,进行显著性检验。
《统计学》
第11章 抽样技术与试验设计
*/*
11.2 试验设计
可计算出包括了反应釜、反应过程加热温度和加热反应时间3个因素的W产品收率拉丁方设计的三因素方差分析计算表。
表11.13 某企业W产品收率拉丁方设计三因素方差分析表

反应釜的P-value为0.658177,大于显著性水平0.05,因此认为该企业5个不同的反应釜对于W产品的收率变动没有显著差异;加热时间的P-value为0.000631,明显小于显著性水平0.05;加热温度的P-value为0.030597,小于显著性水平0.05,表明生产中反应过程的加热时间和加热温度是影响W产品收率的显著因素。
《统计学》
第11章 抽样技术与试验设计
*/*
11.2 试验设计
最后,可以采用方差分析中的多重比较方法,通过不同水平均值之间的配对组合比较,来检验其总体均值是否存在显著差异。这里采用当各水平的观测值个数相等时的最小显著性差异法的式(8.15),对本例中的加热温度不同水平均值进行多重比较。由表11.13可知均方误差为10.41,则有各不同水平均值之间的配对检验统计值如表11.14所示。
表11.14 加热温度因素多重水平均值比较的检验统计值

《统计学》
第11章 抽样技术与试验设计
第11章 抽样技术与试验设计
小结与练习
《统计学教程》
*/*
本章小结
本章介绍了抽样技术和试验设计的基本理论和方法。包括抽样技术的简单随机抽样、系统抽样、分层抽样和整群抽样,必要样本容量和根据费用函数确定样本容量的方法;以及试验设计的完全随机化试验、随机化区组设计和拉丁方设计。
本章的重点是抽样技术的简单随机抽样和分层抽样,以及试验设计的随机化区组设计和拉丁方设计。
本章的难点是分层抽样和整群抽样的抽样平均误差和必要样本容量的计算,试验设计中拉丁方设计的三因素方差分析。
《统计学》
第11章 抽样技术与试验设计
*/*
思考与练习
1、 为什么简单随机抽样具有自加权性质?
2、 简单随机抽样中的重复抽样和不重复抽样的区别?
3、 什么是按有关标志的系统抽样?
4、 分层抽样需要具备什么辅助数据?
5、 怎样通过分层来提高分层抽样的效率?
6、 为什么Neyman最佳配置效率高于比例配置?
7、 怎样根据必要样本容量和费用函数确定来确定样本容量?
8、 试验设计的基本原理是什么?
9、 拉丁方设计具有那些优越性?
《统计学》
第11章 抽样技术与试验设计
第11章 抽样技术与试验设计
结 束
《统计学教程》

展开更多......

收起↑

资源预览