资源简介 (共29张PPT)管 理 统 计 学[第四版]第九章 非参数检验案例导入环境保护是“可持续发展”的题中之意,而居民排污问题一直是环境保护重点关注的问题。某市的建筑规格要求居民区所用污水管破坏强度的中位数大于每线英尺2500磅。一名想向该市供应污水管的制造商对此项目投了标,并提供了补充信息:有一位独立的承包商从这位制造商那里随机抽选了七节污水管,并检验了每节管子的破坏程度。结果(磅/线英尺)列于表9-1。那么在总体分布未知,且样本量极小的情形下,如何对假设H0(该制造商提供的污水管符合所要求的规格)做出统计推断?2610 2750 2420 2510 2540 2490 2680表9.1 污水管破坏强度检查表学习目标本章要求掌握非参检验的应用范围、基本思想以及检验步骤。重点掌握两总体比较的非参检验方法。9.1 非参数检验的概述非参检验是相对于参数检验而存在的。参数检验是在已知总体分布的条件下(一般要求总体服从正态分布)对一些主要的参数(如均值、百分数、方差、相关系数等)进行的检验,有时还要求某些总体参数满足一定条件。如独立样本的T检验和方差检验不仅要求总体符合正态分布,还要求总体方差齐性。对于不服从正态分布的数据,存在很多非参数分析方法。非参数检验不依赖被抽样总体的分布,因而称为与分布无关的检验。9.1 非参数检验的概述非参数检验方法简便,不依赖于总体分布的具体形式因而适用性强,但灵敏度和精确度不如参数检验。一般而言,非参数检验适用于以下三种情况:(1)顺序类型的数据资料,这类数据的分布形态一般是未知的;(2)虽然是连续数据,但总体分布形态未知或者非正态,这和卡方检验一样,称为自由分布检验;(3)总体分布虽然正态,数据也是连续类型,但样本容量极小,如10以下(虽然T检验被称为小样本统计方法,但样本容量太小时,代表性毕竟很差,最好不要用要求严格的参数检验法)。因为这些特点加上非参检验法一般原理和计算比较简便,因此常用于一些为正式研究进行探路的预备性研究中。当然,由于非参数检验许多牵涉不到参数计算,对数据中的信息利用不够,因而其统计检验力相对于参数检验也差得多。9.1 非参数检验的概述单个总体的非参数检验法位置检验:分布函数检验符号检验法拟合优度 检验法拟合优度k-s检验法两个总体的非参数检验法两个配对样本的检验两个独立样本的检验符号检验法符号等级检验法秩和检验法中数检验法图9.2 非参数检验的分类框架前面所学到的参数检验法在非参数检验法中都能找到替代的方法,因此按照和参数检验法相对应的原则可对非参数检验法进行如下分类:9.2单个总体的非参数检验9.2.1单个总体的位置检验由第八章可知,估计总体均值或检验关于总体均值的假设的小样本方法,都要求总体服从某个近似的正态分布。因此,在非正态总体收集一个小样本的情况下,t检验就失效,必须求助于某种非参数方法。适用于此种情形的最简单的非参数方法是正负号检验法(又称符号检验法)。这是一种专为检验关于任意连续分布的中位数的假设而设计的方法。同平均值一样,中位数是分布中心和分布位置的度量,所以正负号检验有时亦称位置检验。9.2单个总体的非参数检验9.2.1单个总体的位置检验例9-1 考虑一个中位数η未知的总体,并假定需要检验零假设H0:η=100对单尾替代假设H1:η>100。所谓的中位数,是指使总体左右两侧概率分布面积相等的数。因此从总体选出大于η的 的概率为0.5,即 。要是零假设事实上为真,那么可以预期将会观察到差不多有一半样本 值大于η。正负号检验所用的检验统计量为S:S=超过100的样本观察值数试求本检验的零假设是否成立。9.2单个总体的非参数检验9.2.1单个总体的位置检验解:S只依赖于每个样本值 与100之差的正负号。也就是说,我们只需数一数样本差( -100)中有几个正号就行了。令每一个样本差( -100)代表由n次相同试验组成的实验中一次试验的结果。如果称正的差值为“成功”,负的差值为“失败”,则S便是n次试验的成功数。在H0之下,观察到任意一次试验为成功的概率为由于各次试验都是独立的,满足二项实验的性质。于是S服从参数n和 =0.5的二项分布,进而计算р值,最后根据р值与显著性水平ɑ的关系,判断H0是否成立。9.2单个总体的非参数检验9.2.1单个总体的位置检验一般而言,单个总体中位数η的正负号检验需要经历以下三个步骤。首先,提出零假设和备择假设:H0:η=η0H1:η>η0(或H1:η<η0)其次,计算检验统计量S:S=大于η0的样本观察值数(或S=小于η0的样本观察值数)最后,根据显著性水平ɑ,判断是否拒绝原假设H0。其判断分小样本和大样本两种情形。9.2单个总体的非参数检验9.2.1单个总体的位置检验(1)在小样本的情形下(n<10)计算р值:(9-1)此处 服从参数为n和 的二项分布。当р值<ɑ时,则拒绝H0。(2)在大样本的情形下(n≥10)计算z值:(9-2)当 时,拒绝H0(注:本章所采取的都是单侧检验下的判断准侧)。9.2单个总体的非参数检验9.2.2单个总体的分布函数检验9.2.2.1拟合优度 检验法假设(猜测)总体的概率密度函数为 (若总体为离散型,则假设总体的概率密度为 ),那么用一组样本 , …, 如何来检验假设是否成立。一般而言,要经历以下四个步骤。首先,提出零假设和备择假设:H0:总体的累积概率分布函数为H1:总体的累积概率分布函数不是其次,在数轴上选取k-1个分点t1,t2,…,tk-1将数轴分为k个区间(不必等区间): , ,…, 。9.2单个总体的非参数检验9.2.2单个总体的分布函数检验9.2.2.1拟合优度 检验法记 为总体在第 个区间上的概率值,则有…记 为样本 , …, 中,落在区间 中的个数(或频数) ,那么,频率 (n至少为50,最好100以上)与概率 之差应当很小,否则就应该拒绝假设H0。9.2单个总体的非参数检验9.2.2单个总体的分布函数检验9.2.2.1拟合优度 检验可以证明(K. Pearson),在H0成立的条件下,统计量(9-3)服从 分布,其中 是总体中未知参数的个数。再次,对于给定的显著性水平 ,可由 分布表,查出临界值 。最后,比较统计量 与临界值 的大小,若 则拒绝H0。9.2单个总体的非参数检验9.2.2单个总体的分布函数检验9.2.2.2 k-s检验法k-s检验法是柯尔摩格罗夫(Kolmogorov)-斯米尔诺夫(Smirnov)检验法的简称。k-s检验法的基本思路如下所示:(1)把不重复的样本观察值从小到大排列,依据不重复的样本观察值的频率,建立一个样本累积频率函数 。(2)对于任何确定的 ,定义 统计量:(9-4)9.2单个总体的非参数检验9.2.2单个总体的分布函数检验9.2.2.2 k-s检验法(3)对于任何确定的 ,统计量 的 (累积)概率分布函数为 ,记为 。对于计算出来的统计量 的值 ,若 ,则接受H0;若,则拒绝H0。9.3两个总体的非参数检验9.3.1 两个配对样本的检验9.3.1.1符号检验法符号检验法是通过对两个配对样本的每对数据之差的符号(正号或负号)进行检验,以比较这两个样本所代表的总体的差异显著性,对应于参数检验中两相关样本差异显著性的T检验。其基本思想是:若两总体差异不显著,则两样本差值的正号与负号应大致各占一半,即中位数为0。符号检验法一般要经历以下三个步骤。首先,提出零假设和备择假设H0:差值的总体中位数为0H1:差值的总体中位数不为09.3两个总体的非参数检验9.3.1 两个配对样本的检验9.3.1.1符号检验法其次,标记出每对数据之差的符号,正号个数记为 ,负号的个数记为 ,差值为0的不计算在内,并记 , 。最后,分小样本和大样本两种情况进行检验。(1)当为小样本的情形下(N≤25时)计算р值:(9-5)此处 服从参数为N和 的二项分布。当р值<ɑ时,则拒绝H0。9.3两个总体的非参数检验9.3.1 两个配对样本的检验9.3.1.1符号检验法(2)当为大样本的情形下(N>25时)计算z统计量:(9-6)若 ,则拒绝H0,否则,接受H0(注:本章所采取的都是单侧检验下的判断准侧)。9.3两个总体的非参数检验9.3.1 两个配对样本的检验9.3.1.2符号等级检验法符号等级检验法(Wilcoxon Signed-Rank test)是由维尔克松提出的,有时也简称维尔克松检验法(Wilcoxon test)。其适用条件与符号检验法相同,也适合于配对样本,但它的精度比符号检验法高,因为它不仅考虑差值的符号同时还考虑差值的大小。符号等级检验法一般要经历以下五个步骤。首先,提出零假设和备择假设H0:差值的总体分布对称且中位数为0H1:差值的总体分布不对称,或中位数不为0其次,将两配对样本数据之差按绝对值由小到大排列,若差值为0,则不参与排序。再次,在各等级前添上差值的符号。9.3两个总体的非参数检验9.3.1 两个配对样本的检验9.3.1.2符号等级检验法然后,记带正号的等级和为 ,记带负号的等级和为 ,并记 , 。最后,分小样本和大样本两种情况进行检验。(1)当为小样本的情形下(N≤25时)根据N查“维尔克森配对差等级和检验临界值表”,得到 。若 ,则拒绝H0,否则接受H0。(2)当为大样本的情形下(N>25时)计算z统计量:(9-7)若 ,则拒绝H0,否则,接受H0(注:本章所采取的都是单侧检验下的判断准侧)。9.3 两个总体的非参数检验9.3.2两个独立总体的非参数检验9.3.2.1秩和检验法秩和(the sum of ranks)即秩次的和或者等级之和。这一方法首先由维尔克松(wilcoxon)提出,叫维尔克松两样本检验法,后来曼(Mann)与惠特尼(Whitney)二人将其应用到两样本容量不等的情况,因而又称作曼-惠特尼-维尔克松秩和检验,或称曼-惠特尼U检验。秩——就是变量值排序的名次。可以将数据升序(或降序)排列,每个变量值都会有一个在整个变量值序列中的位置或名次,这个位置或名次就是变量值的秩。变量值有几个,对应的秩就有几个。秩和检验法相当于考验两个独立样本平均数之差异t检验法。当两个独立样本不符合t检验法的基本假设——其总体分布不是正态时,就要用秩和检验法代替t检验法的基本假设。秩和检验法要经历以下五个步骤。9.3 两个总体的非参数检验9.3.2两个独立总体的非参数检验9.3.2.1秩和检验法首先,提出零假设和备择假设H0:两总体分布相同H1:两总体分布不同其次,将两本数据混合,有小到大排序(相同数据占平均等级)。再次,取容量小的样本中各数据的等级相加,记为 。最后,分小样本和大样本两种情形进行检验(两样本的容量分别记为 , )。(1)当为小样本的情形下( ≤10, ≤10)根据 , 以及 查“维尔克森等级和检验的临界值”表,得到 和 ,当 时,接受原假设,否则拒绝原假设。9.3 两个总体的非参数检验9.3.2两个独立总体的非参数检验9.3.2.1秩和检验法(2)当为大样本的情形下( >10, >10)计算z统计量:(9-8)若 ,则拒绝H0,否则,接受H0(注:本章所采取的都是单侧检验下的判断准侧)。9.3 两个总体的非参数检验9.3.2两个独立总体的非参数检验9.3.2.2中数检验法中数检验法也适用于两独立样本的差异显著性检验,用以检验两总体是否具有相同中数。中数检验法是用中位数作为统计量进行假设检验的方法,它将各组样本数据合在一起找出共同的中位数,然后分别计算每个样本的共同中位数上、下频数,再进行卡方检验。所以实际上中数检验法是利用卡方独立性检验进行决策,中数检验一般要经历以下五个步骤。9.3 两个总体的非参数检验9.3.2两个独立总体的非参数检验9.3.2.2中数检验法首先,提出零假设和备择假设H0:两总体分布具有相同的中位数H1:两总体分布中位数不同其次,两样本有小到大混合排序。再次,计算混合排序数列的中数。然后,分别找出每一样本中大于混合排列中数及小于混合排列中数的数据个数,列成四格表。最后,对四格表进行 检验。若 检验结果显著,则说明两样本中数差异显著。本章小结非参数检验作为对参数检验的补充,其对于统计推断应用范围的延伸有着巨大的推动作用。其主要是用样本信息对总体分布的特征进行检验的方法,不需要对总体的分布参数进行估计,使统计推断的适用性大大提高。与参数检验相对应,非参数检验方法也分为单一总体的非参数检验和两个总体的非参数检验。谢 谢 观 看! 展开更多...... 收起↑ 资源预览