资源简介 (共56张PPT)1统计学Statistics2第 7 章 假设检验7.1 假设检验的基本原理7.2 一个总体参数的检验7.3 两个总体参数的检验7.4 小结3第 7 章 假设检验7.1 假设检验的基本原理4假设检验的基本原理假设检验(hypothesis test)就是在对总体参数提出某种假设的基础上,利用样本信息判断该假设是否成立的一类统计方法。原假设也称零假设(null hypothesis),通常是研究者想要收集证据予以推翻的假设,用H0表示。通俗地理解,假设(hypothesis)就是对总体的某种看法。大多数情况下,假设是对总体某个参数的具体取值所作的陈述。备择假设(alternative hypothesis)是原假设的对立假设,通常是研究者想要收集证据予以支持的假设,用H1或Ha表示。5假设检验的基本原理如果否定不了,只能说明本次抽样的证据还不充分,但尚不能说明原假设是正确的;如果样本信息足以推翻原假设,则等同于间接承认了备择假设。除了理论探讨外,多数情况下假设检验都是以推翻原假设为目标,设立原假设的初衷就是希望利用样本信息找出总体假设与抽样事实之间的“显著”差异,从而否定原假设。因此,通过了检验就意味着有理由拒绝原假设,或者称检验结果是“显著的”,假设检验也被称为显著性检验(significant test)。6假设检验的基本原理如果要检验总体参数是否大于或小于某个假定值,这样的假设检验称为单侧检验或单尾检验(one-tailed test)。从检验形式上来看,如果只是检验总体参数是否等于某个假定值(备择假设含有符号“≠”),这样的假设检验称为双侧检验或双尾检验(two-tailed test)。具体地,备择假设含有符号“<”的单侧检验称为左侧检验(left-tailed test),而备择假设含有符号“>”的单侧检验称为右侧检验(right-tailed test)。7假设检验的基本原理表7-1给出了以单个总体均值为例的三种不同假设检验的原假设和备择假设形式。 原假设 备择假设双侧检验 H0: = 0 H1: ≠ 0左侧检验 H0: ≥ 0 H1: < 0右侧检验 H0: ≤ 0 H1: > 0表7-1 单个总体均值的三种假设检验形式8假设检验的基本原理【例7.1】为了验证“健康成年人的平均体温是37℃”这一说法是否属实,某体检中心研究人员随机抽取了50位健康的成年人,并测量了每个人的体温。试建立该假设检验问题的原假设和备择假设。解:根据题意,该体检中心研究人员想要检验的是所有健康成年人(总体)的平均体温是否等于37℃,即总体均值 是否等于假定值 0。如果抽样测量的50位健康成年人的平均体温与假定值37℃之间的差异(高于或低于)十分显著,就有可能推翻人们长期以来相信的这一说法。因此,研究人员收集证据想要推翻的假设是“健康成年人的平均体温等于37℃”,相应的原假设和备择假设分别为:H0: =37;H1: ≠379假设检验的基本原理【例7.2】某制药公司开发了一种新型抗癌药,并声称“该药物针对特定肿瘤患者的治愈率不低于75%”。在批准该药物上市之前,相关监管部门对其开展临床试验,随机选取了40名志愿肿瘤患者,观测服药后的治愈情况。试建立该假设检验问题的原假设和备择假设。解:根据题意,监管部门想要检验的是所有(特定)肿瘤患者(总体)服用该药物后的治愈率是否不低于75%,即总体比例π是否大于等于假定值π0。如果参与临床试验的40位志愿者中最终治愈的人数占比远低于假定值75%,就有理由怀疑该制药公司的说法过于夸张。因此,监管部门收集证据想要推翻的假设是“该药物针对特定肿瘤患者的治愈率不低于75%”,相应的原假设和备择假设分别为:H0:π≥75%;H1:π<75%10假设检验的基本原理【例7.3】某饮料生产企业采用自动生产线进行灌装,按照生产标准规定,每瓶饮料装填量的标准差不应超过3毫升。为保障生产线正常运转,企业的质检部门定期对其生产的饮料进行抽检,每次随机抽取30瓶灌装好的饮料,测量其实际装填量。试建立该假设检验问题的原假设和备择假设。解:根据题意,质检部门想要检验的是所有灌装的饮料(总体)装填量的方差是否不超过9毫升,即总体方差σ2是否小于等于假定值σ20。如果随机抽检的30瓶饮料的实际装填量方差远大于假定值9毫升,就有理由怀疑自动生产线可能出现了问题,需要重新调试。因此,质检部门收集证据想要推翻的假设是“自动生产线灌装的饮料装填量方差不超过9毫升”,相应的原假设和备择假设分别为:H0:σ2≤9;H1:σ2>911假设检验的基本原理如果当原假设是错误的时候却没有拒绝它,这时就犯了第二类错误(type Ⅱ error),也称为“存伪”错误。在假设检验中,只要做出拒绝原假设的决策,就有可能犯第一类错误;只要做出不拒绝原假设的决策,就有可能犯第二类错误。如果当原假设是正确的时候却拒绝了它,这时就犯了第一类错误(type Ⅰ error),也称为“弃真”错误。当样本量不变的时候,降低犯第一类错误的概率就会增加犯第二类错误的概率,要使二者同时减小的办法是增加样本量。12假设检验的基本原理人们事先指定的犯第一类错误概率的最大允许值就称为显著性水平(significant level),通常用字母α表示。设定的α越小,意味着如果要做出拒绝原假设的决策,犯第一类错误的概率就要控制得越低,也就越难拒绝。由于相对犯第一类错误的概率,犯第二类错误的概率更难计算,所以人们往往会选择先控制犯第一类错误的概率。实践中需要根据研究问题的背景来选择一个合适的α,但无论怎样,α显然都应该是一个“小概率”。13假设检验的基本原理假设检验中用于决策的统计量就称为检验统计量(test statistic)。假设检验的一种思路是,先默认原假设是成立的,选择合适的检验统计量,根据检验统计量的抽样分布和事先设定的显著性水平α,找到小概率事件发生的临界值(critical value),基于临界值构造一个检验统计量的小概率取值区域,即拒绝域(rejection region)。1.用统计量决策如果根据样本数据计算出来的检验统计量的值落入了拒绝域,意味着在原假设成立的前提下,抽取得到这样一个样本结果是一个小概率事件,因此做出拒绝原假设的决策,此时犯第一类错误的概率也就没有超过α;反之,则不能拒绝原假设。14假设检验的基本原理图7-1给出了三种假设检验形式下的拒绝域示意图。图7-1 三种假设检验形式下的拒绝域示意图15假设检验的基本原理拒绝域即为原假设成立时,检验统计量取值概率为α的区间。与拒绝域相对应的,则是原假设成立时,检验统计量取值概率为1-α的区间,类似于参数估计中构造的置信水平为(1-α)%的置信区间,也称为接收域。可以很直观地看出,临界值的位置由抽样分布和显著性水平α确定。16假设检验的基本原理在原假设成立的前提下,检验统计量的值取到实际观测值甚至比它更为极端值的概率称为p-值(p-value)。所谓的“更为极端值”指的是更不利于原假设(也就是与备择假设方向相同的取值)。2.用p-值决策利用p-值进行决策的规则很简单:p-值<α,拒绝原假设;p-值>α,不拒绝原假设。人们将p-值称为观测到的显著性水平。17假设检验的基本原理图7-2给出了三种假设检验形式下的p-值示意图。图7-2 三种假设检验形式下的p-值示意图18假设检验的基本原理第一,建立原假设和备择假设;第二,指定显著性水平α;归纳起来,假设检验的基本步骤为:第三,选择合适的检验统计量并计算其取值;第四,在原假设成立的前提下,确定检验统计量的抽样分布;第五,根据样本数据计算临界值(构造拒绝域)或p-值;第六,做出决策。19假设检验的基本原理此外,检验统计量的抽样分布与样本量直接相关,理论上只要样本量足够大,原假设几乎总能被推翻,但这有可能将样本数据和总体假设之间微小的差异放大化。当无法拒绝原假设时,严格来说,我们也不能给出“接受原假设”的结论,除非你能同时提供犯第二类错误的概率,而这在上述假设检验问题中都是无法计算的。因此,在陈述检验结果的同时,还需要报告样本量的大小作为参考,并且区分“统计显著”与“实际显著”之间的不同。20第 7 章 假设检验7.2 一个总体参数的检验21总体均值的检验在对单个总体均值进行假设检验时,需要考虑总体是否服从正态分布、总体方差是否已知、用于估计的样本是大样本(n≥30)还是小样本(n<30)等几种不同情况。但无论是哪种情况,通常选择的检验统计量都是样本均值 ,在此基础上,以总体均值 等于某一假定值 0为前提,确定 的抽样分布,进而计算指定显著性水平下的临界值或直接计算p-值,最后做出决策。22总体均值的检验在大样本(n≥30)情况下,无论总体是否服从正态分布,由中心极限定理可知,样本均值 都近似服从正态分布,且均值为 ,标准误差为 。设总体均值 取假定值 0,当总体方差已知时, 经过标准化后得到的检验统计量为当总体方差未知时,用样本方差s2代替σ2, 经过标准化后得到的检验统计量为上述检验统计量均近似服从标准正态分布N(0,1)。23总体均值的检验结合指定的显著性水平α,对于双侧检验,临界值即为标准正态分布的α/2上下侧分位数( 和- )。对于左侧检验和右侧检验,临界值即分别为标准正态分布的α下侧分位数(- )和α上侧分位数( )。根据样本数据计算出检验统计量z的实际取值,与临界值进行比较,判断是否落入拒绝域并做出决策。当然,利用计算机也可以直接计算p-值,通过比较p-值与α的大小,做出决策。24总体均值的检验【例7.4】一家咨询机构发布研究报告称,我国公民平均每天的上网时间为3小时。为验证该说法是否准确,相关部门随机调查了36位受访者,记录下其上网时间的数据如表7-2所示。试在0.05的显著性水平下,完成该假设检验问题。3.3 3.1 6.2 5.8 2.3 4.1 5.4 4.5 3.24.4 2 5.4 2.6 6.4 1.8 3.5 5.7 2.32.1 1.9 1.2 5.1 4.3 4.2 3.6 0.8 1.54.7 1.4 1.2 2.9 3.5 2.4 0.5 3.6 2.5表7-2 36位受访者上网时间 单位:小时/天25总体均值的检验解:根据题意,建立该问题的原假设和备择假设:H0: =3;H1: ≠3样本量n=36, 0=3,根据表7-2中的样本数据计算得到: =3.3167,s=1.6093,代入公式得到标准化后的检验统计量值为:指定的显著性水平α=0.05,使用Excel中的【NORM.S.INV】函数计算得到α/2下侧分位数- z0.025=-1.96,相应地,α/2上侧分位数z0.025=1.96,该检验的拒绝域即为z>1.96或z<-1.96。由于z的值并未落入拒绝域,因此,不能拒绝原假设,即没有理由怀疑该咨询机构关于“我国公民平均每天的上网时间为3小时”的说法。也可以直接使用Excel中的【Z.TEST】函数计算得到单侧检验的p-值=0.119,那么,该双侧检验的p-值=2×0.119=0.238。p-值>α,不能拒绝原假设,结论一致。26总体均值的检验在小样本(n<30)情况下,需要假设总体服从正态分布。设总体均值 取假定值 0,当总体方差σ2已知时,样本均值 同样服从均值为 ,标准误差为 的正态分布,构造的检验统计量与前文一致,其抽样分布仍为标准正态分布。服从自由度为n-1的t分布。但当总体方差σ2未知时,用样本方差s2代替σ2, 经过标准化后得到的检验统计量27总体均值的检验结合指定的显著性水平α,对于双侧检验,临界值即为t(n-1)分布的的α/2上下侧分位数( 和- )。对于左侧检验和右侧检验,临界值即分别为t(n-1)分布的α下侧分位数(- )和α上侧分位数( )。根据样本数据计算出检验统计量t的实际取值,与临界值进行比较,判断是否落入拒绝域并做出决策。当然,利用计算机也可以直接计算p-值,通过比较p-值与α的大小,做出决策。这一检验过程通常被称为t检验。28总体均值的检验【例7.5】某医院研究发现,女性由于节食、挑食等原因造成营养缺乏,容易导致所生婴儿的出生体重低于标准体重2.5千克。针对此,该医院尝试推行一项产前保健计划,认为参与该计划的女性所生婴儿平均体重能够高于标准体重2.5千克。为验证该计划的有效性,医院随机抽选了25名志愿者孕妇并提供膳食干预措施,记录下其分娩时新生儿的出生体重数据如表7-3所示。假定所有新生儿的出生体重服从正态分布,试在0.01的显著性水平下,完成该医院的假设检验问题。2.50 4.14 4.00 2.29 2.683.44 2.52 2.37 1.64 2.533.13 2.27 4.10 4.23 2.951.65 3.99 4.19 1.88 3.032.62 3.75 3.40 2.18 2.96表7-3 25名孕妇分娩时新生儿的出生体重数据 单位:千克29总体均值的检验解:根据题意,建立该问题的原假设和备择假设:H0: ≤2.5;H1: >2.5样本量n=25, 0=2.5,根据表7-3中的样本数据计算得到: =2.9776,s=0.8247,代入公式得到标准化后的检验统计量值为:指定的显著性水平α=0.01,使用Excel中的【T.INV】函数计算得到t(24)分布的α下侧分位数-t0.01=-2.49,相应地,α上侧分位数t0.01=2.49,该检验的拒绝域即为t>2.49。由于t的值落入了拒绝域,因此,有理由拒绝原假设,即认为“参与该计划的女性所生婴儿平均体重高于标准体重2.5千克”。也可以直接使用Excel中的【T.DIST.RT】函数计算得到右侧检验的p-值=0.004。p-值<α,拒绝原假设,结论一致。30总体比例的检验在大样本情况下,抽取的样本数据中具有指定特征的个体所占的比例p近似服从正态分布,且均值等于总体比例π,标准误差等于 。近似服从标准正态分布N(0,1)。设总体比例π取假定值π0,样本比例p经过标准化后得到的检验统计量结合指定的显著性水平α,决策的依据与大样本情形下单个总体均值的假设检验完全相同。31总体比例的检验【例7.6】某电视频道旗下一档真人秀节目第一季的收视率为3%,第二季推出后该电视频道预期收视率将超过3%。节目播出期间,调查机构通过电话寻访调查了2000名观众,其中有3.2%的观众正在观看该节目。试在0.05的显著性水平下,完成该假设检验问题。解:根据题意,建立该问题的原假设和备择假设:H0:π≤3%;H1:π>3%样本量n=2000,π0=3%,p=3.2%,代入公式得到标准化后的检验统计量值为:指定的显著性水平α=0.05,使用Excel中的【NORM.S.INV】函数计算得到α下侧分位数- z0.05=-1.64,相应地,α上侧分位数z0.05=1.64,该检验的拒绝域即为z>1.64。由于z的值并未落入拒绝域,因此,不能拒绝原假设,即没有理由认为“该电视频道推出的第二季节目收视率超过3%”。32总体比例的检验利用SPSS软件完成单个总体比例的假设检验,输出结果如下:可以看出,精确的二项分布的p-值和大样本正态近似的p-值均为0.317,大于显著性水平0.05,不能拒绝原假设,与前文结论一致。二项式检验 类别 N 观察比例 检验比例 渐近显著性(单侧) 精确显著性(单侧) 组 1 1 64 .032 .03 .317a .317组 2 0 1936 .968 总数 2000 1.00 a. 基于 Z 近似值。表7-5 SPSS单个总体比例假设检验结果33总体方差的检验在总体服从正态分布的假定下,设总体方差σ2取假定值σ20,基于样本方差s2构造得到的检验统计量服从自由度为n-1的 分布。结合指定的显著性水平α,对于双侧检验,临界值即为 (n-1)分布的的α/2上侧分位数和1-α/2上侧分位数( 和 )。对于左侧检验和右侧检验,临界值即分别为 (n-1)分布的1-α上侧分位数( )和α上侧分位数( )。根据样本数据计算出检验统计量的实际取值,与临界值进行比较,判断是否落入拒绝域并做出决策。利用计算机也可以直接计算p-值,通过比较p-值与α的大小,做出决策。这一检验过程通常被称为 检验。34总体方差的检验【例7.7】沿用例7.3,某饮料生产企业自动生产线的灌装标准是500毫升/瓶,且每瓶饮料装填量的标准差不应超过3毫升。质检部门随机抽取了30瓶灌装好的饮料,测量得到实际装填量数据如表7-6所示。假定该生产线灌装的所有饮料装填量服从正态分布,试在0.01的显著性水平下,检验其装填量方差是否符合标准。501 490 505 498 500 502503 501 500 496 495 503499 504 500 500 499 500498 496 502 501 497 496500 490 499 501 504 500表7-6 30瓶饮料实际装填量数据 单位:毫升35总体方差的检验解:根据题意,建立该问题的原假设和备择假设:H0:σ2≤9;H1:σ2>9样本量n=30,σ20=9,根据表7-6中的样本数据计算得到:s2=12.6437,代入公式得到检验统计量值为:指定的显著性水平α=0.01,使用Excel中的【CHISQ.INV.RT】函数计算得到α上侧分位数 =49.59,该检验的拒绝域即为 >49.59。由于 的值并未落入拒绝域,因此,不能拒绝原假设,即没有理由怀疑“该企业自动生产线灌装的饮料装填量标准差不超过3毫升”。也可以直接使用Excel中的【CHISQ.DIST.RT】函数计算得到右侧检验的p-值=0.07。p-值>α,不能拒绝原假设,结论一致。36第 7 章 假设检验7.3 两个总体参数的检验37两个总体均值之差的检验设两个总体均值分别为 1和 2(假设检验中假定的是二者的差值,以下同),如果两个样本是从两个总体中独立随机抽取的,且均为大样本(n1≥30,n2≥30),那么,两个样本均值之差( )近似服从正态分布,且均值为( 1- 2),标准误差为 。当总体方差已知时,( )经过标准化后得到的检验统计量为当总体方差未知时,分别用两个样本方差s21和s22代替σ21和σ22, ( )经过标准化后得到的检验统计量为上述检验统计量均近似服从标准正态分布N(0,1) 。结合指定的显著性水平α,决策的依据与大样本情形下单个总体均值的假设检验完全相同。升级前 升级后n1=60 n2=50=25.6分钟 =19.3分钟s1=0.9分钟 s2=0.5分钟38两个总体均值之差的检验【例7.8】某汽车加工厂拟对生产线进行升级改造,预期升级后的生产线平均装配时间将减少6分钟以上。为检验升级是否有效,该工厂分别对升级前后的两条生产线进行了装配测试,获取的两个独立样本信息如表7-7所示。试在0.05的显著性水平下,完成该假设检验问题。表7-7 升级前后生产线装配时间样本信息39两个总体均值之差的检验解:根据题意,建立该问题的原假设和备择假设:H0: 1- 2≤6;H1: 1- 2>6随机抽取了两个独立大样本,且总体方差未知,将表7-7中的已知信息代入公式得到标准化后的检验统计量值为:指定的显著性水平α=0.05,使用Excel中的【NORM.S.INV】函数计算得到α下侧分位数- z0.05=-1.64,相应地,α上侧分位数z0.05=1.64,该检验的拒绝域即为z>1.64。由于z的值落入了拒绝域,因此,拒绝原假设,即有理由认为“升级前后的生产线平均装配时间差值超过了6分钟”。也可以使用Excel中的【NORM.S.DIST】函数计算得到右侧检验的p-值=0.014,p-值<α,拒绝原假设,结论一致。40两个总体均值之差的检验如果分别从两个总体中独立随机抽取两个小样本(n1<30,n2<30),这时需要进一步假定两个总体都服从正态分布。当两个总体方差σ21和σ22已知时,两个样本均值之差( )仍然近似服从均值为( 1- 2),标准误差为 的正态分布。因此,同样可以构造为检验统计量并完成检验。当两个总体方差σ21和σ22未知时,则需要进一步区分两种情形。41两个总体均值之差的检验当两个总体方差σ21和σ22未知但相等时,即σ21=σ22=σ2,需要利用两个样本方差来合并估计总体方差,记为s2p,具体公式为用s2p代替σ21和σ22,两个样本均值之差( )经过标准化后得到的检验统计量服从自由度为(n1+n2-2)的t分布。42两个总体均值之差的检验当两个总体方差σ21和σ22未知且不相等时,分别用两个样本方差s21和s22代替总体方差σ21和σ22,两个样本均值之差( )经过标准化后得到的检验统计量服从自由度为v的t分布, 自由度v的计算公式为结合指定的显著性水平α,决策的依据与小样本情形下单个总体均值的t检验完全相同。43两个总体均值之差的检验【例7.9】某公司制定了两套广告宣传计划,并分别投入两个独立的市场进行了一年的测试,统计每个月的销售额(单位:万元)样本数据如表7-8所示。假定两套广告宣传计划月销售额的总体均服从正态分布,试在0.01的显著性水平下,检验这两套广告宣传计划月平均销售额是否存在显著差异。广告宣传 计划一 28.3 30.1 31 37.6 32.1 33.636 37.2 38.5 34.4 35.8 39广告宣传 计划二 27.6 22.2 31 33.8 30 30.231.7 26 32 31.2 33.4 31.9表7-8 某公司两套广告宣传计划下月销售额数据 单位:万元44两个总体均值之差的检验解:根据题意,建立该问题的原假设和备择假设:H0: 1- 2=0;H1: 1- 2≠0两个样本的样本量n1=n2=12,按照两个独立小样本均值检验的基本步骤,需要首先检验两个总体方差是否相等,再构造相应的t检验统计量。由于SPSS的实现过程最为简便,在此仅给出SPSS的输出结果:独立样本检验 莱文方差等同性检验 均值等同性 t 检验F Sig. t 自由度 Sig.(双侧) 均值差值 标准误差值销售额 假设方差相等 .330 .571 3.152 22 .005 4.3833 1.3905假设方差不相等 3.152 21.950 .005 4.3833 1.3905表7-9 SPSS两个独立样本均值之差假设检验结果45两个总体均值之差的检验表7-9输出结果的前两列给出了两个总体方差的假设检验(原假设为σ21=σ22)结果,决策的规则同样以p-值为标准,p-值=0.571,远大于显著性水平0.01,不能拒绝原假设,即没有理由怀疑两个总体方差相等的假设。因此,接下来的两个总体均值检验应在总体方差相等的假设前提下完成,即以第一行的均值t检验结果为准。两个总体均值检验的p-值=0.005,小于指定的显著性水平0.01,拒绝原假设,即有理由相信“这两套广告宣传计划月平均销售额存在显著差异”。46两个总体均值之差的检验在大样本情形下, 近似服从正态分布,且均值为( 1- 2),标准误差为 。那么, 经过标准化后得到的检验统计量为当 未知时,用 代替, 经过标准化后得到的检验统计量为在配对样本中,两个样本的数据是一一对应的,两个样本的样本量n1=n2=n,因此用d表示两两配对数据的差值(即x1-x2), 表示各差值的均值,两个总体配对差值的方差记为 ,两个样本配对差值的方差记为 。上述检验统计量均近似服从标准正态分布N(0,1)。结合指定的显著性水平α,决策的依据与大样本情形下单个总体均值的假设检验完全相同。47两个总体均值之差的检验在小样本情形下,假定两个总体的配对差值服从正态分布,当 已知时, 经过标准化后得到的检验统计量与大样本情形下一致,其抽样分布仍为标准正态分布,决策依据不变;当 未知时,用 代替, 经过标准化后得到的检验统计量服从自由度为(n-1)的t分布。这样,结合指定的显著性水平α,决策的依据与小样本情形下单个总体均值的t检验完全相同。48两个总体均值之差的检验【例7.10】某医院研究开发了一款减肥药,为检验药效,对15名志愿者进行了临床观察,分别记录下每个人服药前后一段时间内的体重数据如表7-10所示。假定服药前后总体体重的差值服从正态分布,试在0.01的显著性水平下,检验该款减肥药是否有显著效果。志愿者编号 服药前 服药后 差值d1 95 89 62 93 88 53 88 87 14 83 79 45 117 107 106 108 103 57 74 71 38 89 89 09 101 91 1010 96 89 711 85 82 312 79 74 513 84 82 214 110 104 615 112 105 7表7-10 15名志愿者服药前后的体重数据 单位:千克49两个总体均值之差的检验解:根据题意,建立该问题的原假设和备择假设:H0: 1- 2≤0;H1: 1- 2>0样本量n1=n2=n=15,根据表7-10中的样本数据计算得到: =4.9333,sd=2.9147,代入公式得到标准化后的检验统计量值为:指定的显著性水平α=0.01,使用Excel中的【T.INV】函数计算得到t(14)分布的α下侧分位数-t0.01=-2.62,相应地,α上侧分位数t0.01=2.62,该检验的拒绝域即为t>2.62。由于t的值落入了拒绝域,因此,拒绝原假设,即有理由认为“服药后平均体重显著低于服药前平均体重”。也可以使用Excel中的【T.DIST.RT】函数计算得到右侧检验的p-值=0.0000064。p-值<α,拒绝原假设,结论一致。50两个总体比例之差的检验设两个总体中具有指定特征的个体所占的比例分别为π1和π2(假设检验中假定的是π1和π2的差值),在独立大样本(n1≥30,n2≥30)条件下,从两个总体抽取的样本数据中具有指定特征的个体所占的比例之差(p1- p2)近似服从正态分布,且均值等于总体比例之差(π1-π2),标准误差等于由于两个总体比例π1和π2是未知的,分别用样本比例p1和p2代替,得到标准化后的检验统计量两个样本比例之差经过标准化后得到的检验统计量为近似服从标准正态分布N(0,1)。结合指定的显著性水平α,决策的依据与大样本情形下单个总体均值的假设检验完全相同。51两个总体比例之差的检验解:根据题意,建立该问题的原假设和备择假设:H0:π1-π2=0;H1:π1-π2≠0样本量n1=n2=100,样本比例p1=0.6,p2=0.56,将已知信息代入公式得到标准化后的检验统计量值为:【例7.11】某城市拟推行垃圾分类强制措施,对于随意投放垃圾的行为将施以罚款。为了解市民对该政策的支持程度,随机调查了100名女性和100名男性市民,其中,60%的女性和56%的男性受访者明确表示赞成。试在0.10的显著性水平下,检验女性市民和男性市民中支持垃圾分类措施的人数所占比例是否有显著差异。52两个总体比例之差的检验指定的显著性水平α=0.10,使用Excel中的【NORM.S.INV】函数计算得到α/2下侧分位数- z0.05=-1.64,相应地,α/2上侧分位数z0.05=1.64,该检验的拒绝域即为z>1.64或z<-1.64。由于z的值未落入拒绝域,因此,不能拒绝原假设,即没有理由怀疑“女性市民和男性市民中支持垃圾分类措施的人数所占比例相同”的看法。也可以使用Excel中的【NORM.S.DIST】函数计算得到双侧检验的p-值=0.57,p-值>α,不能拒绝原假设,结论一致。53两个总体方差之比的检验设两个总体方差分别为σ21和σ22(假设检验中假定的是二者的比值),当两个总体均服从正态分布时,构造的检验统计量结合指定的显著性水平α,对于双侧检验,临界值即为F(n1-1, n2-1)分布的α/2上侧分位数和1-α/2上侧分位数( 和 );对于左侧检验和右侧检验,临界值即分别为F(n1-1, n2-1)分布的1-α上侧分位数( )和α上侧分位数( )。服从自由度为n1-1和n2-1的F分布。根据样本数据计算出检验统计量F的实际取值,与临界值进行比较,判断是否落入拒绝域并做出决策。利用计算机也可以直接计算p-值,通过比较p-值与α的大小,做出决策。这一检验过程通常被称为F检验。54两个总体方差之比的检验解:根据题意,建立该问题的原假设和备择假设:H0:σ21/σ22=1;H1:σ21/σ22≠1样本量n1=n2=12,基于表7-8的样本数据计算得到:s21=12.1552,s22=11.0452,代入公式得到检验统计量的值为:【例7.12】沿用例7.9,在0.01的显著性水平下,基于表7-8的数据检验两套广告宣传计划月销售额的总体方差是否相等。指定的显著性水平α=0.01,使用Excel中的【F.INV.RT】函数可以计算得到F0.005 (11,11)=5.320,F0.995 (11,11)=0.188,该检验的拒绝域即为F>5.32或F<0.188。由于F的值未落入拒绝域,因此,不能拒绝原假设,即没有理由怀疑“两套广告宣传计划月销售额的总体方差相等”的假定。或使用Excel中的【F.TEST】函数计算得到双侧检验的p-值=0.88,p-值>α,不能拒绝原假设,结论一致。55第 7 章 假设检验7.4 小结56小结假设就是对总体的某种看法,假设检验就是在对总体参数提出某种假设的基础上,利用样本信息判断该假设是否成立的一类统计方法。假设检验利用反证法的思想提出原假设和备择假设两个完全对立的假设,其主要目的是寻找样本数据和总体假设之间的差异,判断差异是否“显著”到足以推翻原假设。以原假设成立为前提,构造合适的检验统计量,并根据其抽样分布和事先指定的显著性水平α,确定拒绝域,通过计算检验统计量的实现值判断其是否落入拒绝域从而做出最终的决策;或者在原假设成立的前提下,直接计算出检验统计量的值取到实际观测值甚至比它更为极端值的概率,即p-值,比较p-值与α的大小关系做出决策。 展开更多...... 收起↑ 资源预览