资源简介 (共60张PPT)假设检验第七章第7章7.1 假设检验的概念及分类7.2 检验假设的五个步骤7.3 几种常见的假设检验7.4 假设检验决策的风险假设检验第7章在本章,你将学到:基本的假设检验原理掌握几种常用的假设检验每种假设检验过程的前提假设,如何评价他们,以及被违反的后果正确理解假设检验的两类错误及其关系。本章教学目的假设检验第7章本章重点和难点基本的假设检验原理,关于总体均值、总体比例的假设检验假设检验的两类错误及其关系。假设检验第7章假设是关于总体参数的声称(断言):总体均值总体比例例: 一个城市的每月电话账单均值 μ = $42例: 一个城市成年人拥有手机的比例 π = 0.687.1 假设检验的概念及分类第7章假设检验单侧检验双侧检验7.1 假设检验的概念及分类第7章7.2 假设检验的五个步骤7.2.1 提出原假设和备择假设7.2.2 选择显著性水平7.2.3 确定检验统计量7.2.4 建立决策准则7.2.5 做出决策第7章检验的声称或断言例:在美国每个家庭平均有3台电视机是总体参数,不是样本统计量7.2.1提出原假设和备择假设 原假设,H07.2 假设检验的五个步骤第7章首先假设零假设是真的与无罪,被证明有罪的概念是相似的引用现状或历史价值总是包含 “=” , “≤” 或 “ ”可能被拒绝,也可能不(续)7.2 假设检验的五个步骤原假设,H0第7章零假设的对立面例:在美国每个家庭的电视机不是3台 ( H1: μ ≠ 3 )向现状发出挑战不包含 “=” , “≤” 或 “ ”可能被证明,也可能不一般是研究者试图去证明的备择假设,H17.2 假设检验的五个步骤第7章7.2.2 选择显著性水平显著性水平是原假设为真时拒绝原假设的概率,通常用希腊字母α表示。把概率小于α的事件称为小概率事件。α越大,样本统计量的值与总体参数假设值之间的差异成为显著性差异的可能性越大;α越小,这种差异成为显著性差异的可能性越小。可以将显著性水平α设定为0.05(通常表示为5%),或0.01,或0.10,或介于0与1之间的任意其他数值。7.2 假设检验的五个步骤第7章7.2.3 确定检验统计量检验统计量是由样本信息确定的用于决定是否拒绝原假设的一个数值。检验统计量有很多,常用的有Z统计量、t统计量、F统计量和χ2(卡方)统计量,需要根据具体问题和样本情况选择合适的统计量。7.2 假设检验的五个步骤第7章7.2.4建立决策准则决策准则是原假设被拒绝或原假设不被拒绝的具体条件。接受或拒绝原假设,最终要以显著性水平为依据确定决策准则。决策准则的制定有两种方法:临界值方法和p值方法。7.2 假设检验的五个步骤第7章1、临界值方法临界值方法,是先把α值转化为一定分布下的临界值(将拒绝原假设和不拒绝原假设的区域的分界点称为临界值),然后计算检验统计量的值,最后把检验统计值与临界值相比较来判断是否拒绝原假设。7.2 假设检验的五个步骤第7章检验统计量的抽样分布临界值拒绝域α/2拒绝域α/2接受域1-α正态分布双侧检验接受域与拒绝域示意图7.2 假设检验的五个步骤第7章检验统计量的抽样分布临界值拒绝域α接受域1-α正态分布单侧检验接受域与拒绝域示意图-17.2 假设检验的五个步骤第7章检验统计量的抽样分布临界值拒绝域α接受域1-α正态分布单侧检验接受域与拒绝域示意图-27.2 假设检验的五个步骤第7章2、p值方法P值是在原假设为真的情况下,使得某一检验统计量等于或者大于样本结果的概率。在P值检验中,拒绝的决策准则是:(1)如果P值大于或等于,不拒绝原假设;(2)如果P值小于,拒绝原假设。7.2 假设检验的五个步骤第7章将检验统计量的值与临界值进行比较,然后做出是否拒绝原假设的决定。如果计算得到统计量的值落入接受域,则不能拒绝原假设。不拒绝原假设的逻辑是,这样小的值很可能是由偶然性或抽样误差造成的。如果计算得到统计量的值落入拒绝域,则拒绝原假设。拒绝原假设的推理逻辑是,计算出的值如此之大,不大可能是由抽样误差(偶然性)造成的。7.2.5 做出决策7.2 假设检验的五个步骤第7章7.3.1 总体均值的假设检验;7.3.2 总体比例的假设检验;7.3.3 两个总体均值之差的假设检验;7.3.4 两个总体比例之差的假设检验。7.3 几种常见的假设检验第7章7.3 几种常见的假设检验检验的目的是总体均值μ是否等于(或大于等于,或小于等于)某一特定的数值μ0。我们建立如下假设:7.3.1 总体均值的假设检验(双侧检验)(左单侧检验)(右单侧检验)或或第7章 已知 未知 的假设检验(Z 检验)(t 检验)7.3 几种常见的假设检验Chap 9-第7章把样本统计量(x)转换为ZSTAT检验统计量检验统计量是:σKnownσUnknown 的假设检验 已知 未知(Z检验)(t检验)1.总体均值的Z检验(σ已知)7.3几种常见的假设检验第7章根据抽样分布原理,当总体服从正态分布N(μ, 2)时,那么从中抽取(重复抽样)容量为n 的样本,其样本均值 服从正态分布 ,而统计量 服从标准正态分布。对于双侧检验,对给定的显著性水平α,当时,不能拒绝原假设;当 时,拒绝原假设而接受备择假设。7.3 几种常见的假设检验第7章【例7-2】一家灯泡厂声称其生产的灯泡的平均寿命为375小时。假定灯泡寿命服从正态分布,总体标准差为25小时。质量控制经理想要确定该厂生产的灯泡寿命是否符合其规定,从中抽取100只灯泡,其平均寿命为379小时。试问在0.05的显著性水平下,灯泡的平均寿命与375小时有无明显差异。解:由题意知,这是双侧检验问题,可建立如下假设:由样本均值 和总体标准差 =25,计算得检验统计量Z值为:在α=0.05显著性水平下, ,由于 ,不能拒绝H0,即没有证据表明灯泡的平均寿命与375小时存在显著差异。7.3 几种常见的假设检验第7章对于左单侧检验,对给定的显著性水平α,当时,要拒绝原假设而接受备择假设;当时,则接受原假设。对于右单侧检验,对给定的显著性水平α,当时,要拒绝原假设而接受备择假设;当时,则接受原假设。7.3 几种常见的假设检验第7章【例7-3】某快餐连锁店的平均服务时间是3分钟。为提高其服务质量,快餐店启动了一项质量提升项目,力求缩短平均服务时间。为测试项目实施效果,随机抽取了50名顾客作为样本,其平均等待时间是2.75分钟。假定顾客等待时间服从正态分布,总体标准差为0.5分钟。试问在0.05的显著性水平下,新项目的实施是否明显缩短了平均服务时间。解:由题意知,这是左单侧检验问题,可建立如下假设:由样本均值和总体标准差 =0.5,计算可得检验统计量Z值为:7.3 几种常见的假设检验第7章在 =0.05时, 。由于 ,落入了拒绝域,因此要拒绝原假设而接受备择假设,说明新流程明显缩短了服务时间。7.3 几种常见的假设检验第7章把样本统计量 ( ) 转变为检验统计量tSTATX检验统计量是: 的假设检验σ Knownσ Unknown 已知 未知(Z 检验)(t 检验)2.总体均值的t检验(σ未知)7.3 几种常见的假设检验第7章在关于均值的假设检验中,当为未知时,检验统计量对于双侧检验,当 时,接受H0而拒绝H1;若 或 时,则要拒绝H0而接受H1。对于左单侧检验,当 时,拒绝H0;当 时,则接受H0。对于右单侧检验,当 时,拒绝H0;当 时,则接受H0。服从自由度为n-1的t分布。7.3 几种常见的假设检验第7章【例7-4】某罐装奶粉的标准重量为900克。现从生产线上抽取16罐为样本,测得平均重量为905克,标准差为20克。试问在0.05的显著性水平下,是否有证据表明每罐奶粉的平均质量不同于900克。解:由题意知,这是双侧检验问题,可建立如下假设:由样本均值和样本标准差 S=20,计算可得检验统计量t的值为:查t分布表,在 =0.05,自由度为15时,双侧临界值,由于,落入非拒绝域,因此不能拒绝H0,即没有证据表明每罐奶粉的平均质量不同于900克。7.3 几种常见的假设检验第7章【例7-5】引用【例7-4】,试问在相同的显著性水平下,该奶粉生产商生产的罐装奶粉的平均重量是否偏高。解:由题意知,这是右单侧检验问题,可建立如下假设:检验统计量t的值仍为1,查t分布表,在 =0.05,,由于,落入非拒绝域,因此不能拒绝H0,即没有证据表明罐装奶粉的平均重量比规定的重量偏高。自由度为15时,右单侧临界值7.3 几种常见的假设检验第7章涉及绝对变量两种可能的结果具有成功的特性不具有成功的特性总体成功数的部分或比例表示成π7.3.2 总体比例的假设检验7.3 几种常见的假设检验第7章样本的成功数比例表示成p当nπ和n(1-π)都大于5,p将接近于正态分布,均值和标准差如下:7.3 几种常见的假设检验第7章p的抽样分布接近于正态分布,所以检验统计量是ZSTAT 值:nπ 5和n(1-π) 5p的假设检验nπ < 5或n(1-π) < 5本章不讨论7.3 几种常见的假设检验第7章关于总体比例,可建立如下假设:(双侧检验)(左单侧检验)(右单侧检验)或或7.3 几种常见的假设检验第7章【例7-6】某快餐店承诺,90%的订餐可以在订单被确认后的10分钟内送到。由100份订单组成一个样本,其中有82份订餐在承诺的时间内送到。试问在0.01的显著性水平下,是否可以说在10分钟内送到的订餐比例小于90%。解:由题意知,这是左单侧检验问题,可建立如下假设:样本比例,检验统计量的值为:,落入拒绝域,因此要拒绝H0而接受H1,即有证据表明在10分钟内送到的订餐比例小于90%。7.3 几种常见的假设检验第7章7.3.3 两个总体均值之差的假设检验设两个总体的均值分别为,两个总体的方差分别为,来自两个总体的样本容量 分别为n1和n2,样本均值分别为。检验的目的是验证两个总体的均值是否相等,或两个总体的均值之差是否为零。7.3 几种常见的假设检验第7章关于总体均值之差的检验,可建立如下假设:(双侧检验)(左单侧检验)(右单侧检验)或或7.3 几种常见的假设检验第7章1.两个总体均值之差的Z检验两个总体均值之差的Z检验适用于两个总体服从正态分布且方差已知,或两个总体方差未知但为大样本的情形。此时,统计量为:当原假设H0:成立时,若两总体的方差已知,检验统计量为:7.3 几种常见的假设检验第7章若两个总体方差未知,当原假设H0:成立时,检验统计量为:则用样本方差若样本容量n1和n2都足够大时,来估计,对于双侧检验,当 时,拒绝H0;当 时,接受H0.对于左单侧检验,当 时,拒绝H0;当 时,接受H0.对于右单侧检验,当 时,拒绝H0,当时,接受H0.7.3 几种常见的假设检验第7章【例7-7】要比较甲乙两个餐饮店的便利窗口的平均服务时间。甲快餐店随机调查50人,平均服务时间为3.5分钟,标准差为0.5分钟;乙快餐店随机调查40人,平均服务时间为3.6分钟,标准差为0.4分钟。试问在0.05的显著性水平下,甲乙两个快餐店的便利窗口的平均服务时间是否有显著差异。解:由题意知,这是双侧检验问题,可建立如下假设:根据样本均值和样本标准差S1=0.5,S2=0.4计算得检验统计量Z值为:7.3 几种常见的假设检验第7章因此,不能拒绝H0,即没有证据表明两个快餐店的便利窗口的平均服务时间存在显著差异。,落入接受域,7.3 几种常见的假设检验第7章2.两个总体均值之差的t检验若两个总体均服从正态分布,方差未知且相等,那么当两个样本容量n1和n2都不够大时,关于两个总体均值之差的假设检验就可以用t检验。此时,下列统计量服从自由度为n1+n2-1的t分布,即:式中,表示混合标准差;来自总体1的样本方差;表示来自总体2的样本方差。7.3 几种常见的假设检验第7章当原假设成立时,检验统计量为:对于双侧检验,当 时,拒绝H0;当时,接受H0.对于左单侧检验,当时,拒绝H0。当时,接受H0。当时,拒绝H0。当时,接受H0。对于右单侧检验,7.3 几种常见的假设检验第7章【例7-8】表7-1给出的是度量AA可充电锂电池和镍氢可充电电池随机样本的单次充电平均持续使用分钟数结果。表7-1 不同类型电池的单次充电平均使用分钟数试问在显著性水平 =0.05下,这两种电池的单次充电平均使用分钟数是否不同。假设单次充电使用分钟数总体方差不相等。锂 电 池 镍 氢 电 池样本均值 样本标准差 样本容量 96.5 6.5 14 82.911.2187.3 几种常见的假设检验第7章解:由题意知,这是双侧检验问题,可建立如下假设根据样本均值和样本标准差S1=6.5,S2=11.2计算得检验统计量t的值为:7.3 几种常见的假设检验第7章在 =0.05,自由度14+18-2=30时,,落入拒绝域,因此拒绝H0,,即认为这两种电池的单次充电平均使用分钟数存在显著差异。7.3 几种常见的假设检验第7章7.3.4 两个总体比例之差的假设检验设两个总体的比例分别为,样本比例分别为是否为零。可建立如下假设:。检验两个总体比例是否相等,或两个总体比例之差(双侧检验)(左单侧检验)(右单侧检验)或或第7章当n1和n2都足够大时(n1p1, n1p1(1-p1),n2p2,n2p2(1-p2)均大于5),两个样本比例之差的抽样分布渐近服从正态分布。即由于 未知,要以p1和p2来估计,因此在原假设H0为真时,要以两个样本的合并比例作为两个总体比例的共同估计值,即当原假设成立时,检验统计量为:7.3 几种常见的假设检验第7章【例7-9】某银行想检验网上银行的青年客户比老年客户的百分比高的假设。在对年龄小于40岁的80名客户调查中,发现有68人使用网上银行的多数服务;对大于等于40岁的100名客户调查中,有72人使用网上银行的多数服务。用 =0.05的显著性水平来检验使用网上银行的青年客户比例较高的假设。解:由题意知,这是右单侧检验问题,可建立如下假设根据题中调查数据,可以计算出青年客户使用网上银行的比例为p1=0.85,老年客户使用网上银行的比例为p2=0.72.合并估计值为7.3 几种常见的假设检验第7章计算得检验统计量Z的值为:在 =0.05时,Z =1.64。由于Z>Z ,落入了拒绝域,因此要拒绝原假设H0,即有证据表明使用网上银行的青年客户比例较高。7.3 几种常见的假设检验第7章7.4.1 假设检验的两类错误7.4.2 两类错误的关系7.4 假设检验决策的风险第7章第一类错误拒绝真实的零假设考虑一类严重的错误发生第一类错误的概率 称作统计检验的显著性水平研究者预先设定的第二类错误没有拒绝错误的零假设发生第二类错误的概率β7.4.1 假设检验的两类错误7.4 假设检验决策的风险第7章可能出现的假设检验结果 真实情况 统计决策 H0为真 H0为假不拒绝H0 正确决策 概率1 - α 第二类错误概率β拒绝H0 第一类错误 概率α 正确决策概率1 - β(续)假设检验的两类错误7.4 假设检验决策的风险第7章犯第一类错误的概率α又被称为统计检验的显著性水平。显著性水平通常取0.01,0.05或0.1. 取哪个值取决于犯第一类错误的代价。α确定之后即可知道拒绝域的大小,从而能够确定将拒绝域和非拒绝域区别开来的临界值。(续)假设检验的两类错误7.4 假设检验决策的风险第7章置信系数 (1-α) :是当H0为真且不应该被拒绝的情况下,进行假设检验没有拒绝H0的概率。假设检验的置信水平 是(1-α)*100%.β风险:犯第二类错误的概率。它依赖于总体参数的假设值和真实值之间的差别。统计检验能力 (1-β) 是当H0是假的时候拒绝的概率(续)假设检验的两类错误7.4 假设检验决策的风险第7章第一类与第二类错误不可能同时发生第一类错误仅在H0是真的时候发生第二类错误仅在H0是假的时候发生如果第一类错误的概率 ( ) ,那么第二类错误的概率 ( β )7.4.2两类错误的关系7.4 假设检验决策的风险第7章所有其它条件不变,β当 当 σ当 nβββ当假设参数和真实值 之间的差别影响第二类错误的因素7.4 假设检验决策的风险第7章1.什么是原假设和备择假设?2.假设检验的基本原理是什么?3.假设检验的临界值方法和p值方法的区别?4.假设检验的两类错误是什么?有何关系? 展开更多...... 收起↑ 资源预览