资源简介 (共60张PPT)第 7 章 假设检验7.1 假设检验的步骤7.2 总体均值的检验7.3 总体比例的检验、7.4 总体方差的检验hypothesis test思考一下330 ml(毫升)罐装的可口可乐外包装上标示:每百ml中钠的含量为12 mg(毫克)。你相信标签上的说法吗?如果不相信,你会怎么做?一种“沙棘汁饮料的”外包装上标示:每100ml(毫升)中果汁的含量,你会如何判断这一说法的真伪?有两个品牌的五号电池,它们的平均使用寿命(小时)差不多,但一个品牌的寿命方差为10个小时,另一个品牌的寿命方差为8小时,你认为哪个更好?随机抽取20人,调查它们对某项公共交通改革措施的看法,结果是95%的人支持该项改革。你相信这样的结果吗?理由是什么?7.1 假设检验的步骤7.1.1 提出假设7.1.2 确定显著性水平7.1.3 做出决策7.1.4 表述结果第 7 章 假设检验7.1.1 提出假设7.1 假设检验的步骤什么是假设 (hypothesis) 在参数检验中,对总体参数的具体数值所作的陈述就一个总体而言,总体参数包括总体均值、比例、方差等分析之前必需陈述我认为这种新药的疗效比原有的药物更有效!什么是假设检验 (hypothesis test)先对总体的参数(或分布形式)提出某种假设,然后利用样本信息判断假设是否成立的统计方法有参数检验和非参数检验逻辑上运用反证法,统计上依据小概率原理小概率是在一次试验中,一个几乎不可能发生的事件发生的概率在一次试验中小概率事件一旦发生,我们就有理由拒绝原假设原假设(null hypothesis)又称“0假设”,研究者想收集证据予以反对的假设,用H0表示所表达的含义总是指参数没有变化或变量之间没有关系最初被假设是成立的,之后根据样本数据确定是否有足够的证据拒绝它总是有符号 , 或 H0 : = 某一数值H0 : 某一数值H0 : 某一数值例如, H0 : 10cmnull也称“研究假设”,研究者想收集证据予以支持的假设,用H1或Ha表示所表达的含义是总体参数发生了变化或变量之间有某种关系备择假设通常用于表达研究者自己倾向于支持的看法,然后就是想办法收集证据拒绝原假设,以支持备择假设总是有符号 , 或 H1 : 某一数值H1 : 某一数值H1 : <某一数值备择假设(alternative hypothesis)alternative备择假设没有特定的方向性,并含有符号“ ”的假设检验,称为双侧检验或双尾检验(two-tailed test)备择假设具有特定的方向性,并含有符号“>”或“<”的假设检验,称为单侧检验或单尾检验(one-tailed test)备择假设的方向为“<”,称为左侧检验备择假设的方向为“>”,称为右侧检验双侧检验与单侧检验双侧检验与单侧检验(假设的形式)假设 双侧检验 单侧检验左侧检验 右侧检验原假设 H0 : m =m0 H0 : m m0 H0 : m m0备择假设 H1 : m ≠m0 H1 : m m0以总体均值的检验为例【例7-1】一种零件的生产标准是直径应为50mm,为对生产过程进行控制,质量监测人员定期对一台加工机床检查,确定这台机床生产的零件是否符合标准要求。如果零件的平均直径大于或小于50mm,则表明生产过程不正常,必须进行调整。试陈述用来检验生产过程是否正常的原假设和被择假设研究者想收集证据予以证明的假设应该是“生产过程不正常”。建立的原假设和备择假设为H0 : 50mm H1 : 50mm提出假设(例题分析)【例7-2】农夫山泉550ml瓶装饮用天然水外包装标签上标识:每100ml(毫升)钙的含量为(微克)。如果是消费者来做检验,应该提出怎样的原假设和备择假设?如果是生产厂家自己来做检验,又会提出怎样的原假设和备择假设设每100ml水中钙的含量均值为。消费者做检验的目的是想寻找证据推翻标签中的说法,即,而想支持的观点则是标签中的说法不正确,即。因此,提出的原假设和备择假设应为:;厂家自己做检验,想寻找证据证明标签中的说法是正确的,即,而想推翻的则是,因此会提出与消费者观点不同的原假设和备择假设,即:);提出假设(例题分析)【例7-3】一家研究机构认为,某城市中在网上购物的家庭比例超过80%。为验证这一估计是否正确,该研究机构随机抽取了若干个家庭进行检验。试陈述用于检验的原假设和备择假设设网上购物的家庭的比例真值为。显然,研究者想收集证据予以支持的假设是“该城市中在网上购物的家庭比例超过80%”。因此建立的原假设和备择假设应为:;。提出假设(例题分析)原假设和备择假设是一个完备事件组,而且相互对立在一项假设检验中,原假设和备择假设必有一个成立,而且只有一个成立先确定备择假设,再确定原假设等号“=”总是放在原假设上因研究目的不同,对同一问题可能提出不同的假设(也可能得出不同的结论)提出假设(结论与建议)7.1.2 确定显著性水平7.1 假设检验的步骤两类错误与显著性水平研究者总是希望能做出正确的决策,但由于决策是建立在样本信息的基础之上,而样本又是随机的,因而就有可能犯错误原假设和备择假设不能同时成立,决策的结果要么拒绝H0,要么不拒绝H0。决策时总是希望当原假设正确时没有拒绝它,当原假设不正确时拒绝它,但实际上很难保证不犯错误第Ⅰ类错误( 错误)原假设为正确时拒绝原假设第Ⅰ类错误的概率记为 ,被称为显著性水平2. 第Ⅱ类错误( 错误)原假设为错误时未拒绝原假设第Ⅱ类错误的概率记为 (Beta)两类错误的控制一般来说,对于一个给定的样本,如果犯第Ι类错误的代价比犯第Ⅱ类错误的代价相对较高,则将犯第Ⅰ类错误的概率定得低些较为合理;反之,如果犯第Ι类错误的代价比犯第Ⅱ类错误的代价相对较低,则将犯第Ⅰ类错误的概率定得高些一般来说,发生哪一类错误的后果更为严重,就应该首要控制哪类错误发生的概率。但由于犯第Ι类错误的概率是可以由研究者控制的,因此在假设检验中,人们往往先控制第Ι类错误的发生概率显著性水平 (significant level)事先确定的用于拒绝原假设H0时所必须的证据能够容忍的犯第Ⅰ类错误的最大概率(上限值)2. 原假设为真时,拒绝原假设的概率抽样分布的拒绝域3. 表示为 (alpha)常用的 值有0.01, 0.05, 0.104. 由研究者事先确定7.1.3 做出决策7.1 假设检验的步骤做出决策提即检验假设:;,抽取一个样本得到的样本均值为390,你是否拒绝原假设呢?如果样本均值是410,你是否就不拒绝原假设呢?做出拒绝或不拒绝原假设的依据是什么?传统检验中,决策依据的是样本统计量,现代检验中,人们直接根据样本数据算出犯第Ⅰ类错误的概率,即所谓的P值(p-value)检验时做出决策的依据是:原假设成立时小概率事件不应发生,如果小概率事件发生了,就应当拒绝原假设。统计上,通常把的值统称为小概率。根据样本观测结果计算出对原假设和备择假设做出决策某个样本统计量对样本估计量的标准化结果原假设H0为真点估计量的抽样分布检验统计量(test statistic)标准化的检验统计量用统计量决策(双侧检验 )用统计量决策(左侧检验 )用统计量决策(右侧检验 )统计量决策规则给定显著性水平 ,查表得出相应的临界值z 或z /2,t 或t /2将检验统计量的值与 水平的临界值进行比较作出决策双侧检验:I统计量I > 临界值,拒绝H0左侧检验:统计量 < -临界值,拒绝H0右侧检验:统计量 > 临界值,拒绝H0用P 值决策(P-value)如果原假设为真,所得到的样本结果会像实际观测结果那么极端或更极端的概率P值告诉我们:如果原假设是正确的话,我们得到得到目前这个样本数据的可能性有多大,如果这个可能性很小,就应该拒绝原假设被称为观察到的(或实测的)显著性水平决策规则:若p值< , 拒绝 H0双侧检验的P 值左侧检验的P 值右侧检验的P 值用P值进行检验比根据统计量检验提供更多的信息统计量检验是我们事先给出的一个显著性水平,以此为标准进行决策,无法知道实际的显著性水平究竟是多少比如,根据统计量进行检验时,只要统计量的值落在拒绝域,我们拒绝原假设得出的结论都是一样的,即结果显著。但实际上,统计量落在拒绝域不同的地方,实际的显著性是不同的。比如,统计量落在临界值附近与落在远离临界值的地方,实际的显著性就有较大差异。而P值给出的是实际算出的显著水平,它告诉我们实际的显著性水平是多少P 值决策与统计量的比较P 值决策与统计量的比较7.1.4 解释结果7.1 假设检验的步骤解释结果在假设检验中,当拒绝时称样本结果是“统计上显著的”(statistically significant);不拒绝则称结果是“统计上不显著的”当 拒绝时,表示有足够的证明是错误的;当不拒绝时,通常不说“接受”。因为 “接受”的表述隐含着证明了是正确的值只是推翻原假设的证据,而不是原假设正确的证据。没有足够的证据拒绝原假设并不等于已经“证明”了原假设是真的,它仅仅意味着目前还没有足够的证据拒绝解释结果采取“不拒绝”而不是“接受”的表述方法,也避免了第II类错误发生的风险,因为“接受”所得结论可靠性由第II类错误的概率来度量,而的控制又相对复杂,有时甚至根本无法知道的值(除非你能确切给出,否则就不宜表述成“接受”原假设)不拒绝并不意味着为真的概率很高,它只是意味着拒绝需要更多的证据。7.2 总体均值的检验7.2.1 大样本的检验7.2.2 小样本的检验第 6 章 假设检验7.2.1 大样本的检验7.2 总体均值的检验大样本的检验1. 假定条件大样本(n 30)使用z检验统计量 2 已知: 2 未知:大样本的检验( 2 已知)(例题分析—大样本)【例6-4】一种罐装饮料采用自动生产线生产,每罐的容量是255ml,标准差为5ml。为检验每罐容量是否符合要求,质检人员在某天生产的饮料中随机抽取了40罐进行检验,测得每罐平均容量为255.8ml。取显著性水平 =0.05 ,检验该天生产的饮料容量是否符合标准要求?总体均值的检验( 2 已知)(例题分析-大样本)H0 : = 255H1 : 255 = 0.05n = 40临界值(c):检验统计量:决策:结论:用Excel中的【NORM.S.DIST】函数得到的双尾检验P=0.312945不拒绝H0没有证据表明该天生产的饮料不符合标准要求总体均值的检验( 2 未知)(例题分析—大样本)【例7-5】一种袋装牛奶的外包装标签上标示:每100克的蛋白质含量克。有消费者认为,标签上的说法不属实。为检验消费者的说法是否正确,一家研究机构随机抽取50 进行检验,得到的检测结果如表7—1所示。检验每100克牛奶中的蛋白质含量是否低于3克:假定总体标准差为0.07克,显著性水平为0.01。假定总体标准差未知,显著性水平为0.05。2.96 2.96 2.92 3.01 2.962.95 3.07 2.86 2.95 2.962.98 2.91 2.95 3.04 2.862.94 2.93 2.91 2.95 2.912.84 3.13 3.02 3.02 2.942.98 2.92 3.06 3.06 2.893.05 2.99 3.00 3.00 3.022.88 3.03 3.01 3.05 2.982.98 3.00 2.93 2.98 3.052.97 2.81 2.90 3.04 3.03总体均值的检验(例题分析—大样本)(1) (消费者的说法不正确);(消费者的说法正确)根据样本数据计算得:,。根据式(7.2)得检验统计量为:由Excel的【NORM.S.DIST】函数得。由于,拒绝原假设,表明每100克牛奶中的蛋白质含量显著低于3克总体均值的检验(P 值的图示)计算出的样本统计量=2.949645P=0.001591 Z拒绝H00临界值P 值总体均值的检验(例题分析—大样本)(2) 由于总体标准差未知,用样本标准差代替,使用式(7.3)作为检验的统计量。根据样本数据计算得,检验统计量为: 由Excel的【NORM.S.DIST】函数得。由于,拒绝原假设,表明每100克牛奶中的蛋白质含量显著低于3克用【Z.TEST】函数计算大样本正态检验的P值第1步:将光标放在任意空白单元格。然后点击【公式】,点击插入函数【】。第2步:在【选择类别】中选择【统计】,并在【选择函数】中点击【Z.TEST】,单击【确定】。第3步:在【Array】中选择数据所在的区域,在【X】后输入总体的假设值,在【Sigma】后输入已知的总体标准差(未知时可用样本标准差代替)单击【确定】即可得到右尾概率。用1减去右尾概率即可得到本例的检验P值7.2.2 小样本的检验7.2 总体均值的检验小样本的检验1. 假定条件总体服从正态分布小样本(n < 30)检验统计量 2 已知: 2 未知:总体均值的检验(例题分析—小样本)【例7-6】某大学的管理人员认为,大学生每天用手机玩游戏的时间超过2小时。为此,该管理人员随机抽取20个学生做了调查,得到每天用手机玩游戏的时间如表7—2所示。假定每天用手机玩游戏的时间服从正态分布,检验该大学生每天用手机玩游戏的时间是否显著超过2小时。假定标准差为0.8小时,显著性水平为0.05。假设总体标准差未知,显著性水平为0.05。假设总体标准差未知,显著性水平为0.1。2.2 2.5 2.4 1.5 0.3 3.5 2.4 0.9 3.3 2.92.8 1.6 2.2 3.8 4.0 1.8 3.0 1.7 0.8 3.4小样本的检验(例题分析)(1) 依题意建立如下假设:;由于总体标准差已知,虽然为小样本,但样本均值标准化后仍服从正态分布,因此可使用式(7.2)作为检验统计量。根据样本数据计算得,由式(7.2)得到统计量为:由Excel的【NORM.S.DIST】函数得。由于,拒绝原假设,有证据表明大学生每天用手机玩游戏的时间显著超过2小时小样本的检验(例题分析)(2)由于总体标准差未知,样本均值标准化后服从自由度为的t分布。因此需要用式(7.4)作为检验统计量。根据样本数据计算得,由式(7.4)得到统计量为: 由Excel的【T.DIST.RT】函数得右尾检验的。由于,不拒绝原假设,没有证据表明大学生每天用手机玩游戏的时间是否显著超过2小时(3) 根据问题(2)的计算结果,由于,拒绝原假设,有证据表明大学生每天用手机玩游戏的时间显著超过2小时一个总体均值的检验流程7.3 总体比例的检验第 6 章 假设检验总体比例检验假定条件总体服从二项分布可用正态分布来近似(大样本)检验的 z 统计量 0为假设的总体比例总体比例的检验(例题分析)【例7-7】一家网络游戏公式声称,它们制作的某款网络游戏的玩家中女性超过80%。为验证这一说法是否属实,该公司管理人员随机抽取了200个进行调查,发现有170个女性经常玩该款游戏。分别取显著性水平和,检验该款网络游戏的玩家中女性的比例是否超过80%总体比例的检验(例题分析)提出假设:;根据抽样结果计算得:。检验统计量为:由Excel中的【NORM.S.DIST】函数得右尾检验的。显著性水平为0.05时,由于,拒绝,样本提供的证据表明该款网络游戏的玩家中女性的比例超过80%;显著性水平为0.01时,由于,不拒绝,样本提供的证据表明尚不能推翻原假设,没有证据表明该款网络游戏的玩家中女性的比例超过80%。7.4 总体方差的检验第 6 章 假设检验总体方差的检验( 2检验)检验一个总体的方差或标准差假设总体近似服从正态分布使用 2分布检验统计量假设的总体方差总体方差的检验( 2检验)总体方差的检验(例题分析)【例7-8】啤酒生产企业采用自动生产线灌装啤酒,每瓶的装填量为640ml,但由于受某些不可控因素的影响,每瓶的装填量会有差异。此时,不仅每瓶的平均装填量很重要,装填量的方差同样很重要。如果方差很大,会出现装填量太多或太少的情况,这样要么生产企业不划算,要么消费者不满意。假定生产标准规定每瓶装填量的标准差不应超过4ml。企业质检部门抽取了10瓶啤酒进行检验,得到的样本标准差为s=3.8ml。试以0.05的显著性水平检验装填量的标准差是否符合要求?总体方差的检验(例题分析)H0 : 2 42H1 : 2 > 42 = 0.10df = 10 - 1 = 9临界值(s):统计量:不拒绝H0 (p=0.52185)没有证据表明装填量的标准差不符合要求决策:结论:结 束THANKS 展开更多...... 收起↑ 资源预览