资源简介 (共94张PPT)第五章 假设检验第一节 假设检验概述第二节 一个总体参数的检验第三节 两个总体参数的检验*学好统计学和计量经济学的纵贯线学习目标通过本章的学习,理解假设检验的陈述、表达形式、假设检验的两类错误和显著水平、检验统计量和拒绝域等基本理论;掌握假设检验的流程;重点掌握一个总体的均值、比例等参数检验的方法和实际应用。假设检验的由来:女士品茶1920年的剑桥大学,某个风和日丽的下午,一群科学家正悠闲地享受下午茶时光。正如往常一样准备冲泡奶茶的时候,有位女士突然说:“冲泡的顺序对于奶茶的风味影响很大。先把茶加进牛奶里,与先把牛奶加进茶里,这两种冲泡方式所泡出的奶茶口味截然不同。我可以轻松地辨别出来。”在场的绝大多数人对这位女士的“胡言乱语”嗤之以鼻。然而,其中一位身材矮小、戴着厚眼镜的先生却不这么看,他对这个问题很有兴趣。这个人就是费歇尔(R. A. Fisher)。。假设检验的由来:女士品茶如何验证该女士是否真的有此项能力?Fisher的思路是:他首先假设该女士没有这个能力(这个假设被称为原假设H0)。随后,Fisher将8杯已经调制好的奶茶随机地放到那位女士的面前,看看这位女士能否正确地品尝出不同的茶。用字母p表示该女士每次答对的概率,用随机变量X表示女士答对的次数,那么X应该服从什么分布?假设检验的由来:女士品茶在n次实验中,女士答对X次的概率可以用二项分布来描述:假设检验的由来:女士品茶在原假设H0下,女士没有鉴别的能力,能否答对完全靠蒙——此时,p=0.5(类似于抛硬币)。答对的次数(k) 答对的概率P(X=k) 累计概率P(X<=k)0 0.0039 0.00391 0.0313 0.03522 0.1094 0.14453 0.2188 0.36334 0.2734 0.63675 0.2188 0.85556 0.1094 0.96487 0.0313 0.99618 0.0039 1.000n=8、p=0.5时,女士答对 k次的概率如果实际观测到女士连续答对了8次(即k=8),那么,她到底有没有鉴别能力?假设检验的由来:女士品茶如果原假设H0成立(即女士没有鉴别能力),那么99.61%的情况下,女士蒙对的次数应该小于或者等于7次;“连续答对8次”的概率非常低,仅为 0.39%;而只有当p大于0.5 大于时(比如,接近于1),发生“连续答对8次”这种事情的概率才比较高。也就是说,女士极有可能具备鉴别能力。一、假设的陈述二、假设的表达式三、两类错误四、假设检验的流程第一节 假设检验概述请在此处添加院校名称在参数检验中,对总体参数的具体数值所作的陈述,称为假设。就一个总体而言,总体参数包括总体均值、比例、方差等分析之前必需陈述假设p=0.5(该女士没有这个能力)一、假设的陈述什么是假设检验 先对总体的参数提出某种假设,然后利用样本信息判断假设是否成立的过程。2. 逻辑上运用反证法,统计上依据小概率原理小概率事件是在一次试验中几乎不可能发生的事件在一次试验中小概率事件一旦发生,我们就有理由拒绝原假设举 例在女士品茶案例中,该女士连续答对8次的概率仅为0.39%,可认定为小概率事件发生,则我们有理由拒绝原假设,认为该女士具备品茶能力。原假设通常将研究者想收集证据予以反对的假设称为原假设,或称零假设,用H0表示所表达的含义总是指参数没有变化或变量之间没有关系最初认为原假设是成立的,之后根据样本数据确定是否有足够的证据拒绝它总是有符号 , 或 H0 : = 某一数值H0 : 某一数值H0 : 某一数值例如, H0 : 10cm二、假设的表达将研究者想收集证据予以支持的假设称为备择假设,或称研究假设,用H1表示所表达的含义是总体参数发生了变化或变量之间有某种关系备择假设通常用于表达研究者自己倾向于支持的看法,然后就是想办法收集证据拒绝原假设,以支持备择假设总是有符号 , 或 H1 : 某一数值H1 : 某一数值H1 : <某一数值二、假设的表达备择假设原假设和备择假设是一个完备事件组,而且相互对立;在一项假设检验中,原假设和备择假设必有一个成立,而且只有一个成立建立假设时,通常先确定备择假设,再确定原假设;等号“=”总是放在原假设上因研究目的不同,对同一问题可能提出不同的假设(也可能得出不同的结论)提出假设(结论与建议)原假设和备择假设一般把希望证明的命题放在备择假设上。把原有的、传统的观点或结论放在原假设上。即在此之前大多数人所认可和接受的东西。二、假设的表达【例1】某品牌洗涤剂在它的产品说明书中声称:平均净含量不少于500克。从消费者的利益出发,有关研究人员要通过抽检其中的一批产品来验证该产品制造商的说明是否属实。试陈述用于检验的原假设与备择假设解:研究者抽检的意图是倾向于证实这种洗涤剂的平均净含量并不符合说明书中的陈述 。建立的原假设和备择假设为H0 : 500 H1 : < 500500g提出假设例2:学校欲购入10万只灯泡,合同规定其使用寿命平均不能低于1000小时。已知灯泡使用寿命服从正态分布,标准差为200,现从中随机抽取100只,测得样本均值为960小时,可否认为这批灯泡的平均使用寿命低于1000小时 (a =0.05)解:建立的原假设和备择假设为H0 : ≥ 1000 H1 : < 1000提出假设备择假设没有特定的方向性,并含有符号“ ”的假设检验,称为双侧检验或双尾检验。备择假设具有特定的方向性,并含有符号“>”或“<”的假设检验,称为单侧检验或单尾检验。备择假设的方向为“<”,称为左侧检验备择假设的方向为“>”,称为右侧检验双侧检验与单侧检验双侧检验与单侧检验(假设的形式)假设 双侧检验 单侧检验左侧检验 右侧检验原假设 H0 : m = m0 H0 : m m0 H0 : m m0备择假设 H1 : m ≠m0 H1 : m < m0 H1 : m > m0三、两类错误1. 第一类错误(弃真错误)原假设为正确(真)时,拒绝原假设。第一类错误的概率为 ,被称为显著性水平。研究者总是希望能作出正确的决策,但由于决策是建立在样本信息的基础之上,而样本又是随机的,因而就有可能犯错误。2. 第二类错误(取伪错误)原假设为错误(假)时,接受原假设。第二类错误的概率为 假设检验中的两类错误H0是真实的、正确的 H0是不真实的、错误的拒绝H0 第一类错误(a) 正确接受H0 正确 第二类错误(b )以法庭对被告进行审判为例 错误和 错误的关系概率a与b 是密切相关的在样本一定的条件下,减少a,就增大了b;减少b ,就增大了a。审判被告原假设:被告无罪,备择假设:被告有罪。法庭可能犯的第Ⅰ类错误是(弃真):法庭可能犯的第Ⅱ类错误是(取伪):为了减少冤枉好人的概率,应尽可能接受原假设,判被告无罪,这可能增大了放过坏人的概率。被告无罪但判他有罪,即冤枉了好人;被告有罪但判他无罪,即放过了坏人。四、假设检验的流程假设检验的流程提出假设确定适当的检验统计量规定显著性水平 、计算临界值计算检验统计量的值作出统计决策1.用于假设检验决策的统计量(如 、 )2.选择统计量的方法与参数估计相同,需考虑是大样本还是小样本总体方差已知还是未知确定适当的检验统计量什么是检验统计量?规定显著性水平 1. 是一个概率值2. 原假设为真时,拒绝原假设的概率被称为抽样分布的拒绝域3. 表示为 (alpha)常用的 值有0.01, 0.05, 0.104. 由研究者事先确定什么是显著性水平?显著性指非偶然。一项检验在统计上是显著的(拒绝原假设),是指这样的(样本)结果不是偶然得到的。显著性水平 与临界值显著性水平 与临界值显著性水平 是 H0 为真却被拒绝的概率。给定了显著性水平 ,可由统计量的概率分布确定其临界值,临界值将统计量的所有可能取值区间分为两个互不相交的部分,即原假设的拒绝域和接受域。根据样本观测结果计算得到的,并据以对原假设和备择假设作出决策的某个样本统计量对样本估计量的标准化结果原假设H0为真点估计量的抽样分布计算检验统计量标准化的检验统计量显著性水平和拒绝域(双侧检验 )抽样分布0临界值临界值a/2a/2样本统计量拒绝H0拒绝H01 - 置信水平显著性水平和拒绝域(单侧检验 )0临界值a样本统计量拒绝H0抽样分布1 - 置信水平显著性水平和拒绝域(右侧检验 )0临界值a样本统计量拒绝H0抽样分布1 - 置信水平作出统计决策给定显著性水平 ,查表得出相应的临界值z 或z /2, t 或t /2将检验统计量的值与 水平的临界值进行比较作出决策双侧检验:I统计量I > 临界值,拒绝H0左侧检验:统计量 < -临界值,拒绝H0右侧检验:统计量 > 临界值,拒绝H0利用P值进行决策P值:如果原假设为真,所得到的样本结果会像实际观测结果那么极端或更极端的概率 / 2 / 2Z拒绝拒绝H0值临界值计算出的样本统计量计算出的样本统计量临界值1/2 P 值1/2 P 值利用P值进行决策P值:如果原假设为真,所得到的样本结果会像实际观测结果那么极端或更极端的概率H0值临界值a样本统计量拒绝域1 - 计算出的样本统计量P 值利用P值进行决策P值:如果原假设为真,所得到的样本结果会像实际观测结果那么极端或更极端的概率H0值临界值a拒绝域1 - 计算出的样本统计量P 值若p值<显著性水平a,拒绝H0利用P值进行决策如果我们希望犯第I类错误的概率越小(即p越小),对证据的要求就越高(k值越大)。假设检验告诉我们:The empirical truth cannot be known with absolute certainty. Even scientific laws cant be verified beyond a shadow of a doubt: they can only be falsified by testing. One failed test is enough to falsify, but no amount of conforming instances is sufficient to verify。——波普(索罗斯老师)假设检验告诉我们:无论我们看到过多少只白天鹅,哪怕是上亿只,也不能证明所有的天鹅都是白色的,但是只用看到一只黑天鹅就能证明不是所有天鹅都是白色的。——塔勒布第二节 一个总体参数的检验请在此处添加院校名称一、总体均值的检验二、总体比例的检验三、总体方差的检验一个总体参数的检验一、一个总体均值的假设形式假设 双侧检验 单侧检验左侧检验 右侧检验原假设 H0 : m = m0 H0 : m m0 H0 : m m0备择假设 H1 : m ≠m0 H1 : m < m0 H1 : m > m0(一) 2 已知或 2未知大样本1.假定条件总体服从正态分布若不服从正态分布, 可用正态分布来近似(n 30)使用Z-统计量 2 已知: 2 未知:正太分布, 2 已知均值的检验(例题分析)【例5-2】某机床厂加工一种零件,根据历史数据可知,该厂职工加工零件所需的操作时间渐进服从正态分布,其总体均值为 16 分钟,标准差为 3.2 分钟。现采用新机床进行加工,随机抽取 10 名职工进行操作,结果平均所需时间为 13.5 分钟。试问,在α = 0.05的前提下,采用新机床前后职工的平均操作时间有无明显差异?双侧检验正太分布, 2 已知均值的检验(例题分析)H0: =16H1: 16 = 0.05n = 10临界值(s):检验统计量:Z01.96-1.960.025拒绝 H0拒绝 H00.025决策:结论:在 = 0.05的水平上拒绝H0有证据表明采用新机床前后,职工的平均操作时间有明显差异。检验统计值-2.47正太分布, 2 已知均值的检验(例题分析)【例5-3】在【例 5-2】中,试问在α = 0.05 的前提下,采用新机床后职工的平均操作时间是否显著缩短?左侧检验 2 已知均值的检验(例题分析)检验统计量:Z0-1.645拒绝 H00.05决策:结论:在 = 0.05的水平上拒绝H0有证据表明采用新机床后职工的平均操作时间显著缩短。检验统计值-2.47H0: 16H1: < 16 = 0.05n = 10临界值(s):正太分布, 2 已知均值的检验(例题分析)【例5-4】某地区小麦的某产量服从正态分布,平均亩产量为400千克,标准差为30千克。现用一种新化肥进行试验,25个地块的取样结果为平均亩产420千克,试问当 =0.05时,这种新化肥是否使小麦增产?右侧检验 2 已知均值的检验(例题分析)H0: 400H1: > 400 = 0.05n = 25临界值(s):检验统计量:在 = 0.05的水平上拒绝H0有证据表明新化肥使小麦增产。决策:结论:Z0拒绝域0.051.645检验统计值3.33总体分布未知, 2 已知,大样本(例题分析)【例5-5】某城市2015年人口普查资料显示平均家庭人口数为3.8人。2019年从该市随机抽取400户进行调查,结果为平均每户3.7人,标准差为1.01人,试问在0.01的显著性水平下,该市平均家庭人口数是否有所下降 ?左侧检验H0: 3.8H1: < 3.8 = 0.05n = 400临界值(s):检验统计量:Z0-2.33拒绝 H00.01决策:结论:在 = 0.01的水平上不拒绝H0没有充分证据认为平均家庭人口数有了明显下降。检验统计值-1.98总体分布未知, 2 已知,大样本(例题分析)总体分布未知, 2 未知,大样本(例题分析)【例3】某传媒公司对某地区的200个家庭进行了收视率调查,发现每个家庭每天看电视时间的均值为4小时,标准差为2.5小时。5年前每个家庭看电视的平均时间为4.5小时。在0.05的显著性水平下,能否认为现在收看电视的时间比以前有了明显减少?左侧检验H0: 4.5H1: < 4.5 = 0.05n = 200临界值(s):检验统计量:Z0-1.96拒绝 H00.05决策:结论:在 = 0.05的水平上拒绝H0有充分证据认为现在每个家庭收看电视的时间比5年前显著减少。检验统计值-2.83总体分布未知, 2 未知,大样本(例题分析)(二)正态分布, 2未知,小样本1. 假定条件总体为正态分布 2未知,且小样本2. 使用t 统计量正态分布, 2 未知,小样本(例题分析)【例5-8】某厂采用自动包装机分装产品,假定每包产品的重量服从正态分布,每包标准重量为1000克,某日随机抽查9包,测得样本平均重量为984克,样本标准差是24克。试问在的显著性水平下,能否认为这天自动包装机工作正常。双侧检验 2 未知小样本均值的检验(例题分析)H0: = 1000H1: 1000 = 0.05df = 9 - 1 = 8临界值(s):检验统计量:在 = 0.05的水平上不拒绝H0没有充分证据说明这天的自动包装机工作不正常。决策:结论:t02.306-2.3060.025拒绝 H0拒绝 H00.025检验统计值2.00正态分布, 2 未知,小样本(例题分析)【例5-8】在【例5-7】中,试问在相同的显著性水平下,该自动包装机包装的产品重量是否偏轻?左侧检验H0: 1000H1: < 1000 = 0.05df = 9 - 1 = 8临界值(s):检验统计量:Z0-1.860拒绝 H00.05决策:结论:在 = 0.05的水平上拒绝H0有充分证据认为说明该自动包装机包装的产品重量显著偏轻。检验统计值-2.00总体分布未知, 2 未知,大样本(例题分析)一、总体均值的检验(检验统计量)总体 是否已知?用样本标准差S代替t 检验小样本量n否是z 检验z 检验大二、总体比例检验假定条件总体服从二项分布可用正态分布来近似(大样本)比例检验的Z 统计量 0为总体比例p的假设值p为样本比例二、一个总体比例的假设形式假设 双侧检验 单侧检验左侧检验 右侧检验原假设 H0 : p = 0 H0 : p 0 H0 : p 0备择假设 H1 : p ≠ 0 H1 : p < 0 H1 : p > 0一个总体比例的检验(例题分析)【例5-9】许多人在周末睡懒觉以弥补工作日的睡眠不足。某保健协会报告说,上班族中至少有61%的人在周末每天的睡眠多于7小时。在350个上班族构成的一个随机样本中,发现230人在上周末每天睡觉多于7小时。以0.05的显著性水平,能证实保健协会的研究结论吗?单侧检验一个总体比例的检验(例题分析)H0: p0 61%H1: p0 > 61%p=230/350=65.7% = 0.05n = 350临界值(s):检验统计量:在 = 0.05的水平上拒绝H0样本证据表明上班族周末每天睡眠时间多于7的比例显著高于61%。决策:结论:Z0拒绝域0.051.645检验统计值1.81三、方差的卡方 ( 2) 检验检验一个总体的方差或标准差假设总体近似服从正态分布检验统计量样本方差假设的总体方差三、一个总体方差的假设形式假设 双侧检验 单侧检验左侧检验 右侧检验原假设备择假设双侧检验检验统计量单侧检验左侧检验右侧检验方差的卡方 ( 2) 检验(例题分析)【例5-10】某炼铁厂的铁水含碳量在正常情况下服从正态分布,现就操作工艺进行了某些改进,从中抽取5炉铁水进行调查,测得其含碳量(计量单位:%)分别为4.412、4.052、4.428、4.683、4.357,据此是否可以认为新工艺炼出来的铁水含碳量方差仍为0.1082?( =0.05)双侧检验 2 未知小样本均值的检验(例题分析)H0: 2 = 0.1082H1: 2 0.1082根据样本数据计算得 = 0.05n = 5临界值(s):检验统计量:在 = 0.05的水平上拒绝H0样本数据证明方差发生了改变。决策:结论: 2011.143 /2=0.025检验统计值17.764 /2=0.0250.484假设 双侧检验 单侧检验没有差异有差异 均值1 均值2均值1 < 均值2 均值1 均值2均值1 > 均值2原假设H0 1 – 2 = 0 1 – 2 0 1 – 2 0备择假设H1 1 – 2 0 1 – 2 < 0 1 – 2 > 0一、两个总体均值之差的检验(假设的形式)一、两个总体均值之差的检验1. 假定条件两个样本是独立的随机样本两个总体都是正态分布若不是正态分布, 可以用正态分布来近似(n1 30和 n2 30)检验统计量为(一) 12、 22 已知检验具有不等方差的两个总体的均值假定条件两个样本是独立的随机样本两个总体都是正态分布两个总体方差未知且相等 12 = 22检验统计量一、两个总体均值之差的检验(二) 12、 22 未知且相等,小样本检验具有等方差的两个总体的均值假定条件两个样本是独立的随机样本两个总体都是正态分布两个总体方差未知但不相等 12 22检验统计量一、两个总体均值之差的检验(三) 12、 22 未知且不相等,小样本一、两个总体均值之差的检验双侧检验【例】有两种方法可用于制造某种以抗拉强度为重要特征的产品。根据以往的资料得知,第一种方法生产出的产品其抗拉强度的标准差为8公斤,第二种方法的标准差为10公斤。从两种方法生产的产品中各抽取一个随机样本,样本量分别为n1=32,n2=40,测得 x1= 50公斤, x2= 44公斤。问这两种方法生产的产品平均抗拉强度是否有显著差别? ( = 0.05)一、两个总体均值之差的检验(例题分析)H0: 1- 2 = 0H1: 1- 2 0 = 0.05n1 = 32,n2 = 40临界值(s):检验统计量:决策:结论:在 = 0.05的水平上拒绝H0有证据表明两种方法生产的产品其抗拉强度有显著差异检验统计值2.83一、两个总体均值之差的检验1.检验两个总体的均值配对或匹配重复测量 (前/后)2.假定条件两个总体都服从正态分布如果不服从正态分布,可用正态分布来近似 (n1 30 , n2 30 )(四)匹配样本的 t 检验匹配样本的 t 检验(假设的形式)假设 研究的问题没有差异有差异 总体1 总体2总体1 < 总体2 总体1 总体2总体1 > 总体2H0 1 – 2 = 0 1 – 2 0 1 – 2 0H1 1 – 2 0 1 – 2 < 0 1 – 2 > 0匹配样本的t检验(数据形式)观察序号 样本1 样本2 差值1 x 11 x 21 D1 = x 11 - x 212 x 12 x 22 D1 = x 12 - x 22M M M Mi x 1i x 2i D1 = x 1i - x 2iM M M Mn x 1n x 2n D1 = x 1n- x 2n注:Di = X1i - X2i ,对第 i 对观察值匹配样本的 t 检验(检验统计量)样本差值均值样本差值标准差自由度df =nD - 1统计量:D0:假设的差值【例】一个以减肥为主要目标的健美俱乐部声称,参加其训练班至少可以使减肥者平均体重减重8.5kg以上。为了验证该宣称是否可信,调查人员随机抽取了10名参加者,得到他们的体重记录如下表:匹配样本的 t 检验(例题分析)在 = 0.05的显著性水平下,调查结果是否支持该俱乐部的声称?训练前 94.5 101 110 103.5 97 88.5 96.5 101 104 116.5训练后 85 89.5 101.5 96 86 80.5 87 93.5 93 102单侧检验样本差值计算表训练前 训练后 差值Di94.5101110103.59788.596.5101104116.5 8589.5101.5968680.58793.593102 9.511.58.57.51189.57.51114.5合计 — 98.5配对样本的 t 检验(例题分析)配对样本的 t 检验(例题分析)差值均值差值标准差H0: m1 – m2 8.5H1: m1 – m2 < 8.5a = 0.05df = 10 - 1 = 9临界值(s):检验统计量:决策:结论:在 = 0.05的水平上不拒绝H0不能认为该俱乐部的宣称不可信配对样本的 t 检验(例题分析)1. 假定条件两个总体是独立的两个总体都服从二项分布可以用正态分布来近似(大样本)检验统计量Z假设检验分两种情况:(1)检验两个总体比例相等的假设(2)检验两个总体比例之差不为零的假设二、两个总体比例之差的检验假设 研究的问题没有差异有差异 比例1 ≥比例2比例1 < 比例2 总体1 ≤比例2总体1 > 比例2原假设H0 p1 – p2 = 0 p1 – p2 0 p1 – p2 0备择假设H1 p1 – p2 0 p1 – p2 < 0 p1 – p2 > 0(一)两个总体比例相等的检验(假设的形式)独立、大样本检验统计量Z二、两个总体比例之差的检验(一)两个总体比例相等其中P是将两个样本合并后得到的比例估计量为:假设 双侧检验 单侧检验左侧检验 右侧检验原假设H0 p1 – p2 =p0 p1 – p2 p0 p1 – p2 p0备择假设H1 p1 – p2 p0 p1 – p2 < p0 p1 – p2 > p0(二)两个总体比例之差不为零的检验(假设的形式)p0 0独立、大样本检验统计量Z二、两个总体比例之差的检验(二)两个总体比例之差不为零【例】有一项研究报告说青少年经常上网聊天,男生的比例至少超过女生10个百分点,即p1-p0≥10%(p1为男生比例,p0为女生比例)。现对150个男生和150个女生进行网上聊天的频度调查,其中经常聊天的男生有68人,经常聊天的女生54人。调查结果是否支持研究报告的结论?( = 0.05)二、两个总体比例之差的检验(例题分析)H0: 1- 2 10%H1: 1- 2 < 10% = 0.05n1 =n2 = 150p1=0.45,p2=0.36临界值(s):检验统计量:决策:结论:在 = 0.05的水平上不拒绝H0没有足够理由不支持研究报告的结论。检验统计值-0.177三、两个总体方差比的检验假定条件两个总体都服从正态分布,且方差相等两个独立的随机样本假定形式H0:s12 = s22 或 H0:s12 s22 (或 )H1:s12 s22 H1:s12 < s22 (或 >)检验统计量三、两个总体方差比的 F 检验(双侧检验)【例】某机床厂某日从两台机器所加工的同一种零件中,分别抽若干个样品测量零件尺寸,得:设零件尺寸服从正态分布,问第二台机器的加工精度是否比第一台机器的高?( = 0.05)三、两个总体方差比的检验解:两台机器所加工的零件尺寸分布为X、Y例题分析H0: 12 ≤ 22H1: 12 > 22 = 0.05n1 = 8,n2 = 9临界值(s):检验统计量:决策:结论:在 = 0.05的水平上拒绝H0可以认为第二台机器的加工精度比第一台机器的高。0F0.05拒绝 H0F0.05 (7,8)=3.5谢谢观看 展开更多...... 收起↑ 资源预览