第7章 假设检验 课件(共44张PPT)-《统计学教程》同步教学(北京交大版)

资源下载
  1. 二一教育资源

第7章 假设检验 课件(共44张PPT)-《统计学教程》同步教学(北京交大版)

资源简介

(共44张PPT)
《统计学教程》
第7章 假设检验
/《统计学》第7章 假设检验7.1假设检验的一般问题7.1.1小概率原理7.1.2假设检验的一般步骤7.1.3假设检验两类错误7.1.4双侧检验和单侧检验7.1.5P值7.2单一总体参数的假设检验7.2.1总体均值的假设检验7.2.2总体比例的假设检验7.2.3总体方差的假设检验7.3两个总体参数的假设检验7.3.1两个总体均值之差的假设检验7.3.2两个总体比值之差的假设检验7.3.3两个总体方差之比的假设检验第7章 假设检验
7.1假设检验的一般问题
《统计学教程》
/《统计学》第7章 假设检验7.1假设检验的一般问题7.1.1小概率原理小概率原理(Small Probability Theory)是指在发生概率很小的随机事件在一次实验中几乎是不可能发生的。小概率原理是统计假设检验判定接受或拒绝假设的标准和依据。由于概率很小的随机事件在一次实验中几乎是不可能发生的,假如概率很小的随机事件,在一次实验中竟然发生了,则认为假设条件不正确,将原先设定的假设推翻,即拒绝原先设定的假设。/《统计学》第7章 假设检验7.1假设检验的一般问题7.1.2假设检验的一般步骤一般可以将假设检验的步骤归纳为五个部分。1.提出原假设和备择假设原假设(Null Hypothesis)是指通过样本信息来推断正确与否的命题,也称为零假设。备择假设(Alternative Hypothesis)是指原假设对立的命题,是原假设的替换假设。2.选定适当的检验统计量如同参数估计,假设检验同样是从抽样分布出发,借助样本统计量进行的统计推断。在假设检验中的样本统计量称为检验统计量。检验统计量(Test Statistic)是指根据样本数据计算得到的,对原假设进行判断的样本统计量。/《统计学》第7章 假设检验7.1假设检验的一般问题3.确定适当的显著性水平显著性水平(Significance Level)是指正确的原假设遭到拒绝的错误发生的概率。显著性水平一般取0.1、0.05或0.01等数值。显著性水平的具体是根据研究目的,有关条件,假设检验量等具体情况,由人们主观确定的。各类统计软件在给出检验统计量的数值时,一般都给出该检验统计量数值的相伴概率,即p值。p值是根据检验统计量的数值,及其相关概率分布,自由度等计算出来的实际的临界显著性水平,反映了由该检验统计量进行假设检验时,发生正确的原假设遭到拒绝的错误的实际概率水平。/《统计学》第7章 假设检验7.1假设检验的一般问题4.计算检验统计量的数值检验统计量的数值一般也称为检验统计值。5.假设检验的判断假设检验的判断是根据选定的显著性水平和检验统计量的分布,确定拒绝域的临界值,将检验统计量的数值与临界值相比较,进而作出接受或者拒绝原假设的判断的方法和过程。拒绝域(Rejection Region)是指检验统计量拒绝原假设的所有取值的集合。临界值(Critical Value)是指根据选定的显著性水平所确定的拒绝域的边界数值。拒绝域是由显著性水平确定的一个数值区间,若由样本数据计算的检验统计量的数值落在这个区间里,就拒绝原假设,否则将接受原假设。拒绝域的界定是根据具体的显著性水平所计算的临界值,计算出了临界值,也就确定了拒绝域。/《统计学》第7章 假设检验7.1假设检验的一般问题7.1.3假设检验的两类错误假设检验的判断是建立样本分布的基础上,依据一定的概率水平进行的统计推断。假设检验将可能出现的错误分为第Ⅰ类错误和第II类错误两种类型。第Ⅰ类错误(TypeⅠerror)是指当原假设为真时拒绝原假设的错误,又称为弃真错误。通常将犯第Ⅰ类错误的概率记为α。这个概率就是显著性水平。因此,显著性水平又可表述为犯第Ⅰ类错误的概率。第II类错误(Type II error)是指当原假设为假时接受原假设的错误,又称为取伪错误。通常将犯第II类错误的概率记为β。从而,在假设检验中进行判断时,存在判断正确和判断错误的四种概率。/《统计学》第7章 假设检验表3.1假设检验中四种结果发生的概率在假设检验中,人们总是希望能够进行正确的判断,犯这两类错误的概率越小越好。然而,在样本容量一定的前提下,犯这两类错误的概率是互为消长的。若减小犯第Ⅰ类错误的概率,就增大了犯第II类错误的概率,同样,若减小犯第II类错误的概率,就增大了犯第Ⅰ类错误的概率。7.1假设检验的一般问题/《统计学》第7章 假设检验7.1假设检验的一般问题图7.1假设检验中出现两类错误的示意图/《统计学》第7章 假设检验7.1假设检验的一般问题7.1.4双侧检验和单侧检验1.双侧检验双侧检验(Two-Sides test)是指在数轴上的两端同时设置拒绝域的边界数值,同时进行控制的假设检验。双侧检验的备择假设是指没有特定的方向性,含有“≠”运算符号的假设检验,一般也称为双尾检验(Two-Tailed test)。如图所示,在双侧检验中需要在概率分布的两端,各二分之一显著性水平的位置上确定拒绝域边界的临界数值,从而保证了样本落在接受域的概率仍为 。/《统计学》第7章 假设检验7.1假设检验的一般问题2.单侧检验单侧检验(One-Side test)是指仅在数轴上的一端设置拒绝域的边界数值,只进行单一方向控制的假设检验。单侧检验的备择假设在数轴上具有特定的方向性,是一种包含“<”或“>”运算符号的假设检验,一般也称为单尾检验(One-Tailed test)。如图所示,在单侧检验中只需要在概率分布的某一端的显著性水平的位置上,确定拒绝域边界的临界数值,进行显著性检验。单侧检验方向,即设置拒绝域的边界数值的位置,可以是在概率分布的右端或者左端,这两种方式均使样本落在接受域的概率为 。/《统计学》第7章 假设检验7.1假设检验的一般问题7.1.5 p值p值(P-Value)是当原假设为真时,由样本信息给出的犯第Ⅰ类“弃真”错误的概率的精确数值,所以也称为观察到的显著性水平(Observed Significance Level)。各种统计软件在计算各类检验统计量时,均会同时给出与具体检验统计值相对应的p值,因此p值又称为相应的检验统计量的相伴概率(Concomitant Probability)。利用p值进行假设检验的判断,不仅可以依据值与设定显著性水平数值进行比较,当p值大于显著性水平时就拒绝原假设,当p值小于显著性水平时就接受原假设;而且还可以知道在接受原假设时,p值小于显著性水平的具体数值,以及犯第Ⅰ类“弃真”错误的确切概率。第7章 假设检验
7.2 单一总体参数的假设检验
《统计学教程》
/《统计学》第7章 假设检验7.2单一总体参数的假设检验7.2.1总体均值的假设检验1.大样本总体均值的假设检验由抽样分布可知,在大样本场合样本均值趋于正态分布,并且有样本均值的标准差为总体标准差除以样本容量的平方根。由此可得(7.1)在总体方差已知时,样本均值的方差为,所以式(7.1)可写为(7.2)当总体方差未知时,采用样本方差来替代总体方差,这时检验统计量为(7.3)/《统计学》第7章 假设检验7.2单一总体参数的假设检验例7.4某大学为了培养一年级新生良好的自我管理能力和自习习惯,规定晚自习时间为3小时。根据历史数据,一年级新生晚自习时间长度服从正态分布。该大学教学管理部门在新生入学后的第12周进行了一次一年级新生晚自习时间调查,随机抽取了100名新生的晚自习时间长度数据构成样本,计算得样本均值为2.8小时,假设的总体均值为3小时,样本容量为100。此外,已知总体标准差为0.8小时。要求取显著性水平为5%,试检验总体均值与学校规定的3小时(假设的总体均值)之间有无显著差异。解对其进行双侧检验。(1)提出零假设和备择假设,为(2)确定检验统计量。本例样本容量为100,属大样本,并且总体标准差已知,因此采用式(7.2)的Z检验统计量进行检验。/《统计学》第7章 假设检验7.2单一总体参数的假设检验(3)确定显著性水平。选定的显著性水平为 。在双侧检验场合,需要在正态总体曲线的左右两端尾部确定临界点,并构成拒绝域,在本例中有显著性水平 。(4)计算检验统计量。根据式(7.2)计算得(5)进行判断。通过查阅正态分布表,或借助Excel的NORMSINV函数计算。显著性水平为0.025时,有 。由教材P.323,可查得,当显著性水平0.975时,有 。由于-2.5,小于左端临界值-1.96,处在拒绝域中,因此拒绝零假设,认为该校一年级新生晚自习时间长度的总体均值与学校规定的3小时(假设的总体均值)之间存在显著差异。/《统计学》第7章 假设检验7.2单一总体参数的假设检验例7.5若仅仅将例7.4中的样本容量由100减少到36,其它条件都不变。要求仍然取显著性水平为5%,试检验总体均值与学校规定的3小时(假设的总体均值)之间有无显著差异。解由于本例与例7.4相比较,仅仅是样本容量减少,其它条件都不变。仍采用检验统计量进行检验,则所影响到的只是样本容量减少引起Z检验统计量取值的减小,以及由样本容量减少导致的犯第I类错误的概率,或者第II类错误的概率的增大。仍采用式(7.2)计算检验统计量,有由于,小于临界值-1.96,处在接受域中,因此接受零假设,认为该校一年级新生晚自习时间长度的总体均值与学校规定的3小时(假设的总体均值)之间没有显著差异。/《统计学》第7章 假设检验7.2单一总体参数的假设检验同一个问题,为什么当样本容量减少时反倒由拒绝原假设,转为接受原假设了呢?这是因为显著性水平没有变,在样本容量减少时,为了保证犯第Ⅰ类错误的概率不变,即犯“弃真” 错误的风险不增大,只有通过扩大接受域来实现,就会导致犯第II类错误的概率的相应增大,增加“取伪”的风险。这意味着在样本容量减少时,若显著性水平不变,即犯第Ⅰ类错误的概率不变,必然导致犯第II类错误的概率增大。即样本容量减少时犯第Ⅰ类错误的概率不变,是以增大犯第II类错误的风险为代价,通过扩大接受域的取值区间来实现的。因此,应对假设检验中出现的两类错误,尤其是以隐含形式存在的第II类“取伪”错误,给以充分的重视。/《统计学》第7章 假设检验7.2单一总体参数的假设检验同一个问题,为什么当样本容量减少时反倒由拒绝原假设,转为接受原假设了呢?这是因为显著性水平没有变,在样本容量减少时,为了保证犯第Ⅰ类错误的概率不变,即犯“弃真” 错误的风险不增大,只有通过扩大接受域来实现,就会导致犯第II类错误的概率的相应增大,增加“取伪”的风险。这意味着在样本容量减少时,若显著性水平不变,即犯第Ⅰ类错误的概率不变,必然导致犯第II类错误的概率增大。即样本容量减少时犯第Ⅰ类错误的概率不变,是以增大犯第II类错误的风险为代价,通过扩大接受域的取值区间来实现的。因此,应对假设检验中出现的两类错误,尤其是以隐含形式存在的第II类“取伪”错误,给以充分的重视。★讨论题若例7.5中其它条件都不变,试计算与学校规定的3小时之间出现显著差异的样本均值的临界值。/《统计学》第7章 假设检验7.2单一总体参数的假设检验2.小样本总体均值的假设检验在正态总体的小样本(一般为小于30)的情况下,总体均值的假设检验分为总体方差已知和总体方差未知两种类型。当总体方差已知时,标准化后样本均值仍然服从正态分布,所以依然采用式(7.2)来计算检验统计量。当总体方差未知时,样本均值标准化后的统计量服从于自由度为n-1的t分布,此时其T检验统计量为(7.4)/《统计学》第7章 假设检验7.2单一总体参数的假设检验例7.6以例6.16中的有关数据为例。某地抽取了样本容量为18的一小样本,对在该地就业的本科生在毕业一年后的月工资情况进行调查,假定该总体服从正态分布,但总体方差未知,样本数据如表3.2所示。表3.2 18名毕业一年本科生的月工资情况 元要求若在相邻的S市就业的毕业一年本科生的月工资均值为2400元,试在显著性水平为5%前提下,检验该地就业的毕业一年本科生的月工资总体均值是否显著低于相邻的S市的水平。解属于单侧检验。零假设和备择假设,为计算检验统计量接受零假设。/《统计学》第7章 假设检验7.2单一总体参数的假设检验例7.7将例7.6中的检验问题由比较相邻S市的水平,改为与该市的预期控制目标2200元比较。要求试检验该地毕业一年本科生的月工资总体均值与该市的预期控制目标2200元之间是否存在显著差异。解其进行双侧检验。这时,将在例7.6中提出的零假设和备择假设改为根据式(7.4)计算小于临界值,处在接受域中,因此接受零假设,认为该地毕业一年本科生的月工资总体均值与该市的预期控制目标2200元不存在显著差异。;/《统计学》第7章 假设检验7.2单一总体参数的假设检验7.2.2总体比例的假设检验总体比例是指总体中具有某一特征的单位数占总体单位总数的比重。这一特征可以是数值型,也可以是非数值型的。这里仍然仅讨论在样本比例的抽样分布渐进地趋于正态分布条件下的总体比例的假设检验问题。样本比例标准化后的随机变量渐进地服从于标准正态分布。因此可使用Z统计量进行检验。有(7.7)/《统计学》第7章 假设检验7.2单一总体参数的假设检验例7.8某公司为了分析新产品的电视广告效果,随机访问了100名用户,了解到其中有36人是通过电视广告了解该新产品的。要求试以95%的置信水平估计,此项调查结果是否支持全部用户中有一半以上的用户是通过电视广告了解该新产品的假定。解属于一项左侧的单侧检验问题。提出零假设和备择假设为根据调查数据可计算得样本比例,由式(7.7)有所以拒绝零假设,认为总体中通过电视广告了解该新产品的用户的比例显著小于50%。,/《统计学》第7章 假设检验7.2单一总体参数的假设检验7.2.3总体方差的假设检验对于总体方差的假设检验需要采用卡方分布,要求总体服从正态分布。有(7.8)对于给定的显著性水平,卡方分布的双侧检验的接受域和拒绝域的情况如图7.5所示。/《统计学》第7章 假设检验7.2单一总体参数的假设检验例7.9利用第6章例6.6中36名同学的月工资的有关数据,若月工资服从正态分布,并有该市对于月工资标准差的预期目标值为400元。要求试在显著性水平为5%前提下,检验该地毕业一年本科生的月工资总体标准差与400元之间是否存在显著差异。解进行双侧检验。零假设和备择假设,计算卡方检验统计量数值接受零假设,认为该地毕业一年本科生的月工资总体标准差与该市的预期目标标准差水平的400元之间不存在显著差异。 第7章 假设检验
7.3 两个总体参数的假设检验
《统计学教程》
/《统计学》第7章 假设检验7.3两个总体参数的假设检验7.3.1两个总体均值之差的假设检验1.两个总体方差已知情况下的假设检验在两个正态总体的方差与为已知情况下,无论样本容量大小,两个样本均值之差的分布均服从正态分布,对样本均值之差进行标准化处理,即可得总体均值之差假设检验的统计量。(7.9)由于两个总体均值之差的假设检验的原假设一般为总体均值假之差为0的双侧检验,或者是包括总体均值假之差为0在内的单侧检验。在这一前提下,两个总体均值之差的假设检验统计量为(7.10)/《统计学》第7章 假设检验7.3两个总体参数的假设检验例7.10根据第6章的例6.11有关数据,A、B两厂电机工作时定子线圈最高温度的总体标准差数据为已知,其中A工厂为8℃,B工厂为6℃,并有样本均值分别为A工厂110℃,B工厂114℃。要求试检验在给定显著性水平为0.05时,A、B两厂电机工作时定子线圈最高温度的总体均值之间是否存在显著差异。解本例属于双侧检验。提出零假设和备择假设,为计算检验统计量。根据式(7.10)计算得拒绝零假设,认为在给定显著性水平为0.05时,A、B两厂电机工作时定子线圈最高温度的总体均值之间存在着显著差异。;/《统计学》第7章 假设检验7.3两个总体参数的假设检验2.两个相等总体方差未知情况下的估计在两个服从正态分布总体的方差为未知,并且相等,自这两个总体中独立地抽取两个随机样本来进行假设检验。令这两个相等的未知总体联合方差的估计量为(7.11)一般有原假设令总体均值假之差为0,则T检验统计量的计算公式为(7.13)/《统计学》第7章 假设检验7.3两个总体参数的假设检验3.两个不相等总体方差未知情况下的假设检验若有两个均服从正态分布的总体,总体方差未知并且不相等,自这两个总体中独立地抽取两个随机样本,服从于自由度为f的t分布,自由度f的计算公式为(7.14)由于一般原假设令总体均值假之差为0,T检验统计量的计算公式为(7.16)/《统计学》第7章 假设检验7.3两个总体参数的假设检验例7.11假如将例7.10中已知总体已知条件,改为总体方差未知且不相等,原题中总体方差数据作为样本方差,其它条件不变。解由于总体方差未知,不能采用式(7.10)计算的T检验统计量进行检验,而需要采用式(7.14)计算T检验统计量的自由度f,并运用式(7.16)计算的T检验统计量进行检验。先采用式(7.14)计算T检验统计量的自由度f,有式(7.16)与式(7.10)的形式一致,本例采用同样数据按照式(7.16)计算得到的检验统计量数值,与在例7.9按照式(7.10)计算的检验统计量数值是相同的。所不同的一个是服从正态分布,一个是服从自由度为f的t分布,两者接受域的临界值是不同的。/《统计学》第7章 假设检验7.3两个总体参数的假设检验例7.12仍然使用例7.10中有关数据,总体方差未知且不相等。解由于两个样本的样本容量均为49,可以视为属于充分大的大样本,因此采用式(7.17)的Z检验统计量。与例7.9中的情况类似,式(7.17)与式(7.9)的形式一致,只是采用了样本方差和来代替未知的两个总体方差和,所以本例采用同样数据按照式(7.17)计算的检验统计量数值,与在例7.8按照式(7.9)计算的检验统计量数值是相同的。并且两者都是根据正态分布,来计算接受域的临界值。所以本例的假设检验方法、过程和结论与例7.8相同。所不同仅仅在于本例中根据正态分布得到的临界值为1.96,而在例7.9中根据分布得到的临界值为1.985。由于样本容量较大,两者的差异不是很大。本例中采用的正态分布检验统计量方法,是例7.9中采用的分布检验统计量方法的近似方法。/《统计学》第7章 假设检验7.3两个总体参数的假设检验7.3.2两个总体比值之差的假设检验在大样本的场合下,从两个服从二项分布的总体中得到的两个样本比例之差的抽样分布渐进地趋于正态分布,其标准化后的随机变量渐进地服从标准正态分布。因此,可以采用Z统计量进行检验。有(7.19)在两个总体比例和为未知,可采用样本比例替代总体比例,这时两个总体比例之差的假设检验统计量为(7.20)/《统计学》第7章 假设检验7.3两个总体参数的假设检验7.3.3两个总体方差之比的假设检验总体方差之间是否相等的假设检验一般也称为方差齐性检验。当两个均服从正态分布的总体的参数都为未知,两个独立样本的样本方差之比是两个总体方差比值的估计量。并且由两个方差比值的比值构成F检验统计量,有(7.21)由于两个总体方差之比的原假设一般是两个总体方差比值为1的双侧检验,或者包括所以两个总体方差比值等于1条件在内的单侧检验,在此前提下两个总体方差之比的假设检验统计量为(7.22)/《统计学》第7章 假设检验7.3两个总体参数的假设检验例7.13某商学院对该院一年级和二年级的同学进行了一次参加课外体育活动情况调查,在这两个年级里各自独立地抽取了10名同学在过去一周里参加课外体育活动的累计时间,具体数据如表3.3所示。表3.3某商学院一、二年级同学一周内课外体育活动情况 小时要求试以显著性水平,检验该商学院一、二年级同学一周内课外体育活动时间长度的方差是否存在显著差异。解属于双侧检验。(1)提出零假设和备择假设。有/《统计学》第7章 假设检验7.3两个总体参数的假设检验(2)确定检验统计量。采用式(7.22)的分布检验统计量。(3)确定显著性水平 。(4)计算检验统计量。由和,根据式(7.22)计算得(5)进行判断。由于有检验统计量的数值为1.1685,处在接受域的0.2484和4.026之内,因此接受零假设,认为该商学院一年级和二年级同学课外体育活动时间长度的方差之间不存在显著差异。第7章 假设检验
Excel 应用
《统计学教程》
/《统计学》第7章 假设检验Excel应用例7.14某化工企业为了提高主产品的收率,对生产工艺进行了改进,并从改进前后的实际生产过程中各自独立地抽取了15次收率数据构成了两个随机样本。表3.4某化工企业主产品生产工艺改进对收率的影响情况% 要求(1)对改进前后收率的总体方差比值进行假设检验,显著性水平为0.05。(2)在(1)的基础上,采用适当的方法。对改进前后收率的总体均值之差进行假设检验,显著性水平为0.05。第7章 假设检验
小结与练习
《统计学教程》
/《统计学》第7章 假设检验本章小结本章介绍了假设检验的一般问题,单一总体参数的均值、比例和方差的假设检验,以及两个总体参数的均值之差、比例之差和方差比值的假设检验的方法。本章的重点是如何针对不同情况和要求,正确地运用Z分布,t分布,F分布和卡方分布来构造检验统计量,进行假设检验。本章的难点集中在假设检验的一般问题一节中,包括小概率原理、假设检验的一般步骤、假设检验两类错误、双侧检验和单侧检验、值等假设检验的基础理论和基本方法。 /《统计学》第7章 假设检验思考与练习1、假设检验依据的基本原理是什么?2、假设检验的两类错误是什么?3、假设检验的一般步骤有那些内容和要求?4、什么是假设检验的双侧检验和单侧检验?5、什么是假设检验的值?6、什么是假设检验的原假设和备择假设?7、显著性水平在假设检验中的意义是什么?8、什么是假设检验的拒绝域和临界值?9、什么是大样本,大样本时应怎样计算总体均值检验统计量?第7章 假设检验
结 束
《统计学教程》

展开更多......

收起↑

资源预览