资源简介 (共51张PPT)第六章 假设检验《统计学原理与应用》提纲(outline)6.1 问题的提出6.2 假设检验的基本概念6.3 单参数检验6.4 双参数检验1.人们通常对某件事情做出判断或选择的依据是什么?2.如果自己事先有个基本的判断或选择,那么是否可靠?可靠程度有多少?3.什么是参数检验?和假设检验有什么区别?4.请在您生活中,举出一个假设检验的例子6.1 问题的提出6.2 假设检验的基本概念一、统计学上的假设(一)假设的定义统计学上的假设是针对总体某种特征值做出的决策判断。注意:“假设”与“估计”的区别:“假设"是事先假定的,至于是否需要利用样本数据作考证或检验;而”估计“是根据样本数据完成的一个”计算“。两者在逻辑上先后顺序不一样。6.2 假设检验的基本概念(二)假设的内容统计学上的假设包括原假设(又叫零假设,Null Hypothesis,记为 )和备择假设(Alternative Hypotheise,记为 )。6.2 假设检验的基本概念(三)假设检验的原理从原理上来说,进行假设检验的方法十分简单,对统计调查中出现的差异进行定量分析,以确定其性质。但抽样结果是偶然性在起作用,还是系统性误差造成的,需要给出一个量的界限。假设检验中要给出量的界限使用概率反证法。6.2 假设检验的基本概念概率反证法:有假设 需要检验,先假设 是正确的,在此假设下,某事件A出现的概率很小,进行一次试验如果A出现了,就使人不得不怀疑以小概率时间A为前提的原假设 的正确性;反之,如果小概率事件A不出现,则试验结果与假设相符,没有理由拒绝 。在假设检验中,小概率 为显著性水平, 的选取要根据实际情况而定。6.2 假设检验的基本概念(四)两种假设的一般形式1.单参数假设在单参数检验中,原假设的一般形式如下::::=或或或即总体特征值=假设值(双侧检验)即总体特征值 假设值(左侧检验)即总体特征值 假设值(右侧检验)6.2 假设检验的基本概念在单参数检验中,备择假设的一般形式为以下3种形式中的一种::::或或或即总体特征值 假设值即总体特征值<假设值即总体特征值>假设值6.2 假设检验的基本概念在双参数检验中,备择假设的一般形式为以下的3种形式中的一种:或或或即总体1特征值=总体2相应特征值即总体1特征值<总体2相应特征值即总体1特征值>总体2相应特征值弃真错误(Type Ⅰ Error)是指原假设为真时拒绝原假设而犯的错误,又叫第一类错误,其概率记为 。存伪错误(Type Ⅱ Error)是指原假设为假时未能拒绝原假设而犯的错误,又叫第二类错误,其概率记为 。二、弃真和存伪错误6.2 假设检验的基本概念(一)两类错误的定义(二)两类错误的关系唯一能保证两类错误都不发生的方法就是对整个总体进行调查从而做出决定。然而在大部分情况下,当我们只能利用样本信息进行抉择时,无法保证两类错误都不发生,只能通过增加样本容量使 、 同时减少,但是通过增加样本量来达到减小犯错误的概率往往是不现实的,此种做法将大大增加决策成本。当样本容量n固定时,犯两类错误的概率是此消彼长、相互制约的,即当我们减少第一类错误发生的概率时,就会增加第二类错误发生的概率,反之亦然。标准的检验过程通常控制犯第一类错误的概率 。6.2 假设检验的基本概念三、显著性水平的设定定义:在假设检验中,我们对控制犯第一类错误 的概率称之为显著性水平(Level of Significance),即允许犯弃真错误的概率值。6.2 假设检验的基本概念6.2 假设检验的基本概念注意:(1) 的选取要依据实际情况而定,一般可取0.01,0.05或者0.1。需要注意的是, 的取值并非越小越好。(2)这里的“显著性”指的是“非偶然性”概念,如果样本提供的数据拒绝原假设,则表明检验的结果是显著的;如果不能够拒绝原假设,则表明的结果是不显著的。(3)统计上的“显著性”指的是运用样本推断的结论不是偶然成立的,存在一定的必然性。同样如此,如果检验的结果是不显著的,则表明样本推断的结论是偶然得到的,没有充分的理由拒绝原假设。6.2 假设检验的基本概念1、统计量的含义:在多数情形下,决策者并不是直接利用样本数据对假设进行分析判断,而是通过构造一个与总体参数相关的适用于检验原假设的统计量进行分析判断,此统计量通常称之为检验统计量(Test Statistic)。四、检验统计量的构建6.2 假设检验的基本概念2、常见的检验统计量常见的检验统计量主要有Z统计量、t统计量、 统计量以及F统计量,其中Z统计量、t统计量和 统计量主要用于单参数假设检验问题,F统计量主要用于双参数假设检验问题。以例6.3为例,当正态总体方差已知且以假定饮用水中铅的浓度达到15ppb或者更大为原假设时,样本均值服从的正态分布,于是可构造如下Z统计量:~针对上述所构建的统计量,再根据已知条件代入数据即可计算出检验统计量的值。在计算得到检验统计量的值以后,怎样在原假设和备择假设中做出抉择?这就需要我们确定一个区域.根据小概率事件的原理,对于给定的显著性水平,我们就可以构造出一个小概率事件和由相应的临界值围成的区域即拒绝域,这个小概率事件发生的概率为 。当检验统计量落入拒绝域时,表明一个概率很小的事件发生了,这时我们就有理由怀疑原假设的正确性,从而拒绝原假设。6.2 假设检验的基本概念五、接受域与拒绝域6.2 假设检验的基本概念从拒绝域本身的构造我们即可看出,拒绝域的大小与给定的显著性水平有一定的关系,实际上给定了显著性水平,也就给定了拒绝域的边界值或临界值。以Z统计量的拒绝域的构造为例,在总体方差已知时对总体均值进行双边检验,我们可以构造出Z统计量,根据拒绝域的构造原理,我们可以得到:则拒绝域为:接受域:6.2 假设检验的基本概念利用下图可以更清楚地看到在正态分布图中拒绝域与接受域的范围和关系。图中所示曲线为标准正态曲线,阴影区域表示的是拒绝域,其余部分表示的是接受域。通常我们可将检验统计量的观察值与拒绝域的临界值(在此例中是图1所示的 和 )相比较,当观察值落入拒绝域区域时,我们便有充分的理由拒绝。另外,图6.2还给出了对正态总体进行左侧检验和右侧检验时的拒绝域与接受域。6.2 假设检验的基本概念图6.1 正态分布检验的显著性水平、双边检验的拒绝域和临界值图6.2 正态分布检验的显著性水平、单边检验的拒绝域和临界值(左侧,右侧)6.2 假设检验的基本概念六、p值的含义和应用(一)P值的由来P值即伴随概率是指当原假设为真时检验统计量取该观察值或更极端值的概率。除了利用拒绝域和接受域来判断和抉择是否拒绝原假设以外,我们还可以利用伴随概率进行判断。每一个检验统计量都会对应一个P值。P值是用来测量样本观测数据与原假设中假定 值的偏离程度。P值越小,说明实际观测到的数据与之间不一致的程度就越大,检验的结果也就越显著。6.2 假设检验的基本概念(三)p值的应用(二)p值的含义p值则是构造出的检验统计量落在拒绝域内的概率值,p值是实际计算出来的。P值越小,对于更小的概率值,检验统计量竟然落在了拒绝域,说明拒绝原假设的理由更充分。一般我们将某统计量的观察值对应的P值与设定的显著性水平进行比较,若P值< ,则我们有充分的理由拒绝原假设;若P值> ,则我们不能拒绝原假设。常用的统计软件如EViews、SPSS等的分析结果中均会给出检验统计量对应的P值,因此在实际应用中我们常用P值作为判断的准则。6.2 假设检验的基本概念七、假设检验的五大基本步骤(一) 建立假设正确地提出原假设和备择假设,一个完整的检验问题原假设与备择假设的提法:其中 为总体参数, 为总体参数的设定值同上同上6.2 假设检验的基本概念(二)选取检验统计量假设检验的任务是要确认原假设是否为真,其做法是:先假定原假设成立,然后用样本去判断真伪,由于样本所含信息较为分散,因此需要构造一个统计量来进行判断,此统计量称为检验统计量。6.2 假设检验的基本概念(三)确定显著性水平当我们试图对原假设是否为真作判断时有可能会犯错误,这就是要冒风险。为了控制这一风险,首先需要用一个概率去表示这一风险,这个概率便是事件“为真但被拒绝”的概率,这个概率就是需要确定的显著性水平。由于样本的随机性,要完全避免不犯“弃真错误”是不可能的,因此只能把这个事件发生的概率控制在一个很小的范围内。(四)确定检验统计量的临界值依据统计量的概率分布和显著性水平,确定检验统计量的临界值。6.2 假设检验的基本概念(五)做出统计判断比较利用样本计算出来的统计量值与给定显著性水平下的临界值,若统计量计算出的绝对值大于临界值,则拒绝原假设,否则只能接受原假设。另外,我们也可以将某统计量的观察值对应的P值与设定的显著性水平进行比较,从而做出判断。6.3 单参数检验6.3 单参数检验6.3 单参数检验6.3 单参数检验6.3 单参数检验表6.1 单个总体均值检验的统计量6.3 单参数检验(二)实例应用1. 正态总体且方差已知情形(情形1)当总体方差已知时,对于正态总体无论样本大小都可采用z检验法进行检验(情形1和情形2);非正态总体或总体分布未知的大样本(情形5)也可采用z检验法进行检验。2.正态总体,方差未知情形(情形3)当总体方差未知时,对于正态总体无论样本大小,都可以采用t检验(情形3和情形4);对于大样本情形(即情形4)也可用z检验;但对于非正态总体或总体分布未知的大样本情形(情形6),采用z检验法。6.3 单参数检验3.大样本情形(情形4)当样本容量较大(n > 30)时,不要求检验总体必须服从正态分布,对于总体均值的检验一般采用z检验法(情形2,4,5,6)。对于正态总体来说,当方差未知时(情形4),也可采用t检验法。4.小样本情形(情形3)当样本容量较小(n < 30)时,检验要求总体必须服从正态分布。其中对于方差已知的总体,用z检验法(情形1);对于方差未知的总体,用t检验法(情形3)6.3 单参数检验6.3 单参数检验6.3 单参数检验6.3 单参数检验图14 分布检验的显著性水平、双边检验的拒绝域和临界值6.4 双参数检验双参数检验就是对两个总体的均值、方差和比例是否相同的假设检验。例子:1.证券投资者不仅要对多只股票的收益率进行比较,而且还要对每一股票收益率的波动率(即方差 )作比较;2.老师在教授两个不同班级同一门课程时,通常会对两个班级课程成绩的平均水平作一比较;3.质量管理工程师会不间断地对不同生产车间或流水线上生产同一产品的质量合格率进行比较和监测。6.4 双参数检验一、两个总体均值是否相等的检验两个总体均值是否相等的检验具有下列三种形式:(1) : ; : ——双侧检验(2) : ; : ——左侧检验(3) : ; : ——右侧检验检验两个总体均值是否相等的统计量是以两个样本均值之差( )的抽样分布基础构造出来。6.4 双参数检验(一)独立样本情形1.大样本情形在大样本情形下,采用z检验统计量。方差已知时利用公式(6.7),方差未知时则利用(6.8)。(6.7)(6.8)其中, 和 为从两个不同总体随机抽取的样本容量,和 为来自于两个不同总体的样本方差。6.4 双参数检验2.小样本情形当两个样本都为独立小样本时,需要假定两个总体都服从正态分布。情形Ⅰ: 与 已知,检验统计量与公式(6.7)一样。(6.7)6.4 双参数检验情形Ⅱ: 、 未知,但 = 。检验统计量为:(6.9)其中, 为两总体的合并方差:(6.10)6.4 双参数检验情形Ⅲ: 、 未知,且 ,但 。检验统计量为:(6.11)6.4 双参数检验情形Ⅳ: 、 未知,且 , 。检验统计量为:(6.12)其中上式t分布的自由度v由下列公式计算:(6.13)通常由公式(6.13)计算出来的自由度不一定是整数,具体计算时按四舍五入法规则取整数。6.4 双参数检验(二)匹配样本情形由于样本个体之间的“异质性”而使得独立样本的数据产生可能误差,此时可选择匹配样本。匹配样本情形下两个总体均值是否相等的假设检验统计量由公式(6.14)计算:(6.14)其中 , 为第i个配对样本数据的差值。6.4 双参数检验二、两个总体比例是否相等的检验设两个总体都服从二项分布,两个总体的比例分别为 和 ,对应的样本比例分别为 和 ,两个总体比例是否相等的检验具有下列三种形式:(1) : ; : ——双侧检验(2) : ; : ——左侧检验(3) : ; : ——右侧检验由单个总体比例检验知道,在大样本情形下,样本比例近似服从下列正态分布:因此,检验两个总体比例是否相等的统计量为:(6.15)(6.16)其中,为两样本比例之差抽样分布的标准差。6.4 双参数检验6.4 双参数检验三、两个总体方差是否相等的检验比较两个总体方差是否相等,以两个总体方差之比是否等于1作为比较准则,用两个总体样本的方差之比 进行估计。当两个容量为 和 的两个样本分别独立地取自于两个正态总体时,下列统计量服从第1自由度为 和第2自由度为 的 分布,即(6.17)6.4 双参数检验两个总体方差是否相等的检验具有下列三种形式(1) : ; : ——双侧检验(2) : ; : ——左侧检验(3) : ; : ——右侧检验检验两总体方差是否相等的统计量是:6.4 双参数检验对于两个总体的比例,其各自的样本比例分别为:两个独立总体比例的样本差为:谢谢! 展开更多...... 收起↑ 资源预览