资源简介 (共51张PPT)概率论与数量统计假设检验第八章01假设检验的基本概念假设检验的基本概念01假设检验的思想和方法【例1】某箱子中有红球及白球共100个.已知两种球所占的比例为99:1,但不知是红球个数为99还是白球个数为99,现允许抽一球来进行判断.若抽到红球,则我们更倾向于认为是红球为99个.判断理由如下.以H来表示假设“其中有99个白球”,而以旺来表示与之相反的假设“其中有99个红球”。若成立,则事件“从箱子中抽一球抽到红球”的概率为0.01(该事件即可认为是小概率事件)。从中抽一球,发现为红球(这是试验结果表明的),即小概率事件在一次试验中发生了,这与小概率事件原理不相吻合,所以认为不成立更加合理,即认为箱子中有99个红球。显然,利用这种方法做判断是会犯错误的,但有99%的把握判断正确。这一例子的解决已经在某种程度上体现了假设检验的思想。下面以一个更复杂的例子来说明假设检验问题的一般思想和基本方法。假设检验的基本概念01假设检验的思想和方法【例2】某工厂生产的某种螺栓,在正常生产的情况下其长度X(单位:mm)服从正态分布N(54,0.45),为了知道检修后机器生产是否正常,现任取5只螺栓,测得其长度如下:53.2,54.1,52.6,54.2,52.1.设已知总体X的方差没有改变,依据上述数据,判断机器生产是否正常。解:如果机器生产正常,那么生产的螺栓的平均长度应为54,故取检验假设为称为原假设或零假设(null hypothesis)。当不成立时,则接受假设称为对立假设或备择假设(alternative hypothesis)。对于和,检验的结果是接受且只能接受其中的一个。假设检验的基本概念01假设检验的思想和方法如何检验原假设是否成立呢?考虑样本均值是总体均值的一个比较好的估计量(具有无偏性、一致性等),所以可以利用来进行讨论。当成立时,的观察值应在的附近,否则就不能认为成立。如何判断是否接近呢?为了定量地讨论问题,指定一个小概率,称为显著性水平(significance level)。对概率α,确定一个数k,使当成立时,事件是一个小概率事件.将样本均值的观察值代入式(8.1),若有则说明事件A在一次试验中发生了。若成立,则与小概率事件原理不吻合,故更有理由怀疑的正确性,从而可以做出拒绝的判断。而若则没有充分的理由怀疑的正确性,只好做出接受的决定(这一点与反证法不同)。假设检验的基本概念01假设检验的思想和方法由上所述,判断是否接近,可以以式(8.2)是否满足为标准,为确定常数k。注意到总体服从正态分布,因此如果成立,那么故对于给定的显著性水平,有于是根据上面的讨论,设统计量的观察值为假设检验的基本概念01假设检验的思想和方法则当时(此时事件A发生),拒绝;当时,没有充分的理由拒绝,从而接受。相应地,称式(8.3)中的区域为关于统计量U的拒绝域(rejection region),称式(8.4)中的区域为关于统计量U的接受域(acceptance region),和分别称为临界下限(lower critical bound)和临界上限(upper critical bound)。假设检验的基本概念01假设检验的思想和方法在本例中,根据给定的数据可计算,又,若取显著性水平,则。故即u位于拒绝域内,从而拒绝。即认为机器检修后生产不正常。假设检验的基本概念01假设检验的思想和方法(1)假设检验依赖的原理是小概率事件原理:构造一个在H为真的条件下概率很小的事件A,依小概率事件原理,在一次抽样中,A是不应该发生的。如果抽样的结果中竟然出现了事件A,那么对“事件A的概率很小”这一论断会产生怀疑,由此便怀疑到“为真”这一假设的正确性.假设检验的方法类似于数学推理中的反证法,由于样本只是庞大总体中的一小部分个体,只能携带有限的信息,相当于数学中举出的一个反例,根据它做出对肯定的结论依据是不足的,但是否定,有这一个“反例”就足够了。这也是在假设检验问题中,给出的判断依据常常是拒绝域的缘故。虽然从判断方法上看,利用拒绝域和接受域并无不同,但从逻辑结构来看,二者是不对称的。假设检验的基本概念01假设检验的思想和方法(2)检验的方法,可以利用式(8.3),按例8.1.2的方法判断,称之为U临界值法。注意到故也称区间为关于样本均值的拒绝域。当样本均值的观察值落入拒绝域时,拒绝这种方法称为临界值法.假设检验的基本概念01假设检验的思想和方法又依式(8.5),有上式右端为总体均值的置信水平为1-α的置信区间,因此也可以根据待验参数值是否位于的置信区间内来判断是接受还是拒绝,这种方法称为置信区间法。假设检验的基本概念01双侧检验与单侧检验在上面讨论的检验问题中,取原假设,对立假设.由于是的近似,因此当过大或过小(相应地过大或过小)时,应做出拒绝的判断。故的拒绝分为对称的两部分,即 ,每一部分对应的概率水平为(见图8.1),这样的检验称为双侧检验(two-side test)。双侧检验的特点是它的拒绝域有两个临界值,分别为临界下限和临界上限。假设检验的基本概念01双侧检验与单侧检验式(8.6)和式(8.7)的假设检验分别称为左侧检验和右侧检验,相对于双侧检验,二者也统称为单侧检验。假设检验的基本概念01假设检验中的两类错误首先,显著性水平α是小概率事件A发生的概率,所以当成立时,仍有可能以α的概率而拒绝它,这种错误称为“弃真”错误,在假设检验中也称为第一类错误(tyne I error)。犯第一类错误的概率不超过。当不为真时,按检验规则接受了,这种错误称为“取伪”错误,也称为第二类错误(type lI error).设犯第二类错误的概率为β,则α越小,拒绝域越小,接受域越大,犯第二类错误的概率β便越大。02正态总体参数的假设检验正态总体参数的假设检验02正态总体均值的假设检验(1)已知的情形先以双检测进行讨论。一般地,有如下方法。故原假设关于检验统计量U的拒绝域为正态总体参数的假设检验02正态总体均值的假设检验而对于左侧校验和右侧校验,有类似的方法。对于左侧校验,详细讨论步骤如下。故原假设关于检验统计量U的拒绝域为正态总体参数的假设检验02正态总体均值的假设检验对于右侧检验,先提出检验假设: = ,>。双侧检验与左侧检验中的步骤2°仍然可以保留。注意到对于给定的显著性水平α,有故原假设关于检验统计量U的拒绝域为这里选用的检验统计量U在为真时,服从标准正态分布,故称为U检验法。正态总体参数的假设检验02正态总体均值的假设检验(2)未知的情形当未知时,随机变量中未知参数,所以不能使用上述方法。样本方差为的无偏估计量,故以样本标准差S来代替。由于因此采用作为检验统计量,若原假设成立,则正态总体参数的假设检验02正态总体均值的假设检验设显著性水平为,则对,由得其中t为统计量T的观测值,而表示分布关于的双侧分位数。正态总体参数的假设检验02正态总体均值的假设检验对于单侧检验,检验方法类似 于双侧检验,这里仅叙述不同的地方,不再详细讨论。当时,类似于(8.12),有得得拒绝域为同样,当时,可以得到右侧检验得拒绝域为这里选用了服从t分布得统计量T,这种检验方法称为t检验法。正态总体参数的假设检验02正态总体均值的假设检验【例1】在正常情况下,某厂生产的灯泡寿命X服从正态分布.现随机抽取10只灯泡,测得其寿命(单位: h)为1490,1440,1680,1610,1500,1750,1550,1420,1800,1580.在显著性水平α0.05下能否认为该厂生产的灯泡的平均寿命为1600h 正态总体参数的假设检验02正态总体均值的假设检验设总体,其中未知。在显著性水平下,检验假设其中是已知整数。对应得对立假设可分别为分别对应双侧检验、左侧检验和右侧检测。设()是取自总体X得一个样本,为样本方差。注意到随机变量故若原假设为,则统计量正态总体参数的假设检验02正态总体均值的假设检验设对立假设为,则其中和分别为分布关于得下侧分位数和上侧分位数。从而得到原假设关于检验统计量的拒绝域为类似地,在单侧检测情形,若对立假设为,则由正态总体参数的假设检验02正态总体均值的假设检验推导得拒绝域为若对立假设为推导得拒绝域为用于上述检验中得检验统计统计量服从分布,所以称为。正态总体参数的假设检验02(1)和都已知得情形由于,,且与独立,因此服从正态分布,且故随机变量若成立,则两独立正态总体均值相等得检验正态总体参数的假设检验02于是,可用U检验法进行讨论。以表示标准正态分布关于得双侧分位数,则对于对给定得显著性水平,有于是,对于对立假设,有拒绝域以和分别表示和得观察值,当统计量U的值两独立正态总体均值相等得检验正态总体参数的假设检验02时,拒绝,否则接受。与一个正态总体均值检验的情形类型,对单侧检验情形,有两独立正态总体均值相等得检验正态总体参数的假设检验02两独立正态总体均值相等得检验(2)==,但未知得情形注意到两正态总体方差满足==(具有方差齐性),则随机变量其中若成立,则正态总体参数的假设检验02两独立正态总体均值相等得检验故可以t检验法,对立假设为时,设为显著性水平,则有故的拒绝域为正态总体参数的假设检验02两独立正态总体均值相等得检验当T的观测值为于拒绝域时,拒绝,否则接受。类似地,对单侧检验,有正态总体参数的假设检验02两独立正态总体方差相等的检验当两正态总体的方差未知时,利用t检验法检验两总体均值是否相等,要求两总体具有方差齐性,因此首先要检验两正态总体的方差是否相等,在实际问题当中,也有许多涉及两正态总体方差相等的检验,例如,检验两台机 器加工精度的差异,当两台机器加工产品的方差相等时,可认为加工精度无差异,否则认为加工精度有差异。正态总体参数的假设检验02两独立正态总体方差相等的检验设两正态总体,相互独立。检验假设对于双侧检验、左侧检验与右侧检验的对立假设分别为从总体X中抽取样本(),从总体Y中抽取样本(),样本方差分别记为,则随机变量正态总体参数的假设检验02两独立正态总体方差相等的检验从而若原假设成立,则在给定的显著性水平下,对于对立假设,由可得的拒绝域为正态总体参数的假设检验02两独立正态总体方差相等的检验而对于对立假设,由可得的拒绝域为类似地,对于对立假设,利用关系式得得拒绝域为这里用到的检验统计量服从F分布,故称该检验方法为F检验法。03非正态总体参数的假设检验非正态总体参数的假设检验03单个总体均值的检验设总体X的分布任意(已知),其均值和方差均存在,记,未知为已知,且。在显著水平下,检验假设其中为一已知数。设()为取自X的一个样本,表示样本均值。由中心极限定理知,当很大时,随机变量非正态总体参数的假设检验03单个总体均值的检验近似服从标准正态分布。故若成立,则当很大时,随机变量近似服从标准正态分布。从而对于对立假设,在给定的显著性水平下,有进而找到假设关于检验统计量U的拒绝域为非正态总体参数的假设检验03单个总体均值的检验类似地,可以得到:若方差未知,以的一致估计量代替,则可以证明,当时,仍渐近服从标准正态分布,故亦可分别得到拒绝域为上述形式非正态总体参数的假设检验03单个总体均值的检验【例1】某电子元件的平均电阻值一直保持在=2.64Ω,改变生产工艺后,测得100个元件的电阻的样本均值v=2.62Ω,方差为s3=0.06.问新工艺对此元件的电阻是否显著减小 取显著性水平α =0.01。非正态总体参数的假设检验03两总体均值相等的检验设总体X,Y的分布任意,其均值和方差均存在但未知,记,,,,检验假设对应于双侧检验和单侧检验的对立假设分别取为设()于()分别是取自X与Y的样本,样本均值为与,样本方差分别为与。因为与相互独立,所以根据中心极限定理,当和都很大时,与分别近似服从正态分布和。又注意到,与独立,故近似服从正态分布。从而随机变量近似服从标准正态分布。非正态总体参数的假设检验03两总体均值相等的检验当,未知时,以样本方差,代替,,可以证明也近似服从标准正态分布。于是,当成立时,取作为检验统计量,当,很大时,U近似服从标准正态分布,从而得到的拒绝域为非正态总体参数的假设检验03两总体均值相等的检验【例2】两台机床加工同一种圆筒,抽样测量产品内径(单位: cm),经计算得到如下数据试在显著性水平α=0.05下,检验两台机床加工的圆筒内径均值有无显著差。非正态总体参数的假设检验03两总体均值相等的检验04分布假设检验分布假设检验04分布假设检验的方法有多种,拟合优度检验法(goodness-of-fit test)是常用的一种。这种检验法中所用的统计量由英国统计学家卡尔·皮尔逊(K.Pearson)首先提出并明确了它的分布,故拟合度检验法又称为皮尔逊拟合优度检验法。卡尔·皮尔逊提出了用一个统计量作为检验的标准,称为实际频数,它作为样本的函数,是一个随机变量,其观察值记为,称为理论概率,称为理论频数,当为真时,它们是常数,此式所确定的统计量称为统计量或皮尔逊统计量。分布假设检验04定理8.1 [皮尔逊-费歇(Pearson-Fisher)定理] 设成立,则皮尔逊统计量近似服从分布,记时,以的分布函数为极限,其中是分组数,是中需以最大似然估计法估计的未知参数的个数。根据定理8.1,在给定的显著性水平下,当样本容量n很大()时,有于是,若用记的最大似然估计值,则当统计量的观察值时,拒绝假设;否则,接受,认为总体X的分布函数于无显著差异。分布假设检验04【例1】某商店对一小时内进入该店的顾客人数按分钟记录如下:通常认为,在一段时间内进入商店的人数服从泊松分布。试根据上述数据,检验进入该商店的人数是否服从泊松分布,取吊著l水平α=0.05。分布假设检验04分布假设检验04感谢观看,再见!概率论与数量统计 展开更多...... 收起↑ 资源预览