第七章 假设检验 课件(共59张PPT)- 《统计学(第二版) 》同步教学(人民大学版)

资源下载
  1. 二一教育资源

第七章 假设检验 课件(共59张PPT)- 《统计学(第二版) 》同步教学(人民大学版)

资源简介

(共59张PPT)
统 计 学
第七章 假设检验
第七章 假设检验
假设检验:
也称显著性检验。
是抽样推断中运用甚广的一种统计推断方法。
基本步骤:
对研究总体的参数或分布形式提出假设
根据抽样分布原理,利用样本实际资料计算相关统计量的取值
检验所作假设是否合理
分类:
参数假设检验,简称参数检验;
非参数检验或者自由分布检验。
第七章 假设检验
§1 假设检验基本问题
§2 一个总体参数的假设检验
§3 两个总体参数的假设检验
§1 假设检验基本问题
§1.1 假设检验的基本原理
§1.2 假设检验的步骤
§1.3 关于 值
§1.4 两类错误
§1.5 假设的建立问题
§1.1 假设检验的基本原理
统计思想:
小概率原理
反证法思想
主要表现:
1、主要理论依据是“小概率事件在现实中是不可能发生的”
这一概率思想。
2、采用的逻辑推理方法是反证法。
§1.2 假设检验的步骤
1.原假设与备择假设
原假设:待检验的假设,也称为零假设。
备择假设:原假设的对立面,否定原假设后可供选择的假设。
例:某种饮料包装上注明“净含量500ml”,是否可信?
该假设可以表达为:
其中,字母 表示假设,下标0表示原假设,下标1表示备择假设。
§1.2 假设检验的步骤
零假设与备择假设并不一定完全对称。
假设的形式:
双侧检验:
单侧检验
左侧检验:
(或者 ≥ ; )
右侧检验:
(或者 ≤ ; )
§1.2 假设检验的步骤
2.检验统计量
检验使用的统计量称为检验统计量
检验统计量的构造形式为:
§1.2 假设检验的步骤
3.显著性水平 与临界值
显著性水平 是 为真却被拒绝的概率,它也是假设检验统计思想中所指的小概率。
给定了显著件水平 ,可由统计量的概率分布确定其临界值,临界值将统计量的所有可能取值区间分为两个互不相交的部分,即原假设的拒绝域和接受域。
§1.2 假设检验的步骤
4.接受域与拒绝域
接受域:使原假设不能被拒绝的统计量所在区域。
拒绝域:使原假设能够被拒绝的统计量所在区域。也称否定域。
这两个区域是互补的关系,即检验统计量的实际值必落入且只能落入其中一个区域,它们之间的分界线即临界值。
对于不同形式的假设, 的接受域和拒绝域不同。
§1.2 假设检验的步骤
如果是只需判断有无显著差异的情况,则采用双侧检验。
双侧检验的接受域为检验统计量分布曲线上两临界值之间的区域,而拒绝域分别位于两端;
§1.2 假设检验的步骤
左侧检验
右侧检验
左侧检验的拒绝域位于接受域的左侧;
右侧检验的拒绝域位于接受域的右侧。
如果需要判断参数是否偏大(偏小)的情况,则采取左侧(右侧)检验。
§1.2 假设检验的步骤
5.假设检验的具体步骤
(1)建立假设。
(2)确定检验统计量,并确定该统计量的分布情况,
然后依据样本信息计算该检验统计量的实际值。
(3)设定检验的显著性水平,并确定临界值。
(4)将检验统计量的实际值与临界值进行比较,做出
是否拒绝原假设的决策。
§1.3 关于p值
值:当零假设为真时,所得到样本观察结果或更极端结果的概率。
值越小,样本观测结果出现的可能性越小,拒绝原假设理由
就越充分。
值能够反映出某一样本观测结果与原假设不一致的的精确程
度。
利用 值进行假设检验的准则:
将 值与事先确定的检验显著性水平 进行比较,
若 值小于 ,小概率事件发生,拒绝原假设;
若 值大于 ,小概率事件未发生,不能拒绝原假设。
§1.4 两类错误
进行假设检验时会犯两种错误:
①零假设正确却被拒绝,称之为“第I类错误”;
②零假设不正确却没有被拒绝,称之为“第II类错误”。
§1.4 两类错误
犯第I类错误的概率记为 ,即前面提到的显著性水平。
犯第II类错误的概率记为 。
在一定样本容量下,减少 会引起 增大,减少 会引起 的增大。
假设检验中人们普遍执行同一准则:
首先控制弃真错误( 错误)。
§1.5 假设的建立问题
实践中一般采取“原假设处于被保护地位”的原则,即将没有充分理由便不能拒绝的命题作为原假设,其对立面作为备择假设。
一般将已有的、固有的、经验的命题作为原假设,将想要证明成立的命题作为备择假设,这样做可以有效减小犯第一类错误的概率。
§2 一个总体参数的假设检验
§2.1 总体均值的假设检验
§2.2 正态总体方差的假设检验
§2.3 总体比例的假设检验
§2.1 总体均值的假设检验
§2.1.1 大样本
样本均值 的抽样分布均为正态分布,其数学期望为总体均值 ,方差为 ,其中 为总体方差。
检验统计量 服从标准正态分布,即:
§2.1 总体均值的假设检验
根据检验统计量计算公式计算检验统计量样本值 ,当显著水平为 时,查 分布表:
在双侧检验中,如果 ≥ ,则拒绝原假设 ;反之,则不能拒绝原假设。
在左侧检验中,如果 ,则拒绝原假设;反之,则不能拒绝原假设。
在右侧检验中,如果 ,则拒绝原假设;反之,则不能拒绝原假设。
§2.1 总体均值的假设检验
【例7.1】某车间用一台包装机包装成品食盐,已知袋装食盐的净重服从正态分布,且当机器正常时,其均值为0.5公斤,标准差为0.01公斤。某日开工后要检验包装机是否正常运作,随机抽取了40袋,称得净重如下(单位:公斤):
请检验机器是否处于正常运作状态?( )
§2.1 总体均值的假设检验
解:首先设立原假设与备择假设:

已知该总体服从正态分布及总体的标准差,故本题可以采用
检验。
由题中样本数据及已知条件得到:
, , , , ,
本题属于双侧检验,根据正态分布,有:
不能拒绝原假设,即认为包装机器运作正常。
§2.1 总体均值的假设检验
§2.1.2 小样本
1.正态总体, 已知
采用统计量 对样本均值进行检验
2.正态总体, 未知
检验统计量 服从自由度为( )的 分布,由于 未知,一般用样本标准差 来代替总体标准差 ,即:
§2.1 总体均值的假设检验
对于给定的显著性水平 ,查 分布表:
在双侧检验中,当 时,拒绝原假设;反之,则不能拒绝原假设。
在左侧检验中,当 时,拒绝原假设;反之,则不能拒绝原假设。
在右侧检验中,当 时,拒绝原假设;反之,则不能拒绝原假设。
§2.1 总体均值的假设检验
【例7.2】某灯具厂生产一种白炽灯泡,根据长期观察,得知该灯泡使用寿命服从正态分布,平均使用时间为1500小时,标准差为10小时。现准备采用新技术延长灯泡寿命,引用该生产技术后抽检了16个灯泡进行试验,使用寿命分别为:
试以0.05的显著性水平判断该种新技术是否显著提高灯泡的使用寿命。
§2.1 总体均值的假设检验
解:显然,本题属于单侧检验(右侧检验),首先设立原假设与备择假设:

由题中样本数据及已知条件得到:
, , , ,
检验统计量
因此,拒绝原假设 ,即认为该种新技术显著提高灯泡的使用寿命。
§2.1 总体均值的假设检验
【例7.3】(续例7.1)若其它条件不变,但抽查样本量减为10,且事先并不知道机器正常时的标准差信息。试检验机器是否处于正常运作状态?( )
解:首先设立原假设与备择假设:

由题中样本数据及已知条件得到:
, , , ,
因此,不能拒绝原假设 ,即不能认为包装机器运作不正常。
§2.2 正态总体方差的假设检验
检验方法—— 检验法。
原假设形式为:
双侧检验: ;
左侧检验: ;
(或者 ≥ ; )
右侧检验: ;
(或者 ≤ ; )
检验统计量为:
其中, 为样本方差, 为待检验的假设方差。
§2.2 正态总体方差的假设检验
对于给定的显著性水平 ,查 分布表:
在双侧检验中,首先确定临界值 和 ,
当 或者 时,拒绝原假设;
反之,则不能拒绝原假设。
在左侧检验中,确定临界值 ,
当 时,拒绝原假设;
反之,则不能拒绝原假设。
在右侧检验中,确定临界值 ,
当 时,拒绝原假设;
反之,则不能拒绝原假设。
§2.2 正态总体方差的假设检验
【例7.4】根据某饮料厂长期生产资料可知:该厂饮料灌装线灌装的饮料净含量服从正态分布,标准差为0.20ml。某天进行生产线检查,从灌装线上随机抽取20瓶饮料,测得样本标准差为0.35ml。试判断该条灌装线的波动与平日有无显著差异?( )
解:本题为双侧检验,首先设立原假设与备择假设:

根据条件已知: , ,
则检验统计量
查 分布表,由于 ,拒绝原假设,即该条灌装线的波动与平日有显著差异。
§2.3 总体比例的假设检验
总体服从二项分布,样本量 足够大且满足 时,比例
的抽样分布可用正态分布近似。
的数学期望为 ,
的方差为 ,
样本比例经标准化后的随机变量则服从标准正态分布,即
§2.3 总体比例的假设检验
检验未知的总体比例 等于某一假设值
设 ; (或 ; )
检验统计量 逼近正态分布,因未知 的真实值,用样本比例 来代替 ,因此检验统计量调整为:
其中, 为待检验的总体比例。
§2.3 总体比例的假设检验
【例7.5】某研究机构估计本市居民家庭的电脑拥有率为75%。现随机抽查了200个家庭,其中157个家庭拥有电脑。试问估计的该市居民家庭电脑拥有率是否可信? ( )
解:首先根据题意建立原假设与备择假设:
; ( )
, , ,
不能拒绝原假设,即认为该研究机构估计的该市居民家庭电脑拥有
率是可信的。
§3 两个总体参数的假设检验
根据前提条件不同、检验目标不同等因素,两总体参数假设检验的统计量选择情况可以由下图来示意:
§3 两个总体参数的假设检验
§3.1 独立样本均值的假设检验
§3.2 两独立样本方差的假设检验
§3.3 两匹配样本的假设检验
§3.4 两独立样本比例之差的假设检验
§3.1 独立样本均值的假设检验
三种情形:
原假设: 或
备择假设: 或
基于这个假设下,分别讨论各种情形下的检验过程。
§3.1 独立样本均值的假设检验
1. 、 已知( 检验法)
检验统计量:
其中, 、 分别为两个总体的样本均值; 、 分别为两个总体的方差; 、 分别为两个总体的样本量。
§3.1 独立样本均值的假设检验
【例7.6】为比较甲、乙两种降血糖药物的药效,将20名病情相仿的患者分成两组,每组10人,设服药后维持的药效时间分别服从正态分布 和 ,检测数据如下(单位:小时),问两种降血糖药物的疗效有无显著差异?( )
§3.1 独立样本均值的假设检验
解:本题中 、 已知,且两组样本是独立的。
提出原假设与备择假设:


已知: , , , , , ,
计算得到检验统计量的样本值:
由于 ,不能拒绝原假设,即在显著性
水平 条件下,甲药物与乙药物药效时间均值之间
无显著性差异。
§3.1 独立样本均值的假设检验
2. 、 未知,但 ( 检验法)
检验统计量:
其中, 、 分别为两个总体的样本均值; 、 分别为两个总体的样本量; 、 分别为两个总体的样本方差。
§3.1 独立样本均值的假设检验
【例7.7】若已知A、B两种降血压药物维持的药效时间服从正态分布 和 ,其中 具体值未知。问在显著性水平 下,这两种降血压药物的疗效时间有无显著差异?
§3.1 独立样本均值的假设检验
解:本题中 、 未知,但 ,且两组样本是独立的。
原假设与备择假设不变,由于总体方差未知,所以选用统计量,由题中样本数据:
, , , , , ,
计算得到检验统计量值:
由于 ,因此不能拒绝原假设,即在显著性水平 条件下,A药物与B药物药效时间均值之间无显著性差异。
§3.1 独立样本均值的假设检验
3. 、 未知,样本量充分大( 检验法)
检验统计量:
注:用样本标准差来代替总体标准差。
其中, 、 分别为两个总体的样本均值; 、 分别为两个总体的样本量; 、 分别为两个总体的样本方差。
§3.1 独立样本均值的假设检验
4. 、 未知,小样本( 检验法)
检验统计量:
其中, 、 分别为两个总体的样本均值; 、 分别为两个总体样本
量; 、 分别为两个总体的样本方差。
§3.2 两独立样本方差的假设检验
用于检验两总体的某项指标波动幅度即方差是否相等,采用检验法,此类假设检验的原假设与备择假设为:
原假设: 或者
备择假设: 或者
§3.2 两独立样本方差的假设检验
检验两个总体方差是否相等,选用统计量 :
其中, 、 分别为两个总体的方差; 、 分别为两个总体的样本方差; 、 分别为两个总体的样本量。
根据样本数据计算检验统计量的值,其计算的基本公式为:
§3.2 两独立样本方差的假设检验
规定显著性水平 后,将与临界点值 相比较,根据比较结果进行决策:
在双侧检验中,若 或者 ,则拒绝原假设 ,即两个总体的方差存在显著差异;反之,则不能拒绝原假设,即两总体方差不存在显著差异。
在左侧检验中,若 ,则拒绝原假设;反之,则不能拒绝原假设。
在右侧检验中,若 ,则拒绝原假设;反之,则不能拒绝原假设。
§3.2 两独立样本方差的假设检验
【例7.8】(续例7.7)样本保持不变,问在显著性水平
下,这两种降压药物疗效时间的方差有无显著差异?
解:本题中两组样本试验是独立的,由题意,原假设与备择假
设为: 或

由题中样本数据及已知条件:
, , , ,
计算得到检验统计量值:
由于 ,因此不能拒绝原假
设,即在显著性水平 条件下,A药物与B药物药效时
间方差之间无显著性差异。
§3.3 两匹配样本的假设检验
匹配样本的检验的思想出发点在于对试验前后样本的差值情况进行检验,如果两匹配总体均值不存在显著差异,则匹配样本之差的均值应该与零不存在显著差异。
下面以两组匹配样本 、 为例进行说明。
§3.3 两匹配样本的假设检验
假设两匹配样本均值分别为 和 。则:
首先建立原假设与备择假设:

对两匹配总体进行差值处理,得到新总体 : ,设其均值为 。则问题转化为考察 的均值检验问题,即原假设与备择假设转化为:

显然,对两匹配样本进行差值处理后得到的
: ( )是来自 的一个样本,接下来的分析与一个总体参数的均值检验基本相同。
§3.3 两匹配样本的假设检验
【例7.9】分别检测10名癌症患者化疗前和化疗后1毫升尿样中的尿蛋白含量,得到数据如下(单位:mg/ml):
试在 的显著性水平下,分析化疗是否对病人尿蛋白含量有显著影响?
§3.3 两匹配样本的假设检验
解:根据题意,首先确定原假设与备择假设:

对原始数据进行差值处理, : ( )。得到两匹配样本的差值数据:
则问题转化为考察 的均值检验问题,即原假设与备择假设转化为: ;
§3.3 两匹配样本的假设检验
根据差值数据及其他已知条件可以得到: , 。
采用 检验统计量:
由条件 , 得到:
显然, ,因此拒绝原假设,即认为化疗前后的尿蛋白含量均值不等,化疗对病人尿蛋白含量有显著影响作用。
§3.4 两独立样本比例之差的假设检验
§3.4.1 检验两个总体比例是否相等
检验两总体比例是否相等等价于检验两总体比例之差是否为零,因此,该类检验的原假设与备择假设为:
(或 )
(或 )
检验统计量为:
§3.4 两独立样本比例之差的假设检验
用公共比例来近似替代真实值,即:
其中, 和 分别是在两样本中具有某种特征单位的个数, 和 分别表示两样本量。
因此,检验统计量就转换为:
其中, 。
§3.4 两独立样本比例之差的假设检验
【例7.10】现要比较两小区电脑普及情况,某调查公司通过抽样调查得到下列数据:在甲小区被调查的160户中有80户拥有电脑;在乙公司被调查的180户中有93户拥有电脑。此外,该调查公司在每个小区的抽样比都小于5%。在的置信水平 下,可以判定两个小区电脑普及率不同吗?
§3.4 两独立样本比例之差的假设检验
解:首先建立原假设与备择假设:

根据已知条件得到: ,
检验统计量值为:
当 时,临界值为 ,显然 ,因此不能拒绝原假设,即不能拒绝两个小区电脑普及率相同这个假设。
§3.4 两独立样本比例之差的假设检验
§3.4.2 检验两个总体比例之差为非零常数
检验两总体比例之差为一非零常数,则原假设与备择假设变为:
, ( )
检验统计量为:
由于现实中真正的总体比例 和 往往是未知的,因此在
这样的情况下需要用样本数据来近似替代真实值,此时检
验统计量调整为:
§3.4 两独立样本比例之差的假设检验
【例7.11】某厂质验人员认为该厂A车间产品优质品率比B车间高5%,现从A车间和B车间分别抽取两个独立随机样本进行检验,很到如下数据:在A车间抽检的150个产品中有120个优质品,在B车间抽检的150个产品中有115个优质品。问根据这些数据,能否相信质检人员的说法。( )
解:首先建立原假设与备择假设:

根据已知条件得到: ,
本题属于右侧检验,当 时,临界值为 ,显
然 ,因此不能拒绝原假设,不能支持该厂质检人员的说法。

展开更多......

收起↑

资源预览