第7章 假设检验 课件(共60张PPT)-《应用统计学》同步教学(电工版)

资源下载
  1. 二一教育资源

第7章 假设检验 课件(共60张PPT)-《应用统计学》同步教学(电工版)

资源简介

(共60张PPT)
假设检验
第七章
第7章
7.1 假设检验的概念及分类
7.2 检验假设的五个步骤
7.3 几种常见的假设检验
7.4 假设检验决策的风险
假设检验
第7章
在本章,你将学到:
基本的假设检验原理
掌握几种常用的假设检验
每种假设检验过程的前提假设,如何评价他们,以及被违反的后果
正确理解假设检验的两类错误及其关系。
本章教学目的
假设检验
第7章
本章重点和难点
基本的假设检验原理,
关于总体均值、总体比例的假设检验
假设检验的两类错误及其关系。
假设检验
第7章
假设是关于总体
参数的声称(断言):
总体均值
总体比例
例: 一个城市的每月电话账单均值 μ = $42
例: 一个城市成年人拥有手机的比例 π = 0.68
7.1 假设检验的概念及分类
第7章
假设检验
单侧检验
双侧检验
7.1 假设检验的概念及分类
第7章
7.2 假设检验的五个步骤
7.2.1 提出原假设和备择假设
7.2.2 选择显著性水平
7.2.3 确定检验统计量
7.2.4 建立决策准则
7.2.5 做出决策
第7章
检验的声称或断言
例:在美国每个家庭平均有3台电视机
是总体参数,不是样本统计量
7.2.1提出原假设和备择假设 原假设,H0
7.2 假设检验的五个步骤
第7章
首先假设零假设是真的
与无罪,被证明有罪的概念是相似的
引用现状或历史价值
总是包含 “=” , “≤” 或 “ ”
可能被拒绝,也可能不
(续)
7.2 假设检验的五个步骤
原假设,H0
第7章
零假设的对立面
例:在美国每个家庭的电视机不是3台 ( H1: μ ≠ 3 )
向现状发出挑战
不包含 “=” , “≤” 或 “ ”
可能被证明,也可能不
一般是研究者试图去证明的
备择假设,H1
7.2 假设检验的五个步骤
第7章
7.2.2 选择显著性水平
显著性水平是原假设为真时拒绝原假设的概率,通常用希腊字母α表示。
把概率小于α的事件称为小概率事件。α越大,样本统计量的值与总体参数假设值之间的差异成为显著性差异的可能性越大;α越小,这种差异成为显著性差异的可能性越小。
可以将显著性水平α设定为0.05(通常表示为5%),或0.01,或0.10,或介于0与1之间的任意其他数值。
7.2 假设检验的五个步骤
第7章
7.2.3 确定检验统计量
检验统计量是由样本信息确定的用于决定是否拒绝原假设的一个数值。
检验统计量有很多,常用的有Z统计量、t统计量、F统计量和χ2(卡方)统计量,需要根据具体问题和样本情况选择合适的统计量。
7.2 假设检验的五个步骤
第7章
7.2.4建立决策准则
决策准则是原假设被拒绝或原假设不被拒绝的具体条件。接受或拒绝原假设,最终要以显著性水平为依据确定决策准则。决策准则的制定有两种方法:临界值方法和p值方法。
7.2 假设检验的五个步骤
第7章
1、临界值方法
临界值方法,是先把α值转化为一定分布下的临界值(将拒绝原假设和不拒绝原假设的区域的分界点称为临界值),然后计算检验统计量的值,最后把检验统计值与临界值相比较来判断是否拒绝原假设。
7.2 假设检验的五个步骤
第7章
检验统计量的抽样分布
临界值
拒绝域
α/2
拒绝域
α/2
接受域
1-α
正态分布双侧检验接受域与拒绝域示意图
7.2 假设检验的五个步骤
第7章
检验统计量的抽样分布
临界值
拒绝域α
接受域
1-α
正态分布单侧检验接受域与拒绝域示意图-1
7.2 假设检验的五个步骤
第7章
检验统计量的抽样分布
临界值
拒绝域α
接受域
1-α
正态分布单侧检验接受域与拒绝域示意图-2
7.2 假设检验的五个步骤
第7章
2、p值方法
P值是在原假设为真的情况下,使得某一检验统计量等于或者大于样本结果的概率。
在P值检验中,拒绝的决策准则是:
(1)如果P值大于或等于,不拒绝原假设;
(2)如果P值小于,拒绝原假设。
7.2 假设检验的五个步骤
第7章
将检验统计量的值与临界值进行比较,然后做出是否拒绝原假设的决定。
如果计算得到统计量的值落入接受域,则不能拒绝原假设。不拒绝原假设的逻辑是,这样小的值很可能是由偶然性或抽样误差造成的。
如果计算得到统计量的值落入拒绝域,则拒绝原假设。拒绝原假设的推理逻辑是,计算出的值如此之大,不大可能是由抽样误差(偶然性)造成的。
7.2.5 做出决策
7.2 假设检验的五个步骤
第7章
7.3.1 总体均值的假设检验;
7.3.2 总体比例的假设检验;
7.3.3 两个总体均值之差的假设检验;
7.3.4 两个总体比例之差的假设检验。
7.3 几种常见的假设检验
第7章
7.3 几种常见的假设检验
检验的目的是总体均值μ是否等于(或大于等于,或小于等于)某一特定的数值μ0。我们建立如下假设:
7.3.1 总体均值的假设检验
(双侧检验)
(左单侧检验)
(右单侧检验)


第7章
已知
未知
的假设检验
(Z 检验)
(t 检验)
7.3 几种常见的假设检验
Chap 9-第7章把样本统计量(x)转换为ZSTAT检验统计量检验统计量是:σKnownσUnknown 的假设检验 已知 未知(Z检验)(t检验)1.总体均值的Z检验(σ已知)7.3几种常见的假设检验第7章
根据抽样分布原理,当总体服从正态分布N(μ, 2)时,那么从中抽取(重复抽样)容量为n 的样本,其样本均值 服从正态分布 ,而统计量 服从标准正态分布。
对于双侧检验,对给定的显著性水平α,当
时,不能拒绝原假设;
当 时,拒绝原假设而接受备择假设。
7.3 几种常见的假设检验
第7章
【例7-2】一家灯泡厂声称其生产的灯泡的平均寿命为375小时。假定灯泡寿命服从正态分布,总体标准差为25小时。质量控制经理想要确定该厂生产的灯泡寿命是否符合其规定,从中抽取100只灯泡,其平均寿命为379小时。试问在0.05的显著性水平下,灯泡的平均寿命与375小时有无明显差异。
解:由题意知,这是双侧检验问题,可建立如下假设:
由样本均值 和总体标准差 =25,计算得检验统计量Z值为:
在α=0.05显著性水平下, ,由于 ,不能拒绝H0,即没有证据表明灯泡的平均寿命与375小时存在显著差异。
7.3 几种常见的假设检验
第7章
对于左单侧检验,对给定的显著性水平α,当
时,要拒绝原假设而接受备择假设;当
时,则接受原假设。
对于右单侧检验,对给定的显著性水平α,当
时,要拒绝原假设而接受备择假设;当
时,则接受原假设。
7.3 几种常见的假设检验
第7章
【例7-3】某快餐连锁店的平均服务时间是3分钟。为提高其服务质量,快餐店启动了一项质量提升项目,力求缩短平均服务时间。为测试项目实施效果,随机抽取了50名顾客作为样本,其平均等待时间是2.75分钟。假定顾客等待时间服从正态分布,总体标准差为0.5分钟。试问在0.05的显著性水平下,新项目的实施是否明显缩短了平均服务时间。
解:由题意知,这是左单侧检验问题,可建立如下假设:
由样本均值
和总体标准差 =0.5,计算可
得检验统计量Z值为:
7.3 几种常见的假设检验
第7章
在 =0.05时, 。
由于 ,落入了拒绝
域,因此要拒绝原假设而接受备择假设,说明新流程明显缩短了服务时间。
7.3 几种常见的假设检验
第7章
把样本统计量 ( ) 转变为检验统计量tSTAT
X
检验统计量是:
的假设检验
σ Known
σ Unknown
已知
未知
(Z 检验)
(t 检验)
2.总体均值的t检验(σ未知)
7.3 几种常见的假设检验
第7章
在关于均值的假设检验中,当为未知时,检验统计量
对于双侧检验,当 时,接受H0而拒绝H1;若 或 时,则要拒绝H0而接受H1。
对于左单侧检验,当 时,拒绝H0;当 时,则接受H0。对于右单侧检验,当 时,拒绝H0;当 时,则接受H0。
服从自由度为n-1的t分布。
7.3 几种常见的假设检验
第7章
【例7-4】某罐装奶粉的标准重量为900克。现从生产线上抽取16罐为样本,测得平均重量为905克,标准差为20克。试问在0.05的显著性水平下,是否有证据表明每罐奶粉的平均质量不同于900克。
解:由题意知,这是双侧检验问题,可建立如下假设:
由样本均值
和样本标准差 S=20,计算可
得检验统计量t的值为:
查t分布表,在 =0.05,自由度为15时,双侧临界值
,由于
,落入非拒绝域,因此不能拒绝
H0,即没有证据表明每罐奶粉的平均质量不同于900克。
7.3 几种常见的假设检验
第7章
【例7-5】引用【例7-4】,试问在相同的显著性水平下,该奶粉生产商生产的罐装奶粉的平均重量是否偏高。
解:由题意知,这是右单侧检验问题,可建立如下假设:
检验统计量t的值仍为1,
查t分布表,在 =0.05,
,由于
,落入非拒绝域,因此不能拒绝H0,即没有证据表明罐装奶粉的平均重量比规定的重量偏高。
自由度为15时,右单侧临界值
7.3 几种常见的假设检验
第7章
涉及绝对变量
两种可能的结果
具有成功的特性
不具有成功的特性
总体成功数的部分或比例表示成π
7.3.2 总体比例的假设检验
7.3 几种常见的假设检验
第7章
样本的成功数比例表示成p
当nπ和n(1-π)都大于5,p将接近于正态分布,均值和标准差如下:
7.3 几种常见的假设检验
第7章
p的抽样分布接近于正态分布,所以检验统计量是ZSTAT 值:
nπ 5和
n(1-π) 5
p的假设检验
nπ < 5或
n(1-π) < 5
本章不讨论
7.3 几种常见的假设检验
第7章
关于总体比例,可建立如下假设:
(双侧检验)
(左单侧检验)
(右单侧检验)


7.3 几种常见的假设检验
第7章
【例7-6】某快餐店承诺,90%的订餐可以在订单被确认后的10分钟内送到。由100份订单组成一个样本,其中有82份订餐在承诺的时间内送到。试问在0.01的显著性水平下,是否可以说在10分钟内送到的订餐比例小于90%。
解:由题意知,这是左单侧检验问题,可建立如下假设:
样本比例
,检验统计量的值为:
,落入拒绝域,因此
要拒绝H0而接受H1,即有证据表明在10分钟内送到的订餐比例小于90%。
7.3 几种常见的假设检验
第7章
7.3.3 两个总体均值之差的假设检验
设两个总体的均值分别为
,两个总体的方差
分别为
,来自两个总体的样本容量 分别为n1和n2,
样本均值分别为
。检验的目的是验证两个总体的均值
是否相等,或两个总体的均值之差是否为零。
7.3 几种常见的假设检验
第7章
关于总体均值之差的检验,可建立如下假设:
(双侧检验)
(左单侧检验)
(右单侧检验)


7.3 几种常见的假设检验
第7章
1.两个总体均值之差的Z检验
两个总体均值之差的Z检验适用于两个总体服从正态分布且方差已知,或两个总体方差未知但为大样本的情形。此时,统计量为:
当原假设H0:
成立时,若两总体的方差已知,检
验统计量为:
7.3 几种常见的假设检验
第7章
若两个总体方差未知,
当原假设H0:
成立时,检验统计量为:
则用样本方差
若样本容量n1和n2都足够大时,
来估计,
对于双侧检验,当 时,拒绝H0;当 时,接受H0.对于左单侧检验,当 时,拒绝H0;当 时,接受H0.对于右单侧检验,当 时,拒绝H0,当
时,接受H0.
7.3 几种常见的假设检验
第7章
【例7-7】要比较甲乙两个餐饮店的便利窗口的平均服务时间。甲快餐店随机调查50人,平均服务时间为3.5分钟,标准差为0.5分钟;乙快餐店随机调查40人,平均服务时间为3.6分钟,标准差为0.4分钟。试问在0.05的显著性水平下,甲乙两个快餐店的便利窗口的平均服务时间是否有显著差异。
解:由题意知,这是双侧检验问题,可建立如下假设:
根据样本均值
和样本标准差S1=0.5,S2=0.4
计算得检验统计量Z值为:
7.3 几种常见的假设检验
第7章
因此,不能拒绝H0,即没有证据表明两个快餐店的便利窗口的平均服务时间存在显著差异。
,落入接受域,
7.3 几种常见的假设检验
第7章
2.两个总体均值之差的t检验
若两个总体均服从正态分布,方差未知且相等,那么当两个样本容量n1和n2都不够大时,关于两个总体均值之差的假设检验就可以用t检验。此时,下列统计量服从自由度为n1+n2-1的t分布,即:
式中,
表示混合标准差;
来自总体1的样本方差;
表示来自总体2的样本方差。
7.3 几种常见的假设检验
第7章
当原假设成立时,检验统计量为:
对于双侧检验,当 时,拒绝H0;当
时,接受H0.对于左单侧检验,当
时,拒绝H0。当
时,接受H0。

时,拒绝H0。当
时,接受H0。对于右单侧检验,
7.3 几种常见的假设检验
第7章
【例7-8】表7-1给出的是度量AA可充电锂电池和镍氢可充电电池随机样本的单次充电平均持续使用分钟数结果。
表7-1 不同类型电池的单次充电平均使用分钟数
试问在显著性水平 =0.05下,这两种电池的单次充电平均使用分钟数是否不同。假设单次充电使用分钟数总体方差不相等。
锂 电 池 镍 氢 电 池
样本均值 样本标准差 样本容量 96.5 6.5 14 82.9
11.2
18
7.3 几种常见的假设检验
第7章
解:由题意知,这是双侧检验问题,可建立如下假设
根据样本均值
和样本标准差S1=6.5,S2=11.2
计算得检验统计量t的值为:
7.3 几种常见的假设检验
第7章
在 =0.05,自由度14+18-2=30时,
,落入拒绝域,因此拒绝H0,,即认为这两种电
池的单次充电平均使用分钟数存在显著差异。
7.3 几种常见的假设检验
第7章
7.3.4 两个总体比例之差的假设检验
设两个总体的比例分别为
,样本比例分别为
是否为零。可建立如下假设:
。检验两个总体比例是否相等,或两个总体比例之差
(双侧检验)
(左单侧检验)
(右单侧检验)


第7章
当n1和n2都足够大时(n1p1, n1p1(1-p1),n2p2,n2p2(1-p2)均大于5),两个样本比例之差的抽样分布渐近服从正态分布。

由于 未知,要以p1和p2来估计,因此在原假设H0为真时,要以两个样本的合并比例作为两个总体比例的共同估计值,即
当原假设成立时,检验统计量为:
7.3 几种常见的假设检验
第7章
【例7-9】某银行想检验网上银行的青年客户比老年客户的百分比高的假设。在对年龄小于40岁的80名客户调查中,发现有68人使用网上银行的多数服务;对大于等于40岁的100名客户调查中,有72人使用网上银行的多数服务。用 =0.05的显著性水平来检验使用网上银行的青年客户比例较高的假设。
解:由题意知,这是右单侧检验问题,可建立如下假设
根据题中调查数据,可以计算出青年客户使用网上银行的比例为p1=0.85,老年客户使用网上银行的比例为p2=0.72.
合并估计值为
7.3 几种常见的假设检验
第7章
计算得检验统计量Z的值为:
在 =0.05时,Z =1.64。由于Z>Z ,落入了拒绝域,因此要拒绝原假设H0,即有证据表明使用网上银行的青年客户比例较高。
7.3 几种常见的假设检验
第7章
7.4.1 假设检验的两类错误
7.4.2 两类错误的关系
7.4 假设检验决策的风险
第7章
第一类错误
拒绝真实的零假设
考虑一类严重的错误
发生第一类错误的概率
称作统计检验的显著性水平
研究者预先设定的
第二类错误
没有拒绝错误的零假设
发生第二类错误的概率β
7.4.1 假设检验的两类错误
7.4 假设检验决策的风险
第7章
可能出现的假设检验结果 真实情况 统计决策 H0为真 H0为假
不拒绝H0 正确决策 概率1 - α 第二类错误
概率β
拒绝H0 第一类错误 概率α 正确决策
概率1 - β
(续)
假设检验的两类错误
7.4 假设检验决策的风险
第7章
犯第一类错误的概率α又被称为统计检验的显著性水平。
显著性水平通常取0.01,0.05或0.1. 取哪个值取决于犯第一类错误的代价。
α确定之后即可知道拒绝域的大小,从而能够确定将拒绝域和非拒绝域区别开来的临界值。
(续)
假设检验的两类错误
7.4 假设检验决策的风险
第7章
置信系数 (1-α) :是当H0为真且不应该被拒绝的情况下,进行假设检验没有拒绝H0的概率。
假设检验的置信水平 是(1-α)*100%.
β风险:犯第二类错误的概率。它依赖于总体参数的假设值和真实值之间的差别。
统计检验能力 (1-β) 是当H0是假的时候拒绝的概率
(续)
假设检验的两类错误
7.4 假设检验决策的风险
第7章
第一类与第二类错误不可能同时发生
第一类错误仅在H0是真的时候发生
第二类错误仅在H0是假的时候发生
如果第一类错误的概率 ( ) ,
那么第二类错误的概率 ( β )
7.4.2两类错误的关系
7.4 假设检验决策的风险
第7章
所有其它条件不变,
β

当 σ
当 n
β
β
β
当假设参数和真实值 之间的差别
影响第二类错误的因素
7.4 假设检验决策的风险
第7章
1.什么是原假设和备择假设?
2.假设检验的基本原理是什么?
3.假设检验的临界值方法和p值方法的区别?
4.假设检验的两类错误是什么?有何关系?

展开更多......

收起↑

资源预览