7假设检验课件（共79张PPT）-《应用统计学（第4版）》同步教学（人民邮电版）

资源简介

(共97张PPT)
应用统计学
Applied Statistics
第01章绪论
第02章统计数据的收集
第03章统计数据的整理
第04章描述性统计
第05章抽样
第06章参数估计
第07章假设检验
第08章方差分析
第09章时间序列分析
第10章统计指数
第11章相关回归分析
授课内容
序号实验项目内容提要实验类型学时分配主要仪器设备实验地点备注
1 统计工作过程实验安排学生自己设计、印制、发放、整理、分析统计调查表设计性实验 2 不限
2 Excel在统计分析中的应用应用Excel进行统计计算和分析验证性实验 20 计算机计算机房计算机装有Excel软件，并安装“数据分析”功能；计算器具备单、双变量统计功能
3 统计学知识综合运用分别用计算器、Excel、和手工进行相关与回归分析、时间数列分析及推断统计综合性实验 2 计算机、计算器计算机房实验项目一览表
第七章假设检验
第七章假设检验
第七章假设检验
第七章假设检验
理论部分
第七章假设检验
是推断统计的重要内容之一。它是根据原始资料，在未知总体参数的情况下，先对总体参数及某一随机变量服从某种分布的假设，然后利用样本资料计算相关的检验统计量，在一定的概率下，以可接受的风险来判断估计数值与总体数值是否存在着显著的差异。
假设检验
推断统计
参数估计
假设检验
通过样本统计量估计总体参数
对所估计的总体首先提出一个假设，然后通过样本数据去推断是否拒绝这一假设。
例:某食品厂用自动装罐头机装罐头食品,每罐头标准重量为0.5公斤,按以往的生产经验,标准差为0.01公斤.每隔一定时间需要检查机器工作情况.现随机抽取10罐,称其重量为: 0.498,0.512,0.503,0.510,0.497,0.489,0.506,0.500,0.499,0.505.假定重量服从正态分布,试问机器工作是否正常
H0：μ= μ0=0.5
H1：μ≠μ0=0.5
假设检验
推断统计
参数估计
通过样本统计量估计总体参数
对所估计的总体首先提出一个假设，然后通过样本数据去推断是否拒绝这一假设。
假设检验
假设检验
参数检验
非参数检验
总体分布形式已知，检验的目的是对总体的参数及其性质作出判断
总体分布形式未知，需对总体分布函数形式或总体之间的关系进行判断
第Ⅰ类错误：
弃真
原假设为正确时拒绝原假设
第Ⅰ类错误：
弃真
原假设为错误时未拒绝原假设
第Ⅱ类错误：
取伪
犯第Ⅰ错误的概率是 α
犯第Ⅱ错误的概率是 β
现实的做法：
对犯第Ⅰ错误的概率α加以控制
第Ⅰ类错误：
弃真
α——显著性水平
第Ⅱ类错误：
取伪
犯第Ⅰ错误的概率是 α
犯第Ⅱ错误的概率是 β
现实的做法：
对犯第Ⅰ错误的概率α加以控制
尽量保证弃真错误控制在一定范围内的假设检验叫显著性检验。就是这个假设显著错误的时候，才丢弃，没有显著错误的假设就接受，显著错误的衡量标准就是发生概率低于显著水平。
统计显著性
在假设检验中，如果样本提供的证据拒绝原假设，我们说检验的结果是显著的，如果不拒绝原假设，我们则说结果是不显著的。
统计显著性
一项检验在统计上是“显著的”，意思是指：这样的(样本)结果不是偶然得到的，或者说，不是靠机遇能够得到的。
小概率事件指在一次试验中几乎不会发生的事件。例如，只有0.01，即指平均每100次观察中只出现1次。
以样本资料为依据进行检验，所以样本统计量的取得就相当于这样一次试验。而在取得样本的一次试验中，小概率一般是很难（或不可能）出现的。
如果在原假设中小概率事件居然在取得样本的一次试验中发生了，则就有理由怀疑原来对该事件提出的假设的正确性，从而拒绝原假设成立。小概率值记为α，称为检验水平或显著性水平，一般取α=0.05(或0.01）。
双侧检验的拒绝域
H0
临界值
临界值
a/2
a/2
拒绝H0
拒绝H0
1 -
置信水平
拒绝域
非拒绝域
拒绝域
双侧检验的拒绝域
H0
临界值
临界值
a /2
a /2
样本统计量
拒绝H0
拒绝H0
1 -
置信水平
双侧检验的拒绝域
H0
临界值
临界值
a /2
a /2
样本统计量
拒绝H0
拒绝H0
1 -
置信水平
双侧检验的拒绝域
H0
临界值
临界值
a /2
a /2
样本统计量
拒绝H0
拒绝H0
1 -
置信水平
单侧检验的拒绝域——左侧检验
H0
临界值
a
拒绝H0
1 -
置信水平
样本统计量
单侧检验的拒绝域——左侧检验
H0
临界值
a
样本统计量
拒绝H0
1 -
置信水平
单侧检验的拒绝域——右侧检验
H0
临界值
a
样本统计量
拒绝H0
1 -
置信水平
单侧检验的拒绝域——右侧检验
H0
临界值
a
样本统计量
1 -
置信水平
拒绝H0
用P值进行决策
/ 2
/ 2
Z
拒绝H0
拒绝H0
0
临界值
计算出的样本统计量
计算出的样本统计量
临界值
1/2 P 值
1/2 P 值
用P值进行决策
0
临界值
a
样本统计量
拒绝H0
1 -
置信水平
计算出的样本统计量
P 值
用P值进行决策
0
临界值
a
拒绝H0
1 -
置信水平
计算出的样本统计量
P 值
总体
抽取随机样本
均值
x = 20

我认为人口的平均年龄是50岁
提出假设
拒绝假设
别无选择!
作出决策
第七章假设检验
第七章假设检验
假定条件:
正态总体或非正态总体大样本(n>30)
使用z检验统计量
【例】一种罐装饮料采用自动生产线生产，每罐的容量是255ml，标准差为5ml。为检验每罐容量是否符合要求，质检人员在某天生产的饮料中随机抽取了40罐进行检验，测得每罐平均容量为255.8ml。取显著性水平 =0.05 ，检验该天生产的饮料容量是否符合标准要求？
绿色
健康饮品
绿色
健康饮品
255
255
双侧检验
H0 ： = 255
H1 ： 255
= 0.05
n = 40
临界值(c):
z
0
1.96
-1.96
0.025
拒绝 H0
拒绝 H0
0.025
检验统计量:
决策:
结论:
不拒绝H0（p=0.3125）
样本提供的证据还不足以推翻“该天生产的饮料符合标准要求 ”的看法
【例】一种机床加工的零件尺寸绝对平均误差为1.35mm。生产厂家现采用一种新的机床进行加工以期进一步降低误差。为检验新机床加工的零件平均误差与旧机床相比是否有显著降低，从某天生产的零件中随机抽取50个进行检验。利用这些样本数据，检验新机床加工的零件尺寸的平均误差与旧机床相比是否有显著降低？ ( =0.01)
50个零件尺寸的误差数据 (mm) 1.26 1.19 1.31 0.97 1.81
1.13 0.96 1.06 1.00 0.94
0.98 1.10 1.12 1.03 1.16
1.12 1.12 0.95 1.02 1.13
1.23 0.74 1.50 0.50 0.59
0.99 1.45 1.24 1.01 2.03
1.98 1.97 0.91 1.22 1.06
1.11 1.54 1.08 1.10 1.64
1.70 2.37 1.38 1.60 1.26
1.17 1.12 1.23 0.82 0.86
检验统计量:
拒绝H0(p=0.004579)
新机床加工的零件尺寸的平均误差与旧机床相比有显著降低
决策:
结论:
-2.33
z
0
拒绝H0
0.01
H0 ： 1.35
H1 ： <1.35
= 0.01
n = 50
临界值(c):
假设双侧检验左侧检验右侧检验
假设形式 H0 ：m =m0 H1 ：m m0 H0 ：m m0 H1 ：m H1：m >m0
统计量已知未知拒绝域
P值决策拒绝H0
检验统计量
假定条件:
总体服从正态分布
小样本(n<30)
【例】一种汽车配件的平均长度要求为12cm，高于或低于该标准均被认为是不合格的。汽车生产企业在购进配件时，通常是经过招标，然后对中标的配件提供商提供的样品进行检验，以决定是否购进。现对一个配件提供商提供的10个样本进行了检验。假定该供货商生产的配件长度服从正态分布，在0.05的显著性水平下，检验该供货商提供的配件是否符合要求？
10个零件尺寸的长度 (cm) 12.2 10.8 12.0 11.8 11.9
12.4 11.3 12.2 12.0 12.3
H0 ： =12
H1 ： 12
= 0.05
df = 10 - 1= 9
临界值(c):
检验统计量:
不拒绝H0(p=0.499538)
样本提供的证据还不足以推翻“该供货商提供的零件符合要求 ”的看法
决策：
结论：
t
0
2.262
-2.262
0.025
拒绝 H0
拒绝 H0
0.025
用置信区间进行检验
双侧检验
1. 求出双侧检验均值的置信区间
2. 若总体的假设值 0在置信区间外，拒绝H0
用置信区间进行检验
左侧检验
1. 求出置信区间
2.若总体的假设值 0在置信区间外，拒绝H0
用置信区间进行检验
右侧检验
1. 求出置信区间
2.若总体的假设值 0在置信区间外，拒绝H0
【例】一种袋装食品每包的标准重量应为1000g。现从生产的一批产品中随机抽取16袋，测得其平均重量为991g。已知这种产品重量服从标准差为50g的正态分布。试确定这批产品的包装重量是否合格？( = 0.05)
H0: = 1000
H1: 1000
= 0.05
n = 16
临界值(s):
Z
0
1.96
-1.96
.025
拒绝 H0
拒绝 H0
.025
置信区间为
决策:
结论:
假设的μ0 =1000在置信区间内，不拒绝H0
没有证据表明这批产品的包装重量不合格
是否已知
小
样本容量n
大
是否已知
否
t 检验
否
z 检验
是
z 检验
是
z 检验
假定条件：
总体服从二项分布
可用正态分布来近似(大样本)
使用z检验统计量
【例】一种以休闲和娱乐为主题的杂志，声称其读者群中有80%为女性。为验证这一说法是否属实，某研究部门抽取了由200人组成的一个随机样本，发现有146个女性经常阅读该杂志。分别取显著性水平 =0.05和 =0.01 ，检验该杂志读者群中女性的比例是否为80%？它们的P值各是多少？
双侧检验
H0 ： = 80%
H1 ： 80%
= 0.05
n = 200
临界值(c):
检验统计量:
拒绝H0 (p = 0.013328 < = 0.05)
该杂志的说法并不属实
决策:
结论:
z
0
1.96
-1.96
0.025
拒绝 H0
拒绝 H0
0.025
H0 ： = 80%
H1 ： 80%
= 0.01
n = 200
临界值(c):
检验统计量:
不拒绝H0 (p = 0.013328 > = 0.01)
样本提供的证据还不足以推翻“该杂志声称读者群中有80%为女性”的看法
决策:
结论:
z
0
2.58
-2.58
0.005
拒绝 H0
拒绝 H0
0.005
假定条件：
假设总体近似服从正态分布
使用 2检验统计量
假设双侧检验左侧检验右侧检验
假设形式 H0 ： 2= 02 H1： 2 0 H0 ： 2 02 H1 ： 2 < 02 H0 ： 2 02
H1： 2 > 02
统计量拒绝域
P值决策拒绝H0
朝日
BEER
朝日
BEER
朝日
BEER
朝日
【例】啤酒生产企业采用自动生产线灌装啤酒，每瓶的装填量为640ml，但由于受某些不可控因素的影响，每瓶的装填量会有差异。此时，不仅每瓶的平均装填量很重要，装填量的方差同样很重要。如果方差很大，会出现装填量太多或太少的情况，这样要么生产企业不划算，要么消费者不满意。假定生产标准规定每瓶装填量的标准差不应超过和不应低于4ml。企业质检部门抽取了10瓶啤酒进行检验，得到的样本标准差为s=3.8ml。试以0.10的显著性水平检验装填量的标准差是否符合要求？
H0 ： 2 = 42
H1 ： 2 42
= 0.10
df = 10 - 1 = 9
临界值(s):
统计量:
不拒绝H0(p=0.9563)
样本提供的证据还不足以推翻“装填量的标准差不符合要求”的看法

2
0
16.9190
3.32511
/2 =0.05
决策:
结论:
第七章假设检验
第七章假设检验
假定条件：
两个样本是独立的随机样本
正态总体或非正态总体大样本(n1 30和 n2 30)
检验统计量
假设双侧检验左侧检验右侧检验
假设形式 H0 ：m 1-m 2=0 H1 ：m 1-m 2 0 H0 ：m 1-m 2 0 H1 ：m 1-m 2<0 H0 ：m 1-m 2 0
H1 ：m 1-m 2>0
统计量 12 ， 22 已知 12 ， 22 未知拒绝域
P值决策拒绝H0
【例】某公司对男女职员的平均小时工资进行了调查，独立抽取了具有同类工作经验的男女职员的两个随机样本，并记录下两个样本的均值、方差等资料如右表。在显著性水平为0.05的条件下，能否认为男性职员与女性职员的平均小时工资存在显著差异？
两个样本的有关数据男性职员女性职员
n1=44 n2=32
=75 =70
=64 =42.25
H0 ： 1- 2 = 0
H1 ： 1- 2 0
= 0.05
n1 = 44，n2 = 32
临界值(c):
检验统计量:
决策:
结论:
拒绝H0(p=0.002682)
该公司男女职员的平均小时工资之间存在显著差异
z
0
1.96
-1.96
0.025
拒绝 H0
拒绝 H0
0.025
检验统计量
假定条件：
两个样本是独立的小样本
两个总体都服从正态分布

检验统计量
假定条件：
两个样本是独立的小样本
两个总体都服从正态分布

检验统计量
假定条件：
两个样本是独立的小样本
两个总体都服从正态分布

样本容量相等，即n1=n2=n
【例】为检验两种方法组装产品所需时间的差异，分别对两种不同的组装方法各随机安排12个工人，每个工人组装一件产品所需的时间(单位：min)下如表。假定两种方法组装产品的时间服从正态分布，但方差未知且不相等。取显著性水平0.05，能否认为方法1组装产品的平均时间明显地高于方法2？
两个方法组装产品所需的时间方法1 方法2 28.3 36.0 27.6 31.7
30.1 37.2 22.2 26.0
29.0 38.5 31.0 32.0
37.6 34.4 33.8 31.2
32.1 28.0 20.0 33.4
28.8 30.0 30.2 26.5
2
1
H0 ： 1- 2 <= 0
H1 ： 1- 2 > 0
= 0.05
n1 =n2 = 12
检验统计量:
决策:
结论:
给定显著性水平0.05，t0.05(22)=1.717,t=2.156>t0.05(22),落入拒绝域，因此拒绝H0
方法1组装产品的平均时间明显地高于方法2
=(32.5-28.8)/((15.996+19.358)/12)^2
=2.1556
S12=15.996
S22=19.358
假定条件：
两个总体都服从二项分布
可以使用正态分布来近似
检验统计量
假设双侧检验左侧检验右侧检验
假设形式 H0 ： 1- 2=0 H1 ： 1- 2 0 H0 ： 1- 2 0 H1 ： 1- 2<0 H0 ： 1- 2 0
H1 ： 1- 2>0
统计量拒绝域
P值决策拒绝H0
【例】一所大学准备采取一项学生在宿舍上网收费的措施，为了解男女学生对这一措施的看法是否存在差异，分别抽取了200名男学生和200名女学生进行调查，其中的一个问题是：“你是否赞成采取上网收费的措施？”其中男学生表示赞成的比例为27%，女学生表示赞成的比例为35%。调查者认为，男学生中表示赞成的比例显著低于女学生。取显著性水平 =0.05，样本提供的证据是否支持调查者的看法？
2
1
net
net
H0 ： 1- 2 0
H1 ： 1- 2 < 0
= 0.05
n1=200 , n2=200
临界值(c):
检验统计量:
决策:
结论:
拒绝H0(p= 0.041837 < = 0.05)
样本提供的证据支持调查者的看法
-1.645
Z
0
拒绝域

假定条件：
两个总体都服从正态分布，且方差相等
两个总体相互独立
检验统计量
F
F1-
F
拒绝H0
方差比F检验示意图
拒绝H0
假设双侧检验左侧检验右侧检验
假设形式 H0： 12/ 22=1 H1 ： 12/ 22 1 H0： 12/ 22 1 H1 ： 12/ 22<1 H0 ： 12/ 22 1
H1 ： 12/ 22>1
统计量拒绝域 P值决策拒绝H0
【例】一家房地产开发公司准备购进一批灯泡，公司打算在两个供货商之间选择一家购买。这两家供货商生产的灯泡平均使用寿命差别不大，价格也很相近，考虑的主要因素就是灯泡使用寿命的方差大小。如果方差相同，就选择距离较近的一家供货商进货。为此，公司管理人员对两家供货商提供的样品进行了检测，得到的数据如右表。检验两家供货商灯泡使用寿命的方差是否有显著差异 ( =0.05)
两家供货商灯泡使用寿命数据样本1 650 569 622 630 596
637 628 706 617 624
563 580 711 480 688
723 651 569 709 632
样本2 568 540 596 555
496 646 607 562
589 636 529 584
681 539 617
解：根据题意可知，本题属于两个总体方差的检验问题，关心的是两个厂家灯泡使用寿命是否有差异。可见，属于双侧检验问题，原假设和备择假设为
H0： 12/ 22=1，H1 ： 12/ 22 1
由题意知，样本容量n1=20 , n2=15,
样本方差S12=3675.461 ,S22=2431.429 ,于是构造F统计量：
=3675.461 /2431.429 =1.5116
在显著性水平0.05下，左临界值F0.975（19,14）=0.377796 ，
右临界值F0.025(19，14)=2.860722 。落入接受域，不能拒绝原假设，故认为两家生产的灯泡使用寿命没有显著差异。
参数检验的Excel应用
上机内容

展开更多......

收起↑

请用微信扫码

7假设检验 课件（共79张PPT）-《应用统计学（第4版）》同步教学（人民邮电版）

7假设检验 课件（共79张PPT）-《应用统计学（第4版）》同步教学（人民邮电版）

7假设检验课件（共79张PPT）-《应用统计学（第4版）》同步教学（人民邮电版）

7假设检验课件（共79张PPT）-《应用统计学（第4版）》同步教学（人民邮电版）