7 假设检验 课件(共98张PPT) 《概率论与数理统计(第三版)》同步教学(人民大学)

资源下载
  1. 二一教育资源

7 假设检验 课件(共98张PPT) 《概率论与数理统计(第三版)》同步教学(人民大学)

资源简介

(共98张PPT)
第七章
假设检验
1
上一章介绍了两种常用的参数估计方法,在数理统计中,还有另一类重要的统计推断问题,即假设检验问题。
假设检验是另一种有重要理论和应用价值的统计推断形式。它的基本任务是,在总体的分布函数完全未知或只知其形式但不知其参数的情况下,为了推断总体的某些性质,首先提出某些关于总体的假设,然后根据样本所提供的信息,对所提假设做出“是”或“否”的结论性判断。假设检验有其独特的统计思想,许多实际问题都可以作为假设检验问题而得以有效地解决。
2
第一节 假设检验的基本概念
让我们先看一个例子.
3
生产流水线上罐装可乐不断地封装,然后装箱外运. 怎么知道这批罐装可乐的容量是否合格呢?
把每一罐都打开倒入量杯, 看看容量是否合于标准.
罐装可乐的容量按标准应在
350毫升和360毫升之间.
这样做显然不行!
4
如每隔1小时, 抽查5罐,得5个容量的值X1,…,X5,根据这些值来判断生产是否正常.
每隔一定时间, 抽查若干罐 .
如发现不正常,就应停产,找出原因,排除故障,然后再生产;如没有问题,就继续按规定时间再抽样,以此监督生产,保证质量.
通常的办法是进行抽样检查.
5
很明显,不能由5罐容量的数据,在把握不大的情况下就判断生产 不正常,因为停产的损失是很大的.
当然也不能总认为正常,有了问题不能及时发现,这也要造成损失.
如何处理这两者的关系,假设检验面对的就是这种矛盾.
6
它的对立假设是:
称H0为原假设(或零假设 );
称H1为备择假设.
在实际工作中,往往把不轻易否定的命题作为原假设.
H0:
( = 355)
H1:
一般可以认为X1,…,X5是取自正态总体 的样本,
是一个常数.
当生产比较稳定时,
现在要检验的假设是:
7
那么,如何判断原假设H0 是否成立呢?
较大、较小是一个相对的概念,合理的界限在何处?应由什么原则来确定?
来判断H0 是否成立.
由于 是正态分布的期望值,它的估计量是样本均值 ,因此可以根据 与 的差距
较小时,可以认为H0是成立的;

不正常.

较大时,应认为H0不成立,即生产已
8
问题是,根据所观察到的差异,如何判断它究竟是由于偶然性在起作用,还是生产确实不正常?
即差异是“抽样误差”还是“系统误差”所引起的?
这里需要给出一个量的界限。
一般依据人们在实践中普遍采用的一个原则:
概率很小的事件在一次试验中几乎不会发生 .
“小概率原理” :
9
下面我们用一例说明这个原则。
概率很小的事件在一次试验中几乎不会发生 .
某箱子中有白球和黑球共100个,但不知两种球各占多少。
现在提出假设 :其中99个是白球。
假定 正确,则任取一球为黑球的概率为0.01,
我们认为这是一个小概率事件。
如果任抽一球居然抽得黑球,那么自然要怀疑的正确性,或者说否定 。
10
这个例子中所使用的推理方法,可以称为
带概率性质的反证法
不妨称为概率反证法.
它不同于一般的反证法,数理统计中的推断并不是形式逻辑推断而是统计推断。
概率反证法的依据是:如果小概率事件在一次试验中居然发生,我们就以很大的把握否定原假设。
一般的反证法要求在原假设成立的条件下导出的结论是绝对成立的,如果事实与之矛盾,则完全绝对地否定原假设。
11
它能衡量差异
大小, 且分布已知 .
罐装可乐的容量按标准应在350毫升和360毫升之间. 一批可乐出厂前应进行抽样检查, 现抽查了n 罐,测得容量为X1, X2, …, Xn,问这一批可乐的容量是否合格?
(1) 提出假设
(2) 选取检验统计量
其中 已知,
(3) 对给定的显著性水平 ,可以在标准正态分布表中查到分位数的值 , 使
12
(2) 选取检验统计量
(3) 对给定的显著性水平 ,可以在标准正态分布表中查到分位点的值 , 使
也就是说,“
”是一个小概率事件.
(4) 由样本值算得 U 的值;
如果 ,则拒绝H0 ;否则, 不能拒绝H0 .
为拒绝域.
我们称W:
13
不否定H0并不是肯定H0一定对,而只是说差异还不够显著,还没有达到足以否定H0的程度 .
所以假设检验又叫
“显著性检验”
注意
当作出接受H0的判断时,所依据的既不是逻辑推理,也不是小概率原理,而只是因为不能“信心十足”地拒绝H0而不得不作出接受的“无奈”抉择.
14
上面所提到的“有违常理”的现象,并不是形式逻辑上的绝对不可能现象,而是基于小概率原理或统计推断原理基础上的不可能.因此在对H0的取舍上可能要犯以下两类错误:
(1) 当H0为真时,作出否定H0的决策——称为第一类错误(或称“弃真”错误);
(2) 当H0不真时,作出接受H0的决策——称为第二类错误(或称“存伪”错误)。
犯这两类错误所造成的影响常常很不一样。例如我们要求检验病人是否患某种疾病。若假设H0表示该人患病,则第二类错误(无病当有病)造成后果是使用不必要的药品而引起病人的痛苦和经济上的浪费,但第一类错误(有病当无病)就有可能导致病人的死亡。
15
通常显著性水平 的选取带有一点随意性,习惯上选取 为0.1,0.05,0.01等,当然,水平 的选取也依赖于我们关于假设的先验知识。如果我们根据以往的经验非常相信H0是真的,此时要使人乐意放弃这个信念就要有非常令人信服的依据,此时 就需要取得小一点。
我们当然希望犯这两类错误的概率同时尽可能地小,最好全为零,但实际上这是不可能的。当样本容量确定后,犯这两类成为的概率就不能同时被控制,正好象在区间估计中,要想增大可靠性(即置信概率),就会使区间长度增加而降低精度。我们的做法是限制第一类错误的概率不超过某指定值 ,再在这限制下,使犯第二类错误的概率尽可能小。
16
P{拒绝H0|H0为真}= ,
P{接受H0|H0不真}= .
犯两类错误的概率:
显著性水平 为犯第一类错误的概率.
假设检验的两类错误
H0为真
实际情况
决定
拒绝H0
接受H0
H0不真
第一类错误
正确
正确
第二类错误
17
犯两类错误的概率是互相关联的, 当样本容量固定时, 一类错误概率的减少导致另一类错误概率的增加.
要同时降低两类错误的概率 ,或者要在 不变的条件下降低 ,需要增加样本容量.
假设检验的另一个关键的问题是如何根据问题的需要来合理地提出原假设和备择假设.由以上的讨论知,在显著性检验问题中,若没有非常充足的理由,原假设是不能轻易拒绝的,因此原假设是受到保护的假设. 一般地我们总是将被拒绝时导致的后果更严重的假设作为原假设.
18
§2 单个正态总体参数的假设检验
一、 已知时关于 的假设检验
(1)
第 5 章证明,若

19
一、 已知时关于 的假设检验
U 检验法
(1)
(2) 检验统计量
(3) 对给定的显著性水平 ,查表得 ;
(4) 由样本值算得 u 的值;
如果 ,则拒绝H0 ;否则, 不能拒绝H0 .
§2 单个正态总体参数的假设检验
20
例 已知滚珠直径服从正态分布,现随机地从一批滚珠中抽取6个,测得其直径为14.70,15.21,14.90,14.91,15.32,15.32(mm)。假设滚珠直径总体分布的方差为0.05,问这一批滚珠的平均直径是否为15.25 mm?

故否定H0,即不能认为这一批滚珠的平均直径为15.25 mm。
待检验的假设是
已知
所以取检验统计量
21
例1 根据经验与历史资料知某液化气厂生产的罐装液化气重量服从正态分布 . 现改革了罐装工艺后随机抽查了16罐液化气, 得如下数据(单位:公斤):
29.3 29.8 30.2 29.6 30.5 28.4 29.1 30.0
28.8 30.4 29.4 29.5 29.5 30.6 29.9 30.8
问改革了罐装工艺后罐装液化气平均重量与过去相比有无显著差异?

待检验的假设是
已知
所以取检验统计量
22

待检验的假设是
已知
所以取检验统计量
对于给定的 , 查表得
由样本值算得
因为
所以不否定原假设,
即改革了罐装工艺后罐装液化气平均重量与过去相比无显著差异。
23
(2) 检验统计量
(4) 由样本值算得 U 的值;
如果 ,则拒绝H0 ;否则, 不能拒绝H0 .
(1)
(3) 对给定的显著性水平 ,查表得 ;
类似可得,若要检验假设 ,
单侧检验
右侧检验
24
类似可得,若要检验假设 ,
则否定域为
(2) 检验统计量
(4) 由样本值算得 U 的值;
如果 ,则拒绝H0 ;否则, 不能拒绝H0 .
(1)
(3) 对给定的显著性水平 ,查表得 ;
单侧检验
左侧检验
25

待检验的假设是
已知
所以取检验统计量
例2 某电子产品的寿命服从正态分布
今从某厂生产流水线上抽检了36个产品,测得其平均寿命为 ,问该厂此产品的使用寿命有无显著提高?
对于给定的 , 查表得
由样本值算得
故否定原假设,即认为此产品的使用寿命有显著提高。
26
某织物强力指标X的均值 =21公斤. 改进工艺后生产一批织物,今从中取30件,测得 =21.55公斤. 假设强力指标服从正态分布 且已知 =1.2公斤, 问在显著性水平 =0.01下,新生产织物比过去的织物强力是否有提高
例3
待检验的假设是

检验统计量
由样本值算得
即可以认为新生产织物比过去的织物强力有明显提高.
第 5 章证明,若

二、 未知时关于 的假设检验
(1)
28
t 检验法
(4) 由样本值算得 t 的值;
如果 ,则拒绝H0 ;否则, 不能拒绝H0 .
(1)
(2) 检验统计量
(3) 对给定的显著性水平 ,查表得 ;
二、 未知时关于 的假设检验
29
例 用某仪器间接测量温度,重复五次,所得数据是1250oC,1265oC,1245oC,1260oC,1275oC,而用别的精确方法测得温度为1277oC(可看作温度的真值),试问用此仪器间接测量温度有无系统偏差?

故否定H0,即用此仪器间接测量温度有系统偏差。
待检验的假设是
检验统计量
由样本值算得
30
例4 两家生产同一类产品, 其质量指标假定都服从正态分布, 标准规格为均值等于120. 现从甲厂抽出5件产品, 测得其指标值为119, 120, 119.2, 119.7, 119.6; 从乙厂也抽出5件产品, 测得其指标值为110.5, 106.3, 122.2, 113.8, 117.2. 试判断这两家厂的产品是否符合标准.

待检验的假设是
检验统计量
31

待检验的假设是
检验统计量
甲厂:
算得
乙厂:
算得
即乙厂的产品可以认为符合标准。
32
(4) 由样本值算得 t 的值;
如果 ,则拒绝H0 ;否则, 不能拒绝H0 .
(2) 检验统计量
(3) 对给定的显著性水平 ,查表得 ;
(1)
类似地,若要检验假设 ,
单侧检验
右侧检验
33
(4) 由样本值算得 t 的值;
如果 ,则拒绝H0 ;否则, 不能拒绝H0 .
(2) 检验统计量
(3) 对给定的显著性水平 ,查表得 ;
(1)
类似地,若要检验假设 ,
单侧检验
左侧检验
则否定域为
34
例5 某种牌号的20瓦节能灯正常使用下的使用寿命均值为 2500小时,现生产企业进行了技术革新,从新生产的这种节能灯中抽取了16只检测,得节能灯的平均使用寿命为2700小时,样本标准差为140,已知节能灯的使用寿命服从正态分布,问新生产的这种节能灯的平均使用寿命有无显著提高?

待检验的假设是
检验统计量
对于给定的 , 查表得
由样本值算得
所以拒绝原假设,即认为新生产的这种节能灯的平均使用寿命有显著提高。
35
第 5 章证明,若

三、关于 的假设检验
(1)
36
则拒绝H0 ;
(1)
(2) 检验统计量
(3) 对给定的显著性水平 ,查表得
(4) 由样本值算得 的值;
拒绝H0 .
否则, 不能
三、关于 的假设检验
检验法
37
例 已知幼儿的身高在正常情况下服从正态分布,现从某一幼儿园5岁至6岁幼儿中随机地抽查了9人,其身高(单位:cm)分别为115,120,131,115,109,115,115,105,110,问5岁至6岁幼儿身高的总体方差是否为49?

故不否定H0,即可以认为总体方差为49。
待检验假设
检验统计量
查表得
由样本值算得
38
例6

待检验的假设是
检验统计量
查表得
由样本值算得
即认为方差显著地改变了。
39
(2) 检验统计量
(3) 对给定的显著性水平 ,查表得
(4) 由样本值算得 的值;
(1)
则拒绝H0 ;
否则, 不能拒绝H0 .
类似地有左侧检验。
单侧检验
右侧检验
40
例7 要求某种导线电阻的标准差不得超过0.005(欧姆).今在一批导线中取样品9根,测得 ,设总体为正态分布 .问在水平 下能否认为这批导线的的标准差显著地偏大?
提出假设

检验统计量
对给定的显著性水平 ,查表得
由样本值算得
即可以认为这批导线的标准差明显偏大.
41
例7 我国自2002年起向北美某国出口苹果,按供货要求除每个苹果外形、色泽基本相同外,还要求苹果的平均重量为200克,标准差不能超过10克。现出口企业从待出口苹果中抽出20只检验,得苹果重量的样本均值为202克,样本标准差为8克,已知苹果重量服从正态分布,问这批苹果是否符合供货要求?

设X 为苹果重量,
依题意需要分别检验假设
检验统计量
42
由样本值算得
检验统计量
即可认为这批苹果平均重量为200克。
43
检验统计量
对给定的显著性水平 ,查表得
由样本值算得
即可认为这批苹果重量的标准差不超过10克。
综上可以认为这批苹果符合供货要求。
44
练习:
P168 习题七
1. 2. 3.
45
§3 两个正态总体参数的假设检验

46
(1)

第 5 章证明,若
47
(2) 检验统计量
(4) 由样本值算得 U 的值;
(3) 对给定 , 查表得
如果 ,则拒绝H0 ;否则, 不拒绝H0 .
(1)
48

待检验的假设是

选取检验统计量
故否定H0,即甲乙两厂铜丝的抗拉强度有显著差异。
49

甲:18.9 17.6 18.2 19.0 18.8 17.5 17.7 18.4 18.1 18.5
乙:16.6 15.9 17.1 17.7 17.2 16.7 16.4 17.0 15.8 16.5 16.4 16.3
问两种工艺对金属铜的提炼率有无显著差异?
设甲、乙两种工艺金属铜的提炼率分别是X 和Y ,
待检验的假设是
例1 已知有甲、乙两种工艺从某种矿石中提炼金属铜,两种工艺的提炼率分别服从正态分布 和 ,为比较两种工艺的优劣,现用甲、乙两种工艺各进行了10次和12次试验,得金属铜的提炼率(%)如下:
50
选取检验统计量
由样本值计算得:
对于给定的 , 查表得
所以不否定原假设,即可认为甲、乙两种工艺金属铜的提炼率无显著差异。
51
(1)
(2) 检验统计量
(4) 由样本值算得 U 的值;
(3) 对给定 , 查表得
如果 ,则拒绝H0 ;否则, 不拒绝H0 .
单侧检验
右侧检验
类似地有左侧检验。
52
例2 为比较吸烟与否对人的寿命的影响,专家从不吸烟的成人人群和吸烟的成人人群中各抽取400名和600名根跟踪调查,测得其平均寿命分别是78.2岁和70.4岁,已知两种情形下人的寿命都服从正态分布,且总体标准差分别是8.5岁和8.8岁,问不吸烟的成人人群是否比吸烟的成人人群的寿命要高些?

设不吸烟的成人人群的寿命为X ,吸烟的成人人群的寿命为Y ,依题意得:
待检验的假设是
53
选取检验统计量
由样本值计算得:
对于给定的 , 查表得
所以否定原假设,即可认为不吸烟的成人人群比吸烟的成人人群的寿命要高些。
54
(1)
第 5 章证明,若

其中
55
(2) 检验统计量
(4) 由样本值算得T 的值;
(3) 对给定 , 查表得
如果 ,则拒绝H0 ;否则, 不拒绝H0 .
(1)
其中
56
若两个总体都服从正态分布,问:两个总体的均值是否有显著差异?

待检验的假设是
检验统计量
甲车床:
乙车床:
例3 两台车床生产同一型号滚珠,根据经验可以认为两车床生产的滚珠的直径均服从正态分布,且方差相同。现从两台车床的产品中分别抽出8个和9个,测得滚珠直径的有关数据如下:

待检验的假设是
检验统计量
其中
由样本值算得
即均值无明显差异。
类似可考虑单侧检验问题。
58
第 5 章证明,
(1)
59
(2) 检验统计量
(4) 由样本值算得 F 的值;
(3) 对给定 , 查表得
F 检验法
(1)
类似可考虑单侧检验问题。
60
例4 从贮存某种商品的二个不同仓库中,各抽取容量分别为9和8的二个样本,分别算得其子样的损伤率(%)样本均值和样本方差如下:

待检验的假设是
检验统计量
甲库:
乙库:
若甲、乙二库损伤率都服从正态分布,问:甲乙二库损伤率的方差是否有显著差异?
61

待检验的假设是
检验统计量
由样本值算得
查表得
即方差无明显差异。
62
例5 某纺织厂生产的纱线的强力服从正态分布,为比较甲、乙两地的棉花所纺纱线的强力,各抽取7个和8个样品,测得数据如下:

63
检验统计量
(1)
由样本值算得
查表得
即方差无明显差异。
64
(2)
检验统计量
其中
即均值有明显差异。
65
例6 为了比较两个国家成年妇女的身高,抽样数据为:
A国:
B国:
设两个总体均服从正态分布,问:
(1) 是否可以认为两个总体的方差相等?
(2) 在方差相等的前提下,是否有理由认为A国成年妇女的平均身高比B国的要矮?

(1)
双侧检验
检验统计量
66

(1)
检验统计量
查表得
由样本值算得
即方差无明显差异。
67
(2)
检验统计量
查表得
由样本值算得
即可以认为A国成年妇女的平均身高明显比B国的要矮.
左侧检验
其中

68
练习:
P168 习题七
4.
69
§4 比率的假设检验
比率 p 就是总体中具有某一统计特征的个体所占的比例,它等于做伯努利试验成功的概率,即认为总体 X 服从参数为 p 的0-1分布。
70
一、比率与标准值的比较
1、小样本
直接用二项分布检验。
为满足该式的最大整数
为满足该式的最小整数
类似地有单侧检验。
71
例1

查表得
72
利用正态分布近似。
2、大样本
由中心极限定理,
73
(2) 检验统计量
(4) 由样本值算得U的值;
(3) 对给定 , 查表得
如果 ,则拒绝H0 ;否则, 不拒绝H0 .
(1)
74
双侧检验 左侧检验 右侧检验
假设形式 H0: p = p0 H1: p p0 H0 : p p0 H1 : p < p0 H0 : p p0
H1 : p > p0
统计量
拒绝域
决策 拒绝 H0
正态近似法的 p 检验判断法则
75

例2
检验统计量
76
例3 某商店进某种商品时,要求合格品率不低于75%。现抽检100件,发现有63件合格。问该批产品能否接受?

检验统计量
77
二、两个比率的比较
只考虑大样本的情况。
其中
78
双侧检验 左侧检验 右侧检验
假设形式 H0: p1 = p2 H1: p1 p2 H0 : p1 p2 H1 : p1 < p2 H0 : p1 p2
H1 : p1 > p2
统计量
拒绝域
决策 拒绝 H0
两比率 p1 和 p2 的比较
79
例4 某在一次收视率调查中,北京市居民收看某台新闻节目的收视率为38%,天津市为36%,在北京市调查的样本容量为400人,在天津市调查的样本容量为300人。有人认为北京和天津的收视率不存在差异,你是否同意这种说法?

检验统计量
80
所以不否定 H0,即北京和天津的收视率无显著差异。
检验统计量
81
例5 一所大学准备采取一项学生在宿舍上网收费的措施,为了解男女学生对这一措施的看法是否存在差异,分别抽取了200名男学生和200名女学生进行调查,其中的一个问题是:“你是否赞成采取上网收费的措施?”其中男学生表示赞成的比率为27%,女学生表示赞成的比率为35%。调查者认为,男学生中表示赞成的比率显著低于女学生。问样本提供的证据是否支持调查者的看法?

检验统计量
82
所以否定 H0。即样本提供的证据支持调查者的看法。
检验统计量
83
END
END
84
习题选解
(B)
85
B
86
补充题
87

选 A .
1. 在假设检验中,显著性水平α 的意义是 ( )
A
88

已知
检验统计量
对于给定的 , 查表得
所以不否定原假设,
即可以认为这批产品的指标的
期望值
89

检验统计量
90

检验统计量
查表得
由样本值算得
91
5. 两台车床生产同一型号的滚珠,根据经验可以认为两车床生产的滚珠的直径均服从正态分布,先从两台车床的产品中分别抽出8个和9个,测得滚珠直径的有关数据如下:

92
检验量
其中
计算得
查表得
因为
93

(1)
94
检验量
其中
计算得
查表得
因为
95

7. 为了比较两种枪弹的速度(单位是米/秒),在相同的条件下进行速度测试.算得样本均值和样本标准差如下:
96
检验统计量
查表得
故检验没有落在拒绝域内,故可以认为两个总体的方差相等,即两种枪弹在均匀性方面没有差异.
由样本值算得

97

检验统计量
其中
由样本值算得

展开更多......

收起↑

资源预览