04 假设检验 课件(共50张PPT)-《管理统计学(第2版)》同步教学(电工版)

资源下载
  1. 二一教育资源

04 假设检验 课件(共50张PPT)-《管理统计学(第2版)》同步教学(电工版)

资源简介

(共50张PPT)
管理统计学
4 假设检验
4.1 假设检验的基本原理
4.2 参数假设检验
4.3 非参数假设检验
4.1 假设检验的基本原理
4.1.1 假设检验的定义
4.1.2 假设检验的分类
4.1.3 假设检验的思想方法
4.1.4 原假设和备择假设
4.1.5 假设的两类错误分析
4.1.6 总体参数检验的步骤和方法
4.1.1 假设检验的定义
统计假设:关于总体的分布以及分布中所含参数的各种论断
对随机现象的实际观察
对随机现象的理论分析
假设检验:施加于一个或多个总体的概率分布或参数的假设
假设总体分布的形式或总体的参数有某种特征
判断原先的假设是否合理
合理:承认假设的正确性
不合理:否定原先的假设
对问题作出分析或推断
4.1.2 假设检验的分类
假设检验包括:参数假设检验和非参数假设检验
参数假设检验:X1,X2,…,Xn是来自分布形式已知、参数未知总体的样本,由其观测值检验假设H0: = 0; H1: ≠ 0, 为已知实数
非参数假设检验: X1,X2,…,Xn是来自分布形式未知总体的样本,由其观测值检验假设H0:F(x)=F0(x, ); H1: F(x) ≠F0(x, ), F0(x, )为已知分布函数
4.1.3 假设检验的基本原理
假设检验的基本思想
提出统计假设,根据小概率原理对其进行检验
实际推断原理/小概率原理
小概率事件 :在某次试验或观测中,出现的概率很小的事件
小概率事件在一次试验中几乎不会发生
小概率事件发生,否定原来的假设
4.1.4 原假设和备择假设
假设检验的三种形式
左尾检验、右尾检验和双尾检验
H0为原假设,H1为备择假设
原假设与备择假设的确定
若想支持某种假设,把它作为备择假设,把该陈述的否定假设作为原假设
两种假设互斥且完备,接受H0 ,必须拒绝H1
一个特定形式的H1不只与唯一的H0相对
4.1.5 假设的两类错误分析
两类错误的对比情况表
为拒真概率, 为存伪概率,1 为检验功效
控制第一类型错误较为实际,即只分析原假设H0,这样的假设为显著性检验, 为显著性水平
接受 拒绝
H0真实 正确的决定(1 ) 第一类型错误( )
H0不真实 第二类型错误( ) 正确的决定(1 )
两类错误对比情况表
4.1.6 总体参数检验的步骤
(1)提出假设
根据检验目标,对待推断的总体参数或分布提出一个基本假设
(2)决定检验的显著性水平α
由被检验的统计量分布求出相应的临界值
该临界值为零假设的拒绝域和接受域的分界线
(3)构造检验统计量,依据样本信息计算检验统计量的实际值
(4)将实际求得的检验统计量取值与临界值进行比较,作出拒绝或接受零假设的决策
p<α,拒绝零假设
p>α,不应拒绝零假设
4.2 参数假设检验
4.2.1 一个正态总体参数假设检验
4.2.2 一个正态总体参数假设检验的SPSS应用
4.2.3 两个正态总体参数假设检验
4.2.4 两个正态总体参数假设检验的SPSS应用
4.2.1 一个正态总体参数假设检验
已知方差 2,检验假设 = 0
未知方差 2,检验假设 = 0
未知方差 2,检验假设 > 0
已知方差 2,检验假设 = 0
提出零假设H0
确定统计量Z
已知其分布和参数
统计量的值可以计算
计算统计量Z值
给出显著性水平 ,做出决策
︱Z︱>Z /2,拒绝H0
未知方差 2,检验假设 = 0
提出零假设H0
确定统计量T
已知其分布和参数
统计量的值可以计算
计算统计量T值
给出显著性水平 ,做出决策
︱T︱>T /2,拒绝H0
未知方差 2,检验假设 > 0
为未知方差 2,检验假设: = 0的特殊情况
可由题意及统计量T的构成,确定T >0,仅考虑T ≥Tα/2的情况
例4.1 样品直径均值检验
测得一批零件的20个样品的直径(单位:cm)
假设直径服从正态分布,样本的均值与总体均值显著差别
总体均值为5.20
对样本的数据进行均值检验
4.98 5.11 5.20 5.11 5.00 5.61 4.88 5.27 5.38 5.20
5.46 5.27 5.23 4.96 5.35 5.15 5.35 4.77 5.33 5.54
One-Sample T Test对话框
Analyze→Compare means→One-Samples T test:{One-Sample T Test}
在Test Value框中输入检验值
Test 列表框
用于输入总体均值
One-Sample T Test: Options对话框
置信度:[50,99],默认值95
缺失值的处理方式
剔除计算时涉及变量含有缺失值的case
剔除在任意变量上含有缺失值的case
One-Sample T Test输出结果
One-Sample Statistics
N Mean Std. Deviation Std. Error Mean
直径 20 5.2075 .21851 .04886
单样本数据的统计表
数据个数
均值
标准离差
均值的标准误差
One-Sample Test
Test Value = 5.2
t df Sig. (2-tailed) Mean Difference 95% Confidence Interval of the Difference
Lower Upper
直径 .153 19 .880 .00750 -.0948 .1098
总体均值
T统计量值
自由度
双尾显著性概率
均值差:样本均值与总体均值之间的差值
均值差的95%置信区间
4.2.3 两个正态总体下的参数假设检验
未知未知两个总体的均值 1、 2,检验假设H0:总体方差
未知两个总体的均值 1、 2,检验假设H0:总体方差
未知两个总体的方差 , 已知 ,检验假设H0: 1= 2
未知两个总体的方差 , 已知 ,检验假设H0: 1= 2
未知总体均值 1和 2 ,检验H0:
统计量 服从F(n-1,m-1)分布
计算统计量F值,与Fα/2和F1- α/2比较,做出决策
未知总体均值 1和 2 ,检验H0:
统计量 服从F(n-1,m-1)分布
计算统计量F值,与Fα比较,做出决策
未知总体方差 ,已知
检验H0: 1= 2
统计量 服从t(m+n-2),
n为来自总体X的样本数,m为来自总体Y的样本数
计算统计量F值,
︱t︱≥t α/2,拒绝H0
︱t︱<t α/2 ,接受H0
未知总体方差 ,已知
检验H0: 1= 2
统计量
检验过程同未知两个总体的方差 , 已知 ,检验假设H0: 1= 2 的检验
例4.2 独立样本的t检验
某企业统计了两种不同的膨化食品A和B分别在八家不同超市的日销量(箱)
检验两种膨化食品的日销量是否有显著差异
食品A 86 87 56 93 84 93 75 79
食品B 80 79 58 91 77 82 76 66
Independent-Sample T Test对话框
Analyze→Compare Means→Independent-Samples T Test...
Test 列表框
分类变量
Define Groups对话框
不同变量值对应的数据将被用作检验对象
分别将大于等于与小于窗口中数值的数据作为两组进行t检验
One-Sample T Test: Options对话框
置信度:[50,99],默认值95
缺失值的处理方式
剔除计算时涉及变量含有缺失值的case
剔除在任意变量上含有缺失值的case
Group Statistics输出表
Group Statistics
食品
种类 N Mean Std. Deviation Std. Error Mean
日销量 1 8 81.6250 12.07048 4.26756
2 8 76.1250 10.07738 3.56289
分组统计表
数据个数
均值
标准离差
均值的标准误差
Independent Samples T Test输出表
Levene's Test for Equality of Variances t-test for Equality of Means
F Sig. t df Sig. (2-tailed)
产量 Equal variances assumed .205 .657 .989 14 .339
Equal variances not assumed .989 13.568 .340
Mean Difference Std. Error Difference 95% Confidence Interval of the Difference
产量 Lower Upper
Equal variances assumed .205 .657 5.5000 5.55934 -6.42360 17.42360
Equal variances not assumed 5.5000 5.55934 -6.45935 17.45935
方差齐性
方差非齐性
方差非齐性检验
等均值t检验
均值差异标准误差
例4.3 环境对液态产品的影响检验
不同压力环境A和B下的某液态产品的浓度数据
检验不同环境对该液态产品的浓度是否有显著影响(零假设为没有显著影响)
环境A 62.5 65.2 67.6 69.9 69.4 70.1 67.8 67.0 68.5 62.4
环境B 51.7 54.2 53.3 57.0 56.4 61.5 57.2 56.2 58.4 55.8
Paired-Samples T Test对话框
Analyze→Compare Means→Paired-Samples T Test…
Test 列表框
配对变量
Paired-Samples T Test输出结果
Paired Samples Statistics
Mean N Std. Deviation Std. Error Mean
Pair 1 压力A 67.040 10 2.8218 .8923
压力B 56.170 10 2.7370 .8655
Paired Samples Test
Paired Differences t df Sig. (2-tailed)
Mean Std. Deviation Std. Error Mean 95% Confidence Interval of the Difference
Lower Upper
Pair1 压力A- 压力B 10.87 2.2236 .7032 9.279 12.461 15.458 9 .000
配对样本统计表
配对样本t检验
4.3 非参数假设检验
4.3.1 符号检验法:通过两个相关样本的每对数据之差的符号进行检验,比较两个样本的显著性
配对资料的符号检验
样本中位数与总体中位数比较的符号检验
4.3.2 秩和检验法:一种用样本秩来代替样本值的检验法,可用于检验两个总体的分布函数是否相等的问题
配对试验资料符号秩和检验
非配对试验资料符号秩和检验
4.3.3 非参数假设检验的SPSS应用
卡方检验
柯尔莫哥洛夫-斯米诺夫检验
配对资料的符号检验
提出无效假设与备择假设
H0:甲、乙两个处理差值d总体中位数= 0
H1:甲、乙两个处理差值d总体中位数≠0
进行单尾检验,把“≠”换成“<”或者“>”
计算差值并赋予符号
d>0,记为“+”, “+”个数记为n+
d<0,记为“-”, “-”个数记为n-
d=0,记为“0”, “0”个数记为n0
统计量K = min{ n+ , n- }
统计推断
令n = n++n-
K>K0.05(n),P>0.05,不能否定H0,两个处理差异不显著
K0.01(n)<K≤K0.05(n),0.01<P≤0.05,否定H0,接受H1,两个处理差异显著
K≤K0.01(n),P≤0.01,否定H0,接受H1,两个处理差异极显著
提出无效假设与备择假设
H0:样本所在的中位数= 已知总体的中位数
H1:样本所在的中位数≠已知总体的中位数
进行单尾检验,把“≠”换成“<”或者“>”
计算差值,确定符号及其个数
样本各观测值中大于已知总体中位数的,记为“+”, “+”个数记为n+
样本各观测值中小于已知总体中位数的,记为“-”, “-”个数记为n-
样本各观测值中等于已知总体中位数的,记为“0”, “0”个数记为n0
统计量K = min{ n+ ,n- }
统计推断
令n = n++n-
K>K0.05(n),P>0.05,不能否定H0,样本中位数与已知总体中位数差异不显著
K0.01(n)<K≤K0.05(n),0.01<P≤0.05,否定H0,接受H1,样本中位数与已知总体中位数差异差异显著
K≤K0.01(n),P≤0.01,否定H0,接受H1,样本中位数与已知总体中位数差异差异极显著
样本与总体中位数比较的符号检验
配对试验资料符号秩和检验
提出无效假设与备择假设
H0:差值d总体中位数= 0
H1:差值d总体中位数≠0
进行单尾检验,把“≠”换成“<”或者“>”
编秩次,定符号
求配对数据的差值d
按d的绝对值从小到大编秩次
根据原差值正负,在各秩次前标正负号
d=0,舍去不记
d的绝对值相等,取其平均秩次
确定统计量T
T为正秩次及负秩次和中绝对值较小者
统计推断
令正负差值的总个数为n
T>T0.05(n),P>0.05,不能否定H0,两个处理差异不显著
T0.01(n)<T≤T0.05(n),0.01<P≤0.05,否定H0,接受H1,两个处理差异显著
T≤T0.01(n),P≤0.01,否定H0,接受H1,两个处理差异极显著
非配对试验资料符号秩和检验
提出无效假设与备择假设
H0:甲样本所在的总体中位数=乙样本所在的总体中位数
H1:甲样本所在的总体中位数≠乙样本所在的总体中位数
进行单尾检验,把“≠”换成“<”或者“>”
求两个样本合并数据的秩次
两个样本的含量为n1和n2,合并后为n1+ n2
合并后的数据按从小到大的顺序排列,序号即为数据的秩次
不同样本的观测值相同,取原秩次的平均秩次
同一样本的观测值相同,不必改动
确定统计量T
秩和较小的样本含量记为n1,秩和为T统计量
统计推断
T在T0.05(n1) - T0.05(n2–n1)之内 ,P>0.05,不能否定H0,两个处理差异不显著
T在T0.05(n1) - T0.05(n2–n1)之内外,在T0.01(n1) - T0.01(n2–n1) 之内,0.01<P≤0.05,否定H0,接受H1,两个处理差异差异显著
T在T0.01(n1) - T0.01(n2–n1) 之外,P≤0.01,否定H0,接受H1,两个处理差异差异极显著
非参数假设检验方法
Analyze→Nonparametric Tests
非参数假设检验
卡方检验
二项检验
游程检验
K-S检验
两个独立样本的检验
多个独立样本的检验
两个相关样本的检验
多个相关样本的检验
4.3.3 非参数假设检验中的SPSS应用
卡方检验
属于拟合优度检验
适用于具有明显分类特征的数据
检验某一类别的对象或反应的case数与根据零假设所得期望数是否有显著差异
柯尔莫哥洛夫-斯米诺夫检验
拟合优度型检验
检验样本数据是否服从指定的理论分布
设F0(x)是己知分布函数
设Fn(x)是未知总体分布函数F(x)的一个较优估计
取检验统计量D=max|Fn(x)-F0(x)|
样本数据服从指定分布(即F(x)=F0(x))时,D的观测值应该较小
若D的观测值较大,零假设可能不成立
一次观测中某厂家6条生产线每小时生产的产量
该厂家不同生产线的生产能力有无显著性差异?
例4.4 生产能力差异性检验
生产线A 生产线B 生产线C 生产线D 生产线E 生产线F
20 46 33 35 42 40
Test 列表框
数据范围
取得全部数据
自定义数据
各组数据的期望值相等
自定义期望值
Chi-Square对话框
Exact Test与Options对话框
采用逼近方法计算显著性水平,适用于大样本
采用蒙特卡洛法计算显著性水平
最大迭代次数:[1,1000000000]
计算时间限制
统计量描述
显示描述性统计量
显示四分位数
缺失值的处理方式
卡方检验输出结果
生产线
Observed N Expected N Residual
生产线A 20 36.0 -16.0
生产线B 46 36.0 10.0
生产线C 33 36.0 -3.0
生产线D 35 36.0 -1.0
生产线E 42 36.0 6.0
生产线F 40 36.0 4.0
Total 216
Test Statistics
生产线
Chi-Square 11.611a
df 5
Asymp. Sig. .041
a. 0 cells (.0%) have expected frequencies less than 5. The minimum expected cell frequency is 36.0.
对生产能力的统计
检验结果
例4.5 超市客流量情况分析
某连锁超市在某广场的入口处观察每分钟通过的人数
拟考察该广场的人流情况后,再做入超市购物分析和盈利评估
观测2000余次
人数/分钟 0 1 2 3 4 5 6 7 8 9 10
观测到人数的次数(频次) 53 192 355 527 534 413 273 139 45 27 16
One-Sample Kolmogorov-Smirnov Test对话框
Test 列表框
样本数据分布形式
正态分布
均匀分布
泊松分布
指数分布
One-Sample Kolmogorov-Smirnov Test
假设为正态分布检验结果
One-Sample Kolmogorov-Smirnov Test
每分人数
N 2574
Normal Parametersa Mean 3.9075
Std. Deviation 1.89380
Most Extreme Differences Absolute .126
Positive .126
Negative -.083
Kolmogorov-Smirnov Z 6.384
Asymp. Sig. (2-tailed) .000
a. Test distribution is Normal.
显著性p<0.01,样本与正态分布有显著差异
One-Sample Kolmogorov-Smirnov Test
假设为均匀分布检验结果
One-Sample Kolmogorov-Smirnov Test 2
每分人数
N 2574
Uniform Parametersa Minimum .00
Maximum 10.00
Most Extreme Differences Absolute .312
Positive .312
Negative -.105
Kolmogorov-Smirnov Z 15.820
Asymp. Sig. (2-tailed) .000
a. Test distribution is Uniform.
显著性p<0.01,样本与均匀分布有显著差异
One-Sample Kolmogorov-Smirnov Test
假设为泊松分布检验结果
One-Sample Kolmogorov-Smirnov Test 3
每分人数
N 2574
Poisson Parametera Mean 3.9075
Most Extreme Differences Absolute .019
Positive .013
Negative -.019
Kolmogorov-Smirnov Z .957
Asymp. Sig. (2-tailed) .319
a. Test distribution is Poisson.
显著性p>0.05,样本服从泊松分布
One-Sample Kolmogorov-Smirnov Test
假设为指数分布检验结果
One-Sample Kolmogorov-Smirnov Test4
每分人数
N 2574a
Exponential parameter.b Mean 3.9897
Most Extreme Differences Absolute .297
Positive .159
Negative -.297
Kolmogorov-Smirnov Z 14.916
Asymp. Sig. (2-tailed) .000
a. There are 53 values outside the specified distribution range. These values are skipped.
b. Test Distribution is Exponential.
显著性p<0.01,样本与指数分布有显著差异

展开更多......

收起↑

资源预览