05 方差分析 课件(共60张PPT)-《管理统计学(第2版)》同步教学(电工版)

资源下载
  1. 二一教育资源

05 方差分析 课件(共60张PPT)-《管理统计学(第2版)》同步教学(电工版)

资源简介

(共60张PPT)
管理统计学
5 方差分析
5.1 方差分析基本原理
5.2 单因素方差分析
5.3 单因素方差分析的SPSS应用
5.4 双因素方差分析
5.1 方差分析基本原理
方差分析的实质:检验多个总体均值是否有显著性差异(观测值变异原因的数量分析)
将k个处理的观测值作为一个整体看待,把观测值总变异的平方和及自由度分解为相应于不同变异来源的平方和及自由度,进而获得不同变异来源总体方差估计值
通过计算这些总体方差的估计值的适当比值,检验各样本所属总体平均数是否相等
5.1.1 基本概念(待续)
因素:影响实验结果的条件,常用大写字母A、B、C、…等表示
单因素实验:当研究中只考察一个因素
双因素(多因素)实验:同时研究两个或两个以上的因素
因素水平/水平:因素所处的某种特定状态或数量等级,用代表该因素的字母加添足标表示,如A1、A2、…,B1、B2、…
处理:事先设计好的实施在实验单位上的具体项目
在单因素实验中,实施在实验单位上的具体项目就是实验因素的某一水平
在多因素实验中,实验因素的一个水平组合就是一个处理
基本概念(续)
两类误差
① 随机误差:在因素的同一水平(同一个总体)下,样本的各观察值之间的差异,由抽样的随机性所造成
② 系统误差:在因素的不同水平(不同总体)下,各观察值之间的差异,由系统性因素造成
两类方差
① 组内方差:因素的同一水平(同一个总体)下样本数据的方差,组内方差只包含随机误差
② 组间方差:因素的不同水平(不同总体)下各样本之间的方差,组间方差既包括随机误差,也包括系统误差
实例说明
不同颜色(水平)对销售量(结果)没有影响
组间方差中只包含有随机误差,没有系统误差
组间方差与组内方差很接近,二者比值接近1
不同的水平对结果有影响
组间方差中包含随机误差和系统误差
组间方差大于组内方差,二者比值就会大于1
当这个比值大到某种程度时,不同水平之间存在着显著差异
例5.1 单因素四水平的试验
某饮料生产企业研制出一种新型饮料
饮料的颜色:橘黄色、粉色、绿色和无色透明
饮料的营养含量、味道、价格、包装相同
收集该饮料的销售情况的超级市场地理位置相似、经营规模相仿
试分析饮料的颜色是否对销售量产生影响
超市 无色 粉色 橘黄色 绿色
1
2
3
4
5 26.5
28.7
25.1
29.1
27.2 31.2
28.3
30.8
27.9
29.6 27.9
25.1
28.5
24.2
26.5 30.8
29.6
32.4
31.7
32.8
四色饮料在五家超市的销售情况
例题分析

1为无色饮料 (A1)的平均销售量
2粉色饮料(A2)的平均销售量
3为橘黄色饮料(A3)的平均销售量
4为绿色饮料(A4)的平均销售量
用方差分析,分析饮料的颜色对销售量是否有影响,检验假设
H0: 1 2 3 4
H1: 1, 2, 3, 4不全相等
颜色是要检验的因素或因子
A1、A2、A3、A4四种颜色就是因素的水平
每种颜色饮料的销售量就是观察值
A1、A2、A3、A4四种颜色可以看作是四个总体,从中抽取的样本数据
5.1.2 方差分析中的基本假定
(1)变异的可加性
(2)每个总体都应服从正态分布(分布的正态性)
(3)各组观察数据,是从具有相同方差的总体中抽取的
(4)观察值是独立的
如果总体的均值相等,可期望样本的均值也会很接近:
① 样本的均值越接近,总体均值相等的证据也就越充分
② 样本均值越不同,总体均值不同的证据就越充分
实例分析
例5.1中
如果原假设成立,即H0: 1 2 3 4
四种颜色饮料销售的均值都相等,且没有系统误差
每个样本都来自均值为 、方差为 2的同一正态总体
如果备择假设成立,即H1: i(i=1,2,3,4)不全相等
则至少有一个总体的均值是不同的,且有系统误差
这意味着四个样本分别来自均值不同的四个正态总体
不同正态总体
同一正态总体
5.2 单因素方差分析
5.2.1 多个总体均值是否相同的检验
5.2.2 多个总体均值的多重比较检验
5.2.1 多个总体均值是否相同的检验
例5.1中
μ表示总体X的均值,
μi表示总体Ai的均值,
方案i的主效应 i=μi-μ反映水平Ai对销售量的影响
随机样本Xij,可以视为各个方案的总体均值μi与随机误差之和:
Xij= i + ij
由于Xij是来自Ai的观察值,于是有
Xij= i + ij= i+ + ij (i=1,2,…,4;j=1,2, …,5)
表5-2 单因素方差总体Xij构成表
Xij表达为总平均、方案的主效应i与随机项之和
εij表示观测过程中各种随机影响引起的随机误差(εij相互独立,服从N(0, 2)分布
对应于μi的样本均值(统计量)是 xi ,也就是说, xij - xi表示是随机误差项
由 i= μi-μ ,若各个方案的主效应都是0,则各个方案的均值相同
单因素方案分析的基本任务是检验如下假设
H0:所有 i=0或μ1= μ2 =…=μs= μ
H1:不全相等(至少有两个不相等)
Xij的构成
μi (各方案的总体均值) εij服从N(0, 2)
μ i=(μi-μ)
总体均值 主效应 随机扰动
多个总体均值是否相同的检验
考察例5.1中颜色是否是影响该饮料销售量的主要因素
若饮料的销售量服从正态分布,不同颜色饮料销售量方差相等
考察不同颜色对饮料销售量有无显著影响,即考察4个水平对销售量的影响是否差异显著,即要检验假设:
H0: a1= a2= a3= a4=0
销售量(箱) 试验批号 各水平下平均
销售量Xi
1 2 3 4 5
因素
(颜色) A1(粉色) 26.5 28.7 25.1 29.1 27.2 27.32
A2(无色) 31.2 28.3 30.8 27.9 29.6 29.56
A3(绿色) 27.9 25.1 24.2 26.5 26.5 26.44
A4(桔色) 30.8 29.6 32.4 32.8 32.8 31.46
总平均销量 28.695
分析过程(待续)
① 将总体离差分解
总体销售量离差平方和ST有两个来源
一是由水平不同造成的不同水平下平均销售量差异SA
一是由除了颜色之外的随机干扰造成的、同一水平下的销售量差异SE
其中,m表示因素A(颜色)的水平数m=4,n表示观测次数n=5
② 将总体离差的自由度分解
n的含义不同,前者n表示样本总容量,后者表示观测次数
分析过程(续)
③ 将离差均方化,得均方和(为了具有可比性)
MSA=SA/fA MSE=SE/fE
④ 比较,计算F值:F=MSA/ MSE
⑤ 检验,所示看F统计量是否落在接受域还是拒绝域中
若F≤F0.05(fA,fE) ,则无显著影响,记为/
若F0.05(fA,fE) 若F>F0.03(fA,fE) ,则影响特别显著,记为**
单因素方差分析表
注:
F0.05(3,16)=3.24, F0.03(3,16)=5.29
由于F=10.458> F0.03(fA,fE) ,所以颜色对饮料销售量有特别显著影响
方差来源 离差平方和 自由度 均方和 F值 检验结论
因素A(颜色)
随机干扰E
总和T SA=76.85
SE=39.08
ST=115.93 fA=3
fE=16
fT=19 MSA=25.615
MSE=2.443 F=10.485 **
方差来源 离差平方和 自由度 均方和 F值 检验结论
因素A
随机干扰E
总和T SA
SE
ST fA
fE
fT MSA
MSE F=MSA/MSE
例5.1的单因素方差分析表
例5.2 数学成绩分析
40名学生随机分成5个班,每个班的班主任负责不同科目
A表示班主任教数学
B表示班主任教语文
C表示班主任教生物
D表示班主任教地理
E表示班主任教物理
用方差分析的方法检验5组不同班主任的学生数学成绩是否有显著差异
A B C D E
76 76 62 65 67
78 67 70 68 71
65 70 69 68 72
72 64 73 71 69
71 67 71 61 74
72 83 69 69 79
83 72 73 65 76
79 73 69 69 84
解题过程
① 建立假设 H0: 1= 2= 3= 4= 5
② 平方和 ST=1160.4,SA=314.4
SE=ST-SA=1160.4-314.4=864
③ 自由度 fA=k-1=5-1=4,fE=k(n-1)=35
④ 均方 MSA=SA/fA=314.4/4=78.6
MSE=SE/fE=846/35=24.17
⑤ F检验 F=MSA/MSE=78.6/24.17=3.252
查F分布表(单侧)F0.05(4,35)=2.64,F>F0.05,p<0.05,拒绝原假设,故在不同班主任的班级中数学成绩有显著不同
⑥ 方差分析表
方差来源 离差平方和 自由度 均方和 F值 检验结论
因素A
随机干扰E
总和T 314.4
846
1160.4 4
35
39 78.6
24.17 F=3.252 *
注:*表示在0.05水平上显著
例5.3 服务质量分析
为了对几个行业的服务质量进行评价
在零售业、旅游业、航空公司、家电制造业分别抽取了不同的样本
记录了一年中消费者对总共23家服务企业投诉的次数
试分析这四个行业的服务质量是否有显著差异?( =0.05)
消费者对四个行业的投诉次数
观察值
(j) 行业(A)
零售业 旅游业 航空公司 家电制造业
1 57 62 51 70
2 55 49 49 68
3 46 60 48 63
4 45 54 55 69
5 54 56 47 60
6 53 55
7 47
解题过程
设四个行业被投诉次数的均值分别为, 1, 2, 3, 4,则需要检验如下假设
H0: 1= 2= 3= 4= 5(四个行业的服务质量无显著差异)
H1: 1, 2, 3, 4不全相等(有显著差异)
计算结果如下:
方差来源 离差平方和 自由度 均方和 F值 检验结论
因素A
随机干扰E
总和T 845.2174
362
1207.217 3
19
22 281.7391
19.05263 14.78741 *
5.2.2 多个总体均值的多重比较检验
多重比较:在因变量的三个或三个以上水平下均值之间进行两两比较检验,检验均值间差异
LSD方法:由Fisher提出的最小显著差异方法,是对检验两个总体均值是否相等的t检验方法的总体方差估计加以修正(用MSE来代替)而得到的,可用于判断均值之间差异
LSD的操作步骤
(1)提出假设
H0: i= j(第i个总体的均值等于第j个总体的均值)
H1: i j(第i个总体的均值不等于第j个总体的均值)
(2)检验的统计量为
(3)若|t| t ,拒绝H0;若|t|基于统计量 的LSD方法的操作步骤为
(1)通过判断样本均值之差的大小来检验H0
(2)检验的统计量为: ,检验的步骤为
① 提出假设
H0: i= j(第i个总体的均值等于第j个总体的均值)
H1: i j(第i个总体的均值不等于第j个总体的均值)
② 计算LSD
③ 检验
若| | LSD,拒绝H0,若| |实例分析
针对例5.1,根据前面的计算结果有:
x1=27.3; x2=29.5; x3=26.4; x4=31.4
① 提出假设 H0: i= j; H1: i j
② 计算LSD
③ 检验
| x1- x2|= |27.3-29.5| =2.2>2.096,颜色1与颜色2的销售量有显著差异
| x1- x3|= |27.3-26.4| =0.9<2.096,颜色1与颜色3的销售量没有显著差异
| x1- x4|= |27.3-31.4| =4.1>2.096,颜色1与颜色4的销售量有显著差异
| x2- x3|= |29.5-26.4| =3.1>2.096,颜色2与颜色3的销售量有显著差异
| x2- x4|= |29.5-31.4| =1.9<2.096,颜色2与颜色4的销售量没有显著差异
| x3- x4|= |26.4-31.4| =5>2.096, 颜色3与颜色4的销售量有显著差异
5.3 单因素方差分析的SPSS应用
例5.4 根据下列随机抽样数据,试分析各地区平均每天交通事故的次数是否有显著性差异(α=0.05)
五个地区每天发生交通事故的次数表
东部 北部 中部 南部 西部
15 12 10 14 13
17 10 14 9 12
14 13 13 7 9
11 17 15 10 14
14 12 8 10
7 9
分析过程
分析不同的地理位置是否为影响每天交通事故次数的因素
因素的每个水平——东部、北部、中部、南部、西部看作五个总体
设五个地区平均每天发生交通事故的次数分别为 1、 2、 3、 4、 5,
从不同总体抽取的样本数据的个数,分别是4,5,5,6,6
检验各地区平均每天交通事故的次数是否有显著性差异,是一个单因素方差分析问题
原假设H0: 1= 2= 3= 4= 5
备择假设H1: 1、 2、 3、 4、 5不全相等
One-Way ANOVA对话框设置
打开数据文件,需要注意“所在地区”对应的变量值标签定义为1=“东部”,2=“北部”,3=“中部”,4=“南部”,5=“西部”
Analyze→Compare Means→One-Way ANOVA→{One-Way ANOVA}
放置因变量,
可放置多个
放置自变量
用于比较和分析均值的特性,一元方差分析的时候,一般不用此功能
方差相等或方差不相等情况下的检验选项
选择统计量和缺少值处理方式
One-Way ANOVA Options对话框设置
{One-Way ANOVA} →(变量Y(交通事故次数)) → Dependent List →(变量X(所在地区) → Factor)→ Options → {One-Way ANOVA: Options}
要求输出描述统计量
要求输出固定效应模型的标准离差、标准误差、和95%的置信区间,还输出随机效应模型的标准误差、95%的置信区间和因素水平间方差估计
要求进行方差齐次性检验,输出结果
计算Brown-Forsythe统计量,检验各组均值是否相等
计算Welch统计量,检验各组的均值是否相等
Means plot输出
Continue → OK → {Means plot输出}
描述统计值Descriptives
交通事故次数
N Mean Std.
Deviation Std.
Error 95% Confidence
Interval for Mean Minimum Maximum
Lower
Bound Upper
Bound
1 4 14.25 2.500 1.250 10.27 18.23 11 17
2 5 13.20 2.588 1.158 9.99 16.41 10 17
3 5 12.80 1.924 .860 10.41 15.19 10 15
4 6 9.17 2.639 1.078 6.40 11.94 7 14
5 6 11.17 2.137 .872 8.92 13.41 9 14
Total 26 11.88 2.833 .556 10.74 13.03 7 17
不同地区平均每天交通事故的次数分别是14.25、13.20、12.80、9.17和11.17
方差齐性检验表
设不同地区的交通事故次数的方差分别为
原假设H0:
原假设H1: 不全相等
方差齐性检验表 Test of Homogeneity of Variances
交通事故次数
Levene Statistic df1 df2 Sig.
.096 4 21 .983
Levene Statistic(统计量)的值为0.096
组间、组内自由度分别为4、21,相应的显著性概率p(Sig.)为0.983,非常大
因此,没有理由拒绝原假设,认为不同地区的交通事故次数的方差没有显著性差异,即方差具有齐性
方差分析表 ANOVA
F=3.676,显著性概率(Sig.)=0.02
当取α=0.05时,Sig.=0.02<0.05,故拒绝原假设,认为各地区平均每天交通事故次数有显著性差异
如果查F统计量分布表得到F0.05(4,21)=2.85,
α=0.05时,F=3.676>F0.05(4,21)=2.85,则拒绝原假设H0,表明所检验的因素即地区对平均每天交通事故的次数观测值有显著影响
Sum of Squares df Mean Square F Sig.
Between Groups 82.637 4 20.659 3.676 .020
Within Groups 118.017 21 5.620
Total 200.654 25
两两比较不同水平的差异
在{One-Way ANOVA对话框} →变量Y(交通事故次数)移入到Dependent List 框,变量X(所在地区)移入Factor框内 → Post Hoc → {One-Way ANOVA: Post Hoc Multiple Comparisions对话框}
方差相等假设下的可选择方法
方差非齐次性假设
Equal Variances Assumed
Equal Variances Assumed:方差相等假设下的可选择方法
LSD:最小二乘法,是T检验的变形,在变异与自由度计算上利用了整个样本信息,敏感度最高
Bonferroni:由LSD修正而来,通过设置每个检验的α水平来控制总的α水平水,这个方法的敏感度介于LSD和Scheffe之间
Sidak:用T检验完成多重配对比较,可以调整显著性水平,比Bonfferroni方法的调整界限小
Scheffe:它利用F分布进行均值间的配对比较
R-E-G-W F(Ryan- Einot -Gabriel - Welsch F):利用F检验进行多重比较
R-E-G-W Q(Ryan-Einot -Gabriel - Welsch range test):基于t分布进行多重逐步比较
S-N-K(Student-Newman-Keuls):它利用 T 分布进行均值间的配对比较
Tukey(Tukey’s honestly significant difference):利用T化极差分布进行均值间的配对比较
Tukey’s-b:利用T化极差分布进行均值间的配对比较,精确值为前两种检验相应值的平均值,利用该方法时一般要选择前两种方法
Duncan(Duncan’s multiple range test):逐步比较一系列分布值,得出结论,适用于分布不明确的情况
Hochberg’s GT2:利用T化极差分布进行多重比较
Gabriel:利用T化极差分布进行配对比较
Waller-Duncan:利用t检验进行多重比较
Dunnett方法:选择开头一组或者最后一组为对照,其他组跟它进行比较,当选中这一种方法后,Control Category被激活,它后面的下拉菜单框中有两个选项,即:First和Last,可以选择其中一个,它们就是对照组
Equal Variances Assumed (续)
Equal Variances Not Assumed
Equal Variances Not Assumed:方差非齐次性假设下的方法有:
Tamhane’s T2 :利用t检验进行配对比较,是一种比较老式的方法
Dunnett’s T3:在T化极差分布下进行配对比较
Games-Howell:它是一种较灵活的方差不具齐次时的配对比较检验法
Dunnett’s C :基于t分布下的配对比较
多重比较结果表 Multiple Comparisons
选择LSD → Tamhane’s T2 → Continue → {ANOVA} →OK → {多重比较结果表 Multiple Comparisons}
LSD
(I)
所在地区0 (J)
所在地区 Mean
Difference (I-J) Std. Error Sig. 95% Confidence Interval
Lower Bound Upper Bound
1 2 1.05 1.590 .516 -2.26 4.36
3 1.45 1.590 .372 -1.86 4.76
4 5.08(*) 1.530 .003 1.90 8.27
5 3.08 1.530 .057 -.10 6.27
2 1 -1.05 1.590 .516 -4.36 2.26
3 .40 1.499 .792 -2.72 3.52
4 4.03(*) 1.435 .010 1.05 7.02
5 2.03 1.435 .171 -.95 5.02
(续表)
3 1 -1.45 1.590 .372 -4.76 1.86
2 -.40 1.499 .792 -3.52 2.72
4 3.63(*) 1.435 .019 .65 6.62
5 1.63 1.435 .268 -1.35 4.62
4 1 -5.08(*) 1.530 .003 -8.27 -1.90
2 -4.03(*) 1.435 .010 -7.02 -1.05
3 -3.63(*) 1.435 .019 -6.62 -.65
5 -2.00 1.369 .159 -4.85 .85
5 1 -3.08 1.530 .057 -6.27 .10
2 -2.03 1.435 .171 -5.02 .95
3 -1.63 1.435 .268 -4.62 1.35
4 2.00 1.369 .159 -.85 4.85
* The mean difference is significant at the .05 level.(*表示在0.05的显著性水平下均值差有显著性差异)
只有南部地区的平均每天交通事故次数与东部、北部、中部地区的平均每天交通事故次数有显著性差异
5.4 双因素方差分析(待续)
双因素:是指问题中有两个(反映条件或前提的)变量
As是变量A的一个取值(又称因素A的一个水平)
Bn是变量B的一个取值(又称因素B的一个水平)
假设在Ai与Bj下的总体Xij,服从N(μij,σ2)分布
双因素方差分析的数据结构表
表中,xij表示因素Ai和因素Bj下的试验效果的观察值
因素B1 因素B2 … 因素Bn
因素A1 x11 x12 … x1n
因素A2 x21 x22 … x2n
… … … … …
因素As xs1 xs2 … xsn
双因素方差分析(续)
总体Xij的总平均:
第i行总体的平均:
第j列总体平均:
Ai的主效应:
Aj的主效应:
如果Ai与Bj间不存在交互效应,就有
μij=μ+ ai+bj
5.4.1 无交互作用的双因素方差分析
随机样本Xij可以视为其总体均值ij与随机误差εij之和
Xij=μij+ εij
εij服从N(0,σ2)分布,并且εij之间相互独立于是有
Xij= μ+ ai+bj + εij
称为“无交互影响的双因素(一元)模型”
Xij的构成
(各方案的总体均值) εij服从N(0, 2)
μ ai=(μi-μ)
总体均值 主效应 随机扰动
效果的数据是多元的(向量),就是双因素多元问题
无重复实验双因素方差分析方案的假设
零假设:
备择假设: 之间不完全相等(至少
有两个不等),或不全等于0
之间不完全相等(至少
有两个不等),或不全等于0
统计量
无交互影响的双因素模型下的结论
① SA、SB、SE相互独立,且ST=SA+SB+SE
② SE / 2服从分布 2((s-1)(n-1))
③ H0A成立时,有 SA / 2 服从 2(s-1)
④ H0B成立时,有 SB / 2 服从 2(n-1)
⑤ H0A成立时,有FA服从F((n-1),(s-1)(n-1)) 分布
对给定的α,查表得 F ((n-1),(s-1)(n-1))
若FA>F ((n-1),(s-1)(n-1)) 拒绝H0A,即至少A因素中有两个水平之间的平均效果(均值),差异足够大
反之,接受H0A,即A因素的不同水平的效果(均值)没有显著差异
若FB>F ((n-1),(s-1)(n-1)) ,拒绝H0B,即至少B因素有两个水平之间的平均效果(均值)差异足够大
反之,接受H0B,即B因素中的不同水平的效果(均值)没有显著差异
5.4.2 无交互作用的双因素方差分析SPSS应用
例5.5 考察原料用量和产地对产品质量是否有影响
现有三个产地:甲(A1)、乙(A2)、丙(A3)
原料用量有三种情况:现用量(B1)、增加5%(B2)、增加8%(B3)
每个水平组合做一次试验
现需要分析原料用量及产地对产品质量的影响是否显著
表5-17 产品合格率数据
观测数据 原料用量B
B1 B2 B3
产地 A1 59 70 66
A2 63 74 70
A3 61 66 71
General Lineral Model:Univariate
Analyze → General Lineral Model → {Univariate}
因变量矩形框,将因变量放入其中
固定因素栏,放入固定因素
随机因素栏,放入随机因素
协变量栏,放入协变量
加权变量栏
Model模型对话框
quality →选入Dependent Variable→选中group1和group2 →选入Fixed Factor(s)→ “Model” →{模型对话框}
指定模型类型
建立因素全模型
自定义模型
Univariate:Model对话框中选择Cutom
单击Custom选项,选择自定义模型
选择模型中的主效应的方法
用鼠标单击个变量名,然后单击Build Term(s)栏中下面的箭头,该变量出现在Model框中,重复这种操作,就可以设置多个主效应,但是不要同时送入,否则可能是交互效应
在Build Term(s)栏下面的小菜单中选择Main effects项,然后选择多个主效应变量进入Model框中,如果只进行主效应分析,则单击Continue按钮确认并返回主对话框,否则进入下一步
建立模型中的交互项
Build Term(s) → Interaction右侧向下的黑色小箭头
Interaction:指定任意的交互效应
ALL 2-way:指定所有2维交互效应
ALL 3-way:指定所有3维交互效应
ALL 4-way:指定所有4维交互效应
ALL 5-way:指定所有5维交互效应
因素变量的交互效应,要求模型中包括因素变量:group1和group2的交互效应
① Build Term(s) → Interaction → group1 → group2 → Build Term(s)栏中下面的箭头→交互项就出现在Model框中
② Build Term(s) → ALL 2-way,其他步骤同上
选择分解平方和的方法
TypeI:分层处理平方和的方法,仅对模型主效应之前的每项进行调整,一般适用于平衡ANOYA模型和嵌套模型,在前一模型中一阶交互效应前指定主效应,二阶交互效应前指定一阶交互效应,依此类推
TypeII:对其他所有效应进行调整,一般适用于平衡ANOYA模型、主因素效应模型、回归模型和嵌套设计
Type III(默认值):对其他任何效应都进行调整,其优势是把所估计剩余常量也考虑到单元频数中,一般适用于TypeI、TypeII所列的模型,没有空单元格的平衡和非平衡模型
Type IV:对任何效应F计算平方和,没有缺失单元的设计使用该法
一般使用Type I、Type II所列的模型,没有空单元格的平衡和非平衡模型
无重复试验的双因素方差分析表
Continue → {Univariate} → OK
Dependent Variable: QUALITY
因素“产地”(用Group1标识)的检验,P=0.269>0.05,接受H0A,因此,可有95%的把握可以认为原料产地对产品的质量影响不大
因素“原料用量”(用Group2标识)的检验P=0.026<0.05,所以拒绝H0B,表明有95%的把握可以认为原料的用量对产品的质量有显著影响
Source Type III Sum of Squares df Mean Square F Sig.
Corrected Model 172.000(a) 4 43.000 6.143 .053
Intercept 40000.000 1 40000.000 5714.286 .000
GROUP1 26.000 2 13.000 1.857 .269
GROUP2 146.000 2 73.000 10.429 .026
Error 28.000 4 7.000
Total 40200.000 9
Corrected Total 200.000 8
a R Squared = .860 (Adjusted R Squared = .720)
5.4.3 有交互作用的双因素方差分析
双因素重复试验的方差分析数据结构表
问:
(1)因素A的不同水平(方案)的效果(均值)有无显著影响?
(2)因素B的不同水平(方案)的效果(均值)有无显著影响?
(3)因素A与B之间的交互作用如何?
观测数据 因素B1 因素B2 … 因素Bn
因素A1 x111x112 … x11t x121x122 … x12t … x1n1x1n2 … x1nt
因素A2 x211x212 … x21t x221x222 … x22t … x2n1x2n2 … x2nt
… … … … …
因素As xs11xs12 … xs1t xs11xs22 … xs2t … xsn1xs22 … xsnt
分析过程(待续)
假设在Ai与Bj下的总体Xij,服从N(μi,σ2)分布(注意:相当于s×n个方差相同,均值可能不同)
(1)总体平均分布
(2)第i行总体的平均
(3)第j列总体平均
(4)Ai的主效应
(5)Aj的主效应
分析过程(续)
若Ai与Bj间存在交互影响,则
称为Ai与Bj的交互效应,有
μij=μ+ai+bj+cij
从重复抽样的角度看
Xijk=μij+εijk
εijk服从N(0,σ2)分布,并且εijk之间相互独立,则有
Xijk=μ+ai+bj+cij+εijk
i=1,2,…,s;j=1,2,…,n;k=1,2,…,t;t是实验次数,此式称为“有交互影响的双因素(一元)模型”
有交互影响的双因素模型构成表
Xij的构成
μij的构成
μ αi(= μi - μ)
bi(= μ j - μ) cij εij服从
N(0,σ2)
全局稳定的中心 行、列稳定中心
与全局中心的偏差 交互作用 随机扰动
由上表得:
εijk=Xijk-μ-ai-bj-cij=Xijk-μij
其中,i=1,2,…,s;j=1,2,…,n;k=1,2,…,t
如果效果的数据是多元的(向量),就是双因素多元问题
5.4.4 有交互作用的双因素方差分析SPSS应用
例5.5,在每种情况下观测两个数据组成样本
观测数据 原料用量B
B1 B2 B3
产地 A1 59,61 70,72 66,64
A2 63,61 74,76 70,72
A3 61,64 66,65 71,74
产品合格率数据
分析过程(待续)
Analyze → General Lineral Model → Univariate → {Univariate} → quality → (Dependent Variable) ,group1和group2 → (Fixed Factor(s)) →“Model” → Full Factorial → Type III→“Conitnue” → {Tests of Between-Subjects Effects}
Tests of Between-Subjects Effects
Source Type III Sum of Squares df Mean Square F Sig.
Corrected Model 453.000(a) 8 56.625 23.703 .000
Intercept 81204.500 1 81204.500 33992.581 .000
GROUP1 49.000 2 24.500 10.256 .005
GROUP2 292.000 2 146.000 61.116 .000
GROUP1 * GROUP2 112.000 4 28.000 11.721 .001
Error 21.500 9 2.389
Total 81679.000 18
Corrected Total 474.500 17
分析过程(续)
因素“产地”(用Group1标识)的检验,P=0.005<0.05,所以拒绝H0A,因此,可有95%的把握可以认为原料产地对产品的质量有显著影响
因素“原料用量”(用Group2标识)的检验P=0.000<0.05,所以拒绝H0B,表明有95%的把握可以认为原料的用量对产品的质量有显著影响
两个因素的交互效应(用GROUP1 * GROUP2标识)P=0.001<0.05,所以拒绝原假设,表明有95%的把握可以认为两者的交互作用对产品的质量有显著影响

展开更多......

收起↑

资源预览