资源简介 (共60张PPT)管理统计学5 方差分析5.1 方差分析基本原理5.2 单因素方差分析5.3 单因素方差分析的SPSS应用5.4 双因素方差分析5.1 方差分析基本原理方差分析的实质:检验多个总体均值是否有显著性差异(观测值变异原因的数量分析)将k个处理的观测值作为一个整体看待,把观测值总变异的平方和及自由度分解为相应于不同变异来源的平方和及自由度,进而获得不同变异来源总体方差估计值通过计算这些总体方差的估计值的适当比值,检验各样本所属总体平均数是否相等5.1.1 基本概念(待续)因素:影响实验结果的条件,常用大写字母A、B、C、…等表示单因素实验:当研究中只考察一个因素双因素(多因素)实验:同时研究两个或两个以上的因素因素水平/水平:因素所处的某种特定状态或数量等级,用代表该因素的字母加添足标表示,如A1、A2、…,B1、B2、…处理:事先设计好的实施在实验单位上的具体项目在单因素实验中,实施在实验单位上的具体项目就是实验因素的某一水平在多因素实验中,实验因素的一个水平组合就是一个处理基本概念(续)两类误差① 随机误差:在因素的同一水平(同一个总体)下,样本的各观察值之间的差异,由抽样的随机性所造成② 系统误差:在因素的不同水平(不同总体)下,各观察值之间的差异,由系统性因素造成两类方差① 组内方差:因素的同一水平(同一个总体)下样本数据的方差,组内方差只包含随机误差② 组间方差:因素的不同水平(不同总体)下各样本之间的方差,组间方差既包括随机误差,也包括系统误差实例说明不同颜色(水平)对销售量(结果)没有影响组间方差中只包含有随机误差,没有系统误差组间方差与组内方差很接近,二者比值接近1不同的水平对结果有影响组间方差中包含随机误差和系统误差组间方差大于组内方差,二者比值就会大于1当这个比值大到某种程度时,不同水平之间存在着显著差异例5.1 单因素四水平的试验某饮料生产企业研制出一种新型饮料饮料的颜色:橘黄色、粉色、绿色和无色透明饮料的营养含量、味道、价格、包装相同收集该饮料的销售情况的超级市场地理位置相似、经营规模相仿试分析饮料的颜色是否对销售量产生影响超市 无色 粉色 橘黄色 绿色12345 26.528.725.129.127.2 31.228.330.827.929.6 27.925.128.524.226.5 30.829.632.431.732.8四色饮料在五家超市的销售情况例题分析设 1为无色饮料 (A1)的平均销售量 2粉色饮料(A2)的平均销售量 3为橘黄色饮料(A3)的平均销售量 4为绿色饮料(A4)的平均销售量用方差分析,分析饮料的颜色对销售量是否有影响,检验假设H0: 1 2 3 4H1: 1, 2, 3, 4不全相等颜色是要检验的因素或因子A1、A2、A3、A4四种颜色就是因素的水平每种颜色饮料的销售量就是观察值A1、A2、A3、A4四种颜色可以看作是四个总体,从中抽取的样本数据5.1.2 方差分析中的基本假定(1)变异的可加性(2)每个总体都应服从正态分布(分布的正态性)(3)各组观察数据,是从具有相同方差的总体中抽取的(4)观察值是独立的如果总体的均值相等,可期望样本的均值也会很接近:① 样本的均值越接近,总体均值相等的证据也就越充分② 样本均值越不同,总体均值不同的证据就越充分实例分析例5.1中如果原假设成立,即H0: 1 2 3 4四种颜色饮料销售的均值都相等,且没有系统误差每个样本都来自均值为 、方差为 2的同一正态总体如果备择假设成立,即H1: i(i=1,2,3,4)不全相等则至少有一个总体的均值是不同的,且有系统误差这意味着四个样本分别来自均值不同的四个正态总体不同正态总体同一正态总体5.2 单因素方差分析5.2.1 多个总体均值是否相同的检验5.2.2 多个总体均值的多重比较检验5.2.1 多个总体均值是否相同的检验例5.1中μ表示总体X的均值,μi表示总体Ai的均值,方案i的主效应 i=μi-μ反映水平Ai对销售量的影响随机样本Xij,可以视为各个方案的总体均值μi与随机误差之和:Xij= i + ij由于Xij是来自Ai的观察值,于是有Xij= i + ij= i+ + ij (i=1,2,…,4;j=1,2, …,5)表5-2 单因素方差总体Xij构成表Xij表达为总平均、方案的主效应i与随机项之和εij表示观测过程中各种随机影响引起的随机误差(εij相互独立,服从N(0, 2)分布对应于μi的样本均值(统计量)是 xi ,也就是说, xij - xi表示是随机误差项由 i= μi-μ ,若各个方案的主效应都是0,则各个方案的均值相同单因素方案分析的基本任务是检验如下假设H0:所有 i=0或μ1= μ2 =…=μs= μH1:不全相等(至少有两个不相等)Xij的构成μi (各方案的总体均值) εij服从N(0, 2)μ i=(μi-μ)总体均值 主效应 随机扰动多个总体均值是否相同的检验考察例5.1中颜色是否是影响该饮料销售量的主要因素若饮料的销售量服从正态分布,不同颜色饮料销售量方差相等考察不同颜色对饮料销售量有无显著影响,即考察4个水平对销售量的影响是否差异显著,即要检验假设:H0: a1= a2= a3= a4=0销售量(箱) 试验批号 各水平下平均销售量Xi 1 2 3 4 5因素(颜色) A1(粉色) 26.5 28.7 25.1 29.1 27.2 27.32A2(无色) 31.2 28.3 30.8 27.9 29.6 29.56A3(绿色) 27.9 25.1 24.2 26.5 26.5 26.44A4(桔色) 30.8 29.6 32.4 32.8 32.8 31.46总平均销量 28.695分析过程(待续)① 将总体离差分解总体销售量离差平方和ST有两个来源一是由水平不同造成的不同水平下平均销售量差异SA一是由除了颜色之外的随机干扰造成的、同一水平下的销售量差异SE其中,m表示因素A(颜色)的水平数m=4,n表示观测次数n=5② 将总体离差的自由度分解n的含义不同,前者n表示样本总容量,后者表示观测次数分析过程(续)③ 将离差均方化,得均方和(为了具有可比性)MSA=SA/fA MSE=SE/fE④ 比较,计算F值:F=MSA/ MSE⑤ 检验,所示看F统计量是否落在接受域还是拒绝域中若F≤F0.05(fA,fE) ,则无显著影响,记为/若F0.05(fA,fE) 若F>F0.03(fA,fE) ,则影响特别显著,记为**单因素方差分析表注:F0.05(3,16)=3.24, F0.03(3,16)=5.29由于F=10.458> F0.03(fA,fE) ,所以颜色对饮料销售量有特别显著影响方差来源 离差平方和 自由度 均方和 F值 检验结论因素A(颜色)随机干扰E总和T SA=76.85SE=39.08ST=115.93 fA=3fE=16fT=19 MSA=25.615MSE=2.443 F=10.485 **方差来源 离差平方和 自由度 均方和 F值 检验结论因素A随机干扰E总和T SASEST fAfEfT MSAMSE F=MSA/MSE例5.1的单因素方差分析表例5.2 数学成绩分析40名学生随机分成5个班,每个班的班主任负责不同科目A表示班主任教数学B表示班主任教语文C表示班主任教生物D表示班主任教地理E表示班主任教物理用方差分析的方法检验5组不同班主任的学生数学成绩是否有显著差异A B C D E76 76 62 65 6778 67 70 68 7165 70 69 68 7272 64 73 71 6971 67 71 61 7472 83 69 69 7983 72 73 65 7679 73 69 69 84解题过程① 建立假设 H0: 1= 2= 3= 4= 5② 平方和 ST=1160.4,SA=314.4SE=ST-SA=1160.4-314.4=864③ 自由度 fA=k-1=5-1=4,fE=k(n-1)=35④ 均方 MSA=SA/fA=314.4/4=78.6MSE=SE/fE=846/35=24.17⑤ F检验 F=MSA/MSE=78.6/24.17=3.252查F分布表(单侧)F0.05(4,35)=2.64,F>F0.05,p<0.05,拒绝原假设,故在不同班主任的班级中数学成绩有显著不同⑥ 方差分析表方差来源 离差平方和 自由度 均方和 F值 检验结论因素A随机干扰E总和T 314.48461160.4 43539 78.624.17 F=3.252 *注:*表示在0.05水平上显著例5.3 服务质量分析为了对几个行业的服务质量进行评价在零售业、旅游业、航空公司、家电制造业分别抽取了不同的样本记录了一年中消费者对总共23家服务企业投诉的次数试分析这四个行业的服务质量是否有显著差异?( =0.05)消费者对四个行业的投诉次数观察值(j) 行业(A)零售业 旅游业 航空公司 家电制造业1 57 62 51 702 55 49 49 683 46 60 48 634 45 54 55 695 54 56 47 606 53 557 47解题过程设四个行业被投诉次数的均值分别为, 1, 2, 3, 4,则需要检验如下假设H0: 1= 2= 3= 4= 5(四个行业的服务质量无显著差异)H1: 1, 2, 3, 4不全相等(有显著差异)计算结果如下:方差来源 离差平方和 自由度 均方和 F值 检验结论因素A随机干扰E总和T 845.21743621207.217 31922 281.739119.05263 14.78741 *5.2.2 多个总体均值的多重比较检验多重比较:在因变量的三个或三个以上水平下均值之间进行两两比较检验,检验均值间差异LSD方法:由Fisher提出的最小显著差异方法,是对检验两个总体均值是否相等的t检验方法的总体方差估计加以修正(用MSE来代替)而得到的,可用于判断均值之间差异LSD的操作步骤(1)提出假设H0: i= j(第i个总体的均值等于第j个总体的均值)H1: i j(第i个总体的均值不等于第j个总体的均值)(2)检验的统计量为(3)若|t| t ,拒绝H0;若|t|基于统计量 的LSD方法的操作步骤为(1)通过判断样本均值之差的大小来检验H0(2)检验的统计量为: ,检验的步骤为① 提出假设H0: i= j(第i个总体的均值等于第j个总体的均值)H1: i j(第i个总体的均值不等于第j个总体的均值)② 计算LSD③ 检验若| | LSD,拒绝H0,若| |实例分析针对例5.1,根据前面的计算结果有:x1=27.3; x2=29.5; x3=26.4; x4=31.4① 提出假设 H0: i= j; H1: i j② 计算LSD③ 检验| x1- x2|= |27.3-29.5| =2.2>2.096,颜色1与颜色2的销售量有显著差异| x1- x3|= |27.3-26.4| =0.9<2.096,颜色1与颜色3的销售量没有显著差异| x1- x4|= |27.3-31.4| =4.1>2.096,颜色1与颜色4的销售量有显著差异| x2- x3|= |29.5-26.4| =3.1>2.096,颜色2与颜色3的销售量有显著差异| x2- x4|= |29.5-31.4| =1.9<2.096,颜色2与颜色4的销售量没有显著差异| x3- x4|= |26.4-31.4| =5>2.096, 颜色3与颜色4的销售量有显著差异5.3 单因素方差分析的SPSS应用例5.4 根据下列随机抽样数据,试分析各地区平均每天交通事故的次数是否有显著性差异(α=0.05)五个地区每天发生交通事故的次数表东部 北部 中部 南部 西部15 12 10 14 1317 10 14 9 1214 13 13 7 911 17 15 10 1414 12 8 107 9分析过程分析不同的地理位置是否为影响每天交通事故次数的因素因素的每个水平——东部、北部、中部、南部、西部看作五个总体设五个地区平均每天发生交通事故的次数分别为 1、 2、 3、 4、 5,从不同总体抽取的样本数据的个数,分别是4,5,5,6,6检验各地区平均每天交通事故的次数是否有显著性差异,是一个单因素方差分析问题原假设H0: 1= 2= 3= 4= 5备择假设H1: 1、 2、 3、 4、 5不全相等One-Way ANOVA对话框设置打开数据文件,需要注意“所在地区”对应的变量值标签定义为1=“东部”,2=“北部”,3=“中部”,4=“南部”,5=“西部”Analyze→Compare Means→One-Way ANOVA→{One-Way ANOVA}放置因变量,可放置多个放置自变量用于比较和分析均值的特性,一元方差分析的时候,一般不用此功能方差相等或方差不相等情况下的检验选项选择统计量和缺少值处理方式One-Way ANOVA Options对话框设置{One-Way ANOVA} →(变量Y(交通事故次数)) → Dependent List →(变量X(所在地区) → Factor)→ Options → {One-Way ANOVA: Options}要求输出描述统计量要求输出固定效应模型的标准离差、标准误差、和95%的置信区间,还输出随机效应模型的标准误差、95%的置信区间和因素水平间方差估计要求进行方差齐次性检验,输出结果计算Brown-Forsythe统计量,检验各组均值是否相等计算Welch统计量,检验各组的均值是否相等Means plot输出Continue → OK → {Means plot输出}描述统计值Descriptives交通事故次数N Mean Std.Deviation Std.Error 95% ConfidenceInterval for Mean Minimum MaximumLowerBound UpperBound1 4 14.25 2.500 1.250 10.27 18.23 11 172 5 13.20 2.588 1.158 9.99 16.41 10 173 5 12.80 1.924 .860 10.41 15.19 10 154 6 9.17 2.639 1.078 6.40 11.94 7 145 6 11.17 2.137 .872 8.92 13.41 9 14Total 26 11.88 2.833 .556 10.74 13.03 7 17不同地区平均每天交通事故的次数分别是14.25、13.20、12.80、9.17和11.17方差齐性检验表设不同地区的交通事故次数的方差分别为原假设H0:原假设H1: 不全相等方差齐性检验表 Test of Homogeneity of Variances交通事故次数Levene Statistic df1 df2 Sig..096 4 21 .983Levene Statistic(统计量)的值为0.096组间、组内自由度分别为4、21,相应的显著性概率p(Sig.)为0.983,非常大因此,没有理由拒绝原假设,认为不同地区的交通事故次数的方差没有显著性差异,即方差具有齐性方差分析表 ANOVAF=3.676,显著性概率(Sig.)=0.02当取α=0.05时,Sig.=0.02<0.05,故拒绝原假设,认为各地区平均每天交通事故次数有显著性差异如果查F统计量分布表得到F0.05(4,21)=2.85,α=0.05时,F=3.676>F0.05(4,21)=2.85,则拒绝原假设H0,表明所检验的因素即地区对平均每天交通事故的次数观测值有显著影响Sum of Squares df Mean Square F Sig.Between Groups 82.637 4 20.659 3.676 .020Within Groups 118.017 21 5.620Total 200.654 25两两比较不同水平的差异在{One-Way ANOVA对话框} →变量Y(交通事故次数)移入到Dependent List 框,变量X(所在地区)移入Factor框内 → Post Hoc → {One-Way ANOVA: Post Hoc Multiple Comparisions对话框}方差相等假设下的可选择方法方差非齐次性假设Equal Variances AssumedEqual Variances Assumed:方差相等假设下的可选择方法LSD:最小二乘法,是T检验的变形,在变异与自由度计算上利用了整个样本信息,敏感度最高Bonferroni:由LSD修正而来,通过设置每个检验的α水平来控制总的α水平水,这个方法的敏感度介于LSD和Scheffe之间Sidak:用T检验完成多重配对比较,可以调整显著性水平,比Bonfferroni方法的调整界限小Scheffe:它利用F分布进行均值间的配对比较R-E-G-W F(Ryan- Einot -Gabriel - Welsch F):利用F检验进行多重比较R-E-G-W Q(Ryan-Einot -Gabriel - Welsch range test):基于t分布进行多重逐步比较S-N-K(Student-Newman-Keuls):它利用 T 分布进行均值间的配对比较Tukey(Tukey’s honestly significant difference):利用T化极差分布进行均值间的配对比较Tukey’s-b:利用T化极差分布进行均值间的配对比较,精确值为前两种检验相应值的平均值,利用该方法时一般要选择前两种方法Duncan(Duncan’s multiple range test):逐步比较一系列分布值,得出结论,适用于分布不明确的情况Hochberg’s GT2:利用T化极差分布进行多重比较Gabriel:利用T化极差分布进行配对比较Waller-Duncan:利用t检验进行多重比较Dunnett方法:选择开头一组或者最后一组为对照,其他组跟它进行比较,当选中这一种方法后,Control Category被激活,它后面的下拉菜单框中有两个选项,即:First和Last,可以选择其中一个,它们就是对照组Equal Variances Assumed (续)Equal Variances Not AssumedEqual Variances Not Assumed:方差非齐次性假设下的方法有:Tamhane’s T2 :利用t检验进行配对比较,是一种比较老式的方法Dunnett’s T3:在T化极差分布下进行配对比较Games-Howell:它是一种较灵活的方差不具齐次时的配对比较检验法Dunnett’s C :基于t分布下的配对比较多重比较结果表 Multiple Comparisons选择LSD → Tamhane’s T2 → Continue → {ANOVA} →OK → {多重比较结果表 Multiple Comparisons}LSD(I)所在地区0 (J)所在地区 MeanDifference (I-J) Std. Error Sig. 95% Confidence IntervalLower Bound Upper Bound1 2 1.05 1.590 .516 -2.26 4.363 1.45 1.590 .372 -1.86 4.764 5.08(*) 1.530 .003 1.90 8.275 3.08 1.530 .057 -.10 6.272 1 -1.05 1.590 .516 -4.36 2.263 .40 1.499 .792 -2.72 3.524 4.03(*) 1.435 .010 1.05 7.025 2.03 1.435 .171 -.95 5.02(续表)3 1 -1.45 1.590 .372 -4.76 1.862 -.40 1.499 .792 -3.52 2.724 3.63(*) 1.435 .019 .65 6.625 1.63 1.435 .268 -1.35 4.624 1 -5.08(*) 1.530 .003 -8.27 -1.902 -4.03(*) 1.435 .010 -7.02 -1.053 -3.63(*) 1.435 .019 -6.62 -.655 -2.00 1.369 .159 -4.85 .855 1 -3.08 1.530 .057 -6.27 .102 -2.03 1.435 .171 -5.02 .953 -1.63 1.435 .268 -4.62 1.354 2.00 1.369 .159 -.85 4.85* The mean difference is significant at the .05 level.(*表示在0.05的显著性水平下均值差有显著性差异)只有南部地区的平均每天交通事故次数与东部、北部、中部地区的平均每天交通事故次数有显著性差异5.4 双因素方差分析(待续)双因素:是指问题中有两个(反映条件或前提的)变量As是变量A的一个取值(又称因素A的一个水平)Bn是变量B的一个取值(又称因素B的一个水平)假设在Ai与Bj下的总体Xij,服从N(μij,σ2)分布双因素方差分析的数据结构表表中,xij表示因素Ai和因素Bj下的试验效果的观察值因素B1 因素B2 … 因素Bn因素A1 x11 x12 … x1n因素A2 x21 x22 … x2n… … … … …因素As xs1 xs2 … xsn双因素方差分析(续)总体Xij的总平均:第i行总体的平均:第j列总体平均:Ai的主效应:Aj的主效应:如果Ai与Bj间不存在交互效应,就有μij=μ+ ai+bj5.4.1 无交互作用的双因素方差分析随机样本Xij可以视为其总体均值ij与随机误差εij之和Xij=μij+ εijεij服从N(0,σ2)分布,并且εij之间相互独立于是有Xij= μ+ ai+bj + εij称为“无交互影响的双因素(一元)模型”Xij的构成(各方案的总体均值) εij服从N(0, 2)μ ai=(μi-μ)总体均值 主效应 随机扰动效果的数据是多元的(向量),就是双因素多元问题无重复实验双因素方差分析方案的假设零假设:备择假设: 之间不完全相等(至少有两个不等),或不全等于0之间不完全相等(至少有两个不等),或不全等于0统计量无交互影响的双因素模型下的结论① SA、SB、SE相互独立,且ST=SA+SB+SE② SE / 2服从分布 2((s-1)(n-1))③ H0A成立时,有 SA / 2 服从 2(s-1)④ H0B成立时,有 SB / 2 服从 2(n-1)⑤ H0A成立时,有FA服从F((n-1),(s-1)(n-1)) 分布对给定的α,查表得 F ((n-1),(s-1)(n-1))若FA>F ((n-1),(s-1)(n-1)) 拒绝H0A,即至少A因素中有两个水平之间的平均效果(均值),差异足够大反之,接受H0A,即A因素的不同水平的效果(均值)没有显著差异若FB>F ((n-1),(s-1)(n-1)) ,拒绝H0B,即至少B因素有两个水平之间的平均效果(均值)差异足够大反之,接受H0B,即B因素中的不同水平的效果(均值)没有显著差异5.4.2 无交互作用的双因素方差分析SPSS应用例5.5 考察原料用量和产地对产品质量是否有影响现有三个产地:甲(A1)、乙(A2)、丙(A3)原料用量有三种情况:现用量(B1)、增加5%(B2)、增加8%(B3)每个水平组合做一次试验现需要分析原料用量及产地对产品质量的影响是否显著表5-17 产品合格率数据观测数据 原料用量BB1 B2 B3产地 A1 59 70 66A2 63 74 70A3 61 66 71General Lineral Model:UnivariateAnalyze → General Lineral Model → {Univariate}因变量矩形框,将因变量放入其中固定因素栏,放入固定因素随机因素栏,放入随机因素协变量栏,放入协变量加权变量栏Model模型对话框quality →选入Dependent Variable→选中group1和group2 →选入Fixed Factor(s)→ “Model” →{模型对话框}指定模型类型建立因素全模型自定义模型Univariate:Model对话框中选择Cutom单击Custom选项,选择自定义模型选择模型中的主效应的方法用鼠标单击个变量名,然后单击Build Term(s)栏中下面的箭头,该变量出现在Model框中,重复这种操作,就可以设置多个主效应,但是不要同时送入,否则可能是交互效应在Build Term(s)栏下面的小菜单中选择Main effects项,然后选择多个主效应变量进入Model框中,如果只进行主效应分析,则单击Continue按钮确认并返回主对话框,否则进入下一步建立模型中的交互项Build Term(s) → Interaction右侧向下的黑色小箭头Interaction:指定任意的交互效应ALL 2-way:指定所有2维交互效应ALL 3-way:指定所有3维交互效应ALL 4-way:指定所有4维交互效应ALL 5-way:指定所有5维交互效应因素变量的交互效应,要求模型中包括因素变量:group1和group2的交互效应① Build Term(s) → Interaction → group1 → group2 → Build Term(s)栏中下面的箭头→交互项就出现在Model框中② Build Term(s) → ALL 2-way,其他步骤同上选择分解平方和的方法TypeI:分层处理平方和的方法,仅对模型主效应之前的每项进行调整,一般适用于平衡ANOYA模型和嵌套模型,在前一模型中一阶交互效应前指定主效应,二阶交互效应前指定一阶交互效应,依此类推TypeII:对其他所有效应进行调整,一般适用于平衡ANOYA模型、主因素效应模型、回归模型和嵌套设计Type III(默认值):对其他任何效应都进行调整,其优势是把所估计剩余常量也考虑到单元频数中,一般适用于TypeI、TypeII所列的模型,没有空单元格的平衡和非平衡模型Type IV:对任何效应F计算平方和,没有缺失单元的设计使用该法一般使用Type I、Type II所列的模型,没有空单元格的平衡和非平衡模型无重复试验的双因素方差分析表Continue → {Univariate} → OKDependent Variable: QUALITY因素“产地”(用Group1标识)的检验,P=0.269>0.05,接受H0A,因此,可有95%的把握可以认为原料产地对产品的质量影响不大因素“原料用量”(用Group2标识)的检验P=0.026<0.05,所以拒绝H0B,表明有95%的把握可以认为原料的用量对产品的质量有显著影响Source Type III Sum of Squares df Mean Square F Sig.Corrected Model 172.000(a) 4 43.000 6.143 .053Intercept 40000.000 1 40000.000 5714.286 .000GROUP1 26.000 2 13.000 1.857 .269GROUP2 146.000 2 73.000 10.429 .026Error 28.000 4 7.000Total 40200.000 9Corrected Total 200.000 8a R Squared = .860 (Adjusted R Squared = .720)5.4.3 有交互作用的双因素方差分析双因素重复试验的方差分析数据结构表问:(1)因素A的不同水平(方案)的效果(均值)有无显著影响?(2)因素B的不同水平(方案)的效果(均值)有无显著影响?(3)因素A与B之间的交互作用如何?观测数据 因素B1 因素B2 … 因素Bn因素A1 x111x112 … x11t x121x122 … x12t … x1n1x1n2 … x1nt因素A2 x211x212 … x21t x221x222 … x22t … x2n1x2n2 … x2nt… … … … …因素As xs11xs12 … xs1t xs11xs22 … xs2t … xsn1xs22 … xsnt分析过程(待续)假设在Ai与Bj下的总体Xij,服从N(μi,σ2)分布(注意:相当于s×n个方差相同,均值可能不同)(1)总体平均分布(2)第i行总体的平均(3)第j列总体平均(4)Ai的主效应(5)Aj的主效应分析过程(续)若Ai与Bj间存在交互影响,则称为Ai与Bj的交互效应,有μij=μ+ai+bj+cij从重复抽样的角度看Xijk=μij+εijkεijk服从N(0,σ2)分布,并且εijk之间相互独立,则有Xijk=μ+ai+bj+cij+εijki=1,2,…,s;j=1,2,…,n;k=1,2,…,t;t是实验次数,此式称为“有交互影响的双因素(一元)模型”有交互影响的双因素模型构成表Xij的构成μij的构成μ αi(= μi - μ)bi(= μ j - μ) cij εij服从N(0,σ2)全局稳定的中心 行、列稳定中心与全局中心的偏差 交互作用 随机扰动由上表得:εijk=Xijk-μ-ai-bj-cij=Xijk-μij其中,i=1,2,…,s;j=1,2,…,n;k=1,2,…,t如果效果的数据是多元的(向量),就是双因素多元问题5.4.4 有交互作用的双因素方差分析SPSS应用例5.5,在每种情况下观测两个数据组成样本观测数据 原料用量BB1 B2 B3产地 A1 59,61 70,72 66,64A2 63,61 74,76 70,72A3 61,64 66,65 71,74产品合格率数据分析过程(待续)Analyze → General Lineral Model → Univariate → {Univariate} → quality → (Dependent Variable) ,group1和group2 → (Fixed Factor(s)) →“Model” → Full Factorial → Type III→“Conitnue” → {Tests of Between-Subjects Effects}Tests of Between-Subjects EffectsSource Type III Sum of Squares df Mean Square F Sig.Corrected Model 453.000(a) 8 56.625 23.703 .000Intercept 81204.500 1 81204.500 33992.581 .000GROUP1 49.000 2 24.500 10.256 .005GROUP2 292.000 2 146.000 61.116 .000GROUP1 * GROUP2 112.000 4 28.000 11.721 .001Error 21.500 9 2.389Total 81679.000 18Corrected Total 474.500 17分析过程(续)因素“产地”(用Group1标识)的检验,P=0.005<0.05,所以拒绝H0A,因此,可有95%的把握可以认为原料产地对产品的质量有显著影响因素“原料用量”(用Group2标识)的检验P=0.000<0.05,所以拒绝H0B,表明有95%的把握可以认为原料的用量对产品的质量有显著影响两个因素的交互效应(用GROUP1 * GROUP2标识)P=0.001<0.05,所以拒绝原假设,表明有95%的把握可以认为两者的交互作用对产品的质量有显著影响 展开更多...... 收起↑ 资源预览