资源简介 (共40张PPT)《应用统计学》方差分析CONTENTS目录第一节 方差分析的基本原理第二节 单因素方差分析的过程第三节 双因素方差分析CONTENTS目录第一节 方差分析的基本原理应用统计学应用统计学例:消费者常会因产品或服务质量问题向消费者协会投诉。为了对交通货运4个部门的服务质量进行评价,消费者协会在航空货运、铁路货运、公路货运及水路货运分别抽取了不同的企业作为样本,不同的部门投诉均值是否存在差异?航空货运 铁路货运 公路货运 水路货运32 44 48 4441 37 29 5534 64 39 6435 52 51 7353 48 45 5845 68 60 56 应用统计学方差分析的基本原理因素(A) i水平A1 水平A2 … 水平Akx11 x21 … xk1x12 x22 … xk2: : : :: : : :…应用统计学方差分析的基本原理设因素有k个水平,每个水平的均值分别用 1 , 2, , k 表示H0 : 1 2 … kH1 : 1 , 2 , , k 不全相等方差分析:(Analysis of Variances,简记为:ANOVA)研究一种或多种因素对某一结果的是否有显著影响的模型因素:一个或多个分类型自变量结果:一个数值型因变量应用统计学方差分析的基本原理组间方差因素的不同水平之间数据误差的平方和比如,不同行业之间的被投诉次数之间的差异这种差异可能是由于行业本身所造成的,所形成的误差 是由系统性因素造成的,称为系统误差组内平方和因素的同一水平下数据误差的平方和。比如,同一行业下不同企业被投诉次数之间的差异。这种差异可以看成是随机因素的影响,称为随机误差。方差分析核心:利用组间方差与组内方差的比较来判断因素水平对试验结果的影响。条件和结果:1.若因素水平无显著影响:组间方差类似组内方差,主要由随机差异组成,比值约为1。2.若因素水平有显著影响:组间方差包含系统差异,超过组内方差,比值显著大于1。显著性判定:方差比值超过特定临界点时,表明因素水平间存在显著差异。方差分析的基本原理应用统计学方差分析的基本假定(1)每个总体都应服从正态分布:对于因素的每一个水平,其观察值是来自服从正态分布总体的简单随机样本。比如,每个行业被投诉的次数必须服从正态分布。(2)各个总体的方差必须相同:各组观察数据是从具有相同方差的总体中抽取的。比如,4个行业被投诉次数的方差都相等。(3)观测值是独立的。不同观测结果之间不会相互影响。方差分析的基本原理第二节 单因素方差分析的过程应用统计学应用统计学1. 提出假设例:设 1为航空货运被投诉次数的均值, 2为铁路货运被投诉次数的均值, 3为公路货运被投诉次数的均值, 4为水路货运被投诉次数的均值,提出的假设为:H0 : 1 2 3 4H1 : 1 , 2 , 3 , 4 不全相等应用统计学2. 计算总体误差平方和全部观察值 与总平均值 的离差平方和反映全部观察值的离散状况其计算公式为:其中,应用统计学3. 计算组间误差平方和各组平均值 与总平均值 的离差平方和反映各总体的样本均值之间的差异程度计算公式为应用统计学4. 计算组内误差平方和各组样本数据与其组平均值的离差平方和反映各组样本观察值离散状况计算公式为应用统计学总离差平方和(SST)、误差项离差平方和(SSE)、水平项离差平方和 (SSA) 之间的关系:SST = SSA + SSE应用统计学5. 计算均方差各误差平方和的大小与观察值的多少有关,为消除观察值多少对误差平方和大小的影响,需要将其平均,这就是均方,也称为方差由误差平方和除以相应的自由度求得三个平方和对应的自由度分别是SST 的自由度为n-1,其中n为全部观察值的个数SSA的自由度为k-1,其中k为因素水平(总体)的个数SSE 的自由度为n-k应用统计学组间方差MSA,计算公式为:组内方差MSE,计算公式为:5. 计算均方差应用统计学6. 计算检验统计量应用统计学方差分析的基本原理应用统计学将MSA和MSE进行对比,即得到所需要的检验统计量F。当H0为真时,二者的比值服从分子自由度为k-1、分母自由度为 n-k 的 F 分布,即:6. 计算检验统计量应用统计学7. 进行统计检验 F检验统计量值与给定显著性水平 下的临界值F 进行比较,作出决策:若F>F ,拒绝原假设H0 ,各总体均值不全相等若F不拒绝原假设H0 ,各总体均值无显著统计差异 F (k-1,n-k)0拒绝H0不能拒绝H0F应用统计学方差分析表方差来源 平方和 自由度 均方 F 统计量组间误差 SSA k-1 MSA MSA/MSE组内误差 SSE n-k MSE总误差 SST=SSA+SSE n-1 ---应用统计学方差分析表方差来源 平方和 自由度 均方 F统计量组间误差 1092.95833 3 364.31944 3.45> 3.1=F0.05(3,20)拒绝原假设组内误差 2112 20 105.6总误差 3204.95833 23 应用统计学若方差分析的结果为因子A各水平之间有显著差异,需要进行各水平均值的两两比较,进一步检验到底哪些均值之间存在差异。单因素方差分析中的多重比较应用统计学通过对总体均值之间的配对比较来可采用Fisher提出的最小显著差异方法,简写为LSD。LSD方法是对检验两个总体均值是否相等的t检验方法的总体方差估计加以修正(用MSE来代替)而得到。单因素方差分析中的多重比较单因素方差分析中的多重比较应用统计学1. 提出假设H0: i = j(第i个总体的均值等于第j个总体的均值)H1: i j (第i个总体的均值不等于第j个总体的均值)2. 计算检验的统计量:3. 计算 ,自由度df=n-k4. 决策:若 ,拒绝H0;第三节 双因素方差分析应用统计学应用统计学双因素方差分析的类型无交互作用的双因素方差分析(无重复双因素分析)有交互作用的双因素方差分析(重复双因素分析)假定因素A和因素B的效应之间是相互独立的,不存在相互关系假定因素A和因素B的结合会产生出一种新的效应双因素方差分析无重复双因素方差分析应用统计学某商品有五种不同的包装方式(因素A),在五个不同地区销售(因素B),现从每个地区随机抽取一个规模相同的超级市场,得到该商品不同包装的销售资料如下表.包装方式(A)A1 A2 A3 A4 A5销 售 地 区 (B) B1 20 12 20 10 14B2 22 10 20 12 6B3 24 14 18 18 10B4 16 4 8 6 18B5 26 22 16 20 10应用统计学因素AA1 A2 … Ar因 素 B B1 X11 X12 … X1rB2 X21 X22 … X2r… … … … … …Bk Xk1 Xk2 … Xkr…无重复双因素方差分析应用统计学每个总体都服从正态分布:对于因子的每一个水平,其观察值是来自正态分布总体的简单随机样本。各个总体的方差必须相同:对于各组观察数据,是从具有相同方差的总体中抽取的。观察值是独立的。无重复双因素方差分析应用统计学无重复双因素方差分析应用统计学由离差平方和与自由度可以计算均方差:对因素A而言:对因素B而言:对误差而言:无重复双因素方差分析应用统计学误差来源 离差平方和 自由度 均方差 F值A因素 SSA r-1 MSA=SSA/(r-1) FA=MSA/MSEB因素 SSB k-1 MSB=SSB/(k-1) FB=MSB/MSE误差 SSE (r-1)(k-1) MSE=SSE/(r-1)(k-1) ---合计 SST n-1 --- ---无重复双因素方差分析应用统计学建立假设对因素A:H0: , 包装方式之间无差别。H1: ,不全相等, 包装方式之间有差别。对因素B:H0: ,地区之间无差别。H1: ,不全相等,地区之间有差别。无重复双因素方差分析应用统计学接下来:因此无重复双因素方差分析应用统计学对于因素A,因为FA=3.87>F0.05(4,16)=3.01故拒绝H0 接受H1,说明不同的包装方式对该商品的销售产生影响。对于因素B,因为FB=2.30故接受 H0说明不同地区该商品的销售没有显著差异。无重复双因素方差分析应用统计学 提出假设对行因子提出的假设为H0:m1 = m2 = … = mi = …= mk (mi为第i个水平的均值)H1:mi (i =1,2, … , k) 不全相等对列因子提出的假设为H0: m1 = m2 = … = mj = …= mr (mj为第j个水平的均值)H1: mj (j =1,2,…,r) 不全相等对交互作用的假设为H0:无交互作用H1: 有交互作用有重复双因素方差分析应用统计学总平方和:行变量平方和:列变量平方和:交互作用平方和:误差项平方和:有重复双因素方差分析应用统计学检验行因子的统计量检验列因子的统计量检验交互作用的统计量有重复双因素方差分析 展开更多...... 收起↑ 资源预览