第7章 -方差分析 课件(共40张PPT)-《应用统计学(第2版)》同步教学(电子工业版)

资源下载
  1. 二一教育资源

第7章 -方差分析 课件(共40张PPT)-《应用统计学(第2版)》同步教学(电子工业版)

资源简介

(共40张PPT)
《应用统计学》
方差分析
CONTENTS
目录
第一节 方差分析的基本原理
第二节 单因素方差分析的过程
第三节 双因素方差分析
CONTENTS
目录
第一节 方差分析的基本原理
应用统计学
应用统计学
例:消费者常会因产品或服务质量问题向消费者协会投诉。为了对交通货运4个部门的服务质量进行评价,消费者协会在航空货运、铁路货运、公路货运及水路货运分别抽取了不同的企业作为样本,不同的部门投诉均值是否存在差异?
航空货运 铁路货运 公路货运 水路货运
32 44 48 44
41 37 29 55
34 64 39 64
35 52 51 73
53 48 45 58
45   68 60
    56  
应用统计学
方差分析的基本原理
因素(A) i
水平A1 水平A2 … 水平Ak
x11 x21 … xk1
x12 x22 … xk2
: : : :
: : : :

应用统计学
方差分析的基本原理
设因素有k个水平,每个水平的均值分别用 1 , 2, , k 表示
H0 : 1 2 … k
H1 : 1 , 2 , , k 不全相等
方差分析:(Analysis of Variances,简记为:ANOVA)研究一种或多种因素对某一结果的是否有显著影响的模型
因素:一个或多个分类型自变量
结果:一个数值型因变量
应用统计学
方差分析的基本原理
组间方差
因素的不同水平之间数据误差的平方和
比如,不同行业之间的被投诉次数之间的差异
这种差异可能是由于行业本身所造成的,所形成的误差 是由系统性因素造成的,称为系统误差
组内平方和
因素的同一水平下数据误差的平方和。
比如,同一行业下不同企业被投诉次数之间的差异。
这种差异可以看成是随机因素的影响,称为随机误差。
方差分析核心:利用组间方差与组内方差的比较来判断因素水平对试验结果的影响。
条件和结果:
1.若因素水平无显著影响:组间方差类似组内方差,主要由随机差异组成,比值约为1。
2.若因素水平有显著影响:组间方差包含系统差异,超过组内方差,比值显著大于1。
显著性判定:方差比值超过特定临界点时,表明因素水平间存在显著差异。
方差分析的基本原理
应用统计学
方差分析的基本假定
(1)每个总体都应服从正态分布:
对于因素的每一个水平,其观察值是来自服从正态分布总体的简单随机样本。
比如,每个行业被投诉的次数必须服从正态分布。
(2)各个总体的方差必须相同:
各组观察数据是从具有相同方差的总体中抽取的。
比如,4个行业被投诉次数的方差都相等。
(3)观测值是独立的。不同观测结果之间不会相互影响。
方差分析的基本原理
第二节 单因素方差分析的过程
应用统计学
应用统计学
1. 提出假设
例:设 1为航空货运被投诉次数的均值, 2为铁路货运被投诉次数的均值, 3为公路货运被投诉次数的均值, 4为水路货运被投诉次数的均值,提出的假设为:
H0 : 1 2 3 4
H1 : 1 , 2 , 3 , 4 不全相等
应用统计学
2. 计算总体误差平方和
全部观察值 与总平均值 的离差平方和
反映全部观察值的离散状况
其计算公式为:
其中,
应用统计学
3. 计算组间误差平方和
各组平均值 与总平均值 的离差平方和
反映各总体的样本均值之间的差异程度
计算公式为
应用统计学
4. 计算组内误差平方和
各组样本数据与其组平均值的离差平方和
反映各组样本观察值离散状况
计算公式为
应用统计学
总离差平方和(SST)、误差项离差平方和(SSE)、水平项离差平方和 (SSA) 之间的关系:
SST = SSA + SSE
应用统计学
5. 计算均方差
各误差平方和的大小与观察值的多少有关,为消除观察值多少对误差平方和大小的影响,需要将其平均,这就是均方,也称为方差
由误差平方和除以相应的自由度求得
三个平方和对应的自由度分别是
SST 的自由度为n-1,其中n为全部观察值的个数
SSA的自由度为k-1,其中k为因素水平(总体)的个数
SSE 的自由度为n-k
应用统计学
组间方差MSA,计算公式为:
组内方差MSE,计算公式为:
5. 计算均方差
应用统计学
6. 计算检验统计量
应用统计学
方差分析的基本原理
应用统计学
将MSA和MSE进行对比,即得到所需要的检验统计量F。
当H0为真时,二者的比值服从分子自由度为k-1、分母自由度为 n-k 的 F 分布,即:
6. 计算检验统计量
应用统计学
7. 进行统计检验
F检验统计量值与给定显著性水平 下的临界值F 进行比较,作出决策:
若F>F ,
拒绝原假设H0 ,各总体均值不全相等
若F不拒绝原假设H0 ,各总体均值无显著统计差异

F (k-1,n-k)
0
拒绝H0
不能拒绝H0
F
应用统计学
方差分析表
方差来源 平方和 自由度 均方 F 统计量
组间误差 SSA k-1 MSA MSA/MSE
组内误差 SSE n-k MSE
总误差 SST=SSA+SSE n-1 ---
应用统计学
方差分析表
方差来源 平方和 自由度 均方 F统计量
组间误差 1092.95833 3 364.31944 3.45> 3.1
=F0.05(3,20)
拒绝原假设
组内误差 2112 20 105.6
总误差 3204.95833 23
应用统计学
若方差分析的结果为因子A各水平之间有显著差异,需要进行各水平均值的两两比较,进一步检验到底哪些均值之间存在差异。
单因素方差分析中的多重比较
应用统计学
通过对总体均值之间的配对比较来可采用Fisher提出的最小显著差异方法,简写为LSD。
LSD方法是对检验两个总体均值是否相等的t检验方法的总体方差估计加以修正(用MSE来代替)而得到。
单因素方差分析中的多重比较
单因素方差分析中的多重比较
应用统计学
1. 提出假设
H0: i = j(第i个总体的均值等于第j个总体的均值)
H1: i j (第i个总体的均值不等于第j个总体的均值)
2. 计算检验的统计量:
3. 计算 ,自由度df=n-k
4. 决策:若 ,拒绝H0;
第三节 双因素方差分析
应用统计学
应用统计学
双因素方差分析的类型
无交互作用的
双因素方差分析
(无重复双因素分析)
有交互作用的
双因素方差分析
(重复双因素分析)
假定因素A和因素B的效应之间是相互独立的,不存在相互关系
假定因素A和因素B的结合会产生出一种新的效应
双因素方差分析
无重复双因素方差分析
应用统计学
某商品有五种不同的包装方式(因素A),在五个不同地区销售(因素B),现从每个地区随机抽取一个规模相同的超级市场,得到该商品不同包装的销售资料如下表.
包装方式(A)
A1 A2 A3 A4 A5
销 售 地 区 (B) B1 20 12 20 10 14
B2 22 10 20 12 6
B3 24 14 18 18 10
B4 16 4 8 6 18
B5 26 22 16 20 10
应用统计学
因素A
A1 A2 … Ar
因 素 B B1 X11 X12 … X1r
B2 X21 X22 … X2r
… … … … … …
Bk Xk1 Xk2 … Xkr

无重复双因素方差分析
应用统计学
每个总体都服从正态分布:
对于因子的每一个水平,其观察值是来自正态分布总体的简单随机样本。
各个总体的方差必须相同:
对于各组观察数据,是从具有相同方差的总体中抽取的。
观察值是独立的。
无重复双因素方差分析
应用统计学
无重复双因素方差分析
应用统计学
由离差平方和与自由度可以计算均方差:
对因素A而言:
对因素B而言:
对误差而言:
无重复双因素方差分析
应用统计学
误差来源 离差平方和 自由度 均方差 F值
A因素 SSA r-1 MSA=SSA/(r-1) FA=MSA/MSE
B因素 SSB k-1 MSB=SSB/(k-1) FB=MSB/MSE
误差 SSE (r-1)(k-1) MSE=SSE/(r-1)(k-1) ---
合计 SST n-1 --- ---
无重复双因素方差分析
应用统计学
建立假设
对因素A:
H0: , 包装方式之间无差别。
H1: ,不全相等, 包装方式之间有差别。
对因素B:
H0: ,地区之间无差别。
H1: ,不全相等,地区之间有差别。
无重复双因素方差分析
应用统计学
接下来:
因此
无重复双因素方差分析
应用统计学
对于因素A,因为
FA=3.87>F0.05(4,16)=3.01
故拒绝H0 接受H1,
说明不同的包装方式对该商品的销售产生影响。
对于因素B,因为
FB=2.30故接受 H0
说明不同地区该商品的销售没有显著差异。
无重复双因素方差分析
应用统计学
提出假设
对行因子提出的假设为
H0:m1 = m2 = … = mi = …= mk (mi为第i个水平的均值)
H1:mi (i =1,2, … , k) 不全相等
对列因子提出的假设为
H0: m1 = m2 = … = mj = …= mr (mj为第j个水平的均值)
H1: mj (j =1,2,…,r) 不全相等
对交互作用的假设为
H0:无交互作用
H1: 有交互作用
有重复双因素方差分析
应用统计学
总平方和:
行变量平方和:
列变量平方和:
交互作用平方和:
误差项平方和:
有重复双因素方差分析
应用统计学
检验行因子的统计量
检验列因子的统计量
检验交互作用的统计量
有重复双因素方差分析

展开更多......

收起↑

资源预览