第九章 线性回归分析与方差分析_3 课件(共42张PPT)- 《概率论与数理统计》同步教学(大连理工出版社)

资源下载
  1. 二一教育资源

第九章 线性回归分析与方差分析_3 课件(共42张PPT)- 《概率论与数理统计》同步教学(大连理工出版社)

资源简介

(共42张PPT)
第九章 线性回归分析与方差分析
第一节 一元线性回归分析
第二节 可线性化的非线性回归
第三节 多元线性回归简介
第四节 方差分析
第四节 方差分析
一、单因素方差分析
在实际问题中,影响一事物的因素往往是很多的.
例如,在化工生产中,有原料成分、原料剂量、催化剂、反应温度、压力、反映时间等因素,每一因素的改变都有可能影响产品的质量.
有些因素影响较大,有些影响较小.
方差分析就是根据试验的结果进行分析,鉴别各有关因素对试验结果影响的有效方法.
在试验中,将要考察的指标称为试验指标,影响试验指标的条件称为因素.
因素所处的状态称为该因素的水平.
如果试验仅考虑一个因素,则称为单因素试验,否则称为多因素试验.
我们先讨论单因素试验.
例1 某消防队要考察4种不同型号烟雾报警器的反应时间(单位:s).今将每种型号的报警器5个安装在同一条烟道中,当烟量均匀时观测报警器的反应时间,得数据如下:
报警器型号 反 应 时 间
A1(甲型) 5.2 6.3 4.9 3.2 6.8
A2(乙型) 7.4 8.1 5.9 6.5 4.9
A3(丙型) 3.9 6.4 7.9 9.2 4.1
A4(丁型) 12.3 9.4 7.8 10.8 8.5
这里,试验的指标是报警器的反应时间,报警器为因素.
4种不同型号的报警器是因素的4个不同水平.这是一个单因素试验.
我们要考察:
①各种型号的报警器的反应时间有无显著性差异?
②如果各种型号的报警器的反应时间有显著性差异,那么何种型号的报警器最优?
上表中数据可看作来自4个不同总体(每个水平对应一个总体)的样本值,将各个总体均值依次记为
则各型号报警器的反应时间有无显著性差异的问题相当于需检验假设
不全相等.
若再假定各总体均值为正态总体,且各总体方差相等,
那么这是一个检验同方差的多个正态总体均值是否相等的问题.
显然,检验假设H0可以用前面所讲的t检验法,只要检验任何二个总体均值相等就可以了.
下面所要讨论的方差分析法就是解决这类问题的一种检验方法.
但是这样做要检验3次,比较繁琐.

总体均值

样本均值
Xs2
X22
X12
Xs1
X21
X11
As

A2
A1
水平
观测值
设影响指标值的因素A有s个水平A1,A2,…,As
在水平Ai(i=1,…,s)下,进行 次独立试验,得样本Xij,j=1,…,ni:
假定水平Ai下的样本来自正态总体 ,
未知,且不同水平Ai下的样本独立


j=1,…,ni i=1,…,s
Xij相互独立
于是
为随机误差
由假设
在方差分析中,为了便于推广到多因素试验的情形,习惯上又有下列表示式:
j=1,…,ni i=1,…,s
其中
称 为总平均
称 为水平Ai的效应,
满足
现在,要检验
等价于检验
不全为零
下面从平方和的分解着手,导出上述假设H0的检验方案

ST能反映全部试验数据之间的差异,因此称ST为总偏差平方和
由于
于是有平方和分解式:
ST=SE+SA
其中
称SE为误差平方和,SA为因素A的平方和
SE反映了各水平Ai内由于随机误差而引起的抽样误差
SA反映了因素A的水平不同而引起的误差外加随机误差
定理1
(1)
(2)SE与ST相互独立;
(3)当 时, 。
为了检验

F~F(s-1,n-s)
当H0成立时,由定理1,
直观上,当H0成立时,由因素水平的不同引起的偏差相对于随机误差而言可以忽略不计,即F的值应较小;反之,若F值较大,自然认为H0不成立.
若检验结果认为假设H0不成立,则可用 作为 的点估计,或者对 进行区间估计。

得到:在显著性水平 下H0的拒绝域:
计算F的值可用表9-1所示的方差分析表
n-1
ST
总和
n-s
SE
误差
s-1
SA
因素A
F值
均方和
自由度
平方和
偏差来源
表9-1 单因素方差方析表
来源 平方和 自由度 均方和 F值
因素A 56.29 3 18.76 F=6.15
误差 48.77 16 3.05
在实际应用中,一般在 下若仍不能拒绝H0时则接受原假设H0
例2 在例1中,s=4,n1=n2=n3=n4=5,n=20,经计算列方差分析表如下:
查表,得
F0.10(3.16)=2.46,F0.05(3.16)=3.24
从而在显著性水平
下检验结果拒绝H0
由方差分析可知,4种型号的报警器的反应时间确有显著性差异
计算:

即反应时间较短的是甲,丙次之
二、双因素方差分析
假定要考察两个因素A,B对某项指标值的影响
因素A取s个水平A1,A2,…,As
因素B取r个水平B1,B2,…,Br
在A,B的每对组合水平(Ai,Bj)上作一次试验,
试验结果为Xij,i=1,…,s;j=1,…,r。
所有Xij独立,数据列于下表:

Xsr
Xs2
Xs1
As


X2r

X22
X21
A2
X1r

X12
X11
A1
Br

B2
B1
因素B
因素A
其中
要考察因素A,B是否指标值产生显著性影响?

则有
为随机误差,且
相互独立 i=1,…,s j=1,…, r
再假定在水平组合(Ai, Bj)下的效应可以用水平Ai下的效应(记为 )与水平Bj下的效应(记为 )之和来表示,

其中
作假设
如果H01成立,那么 与i无关
这表明因素A对指标值无显著影响
同样,作假设
如果H02成立,则 与i无关
这表明因素B对指标值无显著影响
类似于单因素方差分析,通过下面的平方和分解式可以检验假设H01,H02

通过简单推导可以证明下列平方和分解式:
SA是由因素A的不同效应和 引起的偏差
SB是由因素B的不同效应和 引起的偏差
而SE表示由 引起的偏差
因此,可用比较SA与SE的值来检验假设H01
用比较SB与SE的值来检验假设H02
定理2
(1)ST,SA,SB相互独立,且
(2)当H01成立时,
(3)当H01成立时,
由定理2
于是有
所以H01的拒绝域为
为显著性水平
类似地,可给出H02的拒绝域:
其中
总和
误差
因素B
因素A
F值
均方和
自由度
平 方 和
偏差
来源
表9-2 双因素方差分析表
43
39.5
37.5
36
A3
39.5
38
36.5
33.5
A2
38.5
35.5
35
32
A1
B4
B3
B2
B1
氧化锌B
促进剂A
例3 在某种橡胶的配方中,考虑了3种不同的促进剂,4种不同的氧化锌.各种配方试验一次,测得300%定强如下:
问不同促进剂、不同份量氧化锌分别对定强有无显著性影响?
来源 平方和 自由度 均方和 F值
因素A 28.3 2 14.15 FA=36.3
因素B 66.1 3 22.03 FB=56.5
误差 2.35 6 0.39
总和 96.75 11
解 由题意,影响定强这一指标值的因素有二个:促进剂A、氧化剂B
s=4,r=3,列出如下的方差分析表:

查表,得F0.05(2,6)=5.14 F0.05(3,6)=4.76
比较可知 FA>5.14 FB>4.76
所以不同促进剂和氧化锌的不同份量对橡胶定强都有显著影响
在以上的双因素方差分析中,我们作了假定:
如果此式不能成立,则需考虑二个因素A与B在不同水平组合下的交互作用。
对有交互作用方差分析感兴趣的读者可进一步阅读有关的书籍
习 题 9-4
工厂 寿 命
A1 38 40 42 45 48
A2 26 28 30 32 34
A3 39 45 43 50 50
1.有A1,A2,A3 3个工厂生产同一型号的电池,从各工厂随机抽取5个电池,测得使用寿命(单位:h)如下:
问各厂生产的电池的使用寿命有无显著性差异?
2.4种大白鼠经不同剂量雌激素注射后的子宫重量(单位:g)如下:
试问:① 鼠种的影响是否显著?
② 剂量差异的影响是否显著?( )
鼠种 雌激素剂量(mg/100g)
0.2 0.4 0.8
甲 106 116 445
乙 42 68 115
丙 70 111 133
丁 42 63 87
3.为了考察某种合金中碳的含量百分比(因子A)与锑铝含量和的百分比(因子B)对合金强度的影响,对因子A取3个水平,因子A取4个水平,在每个水平组合下做一次试验,得数据如下:
假设因子A与因子B无交互作用,试检验因子A或B的效应是否显著(取 )
A/B 3.3% 3.4% 3.5% 3.6%
0.03% 63.1 63.9 65.6 66.8
0.04% 65.1 66.4 67.8 69.0
0.05% 67.1 71.0 71.9 73.6
第九章总习题
1.在服装标准的制订过程中,调查了很多人的身材,得到了一系列服装各部位的尺寸与身高、胸围等的关系.下表给出的是一组女青年的身高x与裤长y的数据:
(1) 求裤长y对x身高的线性回归方程;
(2) 在显著水平 下检验回归方程的显著性.
x 168 162 160 160 156 157 159 168 159 162 158 156 165 158 166
y 107 103 103 102 100 100 101 107 110 102 100 99 105 101 105
162 150 152 156 159 156 164 168 165 162 158 157 172 147 155
105 97 98 101 103 99 107 108 106 103 101 101 110 95 99
2.在镁合金X光探伤中,要考虑透视电压U与透视厚度l之间的关系,做了5次试验,得对应数据如下
求U对l的回归直线方程,并检验回归方程的显著性( ).
l 8 16 20 34 54
U 45 52.5 55 62.5 70
3.已知鱼的体重y与体长x有关系式 ,测得尼罗尼非鱼的生长的数据如下,求尼罗尼非鱼体重y与体长x的经验公式.
( )
y/g 0.5 34 75 122.5 170 192 195
x/m 29 60 124 155 170 185 190
4.设x固定,y为正态随机变量,对x,y有如下数据
(1)求y对x的回归方程
(2)求相关系数,检验线性关系的显著性
(3)当x=0.05时,求y的95%的预测区间
(4)若要求| y | < 4,x应控制在何范围内.
x -2.0 0.6 1.4 1.3 0.1 -1.6 -1.7 0.7 -1.8 -1.1
y -6.1 -0.5 7.2 6.9 -0.2 -2.1 -3.9 3.8 -7.5 -2.1
5.设
其中 相互独立,
且 ,求a和b的最小二乘估计.
6.电视机工程师对不同类型外壳的彩色显象管与传导率是否有差异感兴趣,测得四种类型的显象管,测得传导率数据如下:
外壳类型对传导率有显著影响吗?( )
类型1 143 141 150 146
类型2 152 144 137 143
类型3 134 136 133 129
类型4 129 128 134 129
7.教师对学生智力的评价是否影响学生智力的发展?为此任意抽取18名学生进行试验,将这18名学生随机地分为3组,每组6名,先对每名学生测试智商,然后教师对第一组学生宣称他们在今后一年中智力不可能有较大提高,对第二组学生宣称有中等程度的提高,对第三组学生宣称他们将有很大的提高,一年后再对这些学生测试智商,两次智商测试成绩的差如下所示:
据此能否认为教师的评价影响了学生智力的发展?( )
第一组 3 3 6 9 11 5
第二组 10 4 11 15 6 3
第三组 20 10 16 15 9 8
8.在四台不同的纺织机上,用三种不同的加压水平,测得不同机器在不同加压水平下的纱支强度数据如下:
问不同机器和不同加压水平对纱支强度有无显著影响?( )
机器
加压 B1 B2 B3 B4
A1 1577 1690 1800 1642
A2 1535 1640 1783 1621
A3 1592 1652 1810 1663

展开更多......

收起↑

资源预览