8.2.1 一元线性回归模型 (共35张PPT)

资源下载
  1. 二一教育资源

8.2.1 一元线性回归模型 (共35张PPT)

资源简介

(共35张PPT)
·选择性必修第三册·
第八章 成对数据的统计分析
8.2.1
一元线性回归模型
学习目标
1.结合实例,了解一元线性回归模型的含义,了解模型参数的统计意义
2.了解最小二乘原理,掌握一元线性回归模型参数的最小二乘估计方法.(重点)
3.针对实际问题,会用一元线性回归模型进行预测.(难点)
情景导入
8.2.1 一元线性回归模型
01
复习回顾,引入新知
1. 样本相关系数:
2.相关系数的性质:
① 当r>0时,称成对样本数据正相关;当r<0时,称成对样本数据负相关.
② |r|≤1;
③ 当|r|越接近1时,成对数据的线性相关程度越强;当|r|越接近0时,成对数据的线性相关程度越弱;特别地,当|r|=0时,成对数据的没有线性相关关系;当|r|=1时,成对数据都落在一条直线上.
创设背景,引入新知
恩格尔系数(Engel’s Coefficient)指的是居民家庭中食物支出占消费总支出的比重,是表示生活水平高低的一个指标.其计算公式:恩格尔系数=食物支出金额÷总支出金额.
一个家庭收入越少,家庭总支出中用来购买食物的支出所占的比例就越大,随着家庭收入的增加,家庭收入中或者家庭支出中用来购买食物的支出所占比例将会下降.
恩格尔系数是预测生活水平高低的一个模型,那么当两个变量线性相关时,我们如何对成对样本数据建立一个模型进行预测?
思考
一元线性回归模型
8.2.1 一元线性回归模型
02
探究新知
一般来说,父亲的身高较高时,儿子的身高通常也较高.为了进一步研究两者之间的关系,有人调查了14名男大学生的身高及其父亲的身高,得到的数据如下表所示.
编号 1 2 3 4 5 6 7 8 9 10 11 12 13 14
父亲身高/cm 174 170 173 169 182 172 180 172 168 166 182 173 164 180
儿子身高/cm 176 176 170 170 185 176 178 174 170 168 178 172 165 182
利用前面表示数据的方法,以横轴表示父亲身高、纵轴表示儿子身高建立直角坐标系,再将表中的成对样本数据表示为散点图,如右图所示.
由图可知散点大致分布在一条从左下
角到右上角的直线附近,表明儿子身高和父亲身高线
性相关. 利用统计软件,求得样本相关系数为r≈0.886,
表明儿子身高和父亲身高正线性相关,且相关程度较高.
探究新知
根据上表中的数据,儿子身高和父亲身高这两个变量之间的关系可以用函数模型刻画吗?
表中的数据,存在父亲身高相同而儿子身高不同的情况.例如,第6个和第8个观测父亲的身高均为172cm,而对应的儿子的身高为176cm和174cm;同样在第3,4个观测中,儿子的身高都是170cm,而父亲的身高分别为173cm,169cm.
编号 1 2 3 4 5 6 7 8 9 10 11 12 13 14
父亲身高/cm 174 170 173 169 182 172 180 172 168 166 182 173 164 180
儿子身高/cm 176 176 170 170 185 176 178 174 170 168 178 172 165 182
思考
可见儿子的身高不是父亲身高的函数同样父亲的身高也不是儿子身高的函数,所以不能用函数模型来刻画.
探究新知
我们称(1)式为Y关于x的一元线性回归模型. 其中:
用x表示父亲身高,Y表示儿子身高,e表示随机误差. 假定随机误差e的均值为0,方差为与父亲身高无关的定值σ2,则它们之间的关系可以表示为
由于儿子的身高和父亲的身高身高有较强的线性相关,因此我们可以用一次函数来刻画父亲身高对儿子身高的影响,而把影响儿子身高的其他因素,如母亲身高,生活环境等作为随机误差,得到刻画两个变量之间关系的线性回归模型. (随机误差是一个随机变量)
(1)
Y称为因变量或响应变量,
x称为自变量或解释变量,
a称为截距参数,b称为斜率参数;
e是Y与bx+a之间的随机误差.
模型中的Y也是随机变量,其值虽不能由变量x的值确定,但却能表示为bx+a与e的和,前一部分由x所确定,后一部分是随机的.
如果e=0,那么Y与x之间的关系就可用一元线性函数模型来描述.
探究新知
为什么要假设E(e)=0,而不假设其为某个不为0的常数?
①因为误差是随机的,即取各种正负误差的可能性一样,所以它们均值的理想状态应该为0.
②如果随机误差时一个不为0的常数α,则可以将α合并到截距项a中,否则模型无法确定,即参数没有唯一解.
③另外,如果α不为0,则表示存在系统误差,在实际建模中也不希望模型有系统误差,即模型不存在非随机误差.
思考
探究新知
思考
结合父亲与儿子身高的实例,说明回归模型(1)的意义?
可以解释为父亲身高为的所有男大学生的身高组成一个子总体,该子总体的均值为,即该子总体的均值与父亲身高是线性函数关系.
E(Y)=E(bx+a+e)=E(bx+a)+E(e)=(bx+a)+0=bx+a
思考
对于父亲身高为xi的某一名男大学生,他的身高yi一定是bxi+a吗?
对于父亲身高为的某一名男大学生,他的身高并不一定为 bxi+a ,它仅是该子总体的一个观测值,这个观测值与均值有一个误差项ei=yi -(+a).
探究新知
思考
结合具体实例解释产生模型(1)中随机误差项的原因吗
在研究儿子身高与父亲身高的关系时,产生随机误差e的原因有:
(1) 除父亲身高外,其他可能影响儿子身高的因素,比如母亲身高、生活环境、饮食习惯和锻炼时间等;
(2)在测量儿子身高时,由于测量工具、测量精度所产生的测量误差;
(3)实际问题中,我们不知道儿子身高和父亲身高的相关关系是什么,可以利用一元线性回归模型来近似这种关系,这种近似也是产生随机误差e的原因.
能力提升
8.2.1 一元线性回归模型
03
能力提升
题型一
一元线性回归模型辨析
例题1
ABD
能力提升
解析
总结
这类概念辨析题,只需要根据一元线性回归模型的相关定义即可逐一判断.
能力提升
题型二
一元线性回归模型中随机误差的计算
例题2
645
能力提升
解析
总结
能力提升
题型三
一元线性回归模型与散点图
例题3
解析
A
能力提升
题型三
一元线性回归模型与散点图
例题3
能力提升
解析
能力提升
题型四
一元线性回归模型的实际应用
例题4
解析
10
课堂小结+限时小练
8.2.1 一元线性回归模型
04
课堂小结
随堂限时小结

因变量 响应变量 自变量 解释变量 截距参数 斜率参数
因变量
响应变量
自变量
解释变量
截距参数
斜率参数
随堂限时小结

①②③④
随堂限时小结
回归模型
线性相关
随堂限时小结

随堂限时小结

C
随堂限时小结

D
作业布置与课后练习答案
8.2.1 一元线性回归模型
05
巩固作业
作业布置
作业1:完成教材:第107页 练习第1,2,3题.
作业2:配套辅导资料对应的《一元线性回归模型》.
课后作业答案
1.说明函数模型与回归模型的区别,并分别举出两个应用函数模型和回归模型的例子.
函数模型刻画的是变量之间具有的函数关系,是一种确定性的关系.回归模型刻画的是变量之间具有的相关关系,不是一种确定性的关系,即回归模型刻画的是两个变量之间的随机关系.
举例:路程与速度的关系、正方体体积与边长的关系可以应用函数模型刻画,体重与身高的关系、冷饮销量与气温的关系可以应用回归模型刻画.
课后作业答案
2.在一元线性回归模型(1)中,参数b的含义是什么?
参数b的含义可以解释为解释变量x对响应变量Y的均值的影响,变量x每增加1个单位,响应变量Y的均值将增加b个单位.例如,教科书中父亲身高为175cm的儿子身高的均值比父亲身高为174cm的儿子身高的均值高出0.839cm.
注意:因为响应变量Y最终取值,除了受变量x的影响,还要受随机误差e的影响,所以不能解释成解释变量x每增加一个单位,响应变量Y增加b个单位.
课后作业答案
3.将图8.2-1中的点按父亲身高的大小次序用折线连起来,所得到的图象是一个折线图,可以用这条折线表示儿子身高和父亲身高之间的关系吗?
不能.一是父亲的身高与儿子的身高之间是随机关系,不是函数关系;二是这组数据仅是总体的一个样本,不一定能很好地描述两个变量之间的关系.
THANKS
感谢您的聆听

展开更多......

收起↑

资源预览