4.2.1 回归直线方程(18页) 课件 2024-2025学年高二数学湘教版(2019)选择性必修2

资源下载
  1. 二一教育资源

4.2.1 回归直线方程(18页) 课件 2024-2025学年高二数学湘教版(2019)选择性必修2

资源简介

(共18张PPT)
4.2.1 回归直线方程
1.了解一元线性回归模型的概念及最小二乘法原理,掌握回归直线方程的求法.
H/cm
W/kg
O
P1
P2
P3
P4
P5
P6
P7
P8
P9
P10
P11
P12
找出与散点图中各点散布趋势相似的直线,使各点经过或充分靠近该直线,这样所得到的直线就可以比较科学地反映实际问题中两个变量之间的相关关系. 这条直线叫作回归直线,这条直线的方程叫作回归直线方程. 有了回归直线方程,就可以由一些变量的值去估计或预测另一些变量的值.
某地区从某一年开始进行了环境污染整治,得到了如下数据
(1)作出这些成对数据的散点图,判断污染指数y与x是否线性相关?如果是,判断是正相关还是负相关.
随时间x的增加,污染指数y大致是减少的,因此y与x线性相关,而且是负相关.
(2)你能找出近似描述y与x之间关系的一次函数表达式吗?说说你的方法.
做一条直线使得成对数据构成的点分布在直线的附近.
例如通过点(1,6)和(7,3)的直线就满足条件如图所示.由此得出所要的函数关系式
y=-0.5x+6.5.
(3)类似的直线有很多条,你所求得的是“最好”的直线吗?判断一条直线是否“最好”的标准是什么?
由所求得的函数表达式可以算出x=1,2,3,…,7的值,也可以得到已知数据的实际值(也称为观测值)与预测值之间的误差(一般称为残差),可制作下表:
第x年 1 2 3 4 5 6 7
污染指数y 6.1 5.2 4.5 4.7 3.8 3.4 3.1
预测值
误差
也可以用下图来表示,橙色的点就是预测值对应的点,误差的绝对值就是蓝色的点与相应的橙色的点之间的距离.
随机误差
误差的平方和 作为总随机误差来刻画各估计值与实际值之间的误差.
若总随机误差最小,则这条直线就是所要求的回归直线.
因为是使得平方和最小,所以其中涉及的方法称为最小二乘法.
经计算可知,Q取最小值时,的计算公式为
此时,用最小二乘法得到的回归直线方程为 +,其中是回归直线在y轴上的截距,是回归直线的斜率.
问题:(1)上述情境中,数据y与x的回归直线方程为多少?
(2)根据所得到的关系式,该地区第8年的污染物指数估计是多少?
解:(1)由表中所给数据得 ,可得下表:
从而可知
因此
所求的y关于x的线性回归直线方程为
(2)由题意,将x=8代入回归方程 ,可得
y=-0.475×8+6.3=2.5.
所以预测第8年的污染指数2.5.
归纳总结
求回归直线方程的一般步骤:
例1 某研究机构对高三学生的记忆力x和判断力y进行统计分析,得下表数据:
(1)请画出上表数据的散点图;
(2)请根据上表提供的数据,用最小二乘法求出y关于x的回归直线方程:=x+.
x 6 8 10 12
y 2 3 5 6
解:(1)依题意可得散点图如图所示:
(2)=6×2+8×3+10×5+12×6=158,
==9,==4,
=62+82+102+122=344,
===0.7,==4-0.7×9=-2.3,
故回归直线方程为=0.7x-2.3.
x 6 8 10 12
y 2 3 5 6
例2 甲、乙、丙、丁四位同学各自对A,B两变量做回归分析,分别得到散点图与误差平方和 如下表:
哪位同学的试验结果拟合A,B两变量关系的精度高?(  )
A.甲   B.乙   C.丙   D.丁
D
1.设某大学的女生体重y(单位:kg)与身高x(单位:cm)具有线性相关关系,根据一组样本数据(xi,yi)(i=1,2,…,n),用最小二乘法建立的回归方程为 0.85x-85.71,则下列结论中不正确的是(  )
A.y与x具有正的线性相关关系
B.回归直线过点(,)
C.若该大学某女生身高增加1 cm,则其体重约增加0.85 kg
D.若该大学某女生身高为170 cm,则可断定其体重必为58.79 kg
D
2.根据一组样本数据(x1,y1),(x2,y2),…,(xn,yn)的散点图分析x与y之间具有线性相关关系,其回归直线方程为y=-0.42x+12,则在样本点(10,8.2)处的随机误差为(  )
A.8.2 B.0.4 C.7.8 D.0.42
B
根据本节课所学,回答下列问题:
1.用什么方法求回归直线方程中,,公式是什么?
2.求回归直线方程的步骤是什么?

展开更多......

收起↑

资源预览