人教A版高中数学选择性必修第三册第八章成对数据的统计分析8.2一元线性回归模型及其应用课件(共61张PPT)

资源下载
  1. 二一教育资源

人教A版高中数学选择性必修第三册第八章成对数据的统计分析8.2一元线性回归模型及其应用课件(共61张PPT)

资源简介

(共61张PPT)
第八章 成对数据的统计分析
8.2 一元线性回归模型及其应用
8.2.1 一元线性回归模型
8.2.2 一元线性回归模型参数的最小
二乘估计
课程内容标准 学科素养凝练
  1.结合具体实例,了解一元线性回归模型的含义,了解模型参数的统计意义.
2.了解最小二乘法原理,掌握一元线性回归模型参数的最小二乘估计方法,会使用相关的统计软件.
3.针对实际问题,会用一元线性回归模型进行预测.   在对两个变量进行回归分析的过程中,感悟、提升数学抽象、数据分析、数学运算的核心素养.
一、一元线性回归模型
1.称下式为Y关于x的一元线性回归模型:
其中,Y称为因变量或响应变量,x称为自变量或解释变量;a和b为模型的未知参数,a称为截距参数,b称为斜率参数;e是Y与bx+a之间的随机误差.
说明:
(1)模型中的Y也是随机变量,其值虽然不能由变量x的值确定,但是却能表示为bx+a与e的和(叠加),前一部分由x所确定,后一部分是随机的.
(2)如果e=0,那么Y与x之间的关系就可用一元线性函数模型来描述.
二、一元线性回归模型参数的最小二乘估计
  我们将 称为Y关于x的经验回归方程,也称经验回归函数或经验回归公式,其图形称为经验回归直线,这种求经验回归方程的方法叫做最小二乘法,求得的 叫做 的最小二乘估计.其中,
三、刻画回归效果的方式——残差分析
残差
残差图 利用图形来分析残差特性,作图时纵坐标为残差,横坐标可以选为样本编号(或身高数据、体重估计值等),这样作出的图形称为残差图
残差
图法 残差点比较均匀地落在水平的带状区域内,说明选用的模型比较适合,这样的带状区域的宽度越窄,说明模型拟合精度越高
意义 一般地,建立经验回归方程后,通常需要对模型刻画数据的效果进行分析,借助残差分析还可以对模型进行改进,使我们能根据改进模型做出更符合实际的预测与决策
残差
平方和 残差平方和为 .残差平方和越小,模型拟合效果越好
决定
系数R2 越大,残差平方和越___,模型的拟合效果越____;R2越小,残差平方和越____,即模型的拟合效果越____




×
×

(4)回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法. ( )
(5)利用样本点的散点图可以直观判断两个变量的关系是否可以用线性关系表示. ( )


A
2.已知下表数据:
x 1 2 3
y 3 5.99 12.01
下列四个函数中,拟合效果最好的为 (  )
A.y=3×2x-1    B.y=log2x
C.y=3x D.y=x2
解析
把x=1,2,3分别代入各选项的函数解析式求y值,离y最近的值拟合效果最好.可知选项A的函数模拟效果最好.
C
3.已知经验回归方程为 =2x+1,试验得到的一组数据是(2,4.9),(3,7.1),(4,9.1),则残差平方和是 (  )
A.0.01 B.0.02
C.0.03 D.0.04
解析
因为残差 ,所以残差平方和为(4.9-5)2+(7.1-7)2+(9.1-9)2=0.03.
4.下图是一组数据(x,y)的散点图,经最小二乘法计算,y与x之间的经验回归方程为 ,则 =________.
答案 0.8
解析

探究一 一元线性回归模型
某研究机构对某校高三学生的记忆力x和判断力y进行统计分析,得到下表数据:
x 6 8 10 12
y 2 3 5 6
(1)请画出表中数据的散点图.
(2)请根据表中提供的数据,用最小二乘法求出y关于x的经验回归
方程
(3)试根据求出的经验回归方程,预测记忆力为14的同学的判断力.


[训练1] 下图是我国2016年至2022年生活垃圾无害化处理量(单位:亿吨)的折线图.
注:年份代码1~7分别对应年份2016~2022.




所以y关于t的经验回归方程为
=0.10t+1.92.
将2024年对应的t=9代入方程,得
=0.10×9+1.92=2.82.
所以预测2024年我国生活垃圾无害化处理量约为2.82亿吨.
探究二 经验回归方程分析
为了研究弹簧所挂物体的质量x(单位:g)对弹簧长度y(单位:cm)的影响,对不同质量的6个物体进行测量,数据如下表:
x/g 5 10 15 20 25 30
y/cm 7.25 8.12 8.95 9.9 10.9 11.8
(1)作出散点图,并求经验回归方程.
(2)求出R2.
(3)进行残差分析.




≈0.999 1.

(3)由(2)所列表中第一行的数值可以看出,第3个样本点的残差比较大,需要确认在采集第3个数据时是否有人为的错误,若有需要纠正数据,则重新建立回归模型.由表中数据可以看出残差点比较均匀地落在不超过0.15的狭窄的水平带状区域中,说明选用的线性回归模型的精度较高.由以上分析可知,弹簧长度与被测量物体质量具有线性关系.
[训练2] 某企业为了对新研发的一批产品进行合理定价,将产品按事先拟定的价格进行试销,得到的一组销售数据(xi,yi)(i=1,2,…,6)如下表:
试销单价x/元 4 5 6 7 8 9
产品销量y/件 q 84 83 80 75 68



(3)因为 =-4x+106,
所以 =-4x1+106=-4×4+106=90,
=|90-90|=0<1.
所以(x1,y1)=(4,90)是好数据.
=-4x2+106=86,| -y2|=|86-84|=2>1,
所以(x2,y2)=(5,84)不是好数据.
所以(x3,y3)=(6,83)是好数据.

所以(x4,y4)=(7,80)不是好数据.
所以(x5,y5)=(8,75)是好数据.
所以(x6,y6)=(9,68)不是好数据.
综上,好数据为(4,90),(6,83),(8,75).
探究三 非线性回归分析
某地区不同身高x(单位:cm)的未成年男性的体重y(单位:kg)的平均值如下表:
(1)试建立y与x之间的经验回归方程.
(2)一名在校男生身高为168 cm,预测他的体重约为多少.


作出散点图如下:

由表中数据可求得z与x之间的经验回归方程为 =0.693+0.020x.
故 =e0.693+0.020x.
(2)当x=168时,预测的体重为
=e0.693+0.020×168≈57.57 (kg).
[训练3] (2023·海南海口高二期末)某乡政府为提高当地农民收入,指导农民种植药材,取得较好的效果.下表是某农户近5年种植药材的平均收入的统计数据:
年份 2018 2019 2020 2021 2022
年份
代码x 1 2 3 4 5
平均收入
y/千元 59 61 64 68 73




而y=a+bx的残差平方和是3.5,
且0.24<3.5,
所以回归方程y=0.6x2+58.4拟合效果更好.
故应选择方程y=0.6x2+58.4进行拟合.
当x=6时,y=0.6×62+58.4=80.
因此预测2023年该农户种植药材的平均收入为80千元,即8万元.
D
1.已知利用回归分析得到两个变量x,y的经验回归方程为 =0.8x-3.2.若其中有两个样本点(6,1.5),(10,5),则这两个样本点的残差分别为 (  )
A.0.1,0.2      B.-0.1,-0.2
C.1.6,4.8 D.-0.1,0.2
解析
因为样本点(6,1.5)的预测值为 =0.8×6-3.2=1.6,所以它的残差为1.5-1.6=-0.1;因为样本点(10,5)的预测值为 =0.8×10-3.2=4.8,所以它的残差为5-4.8=0.2.
BC
解析
C
3.某次大学生建模比赛中,编号为1,2,3,4的一组同学分别对得到的数据进行分析,其中对变量x,y进行的回归分析如下表:
学生编号 1 2 3 4
残差平方和 12.37 13.98 9.817 14.32
决定系数R2 0.873 4 0.930 2 0.959 2 0.766 5
则这4个人建立的回归模型中拟合效果最好的是(  )
A.1号 B.2号
C.3号 D.4号
解析
根据回归分析的思想,残差平方和越小,模型拟合效果越好,决定系数R2越近于1,回归的效果越好.由表格中的数据得出3号同学的模型拟合效果最好.
4.某考察团对全国10大城市进行职工人均工资水平x(单位:千元)与居民人均消费水平y(单位:千元)进行统计调查,得出的结论是y与x具有相关关系,经验回归方程为 =0.66x+1.562.若某城市居民人均消费水平为7.675千元,则估计该城市人均消费额占人均工资收入的百分比约为___.
答案 83%
解析
5.某工厂为了对新研发的一种产品进行合理定价,将该产品按事先拟定的价格进行试销,得到数据如下表:
单价x/元 8 8.2 8.4 8.6 8.8 9
销量y/件 90 84 83 80 75 68
(1)求经验回归方程 其中
(2)预计在今后的销售中,销量与单价仍然服从(1)中的关系,且该产品的成本是4元/件.为使工厂获得最大利润,该产品的单价应定为多少元?(利润=销售收入-成本)


(2)设工厂获得的利润为L元,则
L=x(-20x+250)-4(-20x+250)
=-20(x-8.25)2+361.25,
所以该产品的单价定为8.25元时,工厂获得的利润最大.

展开更多......

收起↑

资源预览