资源简介
(共49张PPT)
§1 一元线性回归
第七章
2022
内容索引
01
02
03
自主预习 新知导学
合作探究 释疑解惑
随堂练习
课标定位素养阐释
1.结合具体实例,了解一元线性回归模型的含义,了解模型参数的统计意义.
2.了解最小二乘法,掌握一元线性回归模型参数的最小二乘估计方法.
3.针对实际问题,会用一元线性回归模型进行预测.
4.通过散点图观察变量间的相关关系,体会直观想象的素养.
5.借助一元线性回归模型进行预测,增强数学运算的素养.
自主预习 新知导学
一、直线拟合
【问题思考】
1.下表是水稻产量与施化肥量的一组观测数据:
施化肥量 15 20 25 30 35 40 45
水稻产量 320 330 360 410 460 470 480
如果把施化肥量看作横坐标、水稻产量看作纵坐标.
(1)请在平面直角坐标系中画出上表中的点.
提示:
(2)根据坐标系中点的分布,你能发现随着施化肥量的增加,水稻产量基本上呈什么趋势吗
提示:直线增长的趋势.
2.(1)散点图:每个点对应的一对数据(xi,yi),称为成对数据.这些点构成的图称为散点图.
(2)曲线拟合:从散点图上可以看出,如果变量之间存在着某种关系,这些点会有一个大致趋势,这种趋势通常可以用一条光滑的曲线来近似地描述,这种近似描述的过程称为曲线拟合.
(3)直线拟合:若在两个变量X和Y的散点图中,所有点看上去都在一条直线附近波动,此时就可以用一条直线来近似地描述这两个量之间的关系,称之为直线拟合.
3.做一做:下列图形中的两个变量,它们之间的关系可以用直线拟合的是( ).
A B C D
解析:B中所有点看上去都在一条直线附近波动,故选项B可以用直线拟合.
答案:B
二、一元线性回归方程
【问题思考】
1.(1)最小二乘法:对于给定的两个变量X和Y,可以把其成对的观测值(x1,y1),(x2,y2),…,(xn,yn)表示为平面直角坐标系中的n个点.希望找到一条直线Y=a+bX,使得对每一个xi(i=1,2,…,n),由这个直线方程计算出来的值a+bxi与实际观测值yi的差异尽可能小.为此,希望[y1-(a+bx1)]2+[y2-(a+bx2)]2+…+[yn-(a+bxn)]2达到最小.换句话说,我们希望a,b的取值能使上式达到最小,这种方法称为最小二乘法.
2.做一做:若施化肥量X(单位:千克/亩)与水稻产量Y(单位:千克/亩)的回归方程为Y=250+5X,当施化肥量为80千克/亩时,预计水稻产量为亩产 千克左右.(“亩”非国际通用单位,1亩≈666.7平方米)
解析:当X=80时,Y=250+400=650.
答案:650
【思考辨析】
判断下列说法是否正确,正确的在它后面的括号里画“√”,错误的画“×”.
(1)根据散点图,可以看出两个变量是否呈线性关系.( √ )
(4)任意一组成对数据(xi,yi)都能用直线拟合.( × )
合作探究 释疑解惑
探究一
直线拟合的判断
【例1】 观察两个变量得如下数据:
x -1 -2 -3 -4 -5 5 4 3 2 1
y -9 -7 -5 -3 -1 1 5 3 7 9
画出散点图,判断它们是否能用直线拟合.
分析 可设x为自变量,y为因变量,作出散点图直接判断.
解:由数据可得相应的散点图(如图):
由散点图可知,所有点不在一条直线附近,故不能用直线拟合.
判断两个变量之间的关系能否用直线拟合,一种常用的简便可行的方法就是绘制散点图,根据散点图很容易看出所有点是否在一条直线附近波动,进而判断出这两个变量之间的关系是否能用直线拟合.
【变式训练1】 5名学生的数学和物理成绩如下表:
学科 A B C D E
数学 80 75 70 65 60
物理 70 66 68 64 62
画出散点图,并判断数学成绩和物理成绩之间近似地呈现什么关系.
解:以x轴表示数学成绩,y轴表示物理成绩,可得相应的散点图如图所示,由散点图可知,数学成绩和物理成绩之间近似地呈线性关系.
探究二
求线性回归方程
【例2】 某研究机构对高三学生的记忆力X和判断力Y进行统计分析,得下表数据:
X 6 8 10 12
Y 2 3 5 6
(1)试用最小二乘法求出Y关于X的线性回归方程;
(2)如果某学生的记忆力为9,请预测该学生的判断力是多少.
分析 利用公式求出 即可得到线性回归方程,再利用回归方程可对总体进行预测.
解:(1)画出散点图如下图,从散点图可以看出,表中的两个变量有近似的线性关系.
i xi yi xiyi
1 6 2 36 12
2 8 3 64 24
3 10 5 100 50
4 12 6 144 72
合计 36 16 344 158
故Y关于X的线性回归方程为Y=-2.3+0.7X.
(2)由Y=-2.3+0.7X知,当X=9时,Y=-2.3+0.7×9=4,故预测当学生的记忆力为9时,判断力为4.
1.本例条件不变,如果某学生的判断力为4,请预测该学生的记忆力是多少.
解:由Y=-2.3+0.7X知,当Y=4时,由4=-2.3+0.7X,解得X=9.
故预测当学生的判断力为4时,记忆力为9.
2.某研究机构对高三学生的记忆力X和判断力Y进行统计分析,得到下表数据:
X 6 8 10 12
Y 2 3 m 6
通过分析可知X,Y有线性关系,且其线性回归方程为Y=0.7X-2.3,则实数m的值为 .
∴2+3+m+6=4×4,得m=5.
答案:5
求线性回归方程的步骤
(1)作出散点图,从散点图直观判断变量是否有线性关系.若没有,则说明两变量不线性相关,没有求方程的必要;若有,则继续下一步.
【变式训练2】 假设关于某设备的使用年限X(单位:年)和所支出的维修费用Y(单位:万元)有如下的统计资料:
使用年限X/年 2 3 4 5 6
维修费用Y/万元 2.2 3.8 5.5 6.5 7.0
(1)画出散点图;
(2)求Y关于X的线性回归方程;
(3)估计使用年限为10年时的维修费用.
解:(1)作出散点图,如图所示.
(2)由散点图可知两个变量有近似的线性关系.
列表如下:
所以Y关于X的线性回归方程是Y=0.08+1.23X.
(3)由线性回归方程Y=0.08+1.23X可知,当X=10时,Y=1.23×10+0.08=12.38(万元),
即估计使用10年时维修费用是12.38万元.
探究三
利用线性回归方程对总体进行估计
【例3】 下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量X(单位:吨)与相应的生产能耗Y(单位:吨标准煤)的几组对照数据:
X 3 4 5 6
Y 2.5 3 4 4.5
(1)画出散点图;
(3)已知该厂技改前100吨甲产品的生产能耗为90吨标准煤.试根据(2)求出的线性回归方程,预测生产100吨甲产品的生产能耗比技改前降低多少吨标准煤
分析 (1)以产量为横坐标,以生产能耗对应的测量值为纵坐标,在平面直角坐标系内画散点图;(2)应用计算公式求得系数 的值;(3)实际上就是求当X=100时,对应的Y的值.
解:(1)画出散点图,如图所示.
故线性回归方程为Y=0.35+0.7X.
(3)根据线性回归方程的预测,现在生产100吨甲产品消耗的标准煤为0.35+0.7×100=70.35(吨),
故能耗降低了90-70.35=19.65(吨标准煤).
回归分析的三个步骤
(1)判断两个变量是否有线性关系,可以利用经验,也可以画散点图.
(2)求线性回归方程,注意运算的正确性.
(3)根据线性回归方程进行预测估计:估计值不是实际值,两者会有一定的误差.
【变式训练3】 某产品在某零售摊位的零售价X(单位:元)与每天的销售量Y(单位:个)的统计资料如下表所示:
X 16 17 18 19
Y 50 34 41 31
A.51个 B.50个 C.49个 D.48个
答案:C
【易错辨析】
因对回归直线理解不清致误
【典例】 已知X,Y的取值如下表所示,由散点图分析可知Y与X线性相关,且线性回归方程为Y=0.95X+2.6,那么表格中的数据m的值为 .
X 0 1 3 4
Y 2.2 4.3 4.8 m
错解:因为Y=0.95X+2.6,所以当X=4时,Y=0.95×4+2.6=6.4.
答案:6.4
以上解答过程中都有哪些错误 出错的原因是什么 你如何改正 你如何防范
提示:注意线性回归方程并不是X与Y的函数关系,回归直线不一定过(4,m)这个样本点,因此必须利用样本中心点坐标求解.
答案:6.7
1.注意回归直线不一定经过某个样本点,但一定过样本中心点( , ).
2.平时学习时一定要对每一个基础知识理解透彻.
随堂练习
1.已知变量X,Y之间具有近似的线性关系,其散点图如图所示,则其线性回归方程可能为( ).
A.Y=1.5X+2 B.Y=-1.5X+2
C.Y=1.5X-2 D.Y=-1.5X-2
答案:B
2.已知X与Y之间的一组数据如下表:
X 0 1 2 3 4
Y 1 3 5 7 9
A.(1,2) B.(5,2) C.(2,5) D.(2.5,5)
答案:C
3.有变量X与Y的统计数据如下:
X 2 3 4 5 6
Y 2 4 6 6 7
若由资料知Y与X呈线性关系,则线性回归方程为Y= X+ .
4.已知线性回归方程Y=3.2X+1.8,则当X=5时,Y的估计值为 .
解析:∵回归方程为Y=3.2X+1.8,
∴当X=5时,Y=17.8.
即当X=5时,Y的估计值为17.8.
答案:17.8
5.一个车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了5次试验,测得的数据如下:
零件数X/个 10 20 30 40 50
加工时间Y/分 62 68 75 81 89
(1)如果Y与X具有线性关系,求线性回归方程;
(2)根据(1)所求线性回归方程,预测此车间加工这种零件70个时,所需要的加工时间.
∴线性回归方程为Y=54.9+0.67X.
(2)当X=70时,Y=54.9+0.67×70=101.8(分).
∴预测此车间加工这种零件70个时,所需要的加工时间为101.8分.
本 课 结 束§1 一元线性回归
课后训练巩固提升
A组
1.设一个线性回归方程Y=3+1.2X,则变量X增加一个单位时( ).
A.Y平均增加1.2个单位
B.Y平均增加3个单位
C.Y平均减少1.2个单位
D.Y平均减少3个单位
解析:由b=1.2>0,故选A.
答案:A
2.一名小学生的年龄和身高(单位:cm)的数据如下:
年龄X 6 7 8 9
身高Y 118 126 136 144
由散点图可知,身高Y与年龄X之间的线性回归方程为Y=8.8X+,预测该学生10岁时的身高为( ).
参考公式:
回归方程:Y=X,.
A.154 B.153
C.152 D.151
解析:由题意,=7.5,
=131.
代入Y=8.8X+,可得131=8.8×7.5+,所以=65,所以Y=8.8X+65,所以当X=10时,Y=8.8×10+65=153.
答案:B
3.某产品的广告费用X(单位:万元)与销售额Y(单位:万元)的统计数据如下表:
X 4 2 3 5
Y 49 26 39 54
已知数据对应的回归直线方程Y=X中的=9.4,据此模型预计广告费用为6万元时的销售额为( ).
A.63.6万元 B.65.5万元
C.67.7万元 D.72.0万元
解析:∵=3.5,=42,又回归直线必过样本中心点(),∴42=+9.4×3.5,解得=9.1.
∴线性回归方程为Y=9.4X+9.1.
∴当X=6时,Y=9.4×6+9.1=65.5(万元).
答案:B
4.两个相关变量满足如下关系:
X 10 15 20 25 30
Y 1 003 1 005 1 010 1 011 1 014
两变量的线性回归方程为( ).
A.Y=0.56X+997.4 B.Y=0.63X-231.2
C.Y=50.2X+501.4 D.Y=60.4X+400.7
解析:(10+15+20+25+30)=20,
(1 003+1 005+1 010+1 011+1 014)=1 008.6,代入所给选项知A符合.
答案:A
5.某单位为了了解用电量Y(单位:kW·h)与气温X(单位:℃)之间的关系,随机统计了某4天的用电量与当天的气温(如下表),并求得线性回归方程为Y=-2X+60.
X c 13 10 -1
Y 24 34 38 d
但后来不小心丢失了表中数据c,d,那么由现有数据知2c+d= .
解析:依题意,=-2×+60,化简可得2c+d=100.
答案:100
6.调查了某地若干户家庭的年收入X(单位:万元)和年饮食支出Y(单位:万元),调查显示年收入X与年饮食支出Y具有线性相关关系,并由调查数据得到Y对X的线性回归方程Y=0.254X+0.321.由线性回归方程可知,家庭年收入每增加1万元,年饮食支出平均增加 万元.
解析:由Y=0.254X+0.321知,当X增加1万元时,年饮食支出Y平均增加0.254万元.
答案:0.254
7.某服装商场为了了解毛衣的月销售量Y(单位:件)与月平均气温X(单位:℃)之间的关系,随机统计了某4个月的月销售量与当月平均气温,其数据如下表:
月平均气温X/℃ 17 13 8 2
月销售量Y/件 24 23 40 55
由表中数据算出线性回归方程中的=-2.气象部门预测下个月的平均气温约为6 ℃,据此估计,该商场下个月毛衣的销售量为 件.
解析:样本中心点是(10,35.5),
则=35.5-(-2)×10=55.5,
故线性回归方程为Y=-2X+55.5,
将X=6代入得Y=-2×6+55.5=43.5≈44.
答案:44
8.已知施肥量X(单位:kg)对水稻产量Y(单位:kg)的影响的试验数据如表所示:
X 15 20 25 30
Y 330 345 365 405
(1)试求出Y关于X的线性回归方程;
(2)请估计当施肥量为10 kg时水稻的产量.
解:(1)=22.5,
=361.25,
∴=4.9.
=361.25-4.9×22.5=251.
∴Y关于X的线性回归方程为Y=251+4.9X.
(2)由(1)知,当X=10时,Y=4.9×10+251=300(kg),
∴当施肥量为10 kg时,水稻产量估计为300 kg.
9.班主任为了对本班学生的考试成绩进行分析,决定从本班24名女同学,18名男同学中随机抽取一个容量为7的样本进行分析.
(1)如果按照性别比例分层抽样,求男生和女生各应抽取的人数.
(2)如果随机抽取的7名同学的数学、物理成绩(单位:分)对应如下表:
学生序号i 1 2 3 4 5 6 7
数学成绩xi 60 65 70 75 85 87 90
物理成绩yi 70 77 80 85 90 86 93
根据上表数据,求物理成绩Y关于数学成绩X的线性回归方程(系数精确到0.01);若班上某位同学的数学成绩为96分,预测该同学的物理成绩为多少分
附:线性回归方程Y=X,其中
,
.
xiyi
76 83 44 682 41 244
解:(1)根据分层抽样的方法,女生中应抽取的人数为×24=4,男生中应抽取的人数为×18=3.
(2)依题意,≈0.65,≈83-0.65×76=33.60,
∴物理成绩Y关于数学成绩X的线性回归方程为
Y=33.60+0.65X.
当X=96时,Y=33.60+0.65×96=96,
∴若班上某位同学的数学成绩为96分,则可预测该同学的物理成绩为96分.
B组
1.已知某线性回归方程的斜率为2,样本中心点为-3,a,则线性回归方程为( ).
A.Y=2X+6 B.Y=-2X+6
C.Y=2X-6 D.Y=X+6
解析:由斜率为2,可知B,D不正确,由于在回归直线上,经检验可知答案为A.
答案:A
2.从某高中随机选取5名高三男生,其身高和体重的数据如下表所示:
身高X/cm 160 165 170 175 180
体重Y/kg 63 66 70 72 74
根据上表可得回归直线方程Y=0.56X+,据此模型预测身高为172 cm的高三男生的体重为( ).
A.70.09 B.70.12 C.70.29 D.65.79
解析:∵=170,
=69,
又回归直线过点(),∴69=0.56×170+=-26.2.
∴线性回归方程为Y=0.56X-26.2,当X=172时,Y=70.12.
答案:B
3.对具有线性关系的变量X,Y有一组观测数据(xi,yi)(i=1,2,…,8),其线性回归方程是Y=X,且x1+x2+x3+…+x8=2(y1+y2+y3+…+y8)=6,则实数的值是( ).
A. B.
C. D.
解析:因为x1+x2+x3+…+x8=2(y1+y2+y3+…+y8)=6,
所以,
所以样本中心点的坐标为,代入线性回归方程得,解得.
答案:B
4.已知X与Y之间的几组数据如下表:
X 1 2 3 4 5 6
Y 0 2 1 3 3 4
假设根据上表数据所得线性回归方程为Y=X.若某同学根据上表中的前两组数据(1,0)和(2,2)求得的直线方程为Y=b'X+a',则以下结论正确的是( ).
A.>b',>a'
B.>b',C.a'
D.解析:由(1,0),(2,2)求b',a',
b'==2,a'=0-2×1=-2.
求时,xiyi=0+4+3+12+15+24=58,
=3.5,,
=1+4+9+16+25+36=91,
∴×3.5=-,
∴a'.
答案:C
5.已知X和Y之间的一组数据:
X 0 1 2 3
Y m 3 5.5 7
已知求得关于Y与X的线性回归方程Y=2.1X+0.85,则m的值为 .
解析:∵=1.5,
,
又回归直线过(),
∴=2.1×1.5+0.85=4,
∴m=0.5.
答案:0.5
6.期中考试后,某校高三(9)班对全班65名学生的成绩进行分析,得到数学成绩Y对总成绩X的线性回归方程为Y=0.4X+6.由此可以估计,若两名同学的总成绩相差50分,则他们的数学成绩大约相差 分.
解析:令两人的总成绩分别为x1,x2.
则对应的数学成绩估计为y1=0.4x1+6,y2=0.4x2+6,
所以|y1-y2|=|0.4(x1-x2)|=0.4×50=20.
答案:20
7.一般地,一个人的身高越高,他的手就越大.为了调查这一问题,对10名高三男生的身高与右手一拃长测量得如下数据(单位:cm):
身高 168 170 171 172 174 176 178 178 180 181
一拃长 19.0 20.0 21.0 21.5 21.0 22.0 24.0 23.0 22.5 23.0
(1)根据上述数据制作散点图,能发现两者有何近似关系吗
(2)如果两个变量存在近似的线性关系,求线性回归方程.
(3)如果一个学生身高185 cm,估计他的右手一拃长.
附:线性回归方程Y=X,其中
,
.
xiyi
174.8 21.7 37 986 305 730
解:(1)以横轴表示身高,以纵轴表示一拃长,作散点图.
由散点图可以看出,各点散布在一条直线附近,即它们有线性关系.
(2)设线性回归方程为Y=X+.
代入公式,可得
=≈0.303,
≈-31.246,
∴线性回归方程为Y=0.303X-31.246.
(3)当X=185时,Y=24.809,
即一个学生身高185 cm,估计他的右手一拃长24.809 cm.
展开更多......
收起↑