第九章 第71课时 一元线性回归模型及其应用(课件 学案 练习(含解析))2027届高中数学(通用版)一轮复习

资源下载
  1. 二一教育资源

第九章 第71课时 一元线性回归模型及其应用(课件 学案 练习(含解析))2027届高中数学(通用版)一轮复习

资源简介

第71课时 一元线性回归模型及其应用
[考试要求] 1.了解样本相关系数的统计含义.2.了解最小二乘法原理,掌握一元线性回归模型参数的最小二乘估计方法.3.针对实际问题,会用一元线性回归模型进行预测.
知识点1 变量的相关关系
(1)按变量间的增减性分为________相关和________相关.
①正相关:当一个变量的值增加时,另一个变量的相应值也呈现________的趋势;
②负相关:当一个变量的值增加时,另一个变量的相应值呈现________的趋势.
(2)按变量间是否有线性特征分为________相关和________相关(曲线相关).
①线性相关:如果两个变量的取值呈现正相关或负相关,而且散点落在________附近,我们称这两个变量线性相关;
②非线性相关或曲线相关:如果两个变量具有相关性,但不是________相关,我们称这两个变量非线性相关或曲线相关.
知识点2 相关关系的刻画
(1)散点图:成对样本数据都可用直角坐标系中的点表示出来,由这些点组成的统计图,叫做散点图.
(2)样本相关系数r的计算公式
r=________________________________
=________________________________.
(3)样本相关系数r的性质
①样本相关系数r的取值范围为________;
②当r>0时,成对样本数据________相关;
③当r<0时,成对样本数据________相关;
④样本相关系数与相关程度
当|r|越接近________时,成对样本数据的线性相关程度越强;
当|r|越接近________时,成对样本数据的线性相关程度越弱.
知识点3 一元线性回归模型与最小二乘法
(1)一元线性回归模型
称为Y关于x的一元线性回归模型.其中,Y称为________或响应变量,x称为________或解释变量,________称为截距参数,________称为斜率参数;e是Y与________之间的随机误差.如果e=________,那么Y与x之间的关系就可以用一元线性函数模型来描述.
(2)最小二乘法
将=x+称为Y关于x的经验回归方程,也称经验回归函数或经验回归公式,其图形称为经验回归直线,这种求经验回归方程的方法叫做最小二乘法,求得的,叫做b,a的最小二乘估计,其中
=________________,=________.
知识点4 刻画回归效果的方式
(1)残差图法
在残差图中,残差比较均匀地分布在以横轴为对称轴的水平的带状区域中,说明满足一元线性回归模型的假设,这样的带状区域的宽度越______________,说明模型拟合精度越高.
(2)残差平方和法
残差平方和为________,残差平方和越________,模型拟合效果越好.
(3)决定系数法
R2的值越趋近于1,模型的拟合效果越好.
[常用结论]
1.经验回归直线必过点().
2.计算时,也常用公式
1.(人教B版选择性必修第二册P121习题4-3AT3)变量x和y满足关系y=-0.1x+1,且变量y与z正相关.则(  )
A.x与y负相关,x与z负相关
B.x与y正相关,x与z正相关
C.x与y正相关,x与z负相关
D.x与y负相关,x与z正相关
___________________________________________________________________
___________________________________________________________________
2.(人教A版选择性必修第三册P103习题8.1T1改编)下列四个散点图中,变量x与y之间具有负的线性相关关系的是(  )
A        B
C        D
3.(人教A版选择性必修第三册P103练习T3改编)在一次试验中,测得(x,y)的四组值分别为(1,2),(2,0),(4,-4),(-1,6),则y与x的样本相关系数为(  )
A.   B.-1   C.0   D.-
___________________________________________________________________
___________________________________________________________________
4.(人教A版选择性必修第三册P113练习T2)假如女儿身高y(单位:cm)关于父亲身高x(单位:cm)的经验回归方程为=0.81x+25.82.已知父亲身高为175 cm,则估计女儿的身高是________cm(结果保留整数).
___________________________________________________________________
___________________________________________________________________
___________________________________________________________________
5.(人教A版选择性必修第三册P138复习参考题8 T2)根据变量Y和x的成对样本数据,由一元线性回归模型得到经验回归模型=x+,对应的残差如图所示,模型误差(  )
A.满足一元线性回归模型的所有假设
B.不满足一元线性回归模型的E(e)=0的假设
C.不满足一元线性回归模型的D(e)=σ2的假设
D.不满足一元线性回归模型的E(e)=0和D(e)=σ2的假设
___________________________________________________________________
___________________________________________________________________
___________________________________________________________________
6.(苏教版选择性必修第二册P169习题9.1T1)某小吃店的日盈利y(单位:百元)与当天平均气温x(单位:℃)之间有如下数据:
x/℃ -2 -1 0 1 2
y/百元 5 4 2 2 1
甲、乙、丙3位同学对上述数据进行了分析,发现y与x之间具有线性相关关系,下列经验回归方程正确的是(  )
A.=-x+2.8 B.=-x+3
C.=-1.2x+2.6   D.=x-0.8
考点一 成对数据的统计相关性
[典例1] (1)(2025·上海浦东新区期末)通过随机抽样,收集了若干朵鸢尾花的花萼长度和花瓣长度(单位:cm),绘制的散点图如图所示,计算得样本相关系数r=0.864 2,利用最小二乘法求得相应的经验回归方程为=0.750 1x+0.610 5,根据以上信息,下列命题正确的是(  )
A.花萼长度为7 cm的该品种鸢尾花的花瓣长度的平均值为5.861 2 cm
B.若从样本中抽取一部分,则这部分的样本相关系数一定是0.864 2
C.花瓣长度和花萼长度负相关
D.花瓣长度和花萼长度存在一次函数关系
(2)(2025·淮安月考)某景区试卖一款纪念品,现统计了该款纪念品的定价x(单位:元)与销量y(单位:百件)的对应数据,如表所示:
x 12 12.5 13 13.5 14
y 14 13 11 9 8
参考数据:=-8,≈0.992.
参考公式:样本相关系数r=
(i)求该纪念品定价的平均值和销量的平均值;
(ii)计算x与y的样本相关系数.
___________________________________________________________________
___________________________________________________________________
___________________________________________________________________
___________________________________________________________________
___________________________________________________________________
___________________________________________________________________
___________________________________________________________________
___________________________________________________________________
___________________________________________________________________
___________________________________________________________________
___________________________________________________________________
___________________________________________________________________
___________________________________________________________________
___________________________________________________________________
___________________________________________________________________
___________________________________________________________________
___________________________________________________________________
通性通法:判定两个变量相关性的方法
(1)画散点图:若点的分布从左下角到右上角,则两个变量正相关;若点的分布从左上角到右下角,则两个变量负相关.
(2)样本相关系数:当r>0时,正相关;当r<0时,负相关;|r|越接近1,线性相关性越强.
(3)经验回归方程:当>0时,正相关;当<0时,负相关.
[多维变迁]
1.对两组数据x,y和v,u分别进行回归分析,得到散点图如图所示.求得经验回归方程分别是=1x+1和=2v+2,样本相关系数分别为r1,r2,则(  )
A.12>0 B.-1<r2<0
C.|r1|<|r2| D.r1+r2<0
2.一组样本数据(x1,y1),(x2,y2),…,(xn,yn)(n≥2,x1,x2,…,xn不全相等)的散点图中,若所有样本点(xi,yi)(i=1,2,…,n)都在直线y=-3x+1上,则这组样本数据的样本相关系数为 ________.
考点二 回归模型
 一元线性回归模型
[典例2] 随机抽取某集团公司旗下五家超市,得到广告支出x(单位:万元)与销售额y(单位:万元)的数据如下:
广告支出x/万元 2 4 5 6 8
销售额y/万元 20 30 50 60 70
(1)计算x,y的样本相关系数r,并判断是否可以认为广告支出与销售额具有较强的线性相关程度.(若0.3<|r|<0.75,则线性相关程度一般;若|r|≥0.75,则线性相关程度较强.≈18.55)
(2)求出y关于x的经验回归方程,并预测当广告支出为15万元时,销售额约为多少万元.
参考公式:经验回归直线的斜率和截距的最小二乘估计公式、样本相关系数r的公式分别为
___________________________________________________________________
___________________________________________________________________
___________________________________________________________________
___________________________________________________________________
___________________________________________________________________
___________________________________________________________________
___________________________________________________________________
___________________________________________________________________
___________________________________________________________________
___________________________________________________________________
思维建模:“算、找、代、估”四步模型法求解线性回归分析问题
第1步 算:计算核心统计量,即)2,)2,)等.
第2步 找:画出散点图或找到样本相关系数,分析变量间是否存在线性相关关系(若两个变量之间不具有线性相关关系,则求出的经验回归方程就没有实际意义).
第3步 代:代入公式求出=x+中参数,的值,得到经验回归方程.
第4步 估:根据经验回归方程对实际问题进行估计.
[多维变迁]
(2025·南京月考)已知变量y关于变量x的经验回归方程为=kx-0.5,其相关数据如下表所示:
x 1 2 3 4
y 1 3 4 6
若变量x的值为5,则变量y的估计值为(  )
A.6.5 B.7
C.7.5 D.8
 非线性回归模型
[典例3] (2025·上海宝山区月考)经观测,长江中某鱼类的产卵数y与温度x有关,现将收集到的温度xi和产卵数yi(i=1,2,…,10)的10组观测数据作了初步处理,得到如图的散点图及一些统计量表.
表中ti=,zi=ln yi,=
附:对于一组数据(u1,v1),(u2,v2),…,(un,vn),其经验回归直线=+u的斜率和截距的最小二乘估计分别为==-.
(1)根据散点图判断,y=a+bx,y=n+m与y=c1ec2x哪一个适宜作为y与x之间的经验回归方程模型?(给出判断即可,不必说明理由)
___________________________________________________________________
___________________________________________________________________
___________________________________________________________________
___________________________________________________________________
___________________________________________________________________
___________________________________________________________________
(2)根据(1)的判断结果及表中数据.
(i)试求y关于x的经验回归方程;
(ii)已知用人工培养该鱼类的成本h(x)与温度x和产卵数y的关系h(x)=x(ln y-2.4)+170,当温度x(x取整数)为何值时,培养成本的预报值最小?
___________________________________________________________________
___________________________________________________________________
___________________________________________________________________
___________________________________________________________________
___________________________________________________________________
___________________________________________________________________
___________________________________________________________________
___________________________________________________________________
___________________________________________________________________
___________________________________________________________________
___________________________________________________________________
___________________________________________________________________
___________________________________________________________________
___________________________________________________________________
___________________________________________________________________
思维建模:非线性经验回归模型
第1步 确定经验回归类型:根据散点图或样本相关系数确定经验回归方程的函数类型.
第2步 转化线性经验回归方程:将,x2, ln x等换元转化成一次函数型;若为指数型,可取对数后换元成一次函数型.
第3步 求解线性经验回归方程:利用公式求解.
第4步 代换回原方程:将上一步经验回归方程转化成目标形式.
考点三 决定系数与残差
[典例4] (1)(2026·武威市模拟)已知变量x,y线性相关,其一组样本数据(xi,yi)(i=1,2,…,9)满足=33,用最小二乘法得到的经验回归方程为=2x-1.若增加一个数据(-3,3)后,得到修正后的经验回归直线的斜率为2.1,则数据(4,8)的残差的绝对值为(  )
A.0.1 B.0.2
C.0.3 D.0.4
(2)(2026·济南模拟)下表是2020-2024年中国出生人口数y(单位:十万人)的数据:
年份 2020 2021 2022 2023 2024
年份代码x 1 2 3 4 5
出生人口 数y/十万人 120 106 96 90 95
(i)求2020-2024年中国每年出生人口数的平均数;
(ii)某研究人员建立了y关于x的回归模型=120-6x,用该回归模型预测从哪一年开始中国出生人口数将低于700万;
(iii )求(ii)中回归模型的决定系数R2,并评价其拟合效果.(如果0.85≤R2≤1,就认为拟合效果好,如果0.7≤R2<0.85,就认为拟合效果一般,如果R2<0.7,就认为拟合效果差)
___________________________________________________________________
___________________________________________________________________
___________________________________________________________________
___________________________________________________________________
___________________________________________________________________
___________________________________________________________________
___________________________________________________________________
___________________________________________________________________
易错提醒:模型拟合效果的好坏可由残差平方和、残差图、决定系数R2等进行判断.
1.(链接考点一)(2024·上海卷)已知沿海地区气温和海水表层温度相关,且样本相关系数为正数,对此描述正确的是(  )
A.沿海地区气温高,海水表层温度就高
B.沿海地区气温高,海水表层温度就低
C.随着沿海地区气温由低到高,海水表层温度呈上升趋势
D.随着沿海地区气温由低到高,海水表层温度呈下降趋势
2.(链接考向1)(2026·重庆模拟)已知变量x和y的统计数据如表.
x 80 90 100 110 120
y 120 140 a 165 180
若x,y线性相关,经验回归方程为=1.45x+7,则a=(  )
A.155 B.158
C.160 D.162
3.(链接考向2)(2026·大庆模拟)蝗虫产卵量y与温度x的关系可用模型y=c1拟合,设z=ln y,其变换后得到数据:
x 20 23 25 27 30
z 2 2.4 3 3 4.6
由上表可得经验回归方程=0.2x+,则c1=(  )
A.e-2 B.e3
C.2 D.3
4.(链接考点三)(2025·武汉期末)为了研究某市高二学生脚长x(单位:cm)和身高y(单位:cm)的关系,市卫健委从该市随机抽取若干名高中生做调查,经统计,所调查数据的=19,=161,根据最小二乘法算得脚长和身高的经验回归方程为=4x+.已知被调查的某学生的脚长为25 cm,身高为180 cm,则该样本点的残差为________cm.
第71课时 一元线性回归模型及其应用
理法先行·题练固本
梳必备·破题有方
知识点1 (1)正 负 增加 减小 (2)线性 非线性 一条直线 线性
知识点2 (2)  (3)[-1,1] 正 负 1 0
知识点3 (1)因变量 自变量 a b bx+a 0 (2) 
知识点4 (1)窄 (2)(yi-)2 小
链教材·夯基固本
1.A [因为-0.1<0,所以x与y负相关,
又因为变量y与z正相关,所以x与z负相关.故选A.]
2.D [观察题干散点图可知,只有D选项的散点图表示的是变量x与y之间具有负的线性相关关系.故选D.]
3.B [根据题意得×(1+2+4-1)=1.5,×(2+0-4+6)=1,=22,=56,xiyi=-20,样本相关系数r==-1.
故选B.]
4.168 [当x=175时,=0.81x+25.82=0.81×175+25.82≈168.]
5.C [由一元线性回归模型
得到经验回归模型x+,根据对应的残差图,残差的均值E(e)=0可能成立,但明显残差在x轴上方的数据更分散,D(e)=σ2不满足一元线性回归模型,正确的只有C.]
6.A [计算得(-2-1+0+1+2)=0,
(5+4+2+2+1)=2.8,
经验回归直线必过(0,2.8),故只有A项满足.]
考点深研·题型突破
考点一
典例1 (1)A [对于A,因为利用最小二乘法求得相应的经验回归方程为=0.750 1x+0.610 5,
所以当x=7时,=0.750 1×7+0.610 5=5.861 2 cm,
即花萼长度为7 cm的该品种鸢尾花的花瓣长度的平均值为5.861 2 cm,故A正确;
对于B,由于r=0.864 2是全部数据的样本相关系数,取出来一部分数据,相关性可能变强,可能变弱,
即取出的数据的样本相关系数不一定是0.864 2,故B错误;
对于C,因为计算得样本相关系数r=0.864 2>0,
所以花瓣长度和花萼长度正相关,故C错误;
对于D,因为计算得样本相关系数r=0.864 2,不是1或-1,
所以花瓣长度和花萼长度不存在一次函数关系,故D错误.
故选A.]
(2)解:(i)由表格数据可知,×(12+12.5+13+13.5+14)=13,×(14+13+11+9+8)=11.
(ii)因为(xi-)2=1+0.25+0+0.25+1=2.5,(yi-)2=9+4+0+4+9=26,
所以r==-≈-0.992.
多维变迁
1.D [由散点图可知,x与y负相关,v与u正相关,则<0,>0,0|r2|.又r1<0,r2>0,所以r1+r2<0,故C错误,D正确.故选D.]
2.-1 [因为所有样本点(xi,yi)(i=1,2,…,n)都在直线y=-3x+1上,所以经验回归方程是=-3x+1,可得这两个变量是负相关,
故这组样本数据的样本相关系数为负值,且所有样本点(xi,yi)(i=1,2,…,n)都在直线上,则有|r|=1,所以样本相关系数r=-1.]
考点二
考向1 典例2 解:(1)根据题目表格里的数据可得=5,
=46.
则(xi-)(yi-)=(2-5)×(20-46)+(4-5)×(30-46)+(5-5)×(50-46)+(6-5)×(60-46)+(8-5)×(70-46)=180,
(xi-)2=(2-5)2+(4-5)2+(5-5)2+(6-5)2+(8-5)2=20,
(yi-)2=(20-46)2+(30-46)2+(50-46)2+(60-46)2+(70-46)2=1 720.
所以r=≈0.97>0.75,
故广告支出与销售额具有较强的线性相关程度.
(2)根据公式可得=9,
=46-9×5=1,
所以y关于x的经验回归方程为=9x+1.
所以当广告支出为15万元时,预测销售额约为=9×15+1=136(万元).
多维变迁
 C [由表格中的数据可得=2.5,=3.5,
又经验回归直线过样本点中心(),
所以将(2.5,3.5)代入经验回归方程可得2.5k-0.5=3.5,
解得k=1.6,
故经验回归方程为=1.6x-0.5,
当x=5时,=1.6×5-0.5=7.5,即若变量x的值为5,则变量y的估计值为7.5.
故选C.]
考向2 典例3 解:(1)第1步 确定经验回归类型:根据散点图或样本相关系数确定经验回归方程的函数类型.
根据散点图判断,看出样本点分布在一条指数函数的周围,
所以y=c1适宜作为y与x之间的经验回归方程模型.
(2)(i)第2步 转化线性经验回归方程:将,x2, ln x等换元转化成一次函数型;若为指数型,可取对数后换元成一次函数型.
对y=c1两边同时取对数,得ln y=ln c1+c2x,
令z=ln y,则z=c2x+ln c1,
所以,
所以ln ×,
第3步 求解线性经验回归方程:利用公式求解.
所以x+,
第4步 代换回原方程:将上一步线性经验回归方程转化成目标形式.
所以.
(ii)因为ln y=x+,
所以h(x)=x(ln y-2.4)+170=x+170=x2-x+170,
所以当x=6时,培养成本的预报值最小.
考点三
典例4 (1)A [因为xi=33,
所以,
因为经验回归直线=2x-1过样本点中心(),
所以=2-1=2×-1=,
增加数据(-3,3)后,=3,=6,且经验回归方程为=2.1x+,所以6=2.1×3+ =-0.3,
则=2.1x-0.3,
所以当x=4时,有=2.1×4-0.3=8.1,
故残差的绝对值为|8-8.1|=0.1.
故选A.]
(2)解:(i)由题意可知,(120+106+96+90+95)=101.4.
(ii)中国出生人口数低于700万,即<70,
当x=8时,=120-6×8=72>70,当x=9时,=120-6×9=66<70,
所以x=9对应2028年,即预测从2028年开始中国出生人口数将低于700万.
(iii)分别令x=1,2,3,4,5,得=114,108,102,96,90,
所以R2=1-
=1-=1-
≈0.76,
因为0.7≤R2<0.85,所以这个模型的拟合效果一般.
随堂·对点检测
1.C [因为沿海地区气温和海水表层温度相关,且样本相关系数为正数,
所以随着沿海地区气温由低到高,海水表层温度呈上升趋势.故选C.]
2.A [=100,
经验回归方程为=1.45x+7,
则=1.45×100+7=152,
则a=152×5-120-140-165-180=155.
故选A.]
3.A [由题意可知,
=25,
=3,
因为经验回归直线=0.2x+过样本点中心(25,3),所以3=0.2×25+,
所以=-2,
所以=0.2x-2,
因为z=ln y,所以ln y=0.2x-2,
所以y=e0.2x-2==e-2·e0.2x,
所以c1=e-2.故选A.]
4.-5 [已知=19,=161,
则样本点中心为(19,161),
把(19,161)代入经验回归方程=4x+,
得161=4×19+=85,
所以=4x+85,
当x=25时,=4×25+85=185,
所以该样本点的残差为180-185=-5(cm).]
1 / 12(共112张PPT)
第九章 统计与成对数据的统计分析
第71课时 一元线性回归模型及其应用
[考试要求] 1.了解样本相关系数的统计含义.2.了解最小二乘法原理,掌握一元线性回归模型参数的最小二乘估计方法.3.针对实际问题,会用一元线性回归模型进行预测.
理法先行·题练固本
知识点1 变量的相关关系
(1)按变量间的增减性分为__相关和__相关.
①正相关:当一个变量的值增加时,另一个变量的相应值也呈现____的趋势;
②负相关:当一个变量的值增加时,另一个变量的相应值呈现____的趋势.


增加
减小
(2)按变量间是否有线性特征分为____相关和______相关(曲线相关).
①线性相关:如果两个变量的取值呈现正相关或负相关,而且散点落在________附近,我们称这两个变量线性相关;
②非线性相关或曲线相关:如果两个变量具有相关性,但不是____相关,我们称这两个变量非线性相关或曲线相关.
线性
非线性
一条直线 
线性
知识点2 相关关系的刻画
(1)散点图:成对样本数据都可用直角坐标系中的点表示出来,由这些点组成的统计图,叫做散点图.
(2)样本相关系数r的计算公式
r= ___________________ =.
(3)样本相关系数r的性质
①样本相关系数r的取值范围为__________;
②当r>0时,成对样本数据__相关;
③当r<0时,成对样本数据__相关;
④样本相关系数与相关程度
当|r|越接近_时,成对样本数据的线性相关程度越强;
当|r|越接近_时,成对样本数据的线性相关程度越弱.
[-1,1]


1
0
知识点3 一元线性回归模型与最小二乘法
(1)一元线性回归模型
称为Y关于x的一元线性回归模型.其中,Y称为______或响应变量,x称为______或解释变量,_称为截距参数,_称为斜率参数;e是Y与_____之间的随机误差.如果e=_,那么Y与x之间的关系就可以用一元线性函数模型来描述.
因变量
自变量
a
b
bx+a
0 
(2)最小二乘法
将称为Y关于x的经验回归方程,也称经验回归函数或经验回归公式,其图形称为经验回归直线,这种求经验回归方程的方法叫做最小二乘法,求得叫做b,a的最小二乘估计,其中

知识点4 刻画回归效果的方式
(1)残差图法
在残差图中,残差比较均匀地分布在以横轴为对称轴的水平的带状区域中,说明满足一元线性回归模型的假设,这样的带状区域的宽度越__,说明模型拟合精度越高.
(2)残差平方和法
残差平方和为______________,残差平方和越__,模型拟合效果越好.
(yi-)2


(3)决定系数法
R2=1-.R2的值越趋近于1,模型的拟合效果越好.
[常用结论]
1.经验回归直线必过点().
2.计算.
1.(人教B版选择性必修第二册P121习题4-3AT3)变量x和y满足关系y=-0.1x+1,且变量y与z正相关.则(  )
A.x与y负相关,x与z负相关
B.x与y正相关,x与z正相关
C.x与y正相关,x与z负相关
D.x与y负相关,x与z正相关

A [因为-0.1<0,所以x与y负相关,
又因为变量y与z正相关,所以x与z负相关.故选A.]
2.(人教A版选择性必修第三册P103习题8.1T1改编)下列四个散点图中,变量x与y之间具有负的线性相关关系的是(  )

D [观察题干散点图可知,只有D选项的散点图表示的是变量x与y之间具有负的线性相关关系.故选D.]
3.(人教A版选择性必修第三册P103练习T3改编)在一次试验中,测得(x,y)的四组值分别为(1,2),(2,0),(4,-4),(-1,6),则y与x的样本相关系数为(  )
A.   B.-1   C.0   D.

B [根据题意得×(1+2+4-1)=1.5,×(2+0-4+6)=1,=22,=56,xi yi=-20,样本相关系数r==-1.
故选B.]
4.(人教A版选择性必修第三册P113练习T2)假如女儿身高y(单位:cm)关于父亲身高x(单位:cm)的经验回归方程为=0.81x+25.82.已知父亲身高为175 cm,则估计女儿的身高是______________cm(结果保留整数).
168 [当x=175时,=0.81x+25.82=0.81×175+25.82≈168.]
168
5.(人教A版选择性必修第三册P138复习参考题8 T2)根据变量Y和x的成对样本数据,由一元线性回归模型,对应的残差如图所示,模型误差
(  )
A.满足一元线性回归模型的所有假设
B.不满足一元线性回归模型的E(e)=0的假设
C.不满足一元线性回归模型的D(e)=σ2的假设
D.不满足一元线性回归模型的E(e)=0和D(e)=σ2的假设

C [由一元线性回归模型,根据对应的残差图,残差的均值E(e)=0可能成立,但明显残差在x轴上方的数据更分散,D(e)=σ2不满足一元线性回归模型,正确的只有C.]
6.(苏教版选择性必修第二册P169习题9.1T1)某小吃店的日盈利y(单位:百元)与当天平均气温x(单位:℃)之间有如下数据:
x/℃ -2 -1 0 1 2
y/百元 5 4 2 2 1
甲、乙、丙3位同学对上述数据进行了分析,发现y与x之间具有线性相关关系,下列经验回归方程正确的是(  )
A.   B.=-x+3
C. D.=x-0.8

A [计算得(-2-1+0+1+2)=0,
(5+4+2+2+1)=2.8,
经验回归直线必过(0,2.8),故只有A项满足.]
考点深研·题型突破
考点一 成对数据的统计相关性
[典例1] (1)(2025·上海浦东新区期末)通过随机抽样,收集了若干朵鸢尾花的花萼长度和花瓣长度(单位:cm),绘制的散点图如图所示,计算得样本相关系数r=0.864 2,利用最小二乘法求得相应的经验回归方程为=0.750 1x+0.610 5,根据以上
信息,下列命题正确的是(  )
A.花萼长度为7 cm的该品种鸢尾花的花瓣长度的平均值为5.861 2 cm
B.若从样本中抽取一部分,则这部分的样本相关系数一定是0.864 2
C.花瓣长度和花萼长度负相关
D.花瓣长度和花萼长度存在一次函数关系

(2)(2025·淮安月考)某景区试卖一款纪念品,现统计了该款纪念品的定价x(单位:元)与销量y(单位:百件)的对应数据,如表所示:
x 12 12.5 13 13.5 14
y 14 13 11 9 8
(i)求该纪念品定价的平均值;
(ii)计算x与y的样本相关系数.
参考数据:≈0.992.
参考公式:样本相关系数
r=.
(1)A [对于A,因为利用最小二乘法求得相应的经验回归方程为=0.750 1x+0.610 5,所以当x=7时,=0.750 1×7+0.610 5=5.861 2 cm,
即花萼长度为7 cm的该品种鸢尾花的花瓣长度的平均值为5.861 2 cm,故A正确;
对于B,由于r=0.864 2是全部数据的样本相关系数,取出来一部分数据,相关性可能变强,可能变弱,
即取出的数据的样本相关系数不一定是0.864 2,故B错误;
对于C,因为计算得样本相关系数r=0.864 2>0,
所以花瓣长度和花萼长度正相关,故C错误;
对于D,因为计算得样本相关系数r=0.864 2,不是1或-1,所以花瓣长度和花萼长度不存在一次函数关系,故D错误.
故选A.]
(2)[解] (i)由表格数据可知,×(12+12.5+13+13.5+14)=13,×(14+13+11+9+8)=11.
(ii)因为(xi-)2=1+0.25+0+0.25+1=2.5,(yi-)2=9+4+0+4+9=26,
所以r=≈-0.992.
通性通法:判定两个变量相关性的方法
(1)画散点图:若点的分布从左下角到右上角,则两个变量正相关;若点的分布从左上角到右下角,则两个变量负相关.
(2)样本相关系数:当r>0时,正相关;当r<0时,负相关;|r|越接近1,线性相关性越强.
(3)经验回归方程:当>0时,正相关;当<0时,负相关.
[多维变迁]
1.对两组数据x,y和v,u分别进行回归分析,得到散点图如图所示.求得经验回归方程分别是,样本相关系数分别为r1,r2,则(  )
A.>0
B.-1C.|r1|<|r2|
D.r1+r2<0

D [由散点图可知,x与y负相关,v与u正相关,则<0,>0,0|r2|.又r1<0,r2>0,所以r1+r2<0,故C错误,D正确.故选D.]
2.一组样本数据(x1,y1),(x2,y2),…,(xn,yn)(n≥2,x1,x2,…,xn不全相等)的散点图中,若所有样本点(xi,yi)(i=1,2,…,n)都在直线y=-3x+1上,则这组样本数据的样本相关系数为 ______________.
-1 [因为所有样本点(xi,yi)(i=1,2,…,n)都在直线y=-3x+1上,所以经验回归方程是=-3x+1,可得这两个变量是负相关,
故这组样本数据的样本相关系数为负值,且所有样本点(xi,yi)(i=1,2,…,n)都在直线上,则有|r|=1,所以样本相关系数r=-1.]
-1 
【教用·备选题】
(2022·全国乙卷)某地经过多年的环境治理,已将荒山改造成了绿水青山.为估计一林区某种树木的总材积量,随机选取了10棵这种树木,测量每棵树的根部横截面积(单位:m2)和材积量(单位:m3),得到如下数据:
样本号i 1 2 3 4 5 6 7 8 9 10 总和
根部横截面积xi 0.04 0.06 0.04 0.08 0.08 0.05 0.05 0.07 0.07 0.06 0.6
材积量yi 0.25 0.40 0.22 0.54 0.51 0.34 0.36 0.46 0.42 0.40 3.9
并计算得xiyi=0.247 4.
(1)估计该林区这种树木平均一棵的根部横截面积与平均一棵的材积量;
(2)求该林区这种树木的根部横截面积与材积量的样本相关系数(精确到0.01);
(3)现测量了该林区所有这种树木的根部横截面积,并得到所有这种树木的根部横截面积总和为186 m2.已知树木的材积量与其根部横截面积近似成正比.利用以上数据给出该林区这种树木的总材积量的估计值.
附:样本相关系数
r=≈1.377.
[解] (1)样本中10棵这种树木的根部横截面积的平均值=0.06,
样本中10棵这种树木的材积量的平均值=0.39.
据此可估计该林区这种树木平均一棵的根部横截面积为0.06 m2,平均一棵的材积量为0.39 m3.
(2)r = =
==≈≈0.97.
(3)设该林区这种树木的总材积量的估计值为Y m3,
又已知树木的材积量与其根部横截面积近似成正比,
可得,解得Y=1 209 m3.
则该林区这种树木的总材积量估计为1 209 m3.
考点二 回归模型
考向1 一元线性回归模型
[典例2] 随机抽取某集团公司旗下五家超市,得到广告支出x(单位:万元)与销售额y(单位:万元)的数据如下:
广告支出x/万元 2 4 5 6 8
销售额y/万元 20 30 50 60 70
(1)计算x,y的样本相关系数r,并判断是否可以认为广告支出与销售额具有较强的线性相关程度.(若0.3<|r|<0.75,则线性相关程度一般;若|r|≥0.75,则线性相关程度较强.≈18.55)
(2)求出y关于x的经验回归方程,并预测当广告支出为15万元时,销售额约为多少万元.
参考公式:经验回归直线的斜率和截距的最小二乘估计公式、样本相关系数r的公式分别为,
r=.
[解] (1)根据题目表格里的数据可得=5,=46.
则(xi-)(yi-)=(2-5)×(20-46)+(4-5)×(30-46)+(5-5)×(50-46)+(6-5)×(60-46)+(8-5)×(70-46)=180,
(xi-)2=(2-5)2+(4-5)2+(5-5)2+(6-5)2+(8-5)2=20,
(yi-)2=(20-46)2+(30-46)2+(50-46)2+(60-46)2+(70-46)2=1 720.
所以r==≈0.97>0.75,
故广告支出与销售额具有较强的线性相关程度.
(2)根据公式可得=9,=46-9×5=1,
所以y关于x的经验回归方程为=9x+1.
所以当广告支出为15万元时,预测销售额约为=9×15+1=136(万元).
思维建模:“算、找、代、估”四步模型法求解线性回归分析问题
第1步 算:计算核心统计量,即(xi-)2,(yi-)2,(xi-) (yi-)等.
第2步 找:画出散点图或找到样本相关系数,分析变量间是否存在线性相关关系(若两个变量之间不具有线性相关关系,则求出的经验回归方程就没有实际意义).
第3步 代:代入公式求出的值,得到经验回归方程.
第4步 估:根据经验回归方程对实际问题进行估计.
[多维变迁]
(2025·南京月考)已知变量y关于变量x的经验回归方程为=kx-0.5,其相关数据如下表所示:
x 1 2 3 4
y 1 3 4 6
若变量x的值为5,则变量y的估计值为(  )
A.6.5 B.7
C.7.5 D.8

C [由表格中的数据可得=2.5,=3.5,
又经验回归直线过样本点中心(),
所以将(2.5,3.5)代入经验回归方程可得2.5k-0.5=3.5,解得k=1.6,
故经验回归方程为=1.6x-0.5,
当x=5时,=1.6×5-0.5=7.5,即若变量x的值为5,则变量y的估计值为7.5.故选C.]
【教用·备选题】
(2025·青铜峡市期末)某研究所研究耕种深度x(单位:cm)与水稻每公顷产量y(单位:t)的关系,所得数据资料如下表.
(1)求样本相关系数r(结果保留两位小数),并判断它们是否具有较强的线性相关性;
耕种深度x/cm 8 10 12 14 16 18
每公顷产量y/t 6 7 8 9 11 13
(2)求经验回归方程.
参考数据:≈24.4;
参考公式:r=,

[解] (1)由题意可知
=13,
=9,
故r==
=≈≈0.98,故有较强的线性相关性.
(2)(xi-)(yi-)=-5×(-3)+(-3)×(-2)+(-1)×(-1)+1×0+3×2+5×4=48,
(xi-)2=25+9+1+1+9+25=70,
故,
将(13,9)代入可得×13=,
故经验回归方程为y=.
考向2 非线性回归模型
[典例3] (2025·上海宝山区月考)经观测,长江中某鱼类的产卵数y与温度x有关,现将收集到的温度xi和产卵数yi(i=1,2,…,10)的10组观测数据作了初步处理,得到如图的散点图及一些统计量表.
xi ti yi zi )2
360 54.5 1 360 44 384
(ti-)2 )· (yi-) )· (zi-) )· (yi-)
3 588 32 6 430
表中ti=zi.
(1)根据散点图判断,y=a+bx,y=n+m哪一个适宜作为y与x之间的经验回归方程模型?(给出判断即可,不必说明理由)
(2)根据(1)的判断结果及表中数据.
(i)试求y关于x的经验回归方程;
(ii)已知用人工培养该鱼类的成本h(x)与温度x和产卵数y的关系h(x)=x(ln y-2.4)+170,当温度x(x取整数)为何值时,培养成本的预报值最小?
附:对于一组数据(u1,v1),(u2,v2),…,(un,vn),其经验回归直线的斜率和截距的最小二乘估计分别.
[解] (1)第1步 确定经验回归类型:根据散点图或样本相关系数确定经验回归方程的函数类型.
根据散点图判断,看出样本点分布在一条指数函数的周围,
所以y=c1适宜作为y与x之间的经验回归方程模型.
(2)(i)第2步 转化线性经验回归方程:将,x2, ln x等换元转化成一次函数型;若为指数型,可取对数后换元成一次函数型.
对y=c1两边同时取对数,得ln y=ln c1+c2x,
令z=ln y,则z=c2x+ln c1,
所以,
所以ln ,
第3步 求解线性经验回归方程:利用公式求解.
所以,
第4步 代换回原方程:将上一步线性经验回归方程转化成目标形式.
所以.
(ii)因为ln y=,
所以h(x)=x(ln y-2.4)+170=xx2-x+170,
所以当x=6时,培养成本的预报值最小.
思维建模:非线性经验回归模型
第1步 确定经验回归类型:根据散点图或样本相关系数确定经验回归方程的函数类型.
第2步 转化线性经验回归方程:将,x2, ln x等换元转化成一次函数型;若为指数型,可取对数后换元成一次函数型.
第3步 求解线性经验回归方程:利用公式求解.
第4步 代换回原方程:将上一步经验回归方程转化成目标形式.
【教用·通性通法】
非线性经验回归方程转化为线性经验回归方程的方法
(1)若,设t==a+bt;
(2)若满足对数式:=a+bln x,设t=ln x,则=a+bt;
(3)若满足指数式:,两边取对数得ln =ln c1+c2x,设z=ln ,a=ln c1,b=c2,则=a+bx.
【教用·备选题】
某大型现代化农场在种植某种大棚有机无公害的蔬菜时,为创造更大价值,提高亩产量,积极开展技术创新活动.该农场采用了延长光照时间的方案,该农场选取了20间大棚(每间一亩)进行试点,得到各间大棚产量数据并绘制成散点图.
光照时长为x(单位:小时),大棚蔬菜
产量为y(单位:吨/亩),记w=ln x.
参考数据:
xi yi wi xi yi wi yi
290 102.4 52 4 870 540.28 137 1 578.2 272.1
参考公式:y关于x的经验回归方程.
(1)根据散点图判断,y=a+bx与y=c+dln x哪一个适宜作为大棚蔬菜产量y关于光照时长x的经验回归方程类型(给出判断即可,不必说明理由);
(2)根据(1)的判断结果及表中数据,建立y关于x的经验回归方程(结果保留小数点后两位);
(3)根据实际种植情况,发现上述经验回归方程在光照时长位于6~14小时内拟合程度良好,利用(2)中所求经验回归方程估计当光照时长为e2小时时(e为自然对数的底数),大棚蔬菜的亩产量.
[解] (1)根据散点图,开始的点在某条直线旁,但后面的点会越来越偏离这条直线,因此y=c+dln x更适宜作为大棚蔬菜产量y关于光照时长x的经验回归方程类型.
(2)令w=ln x,则y=c+dln x,即w,=5.12,=2.6,
=≈3.26,
≈5.12-3.26×2.6≈-3.36,
所以=3.26w-3.36,
即=3.26ln x-3.36.
(3)当x=e2时,=3.26ln e2-3.36=3.16.
即当光照时长为e2小时时,大棚蔬菜的亩产量约为3.16吨.
考点三 决定系数与残差
[典例4] (1)(2026·武威市模拟)已知变量x,y线性相关,其一组样本数据(xi,yi)(i=1,2,…,9)满足用最小二乘法得到的经验回归方程=2x-1.若增加一个数据(-3,3)后,得到修正后的经验回归直线的斜率为2.1,则数据(4,8)的残差的绝对值为(  )
A.0.1 B.0.2
C.0.3 D.0.4

(2)(2026·济南模拟)下表是2020-2024年中国出生人口数y(单位:十万人)的数据:
年份 2020 2021 2022 2023 2024
年份代码x 1 2 3 4 5
出生人口 数y/十万人 120 106 96 90 95
(i)求2020-2024年中国每年出生人口数的平均数;
(ii)某研究人员建立了y关于x的回归模型=120-6x,用该回归模型预测从哪一年开始中国出生人口数将低于700万;
(iii)求(ii)中回归模型的决定系数R2,并评价其拟合效果.(如果0.85≤R2≤1,就认为拟合效果好,如果0.7≤R2<0.85,就认为拟合效果一般,如果R2<0.7,就认为拟合效果差)
附:R2=1-)2≈567.
(1)A [因为xi=33,
所以,
因为经验回归直线=2x-1过样本点中心(),
所以-1=2×,
增加数据(-3,3)后,=3,=6,且经验回归方程为,
所以6=2.1×3+ =-0.3,
则=2.1x-0.3,
所以当x=4时,有=2.1×4-0.3=8.1,
故残差的绝对值为|8-8.1|=0.1.
故选A.]
(2)[解] (i)由题意可知,(120+106+96+90+95)=101.4.
(ii)中国出生人口数低于700万,即<70,
当x=8时,=120-6×8=72>70,当x=9时,=120-6×9=66<70,
所以x=9对应2028年,即预测从2028年开始中国出生人口数将低于700万.
(iii)分别令x=1,2,3,4,5,得=114,108,102,96,90,
所以R2=1-=1-=1-≈0.76,
因为0.7≤R2<0.85,所以这个模型的拟合效果一般.
易错提醒:模型拟合效果的好坏可由残差平方和、残差图、决定系数R2等进行判断.
【教用·备选题】
1.假定小麦基本苗数x与成熟期有效穗y之间存在相关关系,今测得5组数据如下:
若由最小二乘法计算得经验回归方程为=0.29x+34.7.
(1)计算各组残差,并计算残差平方和;
(2)求R2,并说明回归模型的拟合效果.
x 15.0 25.8 30.0 36.6 44.4
y 39.4 42.9 42.9 43.1 49.2
(参考数据:)2=50.18,如果0.85≤R2≤1,就认为拟合效果好,如果0.7≤R2<0.85,就认为拟合效果一般,如果R2<0.7,就认为拟合效果差)
[解] (1)由,
可以算得=0.35,=0.718,=-0.5,=
-2.214,=1.624,
所以残差平方和为)2≈8.43.
(2)(yi-)2=50.18,
故R2=1-≈1-≈0.832.
所以回归模型的拟合效果一般.
2.某科技公司对近十年来高科技研发投入情况分析调研,其研发投入y(单位: 亿元)的统计图如图1所示,其中年份代码x=1,2,…,10分别指2016年、2017年、……、2025年.
现用两种模型A:y=bx+a,B:y=c+d分别进行拟合,由此得到相应的经验回归方程,并进行残差分析,得到图2所示的残差图.结合数据,计算得到如下值.
表中ti=ti.
)2 )2 ) (xi-) (yi-)
75 2.25 82.5 4.5 120 28.67
(1)根据图2,比较模型A,B的拟合效果,应选择哪个模型?并说明理由.
(2)根据(1)中所选模型,求y关于x的经验回归方程及该公司2031年高科技研发投入y的预测值(回归系数精确到0.01).
附:.
[解] (1)应选择模型B.理由如下:
由于模型B的残差点比较均匀地落在水平的带状区域中,且带状区域的宽度比模型A的带状区域宽度窄,所以模型B的拟合精度更高,经验回归方程的预报精度相应越高,故选模型B比较合适.
(2)根据模型B,令t=,则研发投入y与t可用线性经验回归模型来拟合,设t.
则≈6.37,所以≈75-6.37×2.25≈60.67.
则y关于t的经验回归方程为=6.37t+60.67,所以y关于x的经验回归方程为
+60.67.
2031年对应年份代码为16,即当x=16时,=6.37×+60.67=86.15.
所以该公司2031年高科技研发投入y的预测值为86.15亿元.
1.(链接考点一)(2024·上海卷)已知沿海地区气温和海水表层温度相关,且样本相关系数为正数,对此描述正确的是(  )
A.沿海地区气温高,海水表层温度就高
B.沿海地区气温高,海水表层温度就低
C.随着沿海地区气温由低到高,海水表层温度呈上升趋势
D.随着沿海地区气温由低到高,海水表层温度呈下降趋势

C [因为沿海地区气温和海水表层温度相关,且样本相关系数为正数,
所以随着沿海地区气温由低到高,海水表层温度呈上升趋势.故选C.]
2.(链接考向1)(2026·重庆模拟)已知变量x和y的统计数据如表.
x 80 90 100 110 120
y 120 140 a 165 180
若x,y线性相关,经验回归方程为=1.45x+7,则a=(  )
A.155 B.158
C.160 D.162

A [=100,
经验回归方程为=1.45x+7,
则=1.45×100+7=152,
则a=152×5-120-140-165-180=155.故选A.]
3.(链接考向2)(2026·大庆模拟)蝗虫产卵量y与温度x的关系可用模型y=c1拟合,设z=ln y,其变换后得到数据:
由上表可得经验回归方程,则c1=(  )
A.e-2 B.e3
C.2 D.3

x 20 23 25 27 30
z 2 2.4 3 3 4.6
A [由题意可知,=25,=3,
因为经验回归直线过样本点中心(25,3),所以3=0.2×25+=-2,
所以=0.2x-2,因为z=ln y,
所以ln y=0.2x-2,
所以y=e0.2x-2==e-2·e0.2x,
所以c1=e-2.故选A.]
4.(链接考点三)(2025·武汉期末)为了研究某市高二学生脚长x(单位:cm)和身高y(单位:cm)的关系,市卫健委从该市随机抽取若干名高中生做调查,经统计,所调查数据的
.已知被调查的某学生的脚长为25 cm,身高为180 cm,则该样本点的残差为______________cm.
-5 
-5 [已知=19,=161,
则样本点中心为(19,161),
把(19,161)代入经验回归方程,
得161=4×19+=85,所以=4x+85,当x=25时,=4×25+85=185,
所以该样本点的残差为180-185=-5(cm).]
题号
1
3
5
2
4
6
8
7
9
一、单项选择题
1.在一次对人体脂肪含量和年龄的关系的研究中,研究人员获得了一组样本数据,并制成如图所示的人体脂肪含量与年龄的关系的散点图.下列结论正确的是(  )
课时作业(七十一) 一元线性回归模型及其应用
题号
1
3
5
2
4
6
8
7
9
A.人体脂肪含量与年龄正相关,且脂肪含量的中位数等于20%
B.人体脂肪含量与年龄正相关,且脂肪含量的中位数小于20%
C.人体脂肪含量与年龄负相关,且脂肪含量的中位数等于20%
D.人体脂肪含量与年龄负相关,且脂肪含量的中位数小于20%

B [观察题干图,可知人体脂肪含量与年龄正相关,且脂肪含量的中位数小于20%.]

题号
1
3
5
2
4
6
8
7
9
2.(2025·银川一模)有一散点图如图所示,在5个(x,y)数据中去掉D(3,10)后,下列说法错误的是(  )
A.残差平方和变小
B.样本相关系数r变大
C.决定系数R2变大
D.解释变量x与响应变量y的相关性变弱
题号
1
3
5
2
4
6
8
7
9
D [由散点图可知,若去掉D点,
则x与y的线性相关性变强,且是正相关,
所以样本相关系数r变大,决定系数R2变大,残差平方和变小.
故选D.]
题号
1
3
5
2
4
6
8
7
9
3.(人教B版选择性必修第二册P115练习B T2改编)某冷饮店日盈利y(单位:百元)与当天气温x(单位:℃)之间有如下数据:
已知y与x之间具有线性相关关系,则y与x的经验回归方程是(  )
A. B.=0.2x-2.2
C. D.=0.2x+2.2

x/℃ 15 20 25 30 35
y/百元 1 2 2 4 5
题号
1
3
5
2
4
6
8
7
9
B [经验回归直线必过样本点中心,由题意得=25,
=2.8,结合选项可知,2.8=0.2×25-2.2,即y与x的经验回归方程是=0.2x-2.2.故选B.]
题号
1
3
5
2
4
6
8
7
9
4.(2025·长沙期末)设两个相关变量x和y分别满足下表:
x 1 2 3 4 5
y 1 2 8 8 16
若相关变量x和y可拟合为非线性经验回归方程=2bx+a,则当x=6时,y的估计值为(  )

题号
1
3
5
2
4
6
8
7
9
(参考公式:对于一组数据(u1,v1),(u2,v2),…,(un,vn),其经验回归直线的斜率和截距的最小二乘估计公式分别为:,1.155≈2)
A.33 B.37
C.65 D.73
题号
1
3
5
2
4
6
8
7
9
B [令zi=log2yi,则,
×(0+1+3+3+4)=×(1+2+3+4+5)=3,=1,
-1×3=-0.8,故=2x-0.8,
当x=6时,y=25.2=25×,
因为1.155≈2,所以≈1.15,
所以y=25.2=25×≈32×1.15=36.8≈37.
故选B.]

题号
1
3
5
2
4
6
8
7
9
二、多项选择题
5. (2025·沧州期中)关于样本相关系数r,下列说法正确的是(  )
A.r∈[-1,1]
B.当|r|越接近1时,成对样本数据的线性相关程度越强
C.当r=0时,成对样本数据之间没有任何相关关系
D.当r>0时,成对样本数据正相关


题号
1
3
5
2
4
6
8
7
9
ABD [对于选项A,由样本相关系数的性质,可得r∈[-1,1],故A正确;
对于选项B,由样本相关系数的性质,可得当|r|越接近1时,成对样本数据的线性相关程度越强,故B正确;
对于选项C,当r=0时,成对样本数据之间没有线性相关关系,但不排除它们之间有其他相关关系,故C错误;
对于选项D,由样本相关系数的性质,可得当r>0时,成对样本数据正相关,故D正确.
故选ABD.]
题号
1
3
5
2
4
6
8
7
9
6.(2026·广元模拟)某直播带货公司统计了今年1月份至5月份的某种产品的月销量y(单位:千件)如表所示:
月份x 1 2 3 4 5
月销量y 2.4 3.1 4 5 5.5
已知变量y与x之间具有线性相关关系,通过最小二乘法求得的经验回归方程为x+1.57,则下列说法正确的是(  )
题号
1
3
5
2
4
6
8
7
9
(参考公式:样本相关系数,决定系数R2=1-)
A.=0.81 B.r>0
C.x每增加1,y一定增加0.81 D.r2=R2



题号
1
3
5
2
4
6
8
7
9
ABD [由题意可知,=3,=4,
因为经验回归直线x+1.57过点(),
所以4=3+1.57,
解得=0.81,故A正确;
所以经验回归方程为=0.81x+1.57,
对于B,因为=0.81>0,所以r>0,故B正确;
对于C,x每增加1,y大约增加0.81,故C错误;
题号
1
3
5
2
4
6
8
7
9
对于D,因为(xi-)(yi-)=-2×(-1.6)+(-1)×(-0.9)+1+2×1.5=8.1,(xi-)2=4+1+1+4=10,(yi-)2=1.62+0.92+1+1.52=6.62,
所以r=,
题号
1
3
5
2
4
6
8
7
9
所以r2=,
因为(yi-)2=0.022+0.092+0.192+0.122=0.059,
则R2=1-,
所以r2=R2,故D正确.故选ABD.]
题号
1
3
5
2
4
6
8
7
9
三、填空题
7.(苏教版选择性必修第二册P187本章测试T6改编)动力电池作为新能源汽车的核心部件,在新能源整车成本中占比较高,而碳酸锂又是动力电池的核心原料.从2020年年底开始,碳酸锂的价格一路水涨船高.如表所示是2025年某企业前5个月碳酸锂的价格与月份的统计数据:
月份代码x 1 2 3 4 5
碳酸锂价格y(万元/kg) 0.5 0.6 1 m 1.5
题号
1
3
5
2
4
6
8
7
9
根据表中数据,得出y关于x的经验回归方程为,根据数据计算出在样本点(5,1.5)处的残差为-0.06,则m=______________.
1.4 
题号
1
3
5
2
4
6
8
7
9
1.4 [由题意,样本点(5,1.5)处的残差为-0.06,则1.5-(0.28×5+)=-0.06,解得=0.16.
由题表数据可得,×(1+2+3+4+5)=3,
×(0.5+0.6+1+m+1.5)=,
则=0.28×3+0.16,解得m=1.4.]
题号
1
3
5
2
4
6
8
7
9
8.(2025·清远市月考)当两个变量呈非线性相关时,有些可以通过适当的转换进行线性相关化,比如反比例关系y=
进行拟合,
用线性经验回归方程的相关知识,可求得的值约为________(精确到0.01).
x 1 2 3 4 5 6
y 2.5 3.6 4.4 5.4 6.6 7.5
2.88
题号
1
3
5
2
4
6
8
7
9
2.88 [设z=x2,则,则
则,
=5,
则=5-0.14×≈2.88.]
z 1 4 9 16 25 36
y 2.5 3.6 4.4 5.4 6.6 7.5
题号
1
3
5
2
4
6
8
7
9
四、解答题
9.(2025·大连期中)某课外实验小组通过实验统计了某种子的发芽率y%与土壤的湿度x%的相关数据如表.
x 40 45 50 55 60
y 50 56 64 72 83
(1)求y关于x的样本相关系数r(精确到0.001),并判断它们是否具有较强的线性相关关系;
题号
1
3
5
2
4
6
8
7
9
(2)求y关于x的经验回归方程,并预测当土壤的湿度为70%时,种子的发芽率y%的值.
参考公式及数据:对于一组数据(x1,y1),(x2,y2),…,(xn,yn),经验回归方程的斜率和截距的最小二乘估计公式分别为样本相关系数
题号
1
3
5
2
4
6
8
7
9
=16 660,=250,≈412.
题号
1
3
5
2
4
6
8
7
9
[解] (1)由题意,×(40+45+50+55+60)=50,×(50+56+64+72+83)=65,
所以y关于x的样本相关系数r=≈≈0.995,
所以x与y具有较强的线性相关关系.
题号
1
3
5
2
4
6
8
7
9
(2)由题意及(1)得,
则×50=-17,
所以y关于x的经验回归方程为x-17,
当x=70时,×70-17=97.8,
所以当土壤的湿度为70%时,种子的发芽率y%的预测值为97.8%.
谢谢!课时作业(七十一) 一元线性回归模型及其应用
一、单项选择题
1.在一次对人体脂肪含量和年龄的关系的研究中,研究人员获得了一组样本数据,并制成如图所示的人体脂肪含量与年龄的关系的散点图.下列结论正确的是(  )
A.人体脂肪含量与年龄正相关,且脂肪含量的中位数等于20%
B.人体脂肪含量与年龄正相关,且脂肪含量的中位数小于20%
C.人体脂肪含量与年龄负相关,且脂肪含量的中位数等于20%
D.人体脂肪含量与年龄负相关,且脂肪含量的中位数小于20%
2.(2025·银川一模)有一散点图如图所示,在5个(x,y)数据中去掉D(3,10)后,下列说法错误的是(  )
A.残差平方和变小
B.样本相关系数r变大
C.决定系数R2变大
D.解释变量x与响应变量y的相关性变弱
3.(人教B版选择性必修第二册P115练习B T2改编)某冷饮店日盈利y(单位:百元)与当天气温x(单位:℃)之间有如下数据:
x/℃ 15 20 25 30 35
y/百元 1 2 2 4 5
已知y与x之间具有线性相关关系,则y与x的经验回归方程是(  )
A.=0.2x-2 B.=0.2x-2.2
C.=0.2x+2 D.=0.2x+2.2
4.(2025·长沙期末)设两个相关变量x和y分别满足下表:
x 1 2 3 4 5
y 1 2 8 8 16
若相关变量x和y可拟合为非线性经验回归方程=2bx+a,则当x=6时,y的估计值为(  )
(参考公式:对于一组数据(u1,v1),(u2,v2),…,(un,vn),其经验回归直线=+ u的斜率和截距的最小二乘估计公式分别为:==-,1.155≈2)
A.33 B.37
C.65 D.73
二、多项选择题
5. (2025·沧州期中)关于样本相关系数r,下列说法正确的是(  )
A.r∈[-1,1]
B.当|r|越接近1时,成对样本数据的线性相关程度越强
C.当r=0时,成对样本数据之间没有任何相关关系
D.当r>0时,成对样本数据正相关
6.(2026·广元模拟)某直播带货公司统计了今年1月份至5月份的某种产品的月销量y(单位:千件)如表所示:
月份x 1 2 3 4 5
月销量y 2.4 3.1 4 5 5.5
已知变量y与x之间具有线性相关关系,通过最小二乘法求得的经验回归方程为=x+1.57,则下列说法正确的是(  )
A.=0.81
B.r>0
C.x每增加1,y一定增加0.81
D.r2=R2
三、填空题
7.(苏教版选择性必修第二册P187本章测试T6改编)动力电池作为新能源汽车的核心部件,在新能源整车成本中占比较高,而碳酸锂又是动力电池的核心原料.从2020年年底开始,碳酸锂的价格一路水涨船高.如表所示是2025年某企业前5个月碳酸锂的价格与月份的统计数据:
月份代码x 1 2 3 4 5
碳酸锂价格y(万元/kg) 0.5 0.6 1 m 1.5
根据表中数据,得出y关于x的经验回归方程为=0.28x+,根据数据计算出在样本点(5,1.5)处的残差为-0.06,则m=________.
8.(2025·清远市月考)当两个变量呈非线性相关时,有些可以通过适当的转换进行线性相关化,比如反比例关系y=,可以设一个新的变量z=,这样y与z之间就是线性关系.下列表格中的数据可以用非线性经验回归方程=0.14x2+进行拟合,
x 1 2 3 4 5 6
y 2.5 3.6 4.4 5.4 6.6 7.5
用线性经验回归方程的相关知识,可求得的值约为________(精确到0.01).
四、解答题
9.(13分)(2025·大连期中)某课外实验小组通过实验统计了某种子的发芽率y%与土壤的湿度x%的相关数据如表.
x 40 45 50 55 60
y 50 56 64 72 83
(1)求y关于x的样本相关系数r(精确到0.001),并判断它们是否具有较强的线性相关关系;
(2)求y关于x的经验回归方程,并预测当土壤的湿度为70%时,种子的发芽率y%的值.
参考公式及数据:对于一组数据(x1,y1),(x2,y2),…,(xn,yn),经验回归方程=x+的斜率和截距的最小二乘估计公式分别为
课时作业(七十一)
1.B [观察题干图,可知人体脂肪含量与年龄正相关,且脂肪含量的中位数小于20%.]
2.D [由散点图可知,若去掉D点,
则x与y的线性相关性变强,且是正相关,
所以样本相关系数r变大,决定系数R2变大,残差平方和变小.
故选D.]
3.B [经验回归直线必过样本点中心,由题意得=25,
=2.8,结合选项可知,2.8=0.2×25-2.2,即y与x的经验回归方程是=0.2x-2.2.故选B.]
4.B [令zi=log2yi,则x+,
×(0+1+3+3+4)=×(1+2+3+4+5)=3,
=1,
-1×3=-0.8,
故=2x-0.8,
当x=6时,y=25.2=25×,
因为1.155≈2,所以≈1.15,
所以y=25.2=25×≈32×1.15=36.8≈37.
故选B.]
5.ABD [对于选项A,由样本相关系数的性质,可得r∈[-1,1],故A正确;
对于选项B,由样本相关系数的性质,可得当|r|越接近1时,成对样本数据的线性相关程度越强,故B正确;
对于选项C,当r=0时,成对样本数据之间没有线性相关关系,但不排除它们之间有其他相关关系,故C错误;
对于选项D,由样本相关系数的性质,可得当r>0时,成对样本数据正相关,故D正确.
故选ABD.]
6.ABD [由题意可知,=3,=4,
因为经验回归直线x+1.57过点(),
所以4=3+1.57,
解得=0.81,故A正确;
所以经验回归方程为=0.81x+1.57,
对于B,因为=0.81>0,所以r>0,故B正确;
对于C,x每增加1,y大约增加0.81,故C错误;
对于D,因为(xi-)(yi-)=-2×(-1.6)+(-1)×(-0.9)+1+2×1.5=8.1,(xi-)2=4+1+1+4=10,(yi-)2=1.62+0.92+1+1.52=6.62,
所以r=
=,
所以r2=,
因为(yi-)2=0.022+0.092+0.192+0.122=0.059,
则R2=1-,
所以r2=R2,故D正确.故选ABD.]
7.1.4 [由题意,样本点(5,1.5)处的残差为-0.06,则1.5-(0.28×5+)=-0.06,解得=0.16.
由题表数据可得,×(1+2+3+4+5)=3,
×(0.5+0.6+1+m+1.5)=,
则=0.28×3+0.16,解得m=1.4.]
8.2.88 [设z=x2,则=0.14z+,则
z 1 4 9 16 25 36
y 2.5 3.6 4.4 5.4 6.6 7.5
则=5,
则-0.14=5-0.14×≈2.88.]
9.解:(1)由题意,×(40+45+50+55+60)=50,×(50+56+64+72+83)=65,
所以y关于x的样本相关系数
r=
=≈≈0.995,
所以x与y具有较强的线性相关关系.
(2)由题意及(1)得,
则=65-×50=-17,
所以y关于x的经验回归方程为x-17,
当x=70时,×70-17=97.8,
所以当土壤的湿度为70%时,种子的发芽率y%的预测值为97.8%.
1 / 4

展开更多......

收起↑

资源列表