资源简介
第三节 变量的相关性与一元线性回归模型
【课标解读】
【课程标准】
1.结合实例,了解样本相关系数的统计含义,了解样本相关系数与标准化数据向量夹角的关系.
2.结合实例,会通过相关系数比较多组成对数据的相关性.
3.结合具体实例,了解一元线性回归模型的含义,了解模型参数的统计意义,了解最小二乘原理,掌握一元线性回归模型参数的最小二乘估计方法,会使用相关的统计软件.
4.针对实际问题,会用一元线性回归模型进行预测.
【核心素养】
数学抽象、数据分析、数学运算.
【命题说明】
考向考法 高考命题常以现实生活为载体,考查样本相关系数、一元线性回归方程、非线性回归方程;一元线性回归方程是高考热点,三种题型都会出现.
预测 预计2025年高考仍会在相关系数、经验回归方程方面出题.
【必备知识·逐点夯实】
知识梳理·归纳
1.变量的相关关系
(1)相关关系:两个变量 有关系 ,但又没有确切到可由其中的一个去精确地决定另一个的程度,这种关系称为相关关系.
(2)相关关系的分类: 正相关 和 负相关 .
(3)线性相关:一般地,如果两个变量的取值呈现正相关或负相关,而且散点落在 一条直线 附近,我们就称这两个变量线性相关.
微思考变量的相关关系是因果关系吗
提示:变量的相关关系,体现的不一定是因果关系.
2.样本相关系数
(1)样本相关系数r==.
(2)样本相关系数r的取值范围为[-1,1],是一个描述成对样本数据的数字特征,它的正负性可以反映成对样本数据的变化特征,它的绝对值大小可以反映成对样本数据之间线性相关的程度:
①当r>0时,成对样本数据 正 相关;
②当r<0时,成对样本数据 负 相关;
③当|r|越接近1时,成对样本数据的线性相关程度越 强 ;
④当|r|越接近0时,成对样本数据的线性相关程度越 弱 .
3.经验回归模型
我们将=x+称为Y关于x的经验回归方程,
其中==,
=-.
微思考如果两变量是正相关,的取值如何
提示:两变量正相关,>0.
4.对模型刻画数据效果的分析
(1)残差图法
在残差图中,如果残差比较均匀地集中在 以横轴为对称轴的水平带状区域内 ,则说明经验回归方程较好地刻画了两个变量的关系.
(2)残差平方和法
残差平方和 (yi-i)2 越小,模型的拟合效果越好.
(3)决定系数R2法
可以用决定系数R2=1-来比较两个模型的拟合效果,R2越 大 ,模型的拟合效果越好,R2越 小 ,模型的拟合效果越差.
基础诊断·自测
类型 辨析 改编 易错
题号 1 2,3 4
1.(思考辨析)(正确的打“√”,错误的打“×”)
(1)相关关系是一种非确定性关系.( )
(2)散点图是判断两个变量相关关系的一种重要方法和手段.( )
(3)经验回归直线=x+至少经过点(x1,y1),(x2,y2),…,(xn,yn)中的一个点.( )
(4)样本相关系数的绝对值越接近1,成对样本数据的线性相关程度越强.( )
2.(选修第三册P101例1改编)对于x,y两个变量,有四组成对样本数据,分别算出它们的样本相关系数r如下,则线性相关性最强的是( )
A.-0.82 B.0.78 C.-0.69 D.0.87
3.(选修第三册P103习题1改编)根据所示的散点图,下列说法正确的是( )
A.身高越高,体重越大 B.身高越高,体重越小
C.身高和体重呈正相关 D.身高和体重呈负相关
4.(误认为经验回归直线过样本点)某互联网公司借助某平台推广自己的产品,对今年前5个月的月平台推广费用x(单位:百万元)与月利润额y(单位:百万元)进行了初步统计,得到下列表格中的数据:
x 2 4 5 6 8
y 30 40 60 p 70
经计算,月平台推广费用x与月利润额y满足经验回归方程=6.5x+17.5,则p的值为( )
A.50 B.56.5 C.60 D.70
【核心考点·分类突破】
考点一成对数据的相关性
[例1](1)(2023·天津高考)调查某种花萼长度和花瓣长度,所得数据如图所示,其中相关系数r=0.824 5,下列说法正确的是( )
A.花瓣长度和花萼长度没有相关性
B.花瓣长度和花萼长度呈现负相关
C.花瓣长度和花萼长度呈现正相关
D.若从样本中抽取一部分,则这部分的相关系数一定是0.824 5
(2)(多选题)对于样本相关系数,下列说法正确的有( )
A.样本相关系数可以用来判断成对样本数据相关的正负性
B.样本相关系数可以是正的,也可以是负的
C.样本相关系数r∈[-1,1]
D.样本相关系数越大,成对样本数据的线性相关程度也越强
解题技法
判断相关关系的两种方法
(1)散点图法:如果所有的样本点都落在某条曲线附近,变量之间就有相关关系.如果所有的样本点都落在某一直线附近,变量之间就有线性相关关系.
(2)相关系数法:利用相关系数判定,|r|越趋近于1,相关性越强.
对点训练
1.某商家今年上半年各月的人均销售额(单位:千元)与利润率统计表如下:
月份 1 2 3 4 5 6
人均销售额 6 5 8 3 4 7
利润率(%) 12.6 10.4 18.5 3.0 8.1 16.3
根据表中数据,下列说法正确的是( )
A.利润率与人均销售额呈现正相关关系
B.利润率与人均销售额呈现负相关关系
C.利润率与人均销售额成正比例函数关系
D.利润率与人均销售额成反比例函数关系
2.若已知(yi-)2是(xi-)2的4倍,(xi-)(yi-)是(xi-)2的1.5倍,则相关系数r的值为 .
【加练备选】
为研究语文成绩和英语成绩之间是否具有线性相关关系,统计某班学生的两科成绩得到如图所示的散点图(x轴、y轴的单位长度相同),用经验回归方程=x+近似地刻画其相关关系,根据图形,以下结论最有可能成立的是( )
A.线性相关关系较强,的值为1.25
B.线性相关关系较强,的值为0.83
C.线性相关关系较强,的值为-0.87
D.线性相关关系较弱,无研究价值
考点二回归模型及其应用
角度1 一元线性回归模型及其应用
[例2]为保证新能源汽车的推广,某市逐渐加大充电基础设施的建设,该市统计了近五年新能源汽车充电站的数量(单位:个),得到如下数据:
年份编号x 1 2 3 4 5
年份 2018 2019 2020 2021 2022
数量y/个 37 104 147 196 226
(1)已知可用线性回归模型拟合y与x的关系,请用相关系数加以说明;
(2)求y关于x的经验回归方程,并预测2026年该市新能源汽车充电站的数量.
参考数据:yi=710,xiyi=2 600,≈149.89,≈3.16.
参考公式:相关系数r=,
经验回归直线=x+中斜率和截距的最小二乘估计公式分别为=,=-.
解题技法
求经验回归方程的步骤
对点训练
1.(2024·宁德模拟)某学校利用实践基地开展劳动教育活动,在其中一块土地上栽种某种蔬菜,并指定一位同学观测其中一棵幼苗的生长情况,该同学获得前6天的数据如下:
第x天 1 2 3 4 5 6
高度y 1 4 7 9 11 13
经这位同学的研究,发现第x天幼苗的高度y的经验回归方程为=2.4x+,据此预测第10天这棵幼苗的高度为( )
A.19 cm B.21 cm C.23 cm D.25 cm
2.某智能机器人的广告费用x(万元)与销售额y(万元)的统计数据如表所示:
广告费用x(万元) 2 3 5 6
销售额y(万元) 28 31 41 48
根据此表可得经验回归方程为=5x+,据此模型预测广告费用为8万元时,销售额为 万元.
角度2 非线性回归模型及其应用
[例3]某企业新研发了一种产品,产品的成本由原料成本及非原料成本组成,每件产品的非原料成本y(元)与生产该产品的数量x(千件)有关,经统计得到如下数据:
x 1 2 3 4 5 6 7 8
y 112 61 44.5 35 30.5 28 25 24
根据以上数据,绘制了散点图.参考数据:(其中ui=)
参考公式:对于一组数据(u1,v1),(u2,v2),…,(un,vn),其经验回归方程=+u的斜率和截距的最小二乘估计分别为=,=-.
uiyi yi
183.4 0.34 0.115 1.53 360 22 385.5
(1)观察散点图判断,y=a+与y=c+dx哪一个适宜作为非原料成本y与生产该产品的数量x的回归方程类型 (给出判断即可,不必说明理由)
(2)根据(1)的判断结果及表中数据,建立y与x的回归方程.
(3)试预测生产该产品10 000件时每件产品的非原料成本.
解题技法
非线性回归分析的步骤
对点训练
1.(2023·郑州模拟)用模型y=a(a>0)拟合一组数据时,令z=ln y,将其变换后得到经验回归方程=2x+,则=( )
A.e B. C. D.2
2.已知具有相关关系的两个随机变量的一组观测数据的散点图分布在函数y=2e2x+1的图象附近,设z=ln y,将其变换后得到经验回归方程为=x+,则mn= .
考点三残差分析
[例4](1)(2024·湖南师大附中模拟)某网店经销某商品,为了解该商品的月销量y(单位:千件)与售价x(单位:元/件)之间的关系,收集5组数据进行了初步处理,得到如表:
x 5 6 7 8 9
y 8 6 4.5 3.5 3
根据表中的数据可得经验回归方程=-1.25x+13.75,以下说法正确的是( )
A.x,y具有负相关关系,相关系数r=-1.25
B.x每增加一个单位,y平均减少13.75个单位
C.第二个样本点对应的残差2=0.25
D.第三个样本点对应的残差3=-0.5
(2)新能源汽车的核心部件是动力电池,电池占了新能源整车成本的很大一部分,而其中的原材料碳酸锂又是电池的主要成分.从2020年底开始,碳酸锂的价格不断升高,下表是2022年某企业的前5个月碳酸锂的价格与月份的统计数据:
月份代码x 1 2 3 4 5
碳酸锂价格y(万元/kg) 0.5 0.6 1 m 1.5
根据表中数据,得出y关于x的经验回归方程为=0.28x+,根据数据计算出在样本点(5,1.5)处的残差为-0.06,则表中m= .
解题技法
检验回归模型的拟合效果的两种方法
(1)残差分析:通过残差分析发现原始数据中的可疑数据,判断所建立模型的拟合效果.
(2)R2分析:通过公式计算R2,R2越大,残差平方和越小,模型的拟合效果越好;R2越小,残差平方和越大,模型的拟合效果越差.
对点训练
色差和色度是衡量毛绒玩具质量优劣的重要指标,现抽检一批产品测得数据列于表中,已知该产品的色度y和色差x之间满足线性相关关系,且=0.8x+,现有一对测量数据为(30,23.6),则该数据的残差为( )
色差x 21 23 25 27
色度y 15 18 19 20
A.-0.96 B.-0.8 C.0.8 D.0.96第三节 变量的相关性与一元线性回归模型
【课标解读】
【课程标准】
1.结合实例,了解样本相关系数的统计含义,了解样本相关系数与标准化数据向量夹角的关系.
2.结合实例,会通过相关系数比较多组成对数据的相关性.
3.结合具体实例,了解一元线性回归模型的含义,了解模型参数的统计意义,了解最小二乘原理,掌握一元线性回归模型参数的最小二乘估计方法,会使用相关的统计软件.
4.针对实际问题,会用一元线性回归模型进行预测.
【核心素养】
数学抽象、数据分析、数学运算.
【命题说明】
考向考法 高考命题常以现实生活为载体,考查样本相关系数、一元线性回归方程、非线性回归方程;一元线性回归方程是高考热点,三种题型都会出现.
预测 预计2025年高考仍会在相关系数、经验回归方程方面出题.
【必备知识·逐点夯实】
知识梳理·归纳
1.变量的相关关系
(1)相关关系:两个变量 有关系 ,但又没有确切到可由其中的一个去精确地决定另一个的程度,这种关系称为相关关系.
(2)相关关系的分类: 正相关 和 负相关 .
(3)线性相关:一般地,如果两个变量的取值呈现正相关或负相关,而且散点落在 一条直线 附近,我们就称这两个变量线性相关.
微思考变量的相关关系是因果关系吗
提示:变量的相关关系,体现的不一定是因果关系.
2.样本相关系数
(1)样本相关系数r==.
(2)样本相关系数r的取值范围为[-1,1],是一个描述成对样本数据的数字特征,它的正负性可以反映成对样本数据的变化特征,它的绝对值大小可以反映成对样本数据之间线性相关的程度:
①当r>0时,成对样本数据 正 相关;
②当r<0时,成对样本数据 负 相关;
③当|r|越接近1时,成对样本数据的线性相关程度越 强 ;
④当|r|越接近0时,成对样本数据的线性相关程度越 弱 .
3.经验回归模型
我们将=x+称为Y关于x的经验回归方程,
其中==,
=-.
微思考如果两变量是正相关,的取值如何
提示:两变量正相关,>0.
4.对模型刻画数据效果的分析
(1)残差图法
在残差图中,如果残差比较均匀地集中在 以横轴为对称轴的水平带状区域内 ,则说明经验回归方程较好地刻画了两个变量的关系.
(2)残差平方和法
残差平方和 (yi-i)2 越小,模型的拟合效果越好.
(3)决定系数R2法
可以用决定系数R2=1-来比较两个模型的拟合效果,R2越 大 ,模型的拟合效果越好,R2越 小 ,模型的拟合效果越差.
基础诊断·自测
类型 辨析 改编 易错
题号 1 2,3 4
1.(思考辨析)(正确的打“√”,错误的打“×”)
(1)相关关系是一种非确定性关系.( √ )
提示:(1)由相关关系的定义可知,相关关系是一种非确定性关系,所以(1)正确;
(2)散点图是判断两个变量相关关系的一种重要方法和手段.( √ )
提示: (2)因为散点图是描述成对数据之间关系的一种直观方法,观察散点图可以大致看出两个变量的相关关系,所以(2)正确;
(3)经验回归直线=x+至少经过点(x1,y1),(x2,y2),…,(xn,yn)中的一个点.( × )
提示: (3)经验回归方程=x+过点(,),不一定过样本数据,所以(3)错误;
(4)样本相关系数的绝对值越接近1,成对样本数据的线性相关程度越强.( √ )
提示: (4)由相关系数的大小与样本相关关系可知(4)正确.
2.(选修第三册P101例1改编)对于x,y两个变量,有四组成对样本数据,分别算出它们的样本相关系数r如下,则线性相关性最强的是( )
A.-0.82 B.0.78 C.-0.69 D.0.87
【解析】选D.由样本相关系数的绝对值|r|越接近1,变量间的线性相关性越强知,各选项中r=0.87的绝对值最接近1.
3.(选修第三册P103习题1改编)根据所示的散点图,下列说法正确的是( )
A.身高越高,体重越大 B.身高越高,体重越小
C.身高和体重呈正相关 D.身高和体重呈负相关
【解析】选C.根据散点图的分布可得:身高和体重呈正相关.
4.(误认为经验回归直线过样本点)某互联网公司借助某平台推广自己的产品,对今年前5个月的月平台推广费用x(单位:百万元)与月利润额y(单位:百万元)进行了初步统计,得到下列表格中的数据:
x 2 4 5 6 8
y 30 40 60 p 70
经计算,月平台推广费用x与月利润额y满足经验回归方程=6.5x+17.5,则p的值为( )
A.50 B.56.5 C.60 D.70
【解析】选A.由于经验回归直线过样本点的中心,=5,=,代入经验回归方程得=6.5×5+17.5,解得p=50.
【核心考点·分类突破】
考点一成对数据的相关性
[例1](1)(2023·天津高考)调查某种花萼长度和花瓣长度,所得数据如图所示,其中相关系数r=0.824 5,下列说法正确的是( )
A.花瓣长度和花萼长度没有相关性
B.花瓣长度和花萼长度呈现负相关
C.花瓣长度和花萼长度呈现正相关
D.若从样本中抽取一部分,则这部分的相关系数一定是0.824 5
【解析】选C.因为相关系数r=0.824 5>0.75,且题中散点图呈左下角到右上角的带状分布,所以花瓣长度和花萼长度呈现正相关.
若从样本中抽取一部分,则这部分的相关系数不一定是0.824 5.
(2)(多选题)对于样本相关系数,下列说法正确的有( )
A.样本相关系数可以用来判断成对样本数据相关的正负性
B.样本相关系数可以是正的,也可以是负的
C.样本相关系数r∈[-1,1]
D.样本相关系数越大,成对样本数据的线性相关程度也越强
【解析】选ABC.因为样本相关系数大于0,说明成对样本数据正相关,样本相关系数小于0,说明成对样本数据负相关,所以选项A正确;
由样本相关系数公式可知:样本相关系数r∈[-1,1],所以选项B,C正确;
样本相关系数的绝对值越接近1,成对样本数据的线性相关程度越强,故D错误.
解题技法
判断相关关系的两种方法
(1)散点图法:如果所有的样本点都落在某条曲线附近,变量之间就有相关关系.如果所有的样本点都落在某一直线附近,变量之间就有线性相关关系.
(2)相关系数法:利用相关系数判定,|r|越趋近于1,相关性越强.
对点训练
1.某商家今年上半年各月的人均销售额(单位:千元)与利润率统计表如下:
月份 1 2 3 4 5 6
人均销售额 6 5 8 3 4 7
利润率(%) 12.6 10.4 18.5 3.0 8.1 16.3
根据表中数据,下列说法正确的是( )
A.利润率与人均销售额呈现正相关关系
B.利润率与人均销售额呈现负相关关系
C.利润率与人均销售额成正比例函数关系
D.利润率与人均销售额成反比例函数关系
【解析】选A.由题中统计表可得利润率与人均销售额不是正比例关系,也不是反比例关系,排除C,D;其属于正相关关系,A正确,B错误.
2.若已知(yi-)2是(xi-)2的4倍,(xi-)(yi-)是(xi-)2的1.5倍,则相关系数r的值为 .
【解析】由r=,得r=.
答案:
【加练备选】
为研究语文成绩和英语成绩之间是否具有线性相关关系,统计某班学生的两科成绩得到如图所示的散点图(x轴、y轴的单位长度相同),用经验回归方程=x+近似地刻画其相关关系,根据图形,以下结论最有可能成立的是( )
A.线性相关关系较强,的值为1.25
B.线性相关关系较强,的值为0.83
C.线性相关关系较强,的值为-0.87
D.线性相关关系较弱,无研究价值
【解析】选B.由题中散点图可以看出两个变量所构成的点在一条直线附近,所以线性相关关系较强,且应为正相关,所以经验回归方程的斜率应为正数,且从散点图观察,经验回归方程的斜率应该比直线y=x的斜率要小一些,综上可知应选B.
考点二回归模型及其应用
角度1 一元线性回归模型及其应用
[例2]为保证新能源汽车的推广,某市逐渐加大充电基础设施的建设,该市统计了近五年新能源汽车充电站的数量(单位:个),得到如下数据:
年份编号x 1 2 3 4 5
年份 2018 2019 2020 2021 2022
数量y/个 37 104 147 196 226
(1)已知可用线性回归模型拟合y与x的关系,请用相关系数加以说明;
【解析】(1)由已知数据得=×(1+2+3+4+5)=3,=×710=142,
(xi-)2=(-2)2+(-1)2+0+1+22=10,
(xi-)(yi-)=xiyi-5 =2 600-5×3×142=470,
所以r≈≈0.99.
因为y与x的相关系数近似为0.99,接近1,说明y与x的线性相关程度相当高,从而可以用线性回归模型拟合y与x的关系.
(2)求y关于x的经验回归方程,并预测2026年该市新能源汽车充电站的数量.
参考数据:yi=710,xiyi=2 600,≈149.89,≈3.16.
参考公式:相关系数r=,
经验回归直线=x+中斜率和截距的最小二乘估计公式分别为=,=-.
【解析】(2)由(1)得===47,
=-=142-47×3=1,
故所求经验回归方程为=47x+1,
将2026年对应的年份编号x=9代入经验回归方程得=47×9+1=424,
故预测2026年该市新能源汽车充电站的数量为424个.
解题技法
求经验回归方程的步骤
对点训练
1.(2024·宁德模拟)某学校利用实践基地开展劳动教育活动,在其中一块土地上栽种某种蔬菜,并指定一位同学观测其中一棵幼苗的生长情况,该同学获得前6天的数据如下:
第x天 1 2 3 4 5 6
高度y 1 4 7 9 11 13
经这位同学的研究,发现第x天幼苗的高度y的经验回归方程为=2.4x+,据此预测第10天这棵幼苗的高度为( )
A.19 cm B.21 cm C.23 cm D.25 cm
【解析】选C.由已知得:==3.5,==7.5,
因为经验回归方程为=2.4x+,
所以7.5=2.4×3.5+,解得=-0.9,
当x=10时,=2.4×10-0.9=23.1,
所以预测第10天这棵幼苗的高度为23 cm.
2.某智能机器人的广告费用x(万元)与销售额y(万元)的统计数据如表所示:
广告费用x(万元) 2 3 5 6
销售额y(万元) 28 31 41 48
根据此表可得经验回归方程为=5x+,据此模型预测广告费用为8万元时,销售额为 万元.
【解析】由题中表格,得==4,
==37,
所以37=5×4+,即=17,
所以预测当广告费用为8万元时,销售额为5×8+17=57(万元).
答案:57
角度2 非线性回归模型及其应用
[例3]某企业新研发了一种产品,产品的成本由原料成本及非原料成本组成,每件产品的非原料成本y(元)与生产该产品的数量x(千件)有关,经统计得到如下数据:
x 1 2 3 4 5 6 7 8
y 112 61 44.5 35 30.5 28 25 24
根据以上数据,绘制了散点图.参考数据:(其中ui=)
参考公式:对于一组数据(u1,v1),(u2,v2),…,(un,vn),其经验回归方程=+u的斜率和截距的最小二乘估计分别为=,=-.
uiyi yi
183.4 0.34 0.115 1.53 360 22 385.5
(1)观察散点图判断,y=a+与y=c+dx哪一个适宜作为非原料成本y与生产该产品的数量x的回归方程类型 (给出判断即可,不必说明理由)
【解析】(1)由散点图可知,y=a+适宜作为非原料成本y与生产该产品的数量x的回归方程类型;
(2)根据(1)的判断结果及表中数据,建立y与x的回归方程.
【解析】(2)令u=,则y=a+bu,
====100,
=-=-100×0.34=11,
所以=11+100u=11+;
(3)试预测生产该产品10 000件时每件产品的非原料成本.
【解析】(3)当x=10(千件)时,=11+=21(元).
故预测生产该产品10 000件时每件产品的非原料成本为21元.
解题技法
非线性回归分析的步骤
对点训练
1.(2023·郑州模拟)用模型y=a(a>0)拟合一组数据时,令z=ln y,将其变换后得到经验回归方程=2x+,则=( )
A.e B. C. D.2
【解析】选D.对y=a(a>0)两边同时取对数,则ln y=ln (a)=ln a+bx+1,令z=ln y,则z=bx+ln a+1,所以 所以=2.
2.已知具有相关关系的两个随机变量的一组观测数据的散点图分布在函数y=2e2x+1的图象附近,设z=ln y,将其变换后得到经验回归方程为=x+,则mn= .
【解析】由z=ln y,则ln y=ln 2,即z=ln 2+ln =ln 2+2x+1,则z=2x+ln 2+1,故m=2,n=ln 2+1,所以mn=2ln 2+2.
答案:2ln 2+2
考点三残差分析
[例4](1)(2024·湖南师大附中模拟)某网店经销某商品,为了解该商品的月销量y(单位:千件)与售价x(单位:元/件)之间的关系,收集5组数据进行了初步处理,得到如表:
x 5 6 7 8 9
y 8 6 4.5 3.5 3
根据表中的数据可得经验回归方程=-1.25x+13.75,以下说法正确的是( )
A.x,y具有负相关关系,相关系数r=-1.25
B.x每增加一个单位,y平均减少13.75个单位
C.第二个样本点对应的残差2=0.25
D.第三个样本点对应的残差3=-0.5
【解析】选D.对于A选项:相关系数绝对值不超过1,A不正确;
对于B选项:由经验回归方程知,x每增加一个单位,y平均减少1.25个单位,B不正确;
对于C选项:第二个样本点对应的残差2=6-(-1.25×6+13.75)=-0.25,C不正确;
对于D选项:第三个样本点对应的残差3=4.5-(-1.25×7+13.75)=-0.5,D正确.
(2)新能源汽车的核心部件是动力电池,电池占了新能源整车成本的很大一部分,而其中的原材料碳酸锂又是电池的主要成分.从2020年底开始,碳酸锂的价格不断升高,下表是2022年某企业的前5个月碳酸锂的价格与月份的统计数据:
月份代码x 1 2 3 4 5
碳酸锂价格y(万元/kg) 0.5 0.6 1 m 1.5
根据表中数据,得出y关于x的经验回归方程为=0.28x+,根据数据计算出在样本点(5,1.5)处的残差为-0.06,则表中m= .
【解析】由题设,1.5-=1.5-(0.28×5+)
=-0.06,可得=0.16.
又==3,
==,
所以0.28×3+0.16=,可得m=1.4.
答案:1.4
解题技法
检验回归模型的拟合效果的两种方法
(1)残差分析:通过残差分析发现原始数据中的可疑数据,判断所建立模型的拟合效果.
(2)R2分析:通过公式计算R2,R2越大,残差平方和越小,模型的拟合效果越好;R2越小,残差平方和越大,模型的拟合效果越差.
对点训练
色差和色度是衡量毛绒玩具质量优劣的重要指标,现抽检一批产品测得数据列于表中,已知该产品的色度y和色差x之间满足线性相关关系,且=0.8x+,现有一对测量数据为(30,23.6),则该数据的残差为( )
色差x 21 23 25 27
色度y 15 18 19 20
A.-0.96 B.-0.8 C.0.8 D.0.96
【解析】选C.由题意可知,==24,==18,
将(24,18)代入=0.8x+,
即18=0.8×24+,解得=-1.2,
所以=0.8x-1.2,
当x=30时,=0.8×30-1.2=22.8,
所以该数据的残差为23.6-22.8=0.8.
展开更多......
收起↑