8.2.2 回归分析模型及其应用(练习,含解析)高中数学人教A版(2019)选择性必修 第三册

资源下载
  1. 二一教育资源

8.2.2 回归分析模型及其应用(练习,含解析)高中数学人教A版(2019)选择性必修 第三册

资源简介

8.2.2 回归分析模型及其应用
1.两个变量y与x的回归模型中,分别选择了4个不同模型,它们的决定系数R2如下,其中拟合效果最好的模型是(  )
A.模型1的决定系数R2为0.98 B.模型2的决定系数R2为0.80
C.模型3的决定系数R2为0.50 D.模型4的决定系数R2为0.25
2.甲、乙、丙、丁4位同学各自对A,B两变量做回归分析,分别得到散点图与残差平方和(yi-)2如下表:
甲 乙 丙 丁
散点图
残差平方和 115 106 124 103
试验结果体现拟合A,B两个变量关系的模型拟合精度高的是(  )
A.甲 B.乙
C.丙 D.丁
3.某工厂为研究某种产品的产量x(单位:t)与所需某种原材料y(单位:t)的相关性,在生产过程中收集了4组对应数据如下表:
x/t 3 4 6 7
y/t 2.5 3 4 m
根据表中数据,得出x关于y的经验回归方程为=0.7x+a.据此计算出在样本点(4,3)处的残差为-0.15,则表中m的值为(注:y- 称为对应样本点的残差)(  )
A.5.9 B.5.5
C.4.5 D.3.3
4.对于数据组(xi,yi)(i=1,2,3,…,n),如果由经验回归方程得到的对应自变量xi的估计值是,那么将yi-称为对应点(xi,yi)的残差.某学校利用实践基地开展劳动教育活动,在其中一块土地上栽种某种蔬菜,并指定一名同学观测其中一棵幼苗生长情况,该同学获得前6天的数据如下:
第x天 1 2 3 4 5 6
高度y/cm 1 4 7 9 11 13
经这名同学的研究,发现第x天幼苗的高度y(单位:cm)关于x的经验回归方程为=2.4x+,据此计算样本点(5,11)处的残差为(  )
A.0.1 B.-0.1
C.0.9 D.-0.9
5.(多选)某种产品的广告支出费用x(单位:万元)与销售量y(单位:万件)之间的对应数据如下表所示:
广告支出费用x/万元 2.2 2.6 4.0 5.3 5.9
销售量y/万件 3.8 5.4 7.0 11.6 12.2
根据表中的数据可得经验回归方程=2.27x-1.08,R2≈0.96,以下说法中错误的有(  )
A.第三个样本点对应的残差=-1,回归模型的拟合效果一般
B.第三个样本点对应的残差=1,回归模型的拟合效果较好
C.销售量y的多少有96%是由广告支出费用引起的
D.销售量y的多少有4%是由广告支出费用引起的
6.(多选)如图是某小卖部5天卖出热茶的杯数与当天气温(单位:℃)的散点图,若去掉B(7,35)后,下列说法正确的有(  )
A.决定系数R2变大
B.变量x与y的相关性变弱
C.样本相关系数r的绝对值变大
D.当气温为11 ℃时,卖出热茶的杯数估计为35杯
7.(多选)5G技术的运营不仅提高了网络传输速度,更拓宽了网络资源的服务范围.某手机商城统计了5个月的5G手机销量,如下表所示:
月份 6月 7月 8月 9月 10月
月份编号x 1 2 3 4 5
销量y/部 52 95 a 185 227
若y与x线性相关,且由上表数据求得经验回归方程为=44x+10,则下列说法正确的是(  )
A.5G手机的销量逐月增加,平均每个月增加约10台
B.a=151
C.y与x正相关
D.预计12月份该手机商城的5G手机销量约为328部
8.在研究气温和热茶销售杯数的关系时,若求得决定系数R2≈0.85,则表明气温解释了____的热茶销售杯数变化,而随机误差贡献了剩余的____,所以气温对热茶销售杯数的效应比随机误差的效应大得多.
9. 已知变量x,y线性相关,其一组样本数据(xi,yi)(i=1,2,…,6)满足xi=30,用最小二乘法得到的经验回归方程为y=x-1,若增加一个数据(-2,4)后,得到新的经验回归方程y=2x+,则此时数据(3,4)的残差为____.
10.为调查某企业年利润y(单位:万元)和它的年研究费用x(单位:万元)的相关性,收集了5组成对数据(x,y),如下表所示:
x 1 2 3 4 5
y 50 60 70 80 100
由表中数据求得y关于x的经验回归方程为=12x+a,据此计算出在样本点(4,80)处的残差为____.
11.某校数学建模小组为了解高中男生的体重y(单位:kg)与身高x(单位:cm)是否存在较好的线性关系,搜集了7位男生的数据,该数据经过计算后得到的有效数据为=52.36,(yi-)2=390,=172,=62,根据所给数据计算得到y关于x的经验回归方程为=1.15x+.
(1) 求 的值;
(2) 已知R2=1-且当R2→0.9时,回归方程的拟合效果非常好;当0.8<R2<0.9时,回归方程的拟合效果良好.试问该经验回归方程的拟合效果是非常好还是良好?请说明理由.
12. 郑州东站位于河南省郑州市郑东新区,是亚洲规模最大的高铁站之一,全国唯一的“米”字型高铁枢纽,总建筑面积41.2万平方米,车站规模16台32线,自运行起客流持续保持高位运行.有调查小组统计郑州东站某处某月1日到9日的客流人数y,得到数据如下表:
时间x/日 1 2 3 4 5 6 7 8 9
人数y 80 98 129 150 203 190 258 292 310
(1) 由于统计人员的疏忽,第5日的数据统计有误,如果去掉第5日的数据,试依据剩下的数据,建立每日客流的人数y关于时间x的经验回归方程.
(2) 根据(1)中所求方程,预测第10日的客流人数.(结果保留整数)
参考数据及公式:=yi=190,(xi-)2=60,(yi- )2=55 482,(xi-)(yi-)=1 800.对于一组数据(x1,y1),(x2,y2),…,(xn,yn),其经验回归直线=x+的斜率和截距的最小二乘估计分别为==,=-.
13.某市春节期间7家超市的广告费支出xi(单位:万元)和销售额yi(单位:万元)数据如下表:
超市 A B C D E F G
广告费支出xi/万元 1 2 4 6 11 13 19
销售额yi/万元 19 32 40 44 52 53 54
(1) 若用线性回归模型拟合y与x的关系,求y关于x的经验回归方程;
(2) 若用对数回归模型拟合y与x的关系,可得经验回归方程:=12ln x+22,经计算得出线性回归模型和对数回归模型的R2分别约为0.75和0.97,请用R2说明选择哪个回归模型更合适,并用此模型预测A超市广告费支出为8万元时的销售额.
参考数据:=8,=42,xiyi=2 794,=708,ln 2≈0.69.
8.2.2 回归分析模型及其应用
1.两个变量y与x的回归模型中,分别选择了4个不同模型,它们的决定系数R2如下,其中拟合效果最好的模型是( A )
A.模型1的决定系数R2为0.98 B.模型2的决定系数R2为0.80
C.模型3的决定系数R2为0.50 D.模型4的决定系数R2为0.25
【解析】 在两个变量y与x的回归模型中,它们的决定系数R2越近于1,模拟效果越好,在四个选项中A的决定系数最大,所以拟合效果最好的是模型的 1 .
2.甲、乙、丙、丁4位同学各自对A,B两变量做回归分析,分别得到散点图与残差平方和(yi-)2如下表:
甲 乙 丙 丁
散点图
残差平方和 115 106 124 103
试验结果体现拟合A,B两个变量关系的模型拟合精度高的是( D )
A.甲 B.乙
C.丙 D.丁
【解析】 从题中的散点图上来看,丁同学的散点图中的点更加近似在一条直线附近;从残差平方和来看,丁同学的最小,说明拟合精度最高.
3.某工厂为研究某种产品的产量x(单位:t)与所需某种原材料y(单位:t)的相关性,在生产过程中收集了4组对应数据如下表:
x/t 3 4 6 7
y/t 2.5 3 4 m
根据表中数据,得出x关于y的经验回归方程为=0.7x+a.据此计算出在样本点(4,3)处的残差为-0.15,则表中m的值为(注:y- 称为对应样本点的残差)( A )
A.5.9 B.5.5
C.4.5 D.3.3
【解析】 由残差为-0.15可知,当x=4时,=3.15,即3.15=0.7×4+a,解得a=0.35,所以经验回归方程为=0.7x+0.35.又==5,==,且样本中心(,)在回归直线上,所以=0.7×5+0.35,解得m=5.9.
4.对于数据组(xi,yi)(i=1,2,3,…,n),如果由经验回归方程得到的对应自变量xi的估计值是,那么将yi-称为对应点(xi,yi)的残差.某学校利用实践基地开展劳动教育活动,在其中一块土地上栽种某种蔬菜,并指定一名同学观测其中一棵幼苗生长情况,该同学获得前6天的数据如下:
第x天 1 2 3 4 5 6
高度y/cm 1 4 7 9 11 13
经这名同学的研究,发现第x天幼苗的高度y(单位:cm)关于x的经验回归方程为=2.4x+,据此计算样本点(5,11)处的残差为( B )
A.0.1 B.-0.1
C.0.9 D.-0.9
【解析】 ==3.5,==7.5.因为经验回归方程=2.4x+过样本中心点(3.5,7.5),所以7.5=2.4×3.5+,解得=-0.9,所以经验回归方程为=2.4x-0.9.当x=5时,=2.4×5-0.9=11.1,所以样本点(5,11)处的残差为11-11.1=-0.1.
5.(多选)某种产品的广告支出费用x(单位:万元)与销售量y(单位:万件)之间的对应数据如下表所示:
广告支出费用x/万元 2.2 2.6 4.0 5.3 5.9
销售量y/万件 3.8 5.4 7.0 11.6 12.2
根据表中的数据可得经验回归方程=2.27x-1.08,R2≈0.96,以下说法中错误的有( ABD )
A.第三个样本点对应的残差=-1,回归模型的拟合效果一般
B.第三个样本点对应的残差=1,回归模型的拟合效果较好
C.销售量y的多少有96%是由广告支出费用引起的
D.销售量y的多少有4%是由广告支出费用引起的
【解析】 由题意得=7-(2.27×4-1.08)=-1,由于R2≈0.96,所以该回归模型拟合的效果比较好,故A,B错误;在线性回归模型中,R2表示解释变量对于响应变量的贡献率,R2≈0.96,则销售量y的多少有96%是由广告支出费用引起的,故C正确,D错误.
6.(多选)如图是某小卖部5天卖出热茶的杯数与当天气温(单位:℃)的散点图,若去掉B(7,35)后,下列说法正确的有( AC )
A.决定系数R2变大
B.变量x与y的相关性变弱
C.样本相关系数r的绝对值变大
D.当气温为11 ℃时,卖出热茶的杯数估计为35杯
【解析】 由散点图可知,去掉B(7,35)后,变量x与y的相关性变强,故B错误;因为是负相关,所以样本相关系数r的绝对值变大,故C正确;决定系数R2变大,故A正确;去掉B(7,35)后,==11,==36,xiyi=4×50+10×37+13×33+17×24=1 407,=42+102+132+172=574,所以==≈-1.97,=-=36+1.97×11=57.67,所以y关于x的经验回归方程为y=-1.97x+57.67.当气温为11 ℃时,y=-1.97×11+57.67=36,所以卖出热茶的杯数估计为36杯,故D错误.
7.(多选)5G技术的运营不仅提高了网络传输速度,更拓宽了网络资源的服务范围.某手机商城统计了5个月的5G手机销量,如下表所示:
月份 6月 7月 8月 9月 10月
月份编号x 1 2 3 4 5
销量y/部 52 95 a 185 227
若y与x线性相关,且由上表数据求得经验回归方程为=44x+10,则下列说法正确的是( BCD )
A.5G手机的销量逐月增加,平均每个月增加约10台
B.a=151
C.y与x正相关
D.预计12月份该手机商城的5G手机销量约为328部
【解析】 由表中数据可知=×(1+2+3+4+5)=3,代入=44x+10,解得=142,所以=×(52+95+a+185+227)=142,解得a=151,由此知5G手机的销量逐月增加,平均每个月增加约44台左右,将x=7代入经验回归方程得=328,因为44>0,所以y与x正相关.
8.在研究气温和热茶销售杯数的关系时,若求得决定系数R2≈0.85,则表明气温解释了__85%__的热茶销售杯数变化,而随机误差贡献了剩余的__15%__,所以气温对热茶销售杯数的效应比随机误差的效应大得多.
【解析】 由决定系数R2的意义可知,R2≈0.85表明气温解释了85%,而随机误差贡献了剩余的15%.
9. 已知变量x,y线性相关,其一组样本数据(xi,yi)(i=1,2,…,6)满足xi=30,用最小二乘法得到的经验回归方程为y=x-1,若增加一个数据(-2,4)后,得到新的经验回归方程y=2x+,则此时数据(3,4)的残差为__2__.
【解析】 由题意知,旧数据==5,则=-1=5-1=4,增加数据(-2,4)后,==4,==4,将点(4,4)代入y=2x+中,得4=8+,即=-4,则y=2x-4,当x=3时,y=2×3-4=2,故残差为4-2=2.
10.为调查某企业年利润y(单位:万元)和它的年研究费用x(单位:万元)的相关性,收集了5组成对数据(x,y),如下表所示:
x 1 2 3 4 5
y 50 60 70 80 100
由表中数据求得y关于x的经验回归方程为=12x+a,据此计算出在样本点(4,80)处的残差为__-4__.
【解析】 由表中数据可得=×(1+2+3+4+5)=3,=×(50+60+70+80+100)=72,代入经验回归方程=12x+a,得a=72-12×3=36,所以经验回归方程为=12x+36.当x=4时,=12×4+36=84,故在样本点(4,80)处的残差为80-84=-4.
11.某校数学建模小组为了解高中男生的体重y(单位:kg)与身高x(单位:cm)是否存在较好的线性关系,搜集了7位男生的数据,该数据经过计算后得到的有效数据为=52.36,(yi-)2=390,=172,=62,根据所给数据计算得到y关于x的经验回归方程为=1.15x+.
(1) 求 的值;
(2) 已知R2=1-且当R2→0.9时,回归方程的拟合效果非常好;当0.8<R2<0.9时,回归方程的拟合效果良好.试问该经验回归方程的拟合效果是非常好还是良好?请说明理由.
【解答】 (1) 因为=172,=62,将(172,62)代入经验回归方程得 =-1.15=-135.8.
(2) 因为R2=1-=1-≈0.87∈(0.8,0.9) ,所以该经验回归方程的拟合效果是良好.
12. 郑州东站位于河南省郑州市郑东新区,是亚洲规模最大的高铁站之一,全国唯一的“米”字型高铁枢纽,总建筑面积41.2万平方米,车站规模16台32线,自运行起客流持续保持高位运行.有调查小组统计郑州东站某处某月1日到9日的客流人数y,得到数据如下表:
时间x/日 1 2 3 4 5 6 7 8 9
人数y 80 98 129 150 203 190 258 292 310
(1) 由于统计人员的疏忽,第5日的数据统计有误,如果去掉第5日的数据,试依据剩下的数据,建立每日客流的人数y关于时间x的经验回归方程.
(2) 根据(1)中所求方程,预测第10日的客流人数.(结果保留整数)
参考数据及公式:=yi=190,(xi-)2=60,(yi- )2=55 482,(xi-)(yi-)=1 800.对于一组数据(x1,y1),(x2,y2),…,(xn,yn),其经验回归直线=x+的斜率和截距的最小二乘估计分别为==,=-.
【解答】 (1) 设原来数据的样本中心点为(,),去掉第5天的数据后样本中心点为(','),则'=×(1+2+3+4+6+7+8+9)=5,=×(1+2+3+4+5+6+7+8+9)=5,=×(80+98+129+150+203+190+258+292+310)=190,'=×(9-y5)=×(9×190-203)=,则===30,='-'=-30×5=,所以所求经验回归方程为=30x+.
(2) 当x=10时,=30×10+≈338,因此预测第10日的客流人数为338人.
13.某市春节期间7家超市的广告费支出xi(单位:万元)和销售额yi(单位:万元)数据如下表:
超市 A B C D E F G
广告费支出xi/万元 1 2 4 6 11 13 19
销售额yi/万元 19 32 40 44 52 53 54
(1) 若用线性回归模型拟合y与x的关系,求y关于x的经验回归方程;
(2) 若用对数回归模型拟合y与x的关系,可得经验回归方程:=12ln x+22,经计算得出线性回归模型和对数回归模型的R2分别约为0.75和0.97,请用R2说明选择哪个回归模型更合适,并用此模型预测A超市广告费支出为8万元时的销售额.
参考数据:=8,=42,xiyi=2 794,=708,ln 2≈0.69.
【解答】 (1) 由题意知===1.7,=-=42-1.7×8=28.4,所以y关于x的经验回归方程是=1.7x+28.4.
(2) 因为0.75<0.97,所以对数回归模型更合适.令x=8,则y=12ln 8+22≈12×3×0.69+22=46.84.所以当x=8万元时,预测A超市销售额为46.84万元.

展开更多......

收起↑

资源预览