8.2.1 一元线性回归模型与参数的最小二乘估计(练习,含解析)高中数学人教A版(2019)选择性必修 第三册

资源下载
  1. 二一教育资源

8.2.1 一元线性回归模型与参数的最小二乘估计(练习,含解析)高中数学人教A版(2019)选择性必修 第三册

资源简介

8.2.1 一元线性回归模型与参数的最小二乘估计
1.在线性回归模型Y=bx+a+e中,下列说法正确的是(  )
A.Y=bx+a+e是一次函数
B.因变量Y是由自变量x唯一确定的
C.因变量Y除了受自变量x的影响外,可能还受到其他因素的影响,这些因素会导致随机误差e的产生
D.随机误差e是由于计算不准确造成的,可通过精确计算避免随机误差e的产生
2.如果在一次实验中,测得(x,y)的四组数值分别是(1,2.2),(2,3.3),(4,5.8),(5,6.7),则y对x的经验回归方程是(  )
A.=0.15x+4.05 B.=x+1.45
C.=1.05x+1.15 D.=1.15x+1.05
3.已知一组样本数据点(x1,y1),(x2,y2),(x3,y3),…,(x6,y6),用最小二乘法求得其经验回归方程为=-2x+4.若x1,x2,x3,…,x6的平均数为1,则y1+y2+y3+…+y6等于(  )
A.2 B.12
C.13 D.14
4. 已知由一组样本数据确定的经验回归方程为=-2x+8,且=3.发现有两对数据(1.7,1)与(4.3,3)误差较大,去掉这两对数据后重新求得经验回归方程为=-1.8x+,则等于(  )
A.2 B.1.6
C.7.4 D.0.8
5. (多选)变量x,y的部分成对观测数据如下表所示:
x 1 2 3 4 5 6 7
y 4 6 6 8 9 11 12
则下列结论中正确的有(  )
A.样本数据y的第50百分位数为7
B.=4,=8
C.x,y两组成对数据表示的向量在原点处夹角的余弦值大于0
D.若用上表数据得到y关于x的经验回归方程为=x+,则=
6.(多选)在研究某种产品的零售价x(单位:元)与销售量y(单位:万件)之间的关系时,根据所得数据得到如下表所示的对应表:
x/元 12 14 16 18 20
y/万件 17 16 14 13 11
利用最小二乘法计算数据,得到的经验回归方程为=x+26.2,则下列说法中正确的有(  )
A.>0
B.<0
C.回归直线必过点(16,14.2)
D.若该产品的零售价定为22元,则销售量一定是9.7万件
7.(多选)某公司过去五个月的广告费支出x(单位:万元)与销售额y(单位:万元)之间有下列对应数据:
x 2 4 5 6 8
y ▲ 40 60 50 70
工作人员不慎将表格中y的第一个数据丢失.已知y对x呈线性相关关系,且经验回归方程为=6.5x+17.5,则下列说法正确的有(  )
A.销售额y与广告费支出x正相关
B.丢失的数据(表中▲处)为30
C.该公司广告费支出每增加1万元,销售额一定增加6.5万元
D.若该公司下月广告费支出为8万元,则预测销售额约为69.5万元
8.已知女儿身高y(单位:cm)关于父亲身高x(单位:cm)的经验回归方程为=0.81x+25.82,当父亲身高每增加1 cm,则女儿身高平均增加____.
9.在某次试验中,实数x,y的取值如下表:
x 0 1 3 5 6
y 1.3 m 2m 5.6 7.4
若x与y之间具有较好的线性相关关系,且求得经验回归方程为=x+1,则实数m的值为____.
10. 将某保护区分为面积大小相近的多个区域,用简单随机抽样的方法抽取其中6个区域,统计这些区域内的某种水源指标xi和某植物分布的数量yi(i=1,2,…,6),得到样本(xi,yi),且其样本相关系数r=,记y关于x的经验回归方程为=+x.经计算可知:=9,=550,(yi-)2=256,则=____.
11.如图是某采矿厂的污水排放量y(单位:吨)与矿产品年产量x(单位:吨)的折线图.
(1) 依据折线图计算样本相关系数r(精确到0.01),并据此判断是否可用线性回归模型拟合y与x的关系?(若|r|>0.75,则线性相关程度很高,可用线性回归模型拟合)
(2) 若可用线性回归模型拟合y与x的关系,请建立y关于x的经验回归方程,并预测年产量为10吨时的污水排放量.
附:r=,≈0.55,≈0.95.经验回归方程=x+中,=,=-.
12. 某企业调研后,得到研发投入x(单位:万元)与产品收益y(单位:万元)的数据如下:
x 1 2 3 4 5
y 9 12 17 21 26
(1) 若y与x线性相关,请根据样本相关系数r推断它们的相关程度;(若0.3<<0.75,则相关程度一般;若≥0.75,则相关程度很强)
(2) 求出y关于x的经验回归方程=x+,并预测当研发投入6万元时的产品收益.
参考数据及公式:≈43.1;
r=,=,=-.
13. 新能源汽车发展非常迅速,某地区2017年至2024年(年份代码分别记为1,2,3,4,5,6,7,8)某品牌新能源汽车的科研经费投入和销售量统计如下表:
年份代码i 1 2 3 4 5 6 7 8
科研经费xi(单位:百亿元) 2 3 6 10 13 15 18 21
销售量yi(单位:百万辆) 1 1 2 2.5 3.5 3.5 4.5 6
  (1) 根据样本数据,计算科研经费x与销售量y之间的样本相关系数,并推断它们的线性相关程度(结果精确到0.01);
(2) 根据样本数据,求销售量y关于科研经费x的经验回归方程(,用分数表达).
参考数据及公式:xiyi=347,=1 308,=93,≈42.25.
样本相关系数r=,=,=-.
8.2.1 一元线性回归模型与参数的最小二乘估计
1.在线性回归模型Y=bx+a+e中,下列说法正确的是( C )
A.Y=bx+a+e是一次函数
B.因变量Y是由自变量x唯一确定的
C.因变量Y除了受自变量x的影响外,可能还受到其他因素的影响,这些因素会导致随机误差e的产生
D.随机误差e是由于计算不准确造成的,可通过精确计算避免随机误差e的产生
【解析】 对于A,在线性回归模型Y=bx+a+e中,方程表示的不是函数关系,因此不是一次函数,故A错误;对于B,因变量Y不是由自变量x唯一确定的,故B错误;对于D,随机误差是不能避免的,只能将误差缩小,故D错误,只有选项C正确.
2.如果在一次实验中,测得(x,y)的四组数值分别是(1,2.2),(2,3.3),(4,5.8),(5,6.7),则y对x的经验回归方程是( D )
A.=0.15x+4.05 B.=x+1.45
C.=1.05x+1.15 D.=1.15x+1.05
3.已知一组样本数据点(x1,y1),(x2,y2),(x3,y3),…,(x6,y6),用最小二乘法求得其经验回归方程为=-2x+4.若x1,x2,x3,…,x6的平均数为1,则y1+y2+y3+…+y6等于( B )
A.2 B.12
C.13 D.14
【解析】 设样本数据点(x1,y1),(x2,y2),(x3,y3),…,(x6,y6)的样本中心点为(,),则=1,代入线性回归方程=-2x+4中,得=-2×1+4=2,则y1+y2+y3+…+y6=6=12.
4. 已知由一组样本数据确定的经验回归方程为=-2x+8,且=3.发现有两对数据(1.7,1)与(4.3,3)误差较大,去掉这两对数据后重新求得经验回归方程为=-1.8x+,则等于( C )
A.2 B.1.6
C.7.4 D.0.8
【解析】 根据=3可知=-2×3+8=2,因此经验回归方程必过(3,2),易知去掉(1.7,1)与(4.3,3)两组数据的平均值为(3,2),则剩余数据均值不变,因此新求得的经验回归方程=-1.8x+也过(3,2),即可得2=-1.8×3+,解得=7.4.
5. (多选)变量x,y的部分成对观测数据如下表所示:
x 1 2 3 4 5 6 7
y 4 6 6 8 9 11 12
则下列结论中正确的有( BCD )
A.样本数据y的第50百分位数为7
B.=4,=8
C.x,y两组成对数据表示的向量在原点处夹角的余弦值大于0
D.若用上表数据得到y关于x的经验回归方程为=x+,则=
【解析】 样本数据y的第50百分位数为8,故A错误;由表中数据知==4,==8,故B正确;将样本中心点(,)代入y关于x的经验回归方程得8=×4+,则=,故D正确;x,y两组成对数据表示的向量都在第一象限,所以原点处夹角的余弦值大于0,故C正确.
6.(多选)在研究某种产品的零售价x(单位:元)与销售量y(单位:万件)之间的关系时,根据所得数据得到如下表所示的对应表:
x/元 12 14 16 18 20
y/万件 17 16 14 13 11
利用最小二乘法计算数据,得到的经验回归方程为=x+26.2,则下列说法中正确的有( BC )
A.>0
B.<0
C.回归直线必过点(16,14.2)
D.若该产品的零售价定为22元,则销售量一定是9.7万件
【解析】 =×(12+14+16+18+20)=16,=×(17+16+14+13+11)==14.2,所以样本点中心的坐标为(16,14.2),代入=x+26.2,得14.2=16+26.2,即=-0.75<0,故A错误,B正确,C正确;由于只能得到估计值,故D错误.
7.(多选)某公司过去五个月的广告费支出x(单位:万元)与销售额y(单位:万元)之间有下列对应数据:
x 2 4 5 6 8
y ▲ 40 60 50 70
工作人员不慎将表格中y的第一个数据丢失.已知y对x呈线性相关关系,且经验回归方程为=6.5x+17.5,则下列说法正确的有( ABD )
A.销售额y与广告费支出x正相关
B.丢失的数据(表中▲处)为30
C.该公司广告费支出每增加1万元,销售额一定增加6.5万元
D.若该公司下月广告费支出为8万元,则预测销售额约为69.5万元
【解析】 由经验回归方程=6.5x+17.5,可知=6.5>0,所以销售额y与支出的广告费x呈正相关,所以A正确;设丢失的数据为m,由表中的数据可得=5,=,把代入经验回归方程,可得=6.5×5+17.5,解得m=30,所以B正确;该公司支出的广告费每增加1万元,销售额不一定增加6.5万元,所以C不正确;当x=8时,=6.5×8+17.5=69.5(万元),所以D正确.
8.已知女儿身高y(单位:cm)关于父亲身高x(单位:cm)的经验回归方程为=0.81x+25.82,当父亲身高每增加1 cm,则女儿身高平均增加__0.81 cm__.
【解析】 由回归方程知,当父亲身高每增加 1 cm,则女儿身高平均增加0.81 cm.
9.在某次试验中,实数x,y的取值如下表:
x 0 1 3 5 6
y 1.3 m 2m 5.6 7.4
若x与y之间具有较好的线性相关关系,且求得经验回归方程为=x+1,则实数m的值为__1.9__.
【解析】 因为=3,=,则=3+1=4,解得m=1.9.
10. 将某保护区分为面积大小相近的多个区域,用简单随机抽样的方法抽取其中6个区域,统计这些区域内的某种水源指标xi和某植物分布的数量yi(i=1,2,…,6),得到样本(xi,yi),且其样本相关系数r=,记y关于x的经验回归方程为=+x.经计算可知:=9,=550,(yi-)2=256,则=____.
【解析】 因为=9,=550,所以(xi-)2=-6=550-6×92=64,由r===,解得(xi-)(yi-)=120,所以===.
11.如图是某采矿厂的污水排放量y(单位:吨)与矿产品年产量x(单位:吨)的折线图.
(1) 依据折线图计算样本相关系数r(精确到0.01),并据此判断是否可用线性回归模型拟合y与x的关系?(若|r|>0.75,则线性相关程度很高,可用线性回归模型拟合)
(2) 若可用线性回归模型拟合y与x的关系,请建立y关于x的经验回归方程,并预测年产量为10吨时的污水排放量.
附:r=,≈0.55,≈0.95.经验回归方程=x+中,=,=-.
【解答】 (1) 由折线图可得==5,==4,(xi-)(yi-)=3+0+0+0+3=6,(xi-)2=9+1+0+1+9=20,(yi-)2=1+0+0+0+1=2,样本相关系数r==≈0.95.因为|r|>0.75,所以可用线性回归模型拟合y与x的关系.
(2) ===0.3,=-=4-0.3×5=2.5,所以经验回归方程为=0.3x+2.5.当x=10时,=5.5,所以预测年产量为10吨时的污水排放量为5.5吨.
12. 某企业调研后,得到研发投入x(单位:万元)与产品收益y(单位:万元)的数据如下:
x 1 2 3 4 5
y 9 12 17 21 26
(1) 若y与x线性相关,请根据样本相关系数r推断它们的相关程度;(若0.3<<0.75,则相关程度一般;若≥0.75,则相关程度很强)
(2) 求出y关于x的经验回归方程=x+,并预测当研发投入6万元时的产品收益.
参考数据及公式:≈43.1;
r=,=,=-.
【解答】 (1) 由题中表格数据可得=×(1+2+3+4+5)=3,=×(9+12+17+21+26)=17,所以(xi-)(yi-)=(1-3)×(9-17)+…+(5-3)×(26-17)=43,==≈43.1,所以r=≈≈0.998>0.75,则可知变量y与x的相关程度很强.
(2) 由(1)可知,=3,=17, (xi-)(yi-)=43,(xi-)2=(1-3)2+(2-3)2+(3-3)2+(4-3)2+(5-3)2=10,所以===4.3,则=-=17-4.3×3=4.1,可得y关于x的经验回归方程为=4.3x+4.1.令x=6,可得=4.3×6+4.1=29.9,即预测研发投入6万元时,产品收益约为29.9万元.
13. 新能源汽车发展非常迅速,某地区2017年至2024年(年份代码分别记为1,2,3,4,5,6,7,8)某品牌新能源汽车的科研经费投入和销售量统计如下表:
年份代码i 1 2 3 4 5 6 7 8
科研经费xi(单位:百亿元) 2 3 6 10 13 15 18 21
销售量yi(单位:百万辆) 1 1 2 2.5 3.5 3.5 4.5 6
  (1) 根据样本数据,计算科研经费x与销售量y之间的样本相关系数,并推断它们的线性相关程度(结果精确到0.01);
(2) 根据样本数据,求销售量y关于科研经费x的经验回归方程(,用分数表达).
参考数据及公式:xiyi=347,=1 308,=93,≈42.25.
样本相关系数r=,=,=-.
【解答】 (1) =xi===11,=yi===3,其中(xi-)(yi-)=xiyi-8,将xiyi=347,=11,=3代入可得(xi-)(yi-)=347-8×11×3=347-264=83,(xi-)2=-8,将=1 308,=11代入可得(xi-)2=1 308-8×112=1 308-968=340,(yi-)2=-8,将=93,=3代入可得(yi-)2=93-8×32=93-72=21,故r===≈0.98,由于0.98接近1,所以两个变量线性相关且线性相关程度很强.
(2) ==,由=-,可得=3-×11=,所以y关于x的经验回归方程为=x+.

展开更多......

收起↑

资源预览