8.2一元线性回归模型及其应用 专项练习(含解析)

资源下载
  1. 二一教育资源

8.2一元线性回归模型及其应用 专项练习(含解析)

资源简介

8.2一元线性回归模型及其应用 专项练习
一、单选题
1.已知某商场在上半年的六个月中,每个月的销售额(万元)与月份满足线性回归方程,则该商场上半年的总销售额约为( )
A.180万元 B.192万元 C.206万元 D.214万元
2.根据变量与的对应关系(如表),求得关于的线性回归方程为,则表中的值为( )
2 4 5 6 8
30 40 50 70
A.60 B.55 C.50 D.45
3.经统计,用于数学学习的时间(单位:小时)与成绩(单位:分)近似于线性相关关系.对某小组学生每周用于数学的学习时间与数学成绩进行数据收集如下:
15 16 18 19 22
102 98 115 115 120
由表中样本数据求得回归方程为,则点与直线的位置关系是( )A.点在直线左侧 B.点在直线右侧
C.点在直线上 D.无法确定
4.某研究所收集、整理数据后得到如下列表:
x 2 3 4 5 6
y 3 7 9 10 11
由两组数据可以得到线性回归方程为,则( )A.1.7 B.1.8 C.1.9 D.2.0
5.某企业推出了一款新食品,为了解每单位该食品中所含某种营养成分x(单位:克)与顾客的满意率y的关系,通过调查研究发现可选择函数模型来拟合y与x的关系,根据以下数据:
营养成分含量x/克 1 2 3 4 5
4.34 4.36 4.44 4.45 4.51
可求得y关于x的回归方程为( )A. B.
C. D.
6.下列说法中,错误的个数是( )
①将一组数据中的每个数据都加上或减去同一个常数后,平均数变,方差恒不变;
②设有一个回归方程,变量增加一个单位时,平均增加6个单位;
③线性回归直线必过;
④曲线上的点与该点的坐标之间具有相关关系.
A.1 B.2 C.3 D.4
7.下表为某外来生物物种入侵某河流生态后的前3个月繁殖数量y(单位:百只)的数据,通过相关理论进行分析,知可用回归模型y=e1+at(a∈R)对y与t的关系进行拟合,则根据该回归模型,预测从第( )个月开始该物种的繁殖数量超过5000只(参考数据:e3≈20.09,e4≈54.60)
第个月 1 2 3
繁殖数量
A.4 B.5 C.6 D.7
8.已知、的对应值如下表所示:
x
y
与具有较好的线性相关关系,可用回归直线方程近似刻画,则在的取值中任取两个数均不大于的概率为( )A. B. C. D.
二、多选题
9.2022年4月15日,因疫情原因,市物价部门对5家商场的某商品一天的线上销售量及其价格进行调查,5家商场的售价x(元)和销售量y(件)之间的一组数据如表所示:
价格x 9 9.5 10 10.5 11
销售量y 11 10 8 6 5
按公式计算,y与x的回归直线方程是:,相关系数,则下列说法正确的是( )A. B.变量x,y线性负相关且相关性较强
C.相应于点(9.5,10)的残差约为-0.4 D.当x=8时,y的估计值为14.4
10.下面命题中,正确的有( )
A.回归直线方程对应的回归直线必经过样本中心点
B.设两个变量x,y之间的线性相关系数为r,则 r越接近1,,的相关性越强
C.一列数据:7,6,5,4,3,2,这列数据的上四分位数为6
D.在残差的散点图中,残差分布的水平带状区域的宽度越窄,其模型的拟合效果越好
11.已知由样本数据组成的一个样本,得到经验回归方程为,且,去除两个样本点和后,得到新的经验回归方程为.在余下的8个样本数据和新的经验回归方程中( ).
A.相关变量x,y具有正相关关系
B.新的经验回归方程为
C.随着自变量x值增加,因变量y值增加速度变小
D.样本的残差为
12.以下说法正确的是( )
A.89,90,91,92,93,94,95,96,97的第75百分位数为95
B.具有相关关系的两个变量x,y的一组观测数据,,,,由此得到的线性回归方程为,回归直线至少经过点,,,中的一个点
C.相关系数r的绝对值越接近于1,两个随机变量的线性相关性越强
D.已知随机事件A,B满足,,且,则事件A与B不互斥
三、填空题
13.月亮公转与自转的周期大约为30天,阴历是以月相变化为依据.人们根据长时间的观测,统计了月亮出来的时间y(简称“月出时间”,单位:小时)与天数x(x为阴历日数,,且)的有关数据如表,并且根据表中数据,求得y关于x的线性回归方程为.
x 2 4 7 10 15 22
y 8.1 9.4 12 14.4 18.5 24
其中,阴历22日是分界线,从阴历22日开始月亮就要到第二天(即23日0:00)才升起.则以下结论正确的是________.
①样本点的中心为;②;③预报月出时间为16时的那天是阴历13日;④预报阴历27日的月出时间为阴历28日早上4:00.
14.蟋蟀鸣叫的频率x(次/分)与气温y()存在着较强的线性相关关系.某地观测人员根据如表所示的观测数据,建立了y关于x的线性回归方程,则当蟋蟀每分钟鸣叫56次时,该地当时的气温预报值为______.
x(次/分) 20 30 40 50 60
y() 25 27.5 29 32.5 36
15.某单位做了一项统计,了解办公楼日用电量(度)与当天平均气温之间的关系,随机统计了四个工作日用电量与当天平均气温,并制作了如下对照表:
日平均气温 18 13 10
日用电量度 24 34 38 64
由表中数据得到线性回归方程,则当日平均气温为时,预测日用电量为___________度.
16.在新冠疫情政策改变后,某社区统计了核酸检测为阳性的人数,用表示天数,表示每天核酸检测为阳性的人数,统计数据如下表所示:
1 2 3 4 5 6 7
6 11 21 34 66 101 196
根据散点图判断,核酸检测为阳性的人数关于天数的回归方程适合用来表示,则其回归方程为______.
参考数据:设,,,
参考公式:对于一组数据,,….其回归直线的斜率和截距的最小二乘估计公式分别为:,
四、解答题
17.商品流通费用率,又称为流通费用水平,是商品流通费用总额(商品在流通过程所耗费劳动与费用总和)对商品销售额的百分比.一定时期内,在实现的销售额一定的情况下,支出的费用越少,表明费用节约程度越高,体现为经济效益就越好.某企业收集了10个营业点的商品销售额x(万元)与商品流通费用率y(%)的有关数据,制作成散点图如图所示:
(1)从这10个营业点中随机抽取3个,求至少抽到一个商品流通费用率不高于6%的营业点的概率;
(2)为了研究y与x的相关关系,有四名同学通过计算得到y与x的相关系数分别为,,,,请你从中选出最有可能正确的结果,并以此求出y关于x的线性回归方程.
参考数据:,,,.
参考公式:相关系数,回归方程中斜率和截距的最小二乘估计公式分别为:,.
18.某地区区域发展指数评价指标体系基于五大发展理念构建,包括创新发展、协调发展、绿色发展、开放发展和共享发展5个一级指标.该地区区域发展指数测算方法以2015年作为基期并设指数值为100,通过时序变化,观察创新发展、协调发展、绿色发展、开放发展和共享发展5个分领域指数值的变动趋势.分别计算创新发展、协调发展、绿色发展、开放发展和共享发展5个分指数,然后合成为该地区区域发展总指数,如下图所示.
若年份x(2015年记为,2016年记为,以此类推)与发展总指数y存在线性关系.
(1)求年份x与发展总指数y的回归方程;
(2)若规定发展总指数大于115的年份为和谐发展年,和谐发展年中发展总指数低于130的视为良好,记1分,发展总指数大于130的视为优秀,记2分,从和谐发展年中任取三年,用X表示赋分之和,求X的分布列和数学期望.
参考公式:回归方程,其中,,,.
19.疫情期间,某校使用一家公司的三种软件来上网课,分别为在线课堂、视频会议、在线直播.根据效果,首选在线课堂,当在线课堂进不去时选视频会议,当在线课堂和视频会议均进不去后再选在线直播.当该校不是该软件的会员时,老师们上网课能够进入在线课堂、视频会议、在线直播的概率分别为,,;当该校充值为会员时,老师们上网课能够进入在线课堂、视频会议、在线直播的概率均为.设在线课堂、视频会议、在线直播的网课效果得分分别记为5分,3分,2分.
(1)调查知前7天能完成全部网课的班级数y如下表所示:
第t天 1 2 3 4 5 6 7
y 3 4 3 4 7 6 8
已知y与t具有线性相关关系,求y关于t的线性回归方程;(t的系数精确到0.01)
(2)请你计算后判断学校充值为会员后,网课效果得分的数学期望是否有提高.
参考公式:在线性回归方程中,,
参考数据:.
20.下图截取自2022年1月27日《西昌发布》公众号公布的自2016年至2021年西昌市地区生产总值条形统计图.将2016年视作第1年,并四舍五入保留地区生产总值整数部分得到图二所示表格.经计算可知年份x与生产总值y之间具有较好的线性相关关系.
(1)求年份x与生产总值y的线性回归方程(最终结果保留整数);
(2)由线性回归方程预测2023年西昌市地区生产总值大约是多少亿元?
年份x 1 2 3 4 5 6
生产总值y(亿元) 443 467 522 565 573 630
附:回归直线的斜率和截距的最小二乘法估计公式分别为:.参考数据:.
21.中国共产党第二十次全国代表大会上的报告中提到,新时代十年我国经济实力实现历史性跃升,国内生产总值从54万亿元增长到114万亿元,我国经济总量稳居世界第二位.建立年份编号为解释变量,地区生产总值为响应变量的一元线性回归模型,现就2012-2016某市的地区生产总值统计如下:
年份 2012 2013 2014 2015 2016
年份编号 1 2 3 4 5
地区生产总值(亿元) 2.8 3.1 3.9 4.6 5.6
(1)求出回归方程,并计算2016年地区生产总值的残差;
(2)随着我国打赢了人类历史上规模最大的脱贫攻坚战,该市2017-2022的地区生产总值持续增长,现对这11年的数据有三种经验回归模型、、,它们的分别为0.976、0.880和0.985,请根据的数值选择最好的回归模型预测一下2023年该市的地区生产总值;
(3)若2012-2022该市的人口数(单位:百万)与年份编号的回归模型为,结合(2)问中的最佳模型,预测一下在2023年以后,该市人均地区生产总值的变化趋势.
参考公式:,8.2一元线性回归模型及其应用专项练习 解析版
一、单选题
1.已知某商场在上半年的六个月中,每个月的销售额(万元)与月份满足线性回归方程,则该商场上半年的总销售额约为( )
A.180万元 B.192万元 C.206万元 D.214万元
2.根据变量与的对应关系(如表),求得关于的线性回归方程为,则表中的值为( )
2 4 5 6 8
30 40 50 70
A.60 B.55 C.50 D.45
3.经统计,用于数学学习的时间(单位:小时)与成绩(单位:分)近似于线性相关关系.对某小组学生每周用于数学的学习时间与数学成绩进行数据收集如下:
15 16 18 19 22
102 98 115 115 120
由表中样本数据求得回归方程为,则点与直线的位置关系是( )A.点在直线左侧 B.点在直线右侧
C.点在直线上 D.无法确定
4.某研究所收集、整理数据后得到如下列表:
x 2 3 4 5 6
y 3 7 9 10 11
由两组数据可以得到线性回归方程为,则( )A.1.7 B.1.8 C.1.9 D.2.0
5.某企业推出了一款新食品,为了解每单位该食品中所含某种营养成分x(单位:克)与顾客的满意率y的关系,通过调查研究发现可选择函数模型来拟合y与x的关系,根据以下数据:
营养成分含量x/克 1 2 3 4 5
4.34 4.36 4.44 4.45 4.51
可求得y关于x的回归方程为( )A. B.
C. D.
6.下列说法中,错误的个数是( )
①将一组数据中的每个数据都加上或减去同一个常数后,平均数变,方差恒不变;
②设有一个回归方程,变量增加一个单位时,平均增加6个单位;
③线性回归直线必过;
④曲线上的点与该点的坐标之间具有相关关系.
A.1 B.2 C.3 D.4
7.下表为某外来生物物种入侵某河流生态后的前3个月繁殖数量y(单位:百只)的数据,通过相关理论进行分析,知可用回归模型y=e1+at(a∈R)对y与t的关系进行拟合,则根据该回归模型,预测从第( )个月开始该物种的繁殖数量超过5000只(参考数据:e3≈20.09,e4≈54.60)
第个月 1 2 3
繁殖数量
A.4 B.5 C.6 D.7
8.已知、的对应值如下表所示:
x
y
与具有较好的线性相关关系,可用回归直线方程近似刻画,则在的取值中任取两个数均不大于的概率为( )A. B. C. D.
二、多选题
9.2022年4月15日,因疫情原因,市物价部门对5家商场的某商品一天的线上销售量及其价格进行调查,5家商场的售价x(元)和销售量y(件)之间的一组数据如表所示:
价格x 9 9.5 10 10.5 11
销售量y 11 10 8 6 5
按公式计算,y与x的回归直线方程是:,相关系数,则下列说法正确的是( )A. B.变量x,y线性负相关且相关性较强
C.相应于点(9.5,10)的残差约为-0.4 D.当x=8时,y的估计值为14.4
10.下面命题中,正确的有( )
A.回归直线方程对应的回归直线必经过样本中心点
B.设两个变量x,y之间的线性相关系数为r,则 r越接近1,,的相关性越强
C.一列数据:7,6,5,4,3,2,这列数据的上四分位数为6
D.在残差的散点图中,残差分布的水平带状区域的宽度越窄,其模型的拟合效果越好
11.已知由样本数据组成的一个样本,得到经验回归方程为,且,去除两个样本点和后,得到新的经验回归方程为.在余下的8个样本数据和新的经验回归方程中( ).
A.相关变量x,y具有正相关关系
B.新的经验回归方程为
C.随着自变量x值增加,因变量y值增加速度变小
D.样本的残差为
12.以下说法正确的是( )
A.89,90,91,92,93,94,95,96,97的第75百分位数为95
B.具有相关关系的两个变量x,y的一组观测数据,,,,由此得到的线性回归方程为,回归直线至少经过点,,,中的一个点
C.相关系数r的绝对值越接近于1,两个随机变量的线性相关性越强
D.已知随机事件A,B满足,,且,则事件A与B不互斥
三、填空题
13.月亮公转与自转的周期大约为30天,阴历是以月相变化为依据.人们根据长时间的观测,统计了月亮出来的时间y(简称“月出时间”,单位:小时)与天数x(x为阴历日数,,且)的有关数据如表,并且根据表中数据,求得y关于x的线性回归方程为.
x 2 4 7 10 15 22
y 8.1 9.4 12 14.4 18.5 24
其中,阴历22日是分界线,从阴历22日开始月亮就要到第二天(即23日0:00)才升起.则以下结论正确的是________.
①样本点的中心为;②;③预报月出时间为16时的那天是阴历13日;④预报阴历27日的月出时间为阴历28日早上4:00.
14.蟋蟀鸣叫的频率x(次/分)与气温y()存在着较强的线性相关关系.某地观测人员根据如表所示的观测数据,建立了y关于x的线性回归方程,则当蟋蟀每分钟鸣叫56次时,该地当时的气温预报值为______.
x(次/分) 20 30 40 50 60
y() 25 27.5 29 32.5 36
15.某单位做了一项统计,了解办公楼日用电量(度)与当天平均气温之间的关系,随机统计了四个工作日用电量与当天平均气温,并制作了如下对照表:
日平均气温 18 13 10
日用电量度 24 34 38 64
由表中数据得到线性回归方程,则当日平均气温为时,预测日用电量为___________度.
16.在新冠疫情政策改变后,某社区统计了核酸检测为阳性的人数,用表示天数,表示每天核酸检测为阳性的人数,统计数据如下表所示:
1 2 3 4 5 6 7
6 11 21 34 66 101 196
根据散点图判断,核酸检测为阳性的人数关于天数的回归方程适合用来表示,则其回归方程为______.
参考数据:设,,,
参考公式:对于一组数据,,….其回归直线的斜率和截距的最小二乘估计公式分别为:,
四、解答题
17.商品流通费用率,又称为流通费用水平,是商品流通费用总额(商品在流通过程所耗费劳动与费用总和)对商品销售额的百分比.一定时期内,在实现的销售额一定的情况下,支出的费用越少,表明费用节约程度越高,体现为经济效益就越好.某企业收集了10个营业点的商品销售额x(万元)与商品流通费用率y(%)的有关数据,制作成散点图如图所示:
(1)从这10个营业点中随机抽取3个,求至少抽到一个商品流通费用率不高于6%的营业点的概率;
(2)为了研究y与x的相关关系,有四名同学通过计算得到y与x的相关系数分别为,,,,请你从中选出最有可能正确的结果,并以此求出y关于x的线性回归方程.
参考数据:,,,.
参考公式:相关系数,回归方程中斜率和截距的最小二乘估计公式分别为:,.
18.某地区区域发展指数评价指标体系基于五大发展理念构建,包括创新发展、协调发展、绿色发展、开放发展和共享发展5个一级指标.该地区区域发展指数测算方法以2015年作为基期并设指数值为100,通过时序变化,观察创新发展、协调发展、绿色发展、开放发展和共享发展5个分领域指数值的变动趋势.分别计算创新发展、协调发展、绿色发展、开放发展和共享发展5个分指数,然后合成为该地区区域发展总指数,如下图所示.
若年份x(2015年记为,2016年记为,以此类推)与发展总指数y存在线性关系.
(1)求年份x与发展总指数y的回归方程;
(2)若规定发展总指数大于115的年份为和谐发展年,和谐发展年中发展总指数低于130的视为良好,记1分,发展总指数大于130的视为优秀,记2分,从和谐发展年中任取三年,用X表示赋分之和,求X的分布列和数学期望.
参考公式:回归方程,其中,,,.
19.疫情期间,某校使用一家公司的三种软件来上网课,分别为在线课堂、视频会议、在线直播.根据效果,首选在线课堂,当在线课堂进不去时选视频会议,当在线课堂和视频会议均进不去后再选在线直播.当该校不是该软件的会员时,老师们上网课能够进入在线课堂、视频会议、在线直播的概率分别为,,;当该校充值为会员时,老师们上网课能够进入在线课堂、视频会议、在线直播的概率均为.设在线课堂、视频会议、在线直播的网课效果得分分别记为5分,3分,2分.
(1)调查知前7天能完成全部网课的班级数y如下表所示:
第t天 1 2 3 4 5 6 7
y 3 4 3 4 7 6 8
已知y与t具有线性相关关系,求y关于t的线性回归方程;(t的系数精确到0.01)
(2)请你计算后判断学校充值为会员后,网课效果得分的数学期望是否有提高.
参考公式:在线性回归方程中,,
参考数据:.
20.下图截取自2022年1月27日《西昌发布》公众号公布的自2016年至2021年西昌市地区生产总值条形统计图.将2016年视作第1年,并四舍五入保留地区生产总值整数部分得到图二所示表格.经计算可知年份x与生产总值y之间具有较好的线性相关关系.
(1)求年份x与生产总值y的线性回归方程(最终结果保留整数);
(2)由线性回归方程预测2023年西昌市地区生产总值大约是多少亿元?
年份x 1 2 3 4 5 6
生产总值y(亿元) 443 467 522 565 573 630
附:回归直线的斜率和截距的最小二乘法估计公式分别为:.参考数据:.
21.中国共产党第二十次全国代表大会上的报告中提到,新时代十年我国经济实力实现历史性跃升,国内生产总值从54万亿元增长到114万亿元,我国经济总量稳居世界第二位.建立年份编号为解释变量,地区生产总值为响应变量的一元线性回归模型,现就2012-2016某市的地区生产总值统计如下:
年份 2012 2013 2014 2015 2016
年份编号 1 2 3 4 5
地区生产总值(亿元) 2.8 3.1 3.9 4.6 5.6
(1)求出回归方程,并计算2016年地区生产总值的残差;
(2)随着我国打赢了人类历史上规模最大的脱贫攻坚战,该市2017-2022的地区生产总值持续增长,现对这11年的数据有三种经验回归模型、、,它们的分别为0.976、0.880和0.985,请根据的数值选择最好的回归模型预测一下2023年该市的地区生产总值;
(3)若2012-2022该市的人口数(单位:百万)与年份编号的回归模型为,结合(2)问中的最佳模型,预测一下在2023年以后,该市人均地区生产总值的变化趋势.
参考公式:,;
参考答案:
1.B
【分析】先求,代入回归直线可得,然后可得答案.
【详解】因为,所以月平均销售额(万元),则总销售额为(万元).
故选:B.
2.A
【分析】先求得样本点中心,再根据回归直线过样本点中心即可求解.
【详解】由表中数据,计算,

因为回归直线方程过样本中心,
,解得,
故选:A
3.C
【分析】计算平均数,根据回归方程过样本中心点,然后根据直线方程即得.
【详解】由题得,,
代入回归方程得,
∴点在直线上.
故选:C
4.C
【分析】先求出样本点,代入回归方程求解.
【详解】解:根据题意,,,
由于样本中心点在回归直线上,
所以,
所以.
故选:C.
5.A
【分析】根据题意可将函数模型化简后两边同时取对数可得,从而可计算出的平均数,根据线性回归方程经过样本中心的性质进行逐项检验即可.
【详解】解析:由得,两边同时取对数,得;
由表中数据可知,的平均数=.
对于A,化简变形可得,两边同时取对数可得,将代入可得,,与题中数据吻合;故选项A正确;
对于B,化简变形可得,两边同时取对数可得,,将代入可得,所以选项B错误;
对于C,,两边同时取对数可得,而表中所给数据为的相关量,所以C错误;
对于D,,两边同时取对数可得,而表中所给数据为的相关量,所以D错误.
故选:A.
6.B
【分析】根据平均数方差变化,回归方程特点,线性回归与平均值关系,相关关系的定义即可求解.
【详解】对于①:
设这组数据为,
平均值为,

都加上或减去同一个常数后,平均数也相应加上或减去同一个常数,方差不变,
或利用公式变换后,


所以平均数变,方差恒不变;
对于②:
回归方程,变量增加一个单位时,平均减少6个单位;
故选项②错误;
对于③:
根据线性回归的样本中心点的关系知,直线一定经过,
故选项③正确;
对于④:
曲线上的点与该点的坐标之间具有一一对应关系,是一种确定关系,因而不是相关关系(不确定关系),
故选项④错误;
故选:B.
7.C
【分析】根据指数计算将回归模型两边取自然对数,并令,由此构建一个u与t的回归直线模型,根据回归直线必过,可求出a值,得到回归模型解出答案.
【详解】由题意,两边取自然对数得,令,则.
,,将数值代入回归直线,得,得,因此,则.
当时,;当时,;当时,从第6个月开始,该物种的繁殖数量超过5000只.
故选:C
8.B
【分析】求出样本中心点的坐标,将其代入回归直线方程,求出的值,可得出的所有取值,然后利用组合计数原理结合古典概型的概率公式可求得所求事件的概率.
【详解】由表格中的数据可得,

所以这组数据的样本点的中心的坐标为,
又因为点在回归直线上,所以,解得,
所以的取值分别为、、、、,
在这个数中,任取两个,取到的两个数都不大于的概率为.
故选:B.
9.ABD
【分析】对选项A由样本中心在回归方程上求参数;对选项B由相关系数的意义及回归方程的斜率符号判断;对选项C利用残差的定义求残差;对选项D将8代入回归方程求估计值.
【详解】由表格知:,
所以,可得,A正确;
由相关系数且回归方程斜率为负,则变量线性负相关且相关性较强,B正确;
由,故残差为,C错误;
由,D正确;
故选:ABD
10.ACD
【分析】回归直线必经过样本中心点,A正确;,的相关性越强,则 r越接近1或,错误;根据百分位数定义计算得到C正确;宽度越窄,拟合精度越高,D正确,得到答案.
【详解】对选项A:回归直线方程对应的回归直线必经过样本中心点,正确;
对选项B:,的相关性越强,则 r越接近1或,错误;
对选项C:7,6,5,4,3,2,,取第2个数据为,正确;
对选项D:残差分布的水平带状区域的宽度越窄,拟合精度越高,拟合效果越好,正确;
故选:ACD
11.ABD
【分析】根据线性回归方程的求法、意义可判断ABC ,再由残差的概念判断D.
【详解】,x新平均数,.
y新平均数,∴,∴.
新的线性回归方程,x,y具有正相关关系,A对.
新的线性回归方程:,B对.
由线性回归方程知,随着自变量x值增加,因变量y值增加速度恒定,C错;
,,,D对.
故选:ABD.
12.ACD
【分析】对于A选项:结合百分位数的定义即可求解;
对于B选项:结合经验回归方程的性质即可求解;
对于C选项:根据相关系数的性质即可判断;
对于D选项:根据互斥事件的定义和事件的相互独立性即可求解.
【详解】对于A选项:从小到大排列共有9个数据,则不是整数,则第75百分位数为从小到大排列的第7个数据,即第75百分位数为95,所以A选项正确;
对于B选项:线性回归方程不一定经过点,,,中的任何一个点,但一定经过样本的中心点即,所以B选项错误;
对于C选项:若两个具有线性相关关系的变量的相关性越强,则线性相关系数的绝对值越接近于,所以C选项正确;
对于D选项:因为,则,
则事件与相互独立,所以事件A与B不互斥,所以D选项正确;
故选:ACD.
13.①④
【分析】①利用平均数求解判断;②将样本点代入回归直线方程求解判断;③由求解判断;④将,代入求解判断
【详解】①,,故①正确;
②将样本平均数,代入,得,故②错误;
③,由,得,故③错误;
④将,代入,得,所以月出时间应该为28日早上4:00,故④正确.
故答案为:①④.
14.
【分析】计算,,代入回归方程得到,再代入数据计算得到答案.
【详解】,,
故,解得,故,当时,.
故答案为:
15.66
【分析】由题知,,代入回归方程得,进而得回归方程为,再求时的值即可得答案.
【详解】解:由题知,,
因为回归方程,
所以,解得,
所以回归方程为,
所以,当时,
所以,当日平均气温为时,预测日用电量为.
故答案为:
16.
【分析】由题可得,然后根据最小二乘法即得.
【详解】由,可得,
设,则,
因为,,

所以,

所以,
所以.
故答案为:.
17.(1)
(2)最有可能的结果是,
【分析】(1)由散点图数出商品流通费用率高于6%的营业点有6个,即可计算结果;
(2)由散点图可知与有较强的负相关关系,最有可能正确的结果为;由给定公式可得,代入数据计算求出,代入可求出,从而求出回归方程.
【详解】(1)解:设“至少抽到一个商品流通费用率不高于6%的营业点”为事件A,

(2)最有可能的结果是,


所以关于的线性回归方程为.
18.(1)
(2)分布列见解析,
【分析】(1)利用已知数据求,,利用公式和参考数据求,,由此可得回归方程;
(2)由条件确定随机变量的可能取值,再求取各值的概率,由此可得其分布列,再由均值公式求均值.
【详解】(1)由已知,
所以

所以,
因为,
所以,
∴.
(2)由题可知,和谐发展年有5个,其中计分为1分的年份有3个,计分为2分的年份有2个.
∴,,.
所以X的分布列为
X 3 4 5
P
数学期望为.
19.(1)
(2)网课效果得分的数学期望有了提高
【分析】(1)根据题中数据和公式求回归方程;
(2)根据题意分别求充值前、后的分布列与期望,比较大小分析理解.
【详解】(1)由题可知,,
,,
,,
所以,,
所以关于的线性回归方程为.
(2)设该校不是会员时,网课效果得分为,则的所有可能取值为5,3,2,0,
,,
,.
故的分布列
5 3 2 0
所以
设该校是会员时,网课效果得分为,则的所有可能取值为5,3,2,0,
,,,

故的分布列
5 3 2 0
所以.
因为,所以该校充值为会员后,网课效果得分的数学期望有了提高.
【点睛】本题考查线性回归及离散型随机变量的期望.
20.(1)
(2)亿元
【分析】(1)根据最小二乘法的计算公式,分别求得和,进而求得年份x与生产总值y的线性回归方程;
(2)由(1)知年份x与生产总值y的线性回归方程,令,求得亿元,即可得到答案.
【详解】(1)解:由题意,可得,,

则,又由,
所以年份x与生产总值y的线性回归方程为.
(2)解:由(1)知年份x与生产总值y的线性回归方程为,
当时,可得亿元,
即西昌市2023年地区生产总值约为亿元.
21.(1),残差为
(2)选用更好,17.773亿元
(3)逐年递增
【分析】(1)应用最小二乘法求回归直线方程即可;
(2)由相关指数的大小,结合其的实际意义确定较好模型,进而估计2023年该市的地区生产总值;
(3)由题设可得该市人均地区生产总值,利用单调性定义判断其在上的单调性即可.
【详解】(1)由数据,,,
而,,
所以,则,
综上,回归方程为,
当时,,故2016年地区生产总值残差为.
(2)根据相关指数越大拟合越好,由于,故模型较好,
因2023年对应,则亿元.
(3)由(2)及题设知:该市人均地区生产总值,
令,且,若,
所以,
而且,则,故,
所以在上递增,则在上递增,
所以该市人均地区生产总值逐年递增.

展开更多......

收起↑

资源列表