资源简介 中小学教育资源及组卷应用平台8.2 一元线性回归模型及其应用考点一 线性回归方程的样本中心【例1-1】(24-25高二上·山东日照·期末)已知之间的一组数据:1 2 3 45.5 4 3.5 3若与满足回归方程,则的值为( )A. B. C. D.【例1-2】(24-25湖南)某蔬菜种植基地最近五年的年投资成本(万元)和年利润(万元)的统计表如下:10 11 12 13 1411 12 19若关于的线性回归方程为,则的平均数 .【一隅三反】1.(2025云南)下表为2017—2023年某企业两轮电动车的年产量(单位:万辆),其中2017—2023年的年份代码分别为1—7.年份代码 1 2 3 4 5 6 7年产量万辆 31 33 38 44已知与具有线性相关关系,且满足经验回归方程,则的值为( )A.146.5 B.164.8 C.179.5 D.197.82.(24-25高二上·广西桂林·期末)某种兼职工作虽然以计件的方式计算工资,但是对于同一个人的工资与其工作时间还是存在一定的相关关系,已知小孙的工作时间(单位:小时)与工资(单位:元)之间的关系如表:工作时间 2 4 5 6 8工资 30 40 50 70若对的线性回归方程为,则的值为( )A.56.5 B.58 C.60 D.62.53.(24-25吉林)已知和之间的一组数据如右表;与线性相关,且回归方程为,为的方差的0.6倍,则当时, .0 1 2 35考点二 线性回归方程【例2】(24-25高二下·全国·单元测试)为了巩固拓展脱贫攻坚的成果,振兴乡村经济,某知名电商平台决定为脱贫乡村的特色水果开设直播带货专场.该特色水果的热卖黄金时段为7月10日至9月10日,为了解直播的效果和关注度,该电商平台统计了已直播的7月10日至7月14日时段中的相关数据,这5天中的第天到该电商平台专营店购物的人数(单位:万人)的数据如下表:日期 7月10日 7月11日 7月12日 7月13日 7月14日第天 1 2 3 4 5人数(单位:万人) 75 84 93 98 100参考数据:,,.附:相关系数,回归直线方程的斜率,截距.(1)依据表中的统计数据,请判断该电商平台直播的第天与到该电商平台专营店购物人数(单位:万人)是否具有较高的线性相关程度?(参考:若,则线性相关程度一般,若,则线性相关程度较高,计算时精确度为0.01)(2)求购物人数与直播的第天的回归直线方程;用样本估计总体,请预测从7月10日起的第38天到该专营店购物的人数(单位:万人).【一隅三反】1.(23-24高二上·江西九江·期末)2023年9月23日—10月8日,亚运会在杭州举行,“碳中和”是本届亚运会一大亮点.为了打造碳中和亚运会,杭州亚运会上线了“亚运碳中和-减污降碳协同”数字化管理平台.该平台将数字化技术运用到碳排放采集 核算 减排 注销 评价管理全流程,探索建立了一套科学完整的碳排放管理体系.值此机会,某家公司重点推出新型品牌新能源汽车,以下是其中五个月的销售单:2023月份 5 6 7 8 9月份代码 1 2 3 4 5新能源车销售(万辆) 1.6 2.1 2.7 3.7 4.6(1)根据表中数据,求出关于的线性回归方程;(2)随着亚运会的火热,新能源汽车也会一直持续下去,试估计2023年12月份该公司出售多少辆新能源汽车?参考公式:对于一组具有线性相关关系的数据,其回归直线的斜率和截距的最小二乘估计公式分别为.2.(24-25高二上·江苏常州·期末)某研究所研究耕种深度(单位:)与水稻每公顷产量(单位:)的关系,所得数据资料如下表.耕种深度 8 10 12 14 16 18每公顷产量 6 7 8 9 11 13(1)求样本相关系数(结果保留两位小数),并判断它们是否具有较强的线性相关性;(2)求经验回归方程.参考数据:;参考公式:,,.考点三 非线性回归方程【例3】(24-25高二上·四川眉山·期中)台州是全国三大电动车生产基地之一,拥有完整的产业链和突出的设计优势.某电动车公司为了抢占更多的市场份额,计划加大广告投入、该公司近5年的年广告费(单位:百万元)和年销售量(单位:百万辆)关系如图所示: 令,数据经过初步处理得:,,,,,,,现有①和②两种方案作为年销售量y关于年广告费x的回归分析模型,其中a,b,m,n均为常数.(1)请从相关系数的角度,分析哪一个模型拟合程度更好?(2)根据(1)的分析选取拟合程度更好的回归分析模型及表中数据,求出y关于x的回归方程,并预测年广告费为6(百万元)时,产品的年销售量是多少?(3)该公司生产的电动车毛利润为每辆200元(不含广告费、研发经费).该公司在加大广告投入的同时也加大研发经费的投入,年研发经费为年广告费的199倍.电动车的年净利润受年广告费和年研发经费影响外还受随机变量影响,设随机变量服从正态分布,且满足.在(2)的条件下,求该公司年净利润的最大值大于1000(百万元)的概率.(年净利润=毛利润×年销售量-年广告费-年研发经费-随机变量).附:①相关系数,回归直线中公式分别为,;②参考数据:,,,.【一隅三反】1.(24-25云南昆明·阶段练习)某乒乓球训练机构以培训青少年为主,其中有一项打定点训练,就是把乒乓球打到对方球台的指定位置(称为“准点球”),每周记录每个接受训练的学员在训练时打的所有球中“准点球”的百分比(y%),A学员已经训练了1年,下表记录了A学员最近七周“准点球”的百分比:周次(x) 1 2 3 4 5 6 7y(%) 52 52.8 53.5 54 54.5 54.9 55.3若.(1)根据上表数据,计算y与z的相关系数r,并说明y与z的线性相关性的强弱;(若,则认为y与z线性相关性很强;若,则认为y与z线性相关性一般;若,则认为y与z线性相关性较弱)(精确到0.01)(2)求y关于x的线性回归方程,并预测第9周“准点球”的百分比(精确到0.01);(3)若现在认为A学员“准点球”的百分比为55%,并以此为概率,现让A学员打3个球,以X表示“准点球”的个数,求X的数学期望.参考公式和数据:对于一组数据,,,,,,,,,.2.(24-25重庆)一年一度的“双11”促销活动落下帷幕,各大电商平台发布的数据显示,在消费品以旧换新、家电政府补贴等促消费政策和活动的带动下,消费市场潜能加速释放,带动相关商品销售保持增长. 经过调研,得到2019年到2024年“双11”活动当天某电商平台线上日销售额(单位: 百亿元)与年份(第年)的6组数据(时间变量的取值依次为),对数据进行处理,得到如下散点图(图1)及一些统计量的值. 其中.48.7 3.5 91 1204 1.1 9.4 388.1分别用两种模型:①;②进行拟合,得到相应的回归方程,并进行残差分析,得到如图所示的残差图(图2)(残差值真实值预测值).(1)根据题中信息,通过残差图比较模型①,②的拟合效果,应选择哪一个模型进行拟合?请说明理由;(2)根据(1)中所选模型,(i)求出关于的经验回归方程(系数精确到0.1);(ⅱ)若该电商平台每年活动当天线上日销售额与当日营销成本及年份存在线性关系: ,则在第几年活动当日营销成本的预测值最大 参考公式: ;参考数据:.单选题1.(2024北京)已知x,y的对应取值如下表,可得到回归直线方程为则,( )x 0 1 3 4y 2.2 4.3 4.8 6.7A.3.25 B.2.6 C.2.2 D.02.(2024江苏南通)设某中学的女生体重(单位:)与身高(单位:)具有线性相关关系,根据一组样本数据,用最小二乘法建立的经验回归方程为.若该中学女生的平均身高为,则该中学女生的平均体重的估计值是( )A. B. C. D.3.(22-23高二下·陕西商洛·阶段练习)根据如下样本数据得到的回归直线方程为,则下列结论不正确的是( )2 3 4 5 64.0 2.5 -0.5 0.5 -2A. B.C. D.预计时,4.(24-25江苏·阶段练习)已知由样本数据=1,2,3,…,8组成的一个样本,得到经验回归方程为,且,增加两个样本点和,得到新样本的经回归方程为.在新的经验回归方程下,当时,的估计值为( )A.3.25 B.3.4 C.3.7 D.3.855.(2024·全国·模拟预测)2023年第19届亚运会在杭州举行,亚运会的吉祥物琮琮、莲莲、宸宸深受大家喜爱,某商家统计了最近5个月销量,如表所示:若y与x线性相关,且线性回归方程为,则下列说法不正确的是( )时间x 1 2 3 4 5销售量y/万只 5 4.5 4 3.5 2.5A.由题中数据可知,变量y与x负相关B.当时,残差为0.2C.可以预测当时销量约为2.1万只D.线性回归方程中6.(24-25广东·开学考试)人工智能技术(简称AI技术)已成为引领世界新一轮科技革命和产业改革的战略性技术,AI技术加持的电脑(以下简称AI电脑)也在全国各地逐渐热销起来.下表为市统计的2024年10月至2025年2月这5个月该市AI电脑的月销量,其中为月份代号,(单位:万台)代表AI电脑该月销量.月份 2024年10月 2024年11月 2024年12月 2025年1月 2025年2月月份代号 1 2 3 4 5月销量万台 0.5 0.9 1 1.2 1.4经过分析,与线性相关,且其线性回归方程为,则预测2025年3月该市AI电脑的月销量约为( )A.1.63万台 B.1.57万台 C.1.61万台 D.1.72万台7.(24-25·浙江)年初,甲流在国内肆意横行,下表是某单位统计了5天内每日新增患甲流的员工人数.第x天 1 2 3 4 5新增y人 2 3 5 8 12已知现用最小二乘法算得线性回归方程是( )A. B. C. D.多选题8.(24-25高二上·陕西渭南·期末)某厂近几年陆续购买了几台A型机床,该型机床已投入生产的时间x(单位:年)与当年所需要支出的维修费用y(单位:万元)有如下统计资料:x 2 3 4 5 6y 2.2 3.8 5.5 6.5 7根据表中的数据可得到线性回归方程为,则( )A.y与x的样本相关系数B.回归直线恒过点C.D.该型机床已投入生产的时间为10年时,当年所需要支出的维修费用一定是12.38万元9.(22-23高二下·浙江宁波·期中)市物价部门对5家商场的某商品一天的线上销售量及其价格进行调查,5家商场的售价(元)和销售量(件)之间的一组数据如表所示:价格 9 9.5 10 10.5 11销售量 11 10 8 6 5按公式计算,与的回归直线方程是:,相关系数,则下列说法正确的是( )A. B.变量线性正相关C.相应于点的残差约为 D.当时,的估计值为14.410(23-24高二下·云南临沧·期末)(多选)某商家统计了最近5个月某产品的销量,如表所示:若y与x线性相关,且线性回归方程为,则( )时间x 1 2 3 4 5销售量y/万只 5 4.5 4 3.5 2.5A.由题中数据可知,变量y与x负相关B.当时,残差为0.2C.可以预测当时销量约为2.1万只D.11.(24-25山东济南)已知变量x,y的样本数据如下表,根据最小二乘法,得经验回归方程为则( )x 1 2 3 4 5y 5 9 10 11 15附:样本相关系数,经验回归方程斜率,截距A.B.当时,对应样本点的残差为C.表中y的所有样本数据的第70百分位数是11D.去掉样本点后,y与x的样本相关系数不变填空题12.(2023·四川德阳)某科学兴趣小组的同学认为生物都是由蛋白质构成的,高温可以使蛋白质变性失活,于是想初步探究某微生物的成活率与温度的关系,微生物数量(个)与温度的部分数据如下表:温度 4 8 10 18微生物数量(个) 30 22 18 14由表中数据算得回归方程为,预测当温度为时,微生物数量为 个.13.(23-24高二下·福建宁德·阶段练习)商家项目投资的利润产生是一个复杂的系统结果.它与项目落地国的商业环境,政府执政能力,法律生态等都有重大的关联.如表所示是某项目在中国和南亚某国投资额和相应利润的统计表.项目落地国 中国 南亚某国投资额x(亿元) 10 11 12 13 14 10 11 12 13 14利润y(亿元) 11 12 14 16 19 12 13 13 14 15请选择平均利润较高的落地国,用最小二乘法求出回归直线方程为 .参考数据和公式:,中国,南亚某国,,.解答题14(2024陕西)2022年11月29日23时03分.我国酒泉卫星发射中心用长征二号F遥十五运载火箭,成功将神舟十五号载人飞船送入预定轨道,顺利将费俊龙、邓清明、张陆3名航天员送入太空,发射取得圆满成功.11月30日7时33分,神舟十五号3名航天员顺利进驻中国空间站,与神舟十四号航天员乘组首次实现“太空会师”.某公司负责生产的A型材料是神舟十五号的重要零件,该材料应用前景十分广泛,该公司为了将A型材料更好地投入商用,拟对A型材料进行应用改造.根据市场调研与模拟,得到应用改造投入x(亿元)与产品的直接收益y(亿元)的数据统计如下表:序号 1 2 3 4 5 6 7x 2 3 4 6 8 10 13y 15 22 27 40 18 54 60建立了y与x的两个回归模型:模型①:,模型②:;(1)根据表格中的数据,比较模型①,②的相关指数的大小;(2)选择拟合精度更高、更可靠的模型,预测对A型材料进行应用改造的投入为17亿元时的直接收益.回归模型 模型① 模型②79.31 20.2附:刻画回归效果的相关指数,且当越大时,回归方程的拟合效果越好..15.(24-25 河南·期末)习近平总书记指出:要完整、准确、全面贯彻新发展理念,加快构建新发展格局,着力推动高质量发展.某部门在对新发展理念组织了全面学习后,对同一组的5名员工采取如下考核制度:在本季度末,由部门其他人对这5名员工进行投票,并统计5名员工本季度创造的营业收入.现将这5名员工所得票数x与本季度创造的营业收入单位:千元用数对表示:,,,,(1)求x与y的相关系数(2)若将本季度创造的营业收入最少的员工移除出组,请根据该小组剩余人员的数据求y关于x的线性回归方程.参考公式:①相关系数②在利用最小二乘法求得的线性回归方程的中,,参考数据:,,,,16.(24-25 海南省直辖县级单位·期末)某市2015~2023年全体居民人均可支配收入(单位:元)如表所示,将其绘制成散点图(如图),发现全体居民人均可支配收入与年份具有线性相关关系.年份 2015 2016 2017 2018 2019 2020 2021 2022 2023全体居民人均可支配收入(单位:元) 18352 20110 22034 24153 26386 28920 30824 33803 35666(1)设年份编号为(2015年的编号为1,2016年的编号为2,依此类推),记全体居民人均可支配收大为(单位:万元),求经验回归方程(结果精确到0.01),并根据所求回归方程,预测2025年该市全体居民人均可支配收入;(2)为进一步对居民人均可支配收入的结构进行分析,某分析员从年中任取3年的数据进行分析,将选出的居民人均可支配收入超过3万的年数记为,求随机变量的分布列与数学期望.参考数据:.参考公式:对于一组数据,其回归直线方程的斜率和截距的最小二乘估计分别为.17.(24-25河北沧州·阶段练习)近年来,共享单车行业在我国各城市迅猛发展,单车为人们的出行提供了便利,但也给城市的交通管理带来了一些困难,为掌握共享单车在省的发展情况,某调查机构从该省抽取了5个城市,并统计了共享单车的指标和指标,数据如下表所示:城市1 城市2 城市3 城市4 城市5指标 2 4 5 6 8指标 3 4 4 4 5(1)试求与间的样本相关系数,并说明与是否具有较强的线性相关关系(若0.75,则认为与具有较强的线性相关关系,否则认为没有较强的线性相关关系);(2)建立关于的经验回归方程,并预测当指标为7时,指标的估计值;(3)若某城市的共享单车的指标在区间的右侧,则认为该城市共享单车数量过多,对城市的交通管理有较大的影响,交通管理部门将进行治理,直至指标在区间内.现已知省某城市共享单车的指标为13,则该城市的交通管理部门是否需要进行治理?试说明理由.参考公式:经验回归方程中,斜率和截距的最小二乘估计分别为,相关系数.参考数据:.18.(2024河南)某市某医疗器械公司转型升级,从9月1日开始投入呼吸机生产,该公司9月1日~9月9日连续9天的呼吸机日生产量为(单位:百台,,2,,9),数据作了初步处理,得到如图所示的散点图.2.73 19 5 285 1095注:图中日期代码1~9分别对应9月1日~9月9日;表中,.(1)从9个样本点中任意选取2个,在2个样本点的生产量都不高于300台的条件下,求2个样本点都高于200台的概率;(2)由散点图分析,样本点都集中在曲线的附近,求y关于t的方程,并估计该公司从生产之日起,需要多少天呼吸机日生产量可超过500台.参考数据:.19.(24-2 5山西·期末)随着国内人均消费水平的提高,居民的运动健身意识不断增强,加之健康与解压需求的增长,使得健身器材行业发展趋势强劲,下表为年中国健身器材市场规模(单位:百亿元),其中年年对应的代码依次为.年份代码中国健身器材市场规模(1)由上表数据可知,可用指数型函数模型拟合与的关系,请建立关于的归方程(,的值精确到);(2)数据显示年购买过体育用品类的中国消费者中购买过运动防护类的占比为,用频率估计概率,现从年购买过体育用品类的中国消费者中随机抽取人,记购买过运动防护类的消费者人数为,求的分布列及数学期望.参考数据:其中,.参考公式:对于一组数据,其回归直线的斜率和截距的最小二乘估计公式分别为,.20.(2024·陕西宝鸡·模拟预测)统计显示,我国在线直播生活购物用户规模近几年保持高速增长态势,下表为年—年我国在线直播生活购物用户规模(单位:亿人),其中年—年对应的代码依次为—.年份代码市场规模,,,其中参考公式:对于一组数据、、、,其经验回归直线的斜率和截距的最小二乘估计公式分别为,.(1)由上表数据可知,若用函数模型拟合与的关系,请估计年我国在线直播生活购物用户的规模(结果精确到);(2)已知我国在线直播生活购物用户选择在品牌官方直播间购物的概率,现从我国在线直播购物用户中随机抽取人,记这人中选择在品牌官方直播间购物的人数为,若,求的数学期望和方差.21.(23-24高二下·河北石家庄·阶段练习)网络直播带货助力乡村振兴,它作为一种新颖的销售土特产的方式,受到社会各界的追捧.某直播间开展地标优品带货直播活动,其主播直播周期次数x(其中10场为一个周期)与产品销售额y(千元)的数据统计如下:直播周期数x 1 2 3 4 5产品销售额y(千元) 3 7 15 30 40根据数据特点,甲认为样本点分布在指数型曲线的周围,据此他对数据进行了一些初步处理.如下表:3.7 55 382 65 978 101其中(1)请根据表中数据,建立y关于x的回归方程;(2)乙认为样本点分布在直线的周围,并计算得回归方程为,以及该回归模型的相关指数,试比较甲、乙两人所建立的模型,谁的拟合效果更好?(精确到0.01)附:对于一组数据,其回归直线的斜率和截距的最小二乘估计分别为,相关指数:.22.(24-25高二上·辽宁·期末)经观测,长江中某鱼类的产卵数与温度有关,现将收集到的温度(单位:)和产卵数的10组观测数据作了初步处理,得到如图所示的散点图及一些统计量表.360 54.5 1360 44 3843 588 32 6430表中,,.(1)根据散点图判断,,与哪一个适宜作为与之间的回归方程模型(给出判断即可,不必说明理由),并求出关于的回归方程;(2)某兴趣小组抽取两批鱼卵,已知第一批中共有5个鱼卵,其中“死卵”有2个;第二批中共有6个鱼卵,其中“死卵”有3个.现随机挑选一批,然后从该批次中随机取出2个鱼卵,求取出“死卵”个数的分布列及数学期望.附:对于一组数据,,…,,其回归直线的斜率和截距的最小二乘估计分别为,.21世纪教育网(www.21cnjy.com)中小学教育资源及组卷应用平台8.2 一元线性回归模型及其应用考点一 线性回归方程的样本中心【例1-1】(24-25高二上·山东日照·期末)已知之间的一组数据:1 2 3 45.5 4 3.5 3若与满足回归方程,则的值为( )A. B. C. D.【答案】B【解析】由表可得,因为线性回归方程过样本中心点,则,解得.故选:B.【例1-2】(24-25湖南)某蔬菜种植基地最近五年的年投资成本(万元)和年利润(万元)的统计表如下:10 11 12 13 1411 12 19若关于的线性回归方程为,则的平均数 .【答案】/【解析】因为线性回归方程过样本中心点,将代入得故答案为:【一隅三反】1.(2025云南)下表为2017—2023年某企业两轮电动车的年产量(单位:万辆),其中2017—2023年的年份代码分别为1—7.年份代码 1 2 3 4 5 6 7年产量万辆 31 33 38 44已知与具有线性相关关系,且满足经验回归方程,则的值为( )A.146.5 B.164.8 C.179.5 D.197.8【答案】B【解析】由表中数据得,因为点在经验回归直线上,所以,所以.故选:B.2.(24-25高二上·广西桂林·期末)某种兼职工作虽然以计件的方式计算工资,但是对于同一个人的工资与其工作时间还是存在一定的相关关系,已知小孙的工作时间(单位:小时)与工资(单位:元)之间的关系如表:工作时间 2 4 5 6 8工资 30 40 50 70若对的线性回归方程为,则的值为( )A.56.5 B.58 C.60 D.62.5【答案】C【解析】由表格数据知:,,由线性回归方程为,,解得.故选:C.3.(24-25吉林)已知和之间的一组数据如右表;与线性相关,且回归方程为,为的方差的0.6倍,则当时, .0 1 2 35【答案】/【解析】由表格可得的平均值,则,由表格可得的平均值,将代入回归直线,可得,解得,则,当,则.故答案为:.考点二 线性回归方程【例2】(24-25高二下·全国·单元测试)为了巩固拓展脱贫攻坚的成果,振兴乡村经济,某知名电商平台决定为脱贫乡村的特色水果开设直播带货专场.该特色水果的热卖黄金时段为7月10日至9月10日,为了解直播的效果和关注度,该电商平台统计了已直播的7月10日至7月14日时段中的相关数据,这5天中的第天到该电商平台专营店购物的人数(单位:万人)的数据如下表:日期 7月10日 7月11日 7月12日 7月13日 7月14日第天 1 2 3 4 5人数(单位:万人) 75 84 93 98 100参考数据:,,.附:相关系数,回归直线方程的斜率,截距.(1)依据表中的统计数据,请判断该电商平台直播的第天与到该电商平台专营店购物人数(单位:万人)是否具有较高的线性相关程度?(参考:若,则线性相关程度一般,若,则线性相关程度较高,计算时精确度为0.01)(2)求购物人数与直播的第天的回归直线方程;用样本估计总体,请预测从7月10日起的第38天到该专营店购物的人数(单位:万人).【答案】(1)具有较高的线性相关程度;(2),314万人【解析】(1)由表中数据可得,,所以.又,,所以,所以该电商平台直播的天数与购物人数具有较高的线性相关程度;(2)由(1)知可用线性回归模型拟合人数与第天之间的关系,由表中数据可得,则,所以,令,可得(万人).【一隅三反】1.(23-24高二上·江西九江·期末)2023年9月23日—10月8日,亚运会在杭州举行,“碳中和”是本届亚运会一大亮点.为了打造碳中和亚运会,杭州亚运会上线了“亚运碳中和-减污降碳协同”数字化管理平台.该平台将数字化技术运用到碳排放采集 核算 减排 注销 评价管理全流程,探索建立了一套科学完整的碳排放管理体系.值此机会,某家公司重点推出新型品牌新能源汽车,以下是其中五个月的销售单:2023月份 5 6 7 8 9月份代码 1 2 3 4 5新能源车销售(万辆) 1.6 2.1 2.7 3.7 4.6(1)根据表中数据,求出关于的线性回归方程;(2)随着亚运会的火热,新能源汽车也会一直持续下去,试估计2023年12月份该公司出售多少辆新能源汽车?参考公式:对于一组具有线性相关关系的数据,其回归直线的斜率和截距的最小二乘估计公式分别为.【答案】(1)(2)6.74万辆【解析】(1),,关于的线性回归方程为.(2)根据表中数据可知,12月份月份代码为8(万辆),估计2023年12月份该公司出售6.74万辆新能源汽车.2.(24-25高二上·江苏常州·期末)某研究所研究耕种深度(单位:)与水稻每公顷产量(单位:)的关系,所得数据资料如下表.耕种深度 8 10 12 14 16 18每公顷产量 6 7 8 9 11 13(1)求样本相关系数(结果保留两位小数),并判断它们是否具有较强的线性相关性;(2)求经验回归方程.参考数据:;参考公式:,,.【答案】(1),有较强的线性相关性,(2)【解析】(1)由题意可知,,故,故有较强的线性相关性,(2),故,将代入可得,故回归直线方程为考点三 非线性回归方程【例3】(24-25高二上·四川眉山·期中)台州是全国三大电动车生产基地之一,拥有完整的产业链和突出的设计优势.某电动车公司为了抢占更多的市场份额,计划加大广告投入、该公司近5年的年广告费(单位:百万元)和年销售量(单位:百万辆)关系如图所示: 令,数据经过初步处理得:,,,,,,,现有①和②两种方案作为年销售量y关于年广告费x的回归分析模型,其中a,b,m,n均为常数.(1)请从相关系数的角度,分析哪一个模型拟合程度更好?(2)根据(1)的分析选取拟合程度更好的回归分析模型及表中数据,求出y关于x的回归方程,并预测年广告费为6(百万元)时,产品的年销售量是多少?(3)该公司生产的电动车毛利润为每辆200元(不含广告费、研发经费).该公司在加大广告投入的同时也加大研发经费的投入,年研发经费为年广告费的199倍.电动车的年净利润受年广告费和年研发经费影响外还受随机变量影响,设随机变量服从正态分布,且满足.在(2)的条件下,求该公司年净利润的最大值大于1000(百万元)的概率.(年净利润=毛利润×年销售量-年广告费-年研发经费-随机变量).附:①相关系数,回归直线中公式分别为,;②参考数据:,,,.【答案】(1)模型②的拟合程度更好(2),13(百万辆)(3)0.3【解析】(1)设模型①和②的相关系数分别为,,由题意可得:,,所以,由相关系数的相关性质可得,模型②的拟合程度更好.(2)因为,又由,,得,所以,即回归方程为,当时,,因此当年广告费为6(百万元)时,产品的销售量大概是13(百万辆).(3)净利润为,,令,所以,可得在上为增函数,在上为减函数,所以,由题意得:,即,,即该公司年净利润大于1000(百万元)的概率为0.3.【一隅三反】1.(24-25云南昆明·阶段练习)某乒乓球训练机构以培训青少年为主,其中有一项打定点训练,就是把乒乓球打到对方球台的指定位置(称为“准点球”),每周记录每个接受训练的学员在训练时打的所有球中“准点球”的百分比(y%),A学员已经训练了1年,下表记录了A学员最近七周“准点球”的百分比:周次(x) 1 2 3 4 5 6 7y(%) 52 52.8 53.5 54 54.5 54.9 55.3若.(1)根据上表数据,计算y与z的相关系数r,并说明y与z的线性相关性的强弱;(若,则认为y与z线性相关性很强;若,则认为y与z线性相关性一般;若,则认为y与z线性相关性较弱)(精确到0.01)(2)求y关于x的线性回归方程,并预测第9周“准点球”的百分比(精确到0.01);(3)若现在认为A学员“准点球”的百分比为55%,并以此为概率,现让A学员打3个球,以X表示“准点球”的个数,求X的数学期望.参考公式和数据:对于一组数据,,,,,,,,,.【答案】(1)0.94,与线性相关性很强(2),55.89%(3).【解析】(1)故与线性相关性很强.(2),,所以关于的线性回归方程为,将代入,得.当时,,故预测第9周“准点球”的百分比为55.89%.(3)现在A学员任打一球是“准点球”的概率为:,由题意,数学期望.2.(24-25重庆)一年一度的“双11”促销活动落下帷幕,各大电商平台发布的数据显示,在消费品以旧换新、家电政府补贴等促消费政策和活动的带动下,消费市场潜能加速释放,带动相关商品销售保持增长. 经过调研,得到2019年到2024年“双11”活动当天某电商平台线上日销售额(单位: 百亿元)与年份(第年)的6组数据(时间变量的取值依次为),对数据进行处理,得到如下散点图(图1)及一些统计量的值. 其中.48.7 3.5 91 1204 1.1 9.4 388.1分别用两种模型:①;②进行拟合,得到相应的回归方程,并进行残差分析,得到如图所示的残差图(图2)(残差值真实值预测值).(1)根据题中信息,通过残差图比较模型①,②的拟合效果,应选择哪一个模型进行拟合?请说明理由;(2)根据(1)中所选模型,(i)求出关于的经验回归方程(系数精确到0.1);(ⅱ)若该电商平台每年活动当天线上日销售额与当日营销成本及年份存在线性关系: ,则在第几年活动当日营销成本的预测值最大 参考公式: ;参考数据:.【答案】(1)应选择模型②,理由见详解;(2)①;②第12年活动当日营销成本的预测值最大.【解析】(1)由残差图可知模型①的残差值比较分散和远离横轴,所以模型①平方和大于模型②的残差平方和,所以应选择模型②.(2)(i)对于模型②:,令,可得,则,可得,所以关于的经验回归方程为;(ⅱ)由(i)可得:,整理可得,,则,令,解得;令,解得;可知在内单调递增,在内单调递减,所以当时,取到最大值,即取得最大值,所以第12年活动当日营销成本的预测值最大.单选题1.(2024北京)已知x,y的对应取值如下表,可得到回归直线方程为则,( )x 0 1 3 4y 2.2 4.3 4.8 6.7A.3.25 B.2.6 C.2.2 D.0【答案】B【解析】依题意,,而回归直线过点,则,所以.故选:B2.(2024江苏南通)设某中学的女生体重(单位:)与身高(单位:)具有线性相关关系,根据一组样本数据,用最小二乘法建立的经验回归方程为.若该中学女生的平均身高为,则该中学女生的平均体重的估计值是( )A. B. C. D.【答案】A【解析】将代入回归直线方程得,因此,该中学女生的平均体重的估计值是.故选:A.3.(22-23高二下·陕西商洛·阶段练习)根据如下样本数据得到的回归直线方程为,则下列结论不正确的是( )2 3 4 5 64.0 2.5 -0.5 0.5 -2A. B.C. D.预计时,【答案】D【解析】由表格中的数据,可得,,所以样本点的中心的坐标为,对于B中,由随着的增大而趋于减小,可得的斜率,所以B正确;对于A中,当时,可得,所以A正确;对于C中,将样本中心代入回归方程,可得,所以C正确;对于D中,由由随着的增大而趋于减小,预计时,,所以D错误.故选:D.4.(24-25江苏·阶段练习)已知由样本数据=1,2,3,…,8组成的一个样本,得到经验回归方程为,且,增加两个样本点和,得到新样本的经回归方程为.在新的经验回归方程下,当时,的估计值为( )A.3.25 B.3.4 C.3.7 D.3.85【答案】D【解析】,增加两个样本点后的平均数为;,,增加两个样本点后的平均数为,,解得:,新的经验回归方程为:,则当时,,故选:D.5.(2024·全国·模拟预测)2023年第19届亚运会在杭州举行,亚运会的吉祥物琮琮、莲莲、宸宸深受大家喜爱,某商家统计了最近5个月销量,如表所示:若y与x线性相关,且线性回归方程为,则下列说法不正确的是( )时间x 1 2 3 4 5销售量y/万只 5 4.5 4 3.5 2.5A.由题中数据可知,变量y与x负相关B.当时,残差为0.2C.可以预测当时销量约为2.1万只D.线性回归方程中【答案】B【解析】对于选项A,从数据看,随的增大而减小,所以变量与负相关,故A正确;对于选项B,由表中数据知,,所以样本中心点为,将样本中心点代入中得,所以线性回归方程为,所以,残差,故B错误;对于选项C,当时销量约为(万只),故C正确.对于选项D,由B选项可知,故D正确.故选:B.6.(24-25广东·开学考试)人工智能技术(简称AI技术)已成为引领世界新一轮科技革命和产业改革的战略性技术,AI技术加持的电脑(以下简称AI电脑)也在全国各地逐渐热销起来.下表为市统计的2024年10月至2025年2月这5个月该市AI电脑的月销量,其中为月份代号,(单位:万台)代表AI电脑该月销量.月份 2024年10月 2024年11月 2024年12月 2025年1月 2025年2月月份代号 1 2 3 4 5月销量万台 0.5 0.9 1 1.2 1.4经过分析,与线性相关,且其线性回归方程为,则预测2025年3月该市AI电脑的月销量约为( )A.1.63万台 B.1.57万台 C.1.61万台 D.1.72万台【答案】A【解析】因为.所以,所以关于的线性回归方程为,令,故此时万台.故选:A.7.(24-25·浙江)年初,甲流在国内肆意横行,下表是某单位统计了5天内每日新增患甲流的员工人数.第x天 1 2 3 4 5新增y人 2 3 5 8 12已知现用最小二乘法算得线性回归方程是( )A. B. C. D.【答案】D【解析】由题中的数据可知所以所以所以y关于x的线性回归方程为故选:D多选题8.(24-25高二上·陕西渭南·期末)某厂近几年陆续购买了几台A型机床,该型机床已投入生产的时间x(单位:年)与当年所需要支出的维修费用y(单位:万元)有如下统计资料:x 2 3 4 5 6y 2.2 3.8 5.5 6.5 7根据表中的数据可得到线性回归方程为,则( )A.y与x的样本相关系数B.回归直线恒过点C.D.该型机床已投入生产的时间为10年时,当年所需要支出的维修费用一定是12.38万元【答案】ABC【解析】由表中数据可得,故样本中心为,故B正确,由于线性回归方程为,斜率为正数,故相关系数,A正确,将代入可得,故C正确,当时,,故该型机床已投入生产的时间为10年时,当年所需要支出的维修费用约为12.38万元,故D错误,故选:ABC9.(22-23高二下·浙江宁波·期中)市物价部门对5家商场的某商品一天的线上销售量及其价格进行调查,5家商场的售价(元)和销售量(件)之间的一组数据如表所示:价格 9 9.5 10 10.5 11销售量 11 10 8 6 5按公式计算,与的回归直线方程是:,相关系数,则下列说法正确的是( )A. B.变量线性正相关C.相应于点的残差约为 D.当时,的估计值为14.4【答案】AD【解析】由表格知:,所以,可得,A正确;由相关系数且回归方程斜率为负,则变量线性负相关且相关性较强,B错误;由,故残差为,C错误;由,D正确;故选:AD.10(23-24高二下·云南临沧·期末)(多选)某商家统计了最近5个月某产品的销量,如表所示:若y与x线性相关,且线性回归方程为,则( )时间x 1 2 3 4 5销售量y/万只 5 4.5 4 3.5 2.5A.由题中数据可知,变量y与x负相关B.当时,残差为0.2C.可以预测当时销量约为2.1万只D.【答案】ACD【解析】对于A,由题中数据可知,随着x变大,变小,则变量y与x负相关,故A正确;对于D,由表中数据可知,,,又因为,则,解得,故D正确;对于B,当时,残差为,故B错误;对于C,当时,,故可以预测当时销量约为2.1万只,故C正确.故选:ACD.11.(24-25山东济南)已知变量x,y的样本数据如下表,根据最小二乘法,得经验回归方程为则( )x 1 2 3 4 5y 5 9 10 11 15附:样本相关系数,经验回归方程斜率,截距A.B.当时,对应样本点的残差为C.表中y的所有样本数据的第70百分位数是11D.去掉样本点后,y与x的样本相关系数不变【答案】BCD【解析】由表中数据可得因为经验回归方程为,经过点则,解得:,故错误;当时,,残差为故正确;因为,所以表中y的所有样本数据的第70百分位数是从小到大排列的第4个数,为11,故正确;因为,所以去掉样本点后,y与x的样本相关系数计算公式中的分子、分母都不发生变化不变,所以相关系数的值不变,故正确.故选:.填空题12.(2023·四川德阳)某科学兴趣小组的同学认为生物都是由蛋白质构成的,高温可以使蛋白质变性失活,于是想初步探究某微生物的成活率与温度的关系,微生物数量(个)与温度的部分数据如下表:温度 4 8 10 18微生物数量(个) 30 22 18 14由表中数据算得回归方程为,预测当温度为时,微生物数量为 个.【答案】9【解析】由表格数据可知,,,因为点在直线上,所以,即,故当时,,即预测当温度为时,微生物数量为9个.故答案为:913.(23-24高二下·福建宁德·阶段练习)商家项目投资的利润产生是一个复杂的系统结果.它与项目落地国的商业环境,政府执政能力,法律生态等都有重大的关联.如表所示是某项目在中国和南亚某国投资额和相应利润的统计表.项目落地国 中国 南亚某国投资额x(亿元) 10 11 12 13 14 10 11 12 13 14利润y(亿元) 11 12 14 16 19 12 13 13 14 15请选择平均利润较高的落地国,用最小二乘法求出回归直线方程为 .参考数据和公式:,中国,南亚某国,,.【答案】【解析】两国的平均利润分别为和,故中国的平均利润较高.根据题设数据,有,.故答案为:.解答题14(2024陕西)2022年11月29日23时03分.我国酒泉卫星发射中心用长征二号F遥十五运载火箭,成功将神舟十五号载人飞船送入预定轨道,顺利将费俊龙、邓清明、张陆3名航天员送入太空,发射取得圆满成功.11月30日7时33分,神舟十五号3名航天员顺利进驻中国空间站,与神舟十四号航天员乘组首次实现“太空会师”.某公司负责生产的A型材料是神舟十五号的重要零件,该材料应用前景十分广泛,该公司为了将A型材料更好地投入商用,拟对A型材料进行应用改造.根据市场调研与模拟,得到应用改造投入x(亿元)与产品的直接收益y(亿元)的数据统计如下表:序号 1 2 3 4 5 6 7x 2 3 4 6 8 10 13y 15 22 27 40 18 54 60建立了y与x的两个回归模型:模型①:,模型②:;(1)根据表格中的数据,比较模型①,②的相关指数的大小;(2)选择拟合精度更高、更可靠的模型,预测对A型材料进行应用改造的投入为17亿元时的直接收益.回归模型 模型① 模型②79.31 20.2附:刻画回归效果的相关指数,且当越大时,回归方程的拟合效果越好..【答案】(1)(2)模型②拟合精度更高、更可靠,72.93亿元【解析】(1)对于模型①,对应的,故对应的,故对应的相关指数,对于模型②,同理对应的相关指数,.(2)模型②拟合精度更高、更可靠.故对A型材料进行应用改造的投入为17亿元时的直接收益为(亿元).15.(24-25 河南·期末)习近平总书记指出:要完整、准确、全面贯彻新发展理念,加快构建新发展格局,着力推动高质量发展.某部门在对新发展理念组织了全面学习后,对同一组的5名员工采取如下考核制度:在本季度末,由部门其他人对这5名员工进行投票,并统计5名员工本季度创造的营业收入.现将这5名员工所得票数x与本季度创造的营业收入单位:千元用数对表示:,,,,(1)求x与y的相关系数(2)若将本季度创造的营业收入最少的员工移除出组,请根据该小组剩余人员的数据求y关于x的线性回归方程.参考公式:①相关系数②在利用最小二乘法求得的线性回归方程的中,,参考数据:,,,,【答案】(1)(2)【解析】(1)由题可知,,所以(2)由题可知,需将营业收入为60千元的员工移除出组,剔除数据后的,,,,,所以,故故y关于x的线性回归方程为16.(24-25 海南省直辖县级单位·期末)某市2015~2023年全体居民人均可支配收入(单位:元)如表所示,将其绘制成散点图(如图),发现全体居民人均可支配收入与年份具有线性相关关系.年份 2015 2016 2017 2018 2019 2020 2021 2022 2023全体居民人均可支配收入(单位:元) 18352 20110 22034 24153 26386 28920 30824 33803 35666(1)设年份编号为(2015年的编号为1,2016年的编号为2,依此类推),记全体居民人均可支配收大为(单位:万元),求经验回归方程(结果精确到0.01),并根据所求回归方程,预测2025年该市全体居民人均可支配收入;(2)为进一步对居民人均可支配收入的结构进行分析,某分析员从年中任取3年的数据进行分析,将选出的居民人均可支配收入超过3万的年数记为,求随机变量的分布列与数学期望.参考数据:.参考公式:对于一组数据,其回归直线方程的斜率和截距的最小二乘估计分别为.【答案】(1),3.99万元.(2)分布列见解析,1【解析】(1)由题意得,故,,故经验回归方程为,又2025年的年份编号为11,将,得,即预测2025年该市全体居民人均可支配收入为3.99万元.(2)由图表知,居民人均可支配收入超过3万的年份有3年,故的可能取值为,则,故随机变量的分布列为:0 1 2 3故.17.(24-25河北沧州·阶段练习)近年来,共享单车行业在我国各城市迅猛发展,单车为人们的出行提供了便利,但也给城市的交通管理带来了一些困难,为掌握共享单车在省的发展情况,某调查机构从该省抽取了5个城市,并统计了共享单车的指标和指标,数据如下表所示:城市1 城市2 城市3 城市4 城市5指标 2 4 5 6 8指标 3 4 4 4 5(1)试求与间的样本相关系数,并说明与是否具有较强的线性相关关系(若0.75,则认为与具有较强的线性相关关系,否则认为没有较强的线性相关关系);(2)建立关于的经验回归方程,并预测当指标为7时,指标的估计值;(3)若某城市的共享单车的指标在区间的右侧,则认为该城市共享单车数量过多,对城市的交通管理有较大的影响,交通管理部门将进行治理,直至指标在区间内.现已知省某城市共享单车的指标为13,则该城市的交通管理部门是否需要进行治理?试说明理由.参考公式:经验回归方程中,斜率和截距的最小二乘估计分别为,相关系数.参考数据:.【答案】(1)0.95,与具有较强的线性相关关系.(2),估计值为4.6.(3)需要进行治理,理由见解析【解析】(1)由题表得,.,所以,,,所以,因为,所以与具有较强的线性相关关系.(2)由(1)得,所以经验回归方程为.当时,,即当指标为7时,指标的估计值为4.6.(3)该城市的交通管理部门需要进行治理.理由如下:由题意得,因为,所以该城市的交通管理部门需要进行治理.18.(2024河南)某市某医疗器械公司转型升级,从9月1日开始投入呼吸机生产,该公司9月1日~9月9日连续9天的呼吸机日生产量为(单位:百台,,2,,9),数据作了初步处理,得到如图所示的散点图.2.73 19 5 285 1095注:图中日期代码1~9分别对应9月1日~9月9日;表中,.(1)从9个样本点中任意选取2个,在2个样本点的生产量都不高于300台的条件下,求2个样本点都高于200台的概率;(2)由散点图分析,样本点都集中在曲线的附近,求y关于t的方程,并估计该公司从生产之日起,需要多少天呼吸机日生产量可超过500台.参考数据:.【答案】(1)(2),38天【解析】(1)由散点图知,不高于300台的样本点有5个,其中高于200台的样本点有4个,则在2个样本点的生产量都不高于300台的条件下,2个样本点都高于200台的概率为(2)则由回归直线方程系数求解公式知,,,故.,所以需要38天呼吸机日生产量可超过500台.19.(24-2 5山西·期末)随着国内人均消费水平的提高,居民的运动健身意识不断增强,加之健康与解压需求的增长,使得健身器材行业发展趋势强劲,下表为年中国健身器材市场规模(单位:百亿元),其中年年对应的代码依次为.年份代码中国健身器材市场规模(1)由上表数据可知,可用指数型函数模型拟合与的关系,请建立关于的归方程(,的值精确到);(2)数据显示年购买过体育用品类的中国消费者中购买过运动防护类的占比为,用频率估计概率,现从年购买过体育用品类的中国消费者中随机抽取人,记购买过运动防护类的消费者人数为,求的分布列及数学期望.参考数据:其中,.参考公式:对于一组数据,其回归直线的斜率和截距的最小二乘估计公式分别为,.【答案】(1)(2)分布列见解析,【解析】(1)两边同时取自然对数得.设,所以,因为,,,所以.把代入,得,可得,.所以,即关于的回归方程为.(2)由题意,得的所有可能取值依次为,,,,,且,,,,,,所以的分布列为0 1 2 3 4.20.(2024·陕西宝鸡·模拟预测)统计显示,我国在线直播生活购物用户规模近几年保持高速增长态势,下表为年—年我国在线直播生活购物用户规模(单位:亿人),其中年—年对应的代码依次为—.年份代码市场规模,,,其中参考公式:对于一组数据、、、,其经验回归直线的斜率和截距的最小二乘估计公式分别为,.(1)由上表数据可知,若用函数模型拟合与的关系,请估计年我国在线直播生活购物用户的规模(结果精确到);(2)已知我国在线直播生活购物用户选择在品牌官方直播间购物的概率,现从我国在线直播购物用户中随机抽取人,记这人中选择在品牌官方直播间购物的人数为,若,求的数学期望和方差.【答案】(1)亿人(2),【解析】(1)设,则,因为,,,所以,,所以,与的拟合函数关系式为当时,,则估计年我国在线直播生活购物用户的规模为亿人.(2)由题意知,所以,,,由,可得,因为,解得,所以,,.21.(23-24高二下·河北石家庄·阶段练习)网络直播带货助力乡村振兴,它作为一种新颖的销售土特产的方式,受到社会各界的追捧.某直播间开展地标优品带货直播活动,其主播直播周期次数x(其中10场为一个周期)与产品销售额y(千元)的数据统计如下:直播周期数x 1 2 3 4 5产品销售额y(千元) 3 7 15 30 40根据数据特点,甲认为样本点分布在指数型曲线的周围,据此他对数据进行了一些初步处理.如下表:3.7 55 382 65 978 101其中(1)请根据表中数据,建立y关于x的回归方程;(2)乙认为样本点分布在直线的周围,并计算得回归方程为,以及该回归模型的相关指数,试比较甲、乙两人所建立的模型,谁的拟合效果更好?(精确到0.01)附:对于一组数据,其回归直线的斜率和截距的最小二乘估计分别为,相关指数:.【答案】(1);(2)乙建立的回归模型拟合效果更好.【解析】(1)将两边取对数得:,令,则,因为,所以根据最小二乘估计可知:,所以,所以回归方程为,即.(2)甲建立的回归模型的.所以乙建立的回归模型拟合效果更好.22.(24-25高二上·辽宁·期末)经观测,长江中某鱼类的产卵数与温度有关,现将收集到的温度(单位:)和产卵数的10组观测数据作了初步处理,得到如图所示的散点图及一些统计量表.360 54.5 1360 44 3843 588 32 6430表中,,.(1)根据散点图判断,,与哪一个适宜作为与之间的回归方程模型(给出判断即可,不必说明理由),并求出关于的回归方程;(2)某兴趣小组抽取两批鱼卵,已知第一批中共有5个鱼卵,其中“死卵”有2个;第二批中共有6个鱼卵,其中“死卵”有3个.现随机挑选一批,然后从该批次中随机取出2个鱼卵,求取出“死卵”个数的分布列及数学期望.附:对于一组数据,,…,,其回归直线的斜率和截距的最小二乘估计分别为,.【答案】(1)适宜作为与之间的回归方程模型,(2)答案见解析,.【解析】(1)根据散点图判断,看出样本点分布在一条指数函数的周围,所以适宜作为与之间的回归方程模型.令,则,,,所以,所以关于的回归方程为.(2)由题意设随机挑选一批,取出两个鱼卵,其中“死卵”个数为,则的可能取值为,,,设“所取两个鱼卵来自第批”,所以,设“所取两个鱼卵有个‘死卵’”,由全概率公式得,,,所以取出“死卵”个数的分布列为0 1 2所以,所以取出“死卵”个数的数学期望为.21世纪教育网(www.21cnjy.com) 展开更多...... 收起↑ 资源列表 8.2 一元线性回归模型及其应用(原卷版).docx 8.2 一元线性回归模型及其应用(解析版).docx