第九章第04讲 拓展一:非线性经验回归方程 (精讲)(含解析)

资源下载
  1. 二一教育资源

第九章第04讲 拓展一:非线性经验回归方程 (精讲)(含解析)

资源简介

第04讲 拓展一:非线性经验回归方程 (精讲)
目录
第一部分:知识点精准记忆
第二部分:典型例题剖析
题型一:指数型
题型二:对数型
题型三:幂函数型
知识点一:非线性经验回归
当经验回归方程并非形如()时,称之为非线性经验回归方程,当两个变量不呈线性相关关系时,依据样本点的分布选择合适的曲线方程来模拟,常见的非线性经验回归方程的转换方式总结如下:
曲线方程 变换公式 变换后的线性关系式
建立非线性经验回归模型的基本步骤
1.确定研究对象,明确哪个是解释变量,哪个是响应变量;
2.由经验确定非线性经验回归方程的模型;
3.通过变换(一般题目都有明显的暗示如何换元,换元成什么变量),将非线性经验回归模型转化为线性经验回归模型(特别注意:使用线性回归方程的公式,注意代入变换后的变量);
4.按照公式计算经验回归方程中的参数,得到经验回归方程;
5.消去新元,得到非线性经验回归方程;
6.得出结果后分析残差图是否有异常 .
知识点二:非线性经验回归类型
非线性回归方程主要分为三大类,指数型,对数型,幂函数型,做题关键在于变量之间的转换
1、指数型:
①类型一,,处理方式是对方程两边取对数(具体取什么对数观察参考数据,自然对数和常用对数用的较多),比如e为底数,取ln,则现在方程变为,,将进行换元,,则非线性回归方程变成线性回归直线方程;
②类型二,,此为类型一的变式,多了常数项部分,常见的变化形式为(具体取什么对数观察参考数据,自然对数和常用对数用的较多),令,则非线性回归方程变成线性回归直线方程
2、对数型:
①类型一,形如,则令,则非线性回归方程变成线性回归直线方程
②类型二,,两边同时消掉对数,(取什么底数判断方法同上)取,令,则非线性回归方程变成线性回归直线方程
3、幂函数型:
①类型一,,,等等,处理方式是将方程中幂函数部分换成一个新变量,比如,,,然后将非线性回归方程变成线性回归直线方程
②类型二,,做法同指数型,变化方式为两边取对数(底数判断方式同上),令,则非线性回归方程变成线性回归直线方程
题型一:指数型
典型例题
例题1.(2022·辽宁·鞍山一中模拟预测)用模型拟合一组数,若,,设,得变换后的线性回归方程为,则( )
A.12 B. C. D.7
【答案】B
【详解】由已知,,所以,
,,所以

由题意,满足线性回归方程为,所以,所以,
此时线性回归方程为,即,
可将此式子化为指数形式,即为,
因为模型为模型,所以,,
所以.
故选:B.
例题2.(2022·广西桂林·模拟预测(文))一只红铃虫产卵数和温度有关,现测得一组数据,可用模型拟合,设,其变换后的线性回归方程为,若,,为自然常数,则________.
【答案】
【详解】经过变换后,得到,根据题意,故,又,故,,故,于是回归方程为一定经过,故,解得,即,于是.
故答案为:.
例题3.(2022·河南商丘·高二期末(文))网络是指第五代移动网络通讯技术,它的主要特点是传输速度快,峰值传输速度可达每秒钟数十.作为新一代移动通讯技术,它将要支持的设备远不止智能手机,而是会扩展到未来的智能家居,智能穿戴等设备.某科技创新公司基于领先技术的支持,经济收入在短期内逐月攀升,该公司1月份至6月份的经济收入(单位:万元)关于月份的数据如下表所示,并根据数据绘制了如图所示的散点图.
月份 1 2 3 4 5 6
收入 6 11 23 37 72 124
(1)根据散点图判断,与(均为常数)哪一个更适合作为经济收入关于月份的回归方程类型(给出判断即可,不必说明理由)?
(2)根据(1)的结果及表中数据,求出关于的回归方程(结果保留两位小数);
(3)根据(2)所求得的回归方程,预测该公司7月份的经济收入(结果保留两位小数).
参考公式及参考数据:回归方程中斜率和截距的最小二乘估计公式为:,;
3.5 45.5 3.34 17.5 393.5 10.63 239.85
其中,().
【答案】(1)更适合
(2)
(3)239.85万元
(1)由散点图可知,更适合作为经济收入y关于月份x的回归方程类型.
(2)的两边取自然对数,得.因为,,,,所以,,所以,所以经济收入y关于月份x的回归方程为.
(3)当时,.预测该公司7月份的经济收入约为239.85万元.
例题4.(2022·福建三明·高二期末)在国家大力发展新能源汽车产业的政策下,我国新能源汽车的产销量高速增长.已知某地区2014年底到2021年底新能源汽车保有量的数据统计表如下:
年份(年) 2014 2015 2016 2017 2018 2019 2020 2021
年份代码 1 2 3 4 5 6 7 8
保有量/千辆 1.95 2.92 4.38 6.58 9.87 15.00 22.50 33.70
(1)根据统计表中的数据判断,与哪一个更适合作为关于的经验回归方程(给出判断即可,不必说明理由),并根据你的判断结果建立关于的经验回归方程;
(2)假设每年新能源汽车保有量按(1)中求得的函数模型增长,且传统能源汽车保有量每年下降的百分比相同.若2021年底该地区传统能源汽车保有量为500千辆,预计到2026年底传统能源汽车保有量将下降10%.试估计到哪一年底新能源汽车保有量将超过传统能源汽车保有量.
参考数据:
,,,其中,,,.
参考公式:
对于一组数据(,),(,),…,(,),其经验回归直线的斜率和截距的
最小二乘估计公式分别为;
【答案】(1),
(2)2028年底新能源汽车的数量将超过传统能源汽车
(1)根据该地区新能源汽车保有量的增长趋势知,应选择的函数模型是
令,则,
因为,,
所以,

所以.
(2)设传统能源汽车保有量每年下降的百分比为r,
依题意得,,解得,
设从2021年底起经过x年后的传统能源汽车保有量为y千辆,
则有,
设从2021年底起经过x年后新能源汽车的数量将超过传统能源汽车,则有

所以,
解得
故从2021年底起经过7年后,即2028年底新能源汽车的数量将超过传统能源汽车.
同类题型归类练
1.(2022·全国·高二期末)某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x(单位:千元)对年销售量y(单位:t)的影响,对近8年的年宣传费xi和年销售量 数据作了初步处理,得到下面的散点图:
由此散点图可得,下面四个回归方程类型中最适宜作为年销售量y与年宣传费x的回归方程类型是( )
A. B. C. D.
【答案】C
【详解】从散点图看出,样本点分布在开口向右的抛物线(上支)附近,上升的趋势比较平缓,
因此对于A,图象是直线,不适合;
对于B,时对应曲线是开口向上的抛物线,右侧部分上升趋势较快,不适合;
对于C,时对应曲线是开口向右的抛物线,上支部分上升趋势较平缓,适合题意;
对于D,对应曲线是指数型曲线,时上升趋势是越来越快,不适合,
故选:C.
2.(2022·全国·高二课时练习)一组数据如下表所示:
1 2 3 4
已知变量关于的回归方程为,若,则预测的值可能为
A. B. C. D.
【答案】C
【详解】将式子两边取对数,得到,令,得到,
根据已知表格数据,得到的取值对照表如下:
由上述表格可知:
,,
利用回归直线过样本中心点,即可得,
求得,则,
进而得到,将代入,
解得.
故选:C.
3.(2022·黑龙江·尚志市尚志中学高二阶段练习)近期,某公交公司分别推出支付宝和微信扫码支付乘车活动,活动设置了一段时间的推广期,由于推广期优惠力度较大,吸引越来越多的人开始使用扫码支付.某线路公交车队统计了活动刚推出一周内每一天使用扫码支付的人次,用表示活动推出的天数,表示每天使用扫码支付的人次(单位:十人次),统计数据如表1所示:
表1:
1 2 3 4 5 6 7
6 11 21 34 66 101 196
根据以上数据,绘制了如图1所示的散点图.
参考数据:
62.14 1.54 2535 50.12 3.47
其中
参考公式:
对于一组数据,其回归直线的斜率和截距的最小二乘估计分别为.
(1)根据散点图判断,在推广期内,与 (均为大于零的常数)哪一个适宜作为扫码支付的人次关于活动推出天数的回归方程类型?(给出判断即可,不必说明理由)
(2)根据(1)的判断结果及表1中的数据,求关于的回归方程,并预测活动推出第8天使用扫码支付的人次;
【答案】(1)适宜
(2),3470
(3)1.66元
(1)根据散点图判断,适宜作为扫码支付的人数关于活动推出天数的回归方程类型;
(2)∵,两边同时取常用对数得: ;



把样本中心点代入,得:,

关于的回归方程式:;
把代入上式:;
活动推出第8天使用扫码支付的人次为;
4.(2022·江西·南城县第二中学高二阶段练习(理))为了研究某种细菌随时间x变化,繁殖的个数,收集数据如下:
天数x/天 1 2 3 4 5 6
繁殖个数y/个 6 12 25 49 95 190
(1)用天数作解释变量,繁殖个数作预报变量,与y=哪一个作为繁殖的个数y关于时间x变化的回归方程类型为最佳?(给出判断即可,不必说明理由)
3.5 62.83 3.53 17.5 596.505 12.04
其中;
(2)根据(1)的判断最佳结果及表中的数据,建立y关于x 的回归方程.
参考公式:,
【答案】(1)选y=
(2)
(1)
由散点图看出样本点分布在曲线周围,不是直线周围,于是选择y=
(2)由(1)可知y=
令,则

,则
则有
题型二:对数型
典型例题
例题1.(2022·河南郑州·高二期末(文))目前,新冠病毒引起的疫情仍在全球肆虐,在党中央的正确领导下,全国人民团结一心,使我国疫情得到了有效的控制.为了应对最新型的奥密克戎病毒,各大药物企业积极投身到新疫苗的研发中.某药企为评估一款新药的药效和安全性,组织一批志愿者进行临床用药实验,结果显示临床疗效评价指标的数量与连续用药天数具有相关关系.刚开始用药时,指标的数量变化明显,随着天数增加,的变化趋缓.根据志愿者的临床试验情况,得到了一组数据,,表示连续用药天,表示相应的临床疗效评价指标的数值.该药企为了进一步研究药物的临床效果,建立了关于的两个回归模型:
模型①:由最小二乘公式可求得与的线性回归方程:;
模型②:由样本点的分布,可以认为样本点集中在曲线:的附近,令,则有,,,.
(1)根据所给的统计量,求模型②中关于的回归方程;
(2)根据下列表格中的数据,说明哪个模型的预测值精度更高、更可靠;
(3)根据(2)中精确度更高的模型,预测用药一个月后,临床疗效评价指标相对于用药半个月的变化情况(一个月以30天计,结果保留两位小数).
回归模型 模型① 模型②
残差平方和 102.28 36.19
参考数据:.
【答案】(1)
(2)答案见解析
(3)用药一个月后,疗效评价指标相对于用药半个月提高17.33
(1)解:由题意,知,,
所以,,
又由,

则,
所以,模型②中y关于x的回归方程;
(2)由表格中的数据,可得,
即,
所以模型①的小于模型②,说明回归模型②刻画的拟合效果更好;
(3)根据模型②,当连续用药30天后,,
连续用药15天后,,
∵,
∴用药一个月后,疗效评价指标相对于用药半个月提高17.33.
例题2.(2022·内蒙古·赤峰二中模拟预测(理))受北京冬奥会的影响,更多人开始关注滑雪运动,但由于室外滑雪场需要特殊的气候环境,为了满足日益增长的消费需求,国内出现了越来越多的室内滑雪场.某投资商抓住商机,在某大学城附近开了一家室内滑雪场.经过6个季度的经营,统计该室内滑雪场的季利润数据如下:
第个季度 1 2 3 4 5 6
季利润(万元) 2.2 3.6 4.3 4.9 5.3 5.5
根据上面的数据得到的一些统计量如下:
4.3 0.5 101.4 14.1 1.8
表中,.
(1)若用方程拟合该室内滑雪场的季利润与季度的关系,试根据所给数据求出该方程;
(2)利用(1)中得到的方程预测该室内滑雪场从第几个季度开始季利润超过6.5万元;
附:线性回归方程中,,.参考数据:
【答案】(1);
(2)第12个;
(3)分布列见解析,期望为2.
(1)由,先求y关于u的线性回归方程.由已知数据得,故,所以y关于u的回归方程为,故y关于x的回归方程为;
(2)令,得,所以,故预测从第12个季度开始季利润超过6.5万元;
同类题型归类练
1.(2022·福建省尤溪第一中学高二期末)目前,新冠病毒引起的疫情仍在全球肆虐,在党中央的正确领导下,全国人民团结一心,使我国疫情得到了有效的控制.其中,各大药物企业积极投身到新药的研发中.汕头某药企为评估一款新药的药效和安全性,组织一批志愿者进行临床用药实验,结果显示临床疗效评价指标A的数量y与连续用药天数x具有相关关系.刚开始用药时,指标A的数量y变化明显,随着天数增加,y的变化趋缓.根据志愿者的临床试验情况,得到了一组数据,,2,3,4,5,…,10,表示连续用药i天,表示相应的临床疗效评价指标A的数值.该药企为了进一步研究药物的临床效果,建立了y关于x的两个回归模型:
模型①:由最小二乘公式可求得y与x的线性回归方程:;
模型②:由图中样本点的分布,可以认为样本点集中在曲线:的附近,令,则有,,,.
(1)根据所给的统计量,求模型②中y关于x的回归方程;
(2)根据下列表格中的数据,说明哪个模型的预测值精度更高、更可靠.
(3)根据(2)中精确度更高的模型,预测用药一个月后,疗效评价指标相对于用药半个月的变化情况(一个月以30天计,结果保留两位小数).
回归模型 模型① 模型②
残差平方和 102.28 36.19
附:样本(,2,…,n)的最小二乘估计公式为,;相关指数,参考数据:.
【答案】(1)
(2)回归模型②刻画的拟合效果更好
(3)17.33
(1)由题意,知,,可得,,又由,则,所以,模型②中y关于x的回归方程;
(2)由表格中的数据,可得,即,所以模型①的小于模型②,说明回归模型②刻画的拟合效果更好;
(3)根据模型②,当连续用药30天后,,连续用药15天后,,∵,
∴用药一个月后,疗效评价指标相对于用药半个月提高17.33.
2.(2022·全国·高二课时练习)发展扶贫产业,找准路子是关键,重庆市石柱土家族自治县中益乡华溪村不仅找准了路,还将当地打造成了种植中药材黄精的产业示范基地.通过种植黄精,华溪村村民的收入逐年递增.以下是2014年至2020年华溪村村民每户平均可支配收入的统计数据:
年份 2014 2015 2016 2017 2018 2019 2020
年份代码 1 2 3 4 5 6 7
每户平均可支配收入(千元) 4 15 22 26 29 31 32
根据以上数据,绘制如图所示的散点图:
(1)根据散点图判断,与哪一个更适宜作为每户平均可支配收入(千元)关于年份代码的回归方程模型(给出判断即可,不必说明理由),并建立关于的回归方程(结果保留1位小数);
(2)根据(1)建立的回归方程,试预测要到哪一年华溪村的每户平均可支配收入才能超过35(千元);
参考数据:
22.7 1.2 759 235.1 13.2 8.2
其中,.
参考公式:线性回归方程中,,.
【答案】(1)更适宜作为每户平均可支配收入(千元)关于年份代码的回归方程模型,;
(2)到2022年每户平均可支配收入才能超过35(千元);
(3).
(1)解:根据题中散点图,得更适宜作为每户平均可支配收入(千元)关于年份代码的回归方程模型.
由已知数据,得,
故,故关于的回归方程为
(2)
解:由题知,令,整理,得,即.
故当时,即到2022年每户平均可支配收入才能超过35(千元).
题型三:幂函数型
典型例题
例题1.(2022·全国·高二期末)某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费(单位:千元)对年销售量(单位:t)的影响,对近8年的年宣传费和年销售量 数据作了初步处理,得到下面的散点图:
由此散点图可得,下面四个回归方程类型中最适宜作为年销售量与年宣传费的回归方程类型是( )
A. B. C. D.
【答案】C
【详解】从散点图看出,样本点分布在开口向右的抛物线(上支)附近,上升的趋势比较平缓,
因此对于A,图象是直线,不适合;
对于B,时对应曲线是开口向上的抛物线,右侧部分上升趋势较快,不适合;
对于C,时对应曲线是开口向右的抛物线,上支部分上升趋势较平缓,适合题意;
对于D,对应曲线是指数型曲线,时上升趋势是越来越快,不适合,
故选:C.
例题2.(2022·河南信阳·高二期末(文))设关于某产品的明星代言费(百万元)和其销售额(千万元),有如下表的统计表格:
1 2 3 4 5 合计
(百万元) 1.26 1.44 1.59 1.71 1.82 7.82
(百万元) 2.00 2.99 4.02 5.00 6.03 20.04
(百万元) 3.20 4.80 6.50 7.50 8.00 30.00
,,,,,,
表中.
(1)在坐标系中,作出销售额y关于广告费x的回归方程的散点图;
(2)根据散点图指出:,哪一个适合作销售额关于明星代言费的回归方程(不需要说明理由),并求出此回归方程.
附:对于一组数据,,……,,其回归线的斜率和截距的最小二乘估计分别为:,.
【答案】(1)答案见解析
(2)适合,
(1)解:散点图如下:
(2)根据散点图可知,适合作销售额y关于明星代言费x的回归类方程;令,则是y关于w的线性回归方程,由已知条件得,,,所以,故回归方程为:
例题3.(2022·四川雅安·高二期末(理))某城市选用某种植物进行绿化,设其中一株幼苗从观察之日起,第x天的高度为y cm,测得一些数据如下表所示:
第x天 1 4 9 16 25 36 49
高度y/cm 0 4 7 9 11 12 13
作出这组数的散点图如下
(1)请根据散点图判断,与中哪一个更适宜作为幼苗高度y关于时间x的回归方程类型?(给出判断即可,不必说明理由)
(2)根据(1)的判断结果及表中数据,建立y关于x的回归方程,并预测第196天这株幼苗的高度(结果保留整数).
附:, 参考数据:
140 28 56 283
【答案】(1)更适宜
(2);预测第196天幼苗的高度大约为29cm
(1)根据散点图,更适宜作为幼苗高度y关于时间x的回归方程类型;
(2)令,则构造新的成对数据,如下表所示:
x 1 4 9 16 25 36 49
1 2 3 4 5 6 7
y 0 4 7 9 11 12 13
容易计算,,.通过上表计算可得:
因此
∵回归直线过点,∴,
故y关于的回归直线方程为
从而可得:y关于x的回归方程为
令,则,所以预测第196天幼苗的高度大约为29cm.
例题4.(2022·辽宁·高二阶段练习)某企业积极响应“碳达峰”号召,研发出一款性能优越的新能源汽车,备受消费者青睐.该企业为了研究新能源汽车在某地区每月销售量(单位:千辆)与月份的关系,统计了今年前5个月该地区的销售量,得到下面的散点图及一些统计量的值.
表中.
(1)根据散点图判断两变量的关系用与哪一个比较合适?(给出判断即可,不必说明理由)
(2)根据(1)的判断结果及表中数据,建立关于的回归方程(的值精确到),并预测从今年几月份起该地区的月销售量不低于万辆?
附:对于一组数据,其回归直线方程的斜率和截距的最小二乘法估计分别为.
【答案】(1)见解析
(2)见解析
(1)比较合适(散点图中点的分布不是一条直线,相邻两点的纵坐标的差值是增大趋势,所以比较合适)
(2)设,则,
先建立y关于t的回归方程

所以y关于t的回归方程为,
因此y关于x的回归方程为
令,解得或(舍去),
故估计从今年8月份起该地区的月销售量不低于万辆.
同类题型归类练
1.(2022·山东聊城·高二期末)网民的智慧与活力催生新业态,网络购物,直播带货,APP买菜等进入我们的生活,改变了我们的生活方式,随之电信网络诈骗犯罪形势也非常严峻.自“国家反诈中心APP”推出后,某地区采取多措并举的推广方式,努力为人民群众构筑一道防诈反诈的“防火墙”.经统计,该地区网络诈骗月报案数与推广时间有关,并记录了经推广x个月后月报案件数y的数据.
x(个) 1 2 3 4 5 6 7
y(件) 891 888 351 220 200 138 112
(1)根据以上数据,判断与哪一个适宜作为回归方程模型?根据判断结果,求出y关于x的回归方程;
(2)分析该地区一直推广下去,两年后能否将网络诈骗月报案数降至75件以下.
参考数据(其中,,,,.
参考公式:对于一组数据,其回归直线的斜率和截距的最小二乘估计公式分别为:,.
【答案】(1)
(2)两年后网络诈骗月报案数能降至75件以下
(1)由表中数据可得更适宜.

令,设y关于t的线性回归方程为,

则,
故y关于x的回归方程为
(2)由回归方程可知,随x的增大,y逐渐减少,
当时,,
故两年后网络诈骗月报案数能降至75件以下.
2.(2022·湖北·高二期末)快递业的迅速发展导致行业内竞争日趋激烈.某快递网点需了解一天中收发一件快递的平均成本(单位:元)与当天揽收的快递件数即揽件量(单位:千件)之间的关系,对该网点近天的每日揽件量(单位:千件)与当日收发一件快递的平均成本(单位:元)()的数据进行了初步处理,得到散点图及一些统计量的值.
表中,.
(1)根据散点图判断与哪一个更适宜作为关于的经验回归方程类型?并根据判断结果及表中数据求出关于的经验回归方程;
(2)已知该网点每天的揽件量(单位:千件)与单件快递的平均价格(单位:元)之间的关系是,收发一件快递的利润等于单件的平均价格减去平均成本,根据(1)中建立的经验回归方程解决以下问题:
①预测该网点某天揽件量为千件时可获得的总利润;
②单件快递的平均价格为何值时,该网点一天内收发快递所获利润的预报值最大?
附:对于一组具有线性相关关系的数据,其经验回归直线的斜率和截距的最小二乘估计分别为,.
【答案】(1)更适宜作为关于的经验回归方程类型,
(2)①元;②单件快递的平均价格元时,该网点一天内收发快递所获利润的预报值最大.
(1)由散点图可知:更适宜作为关于的经验回归方程类型;
令,则,,
关于的经验回归方程为:.
(2)设收发千件快递获利千元,则;
①当时,,即该网点某天揽收件快递可获得的总利润约为元.
②,令,解得:,
当时,;当时,;
在上单调递增,在上单调递减,
当时,,此时;
单件快递的平均价格元时,该网点一天内收发快递所获利润的预报值最大.
3.(2022·河北承德·高二阶段练习)某制造企业从生产的产品中随机抽查了1000件,经检验,其中一等品有800件,二等品有150件,次品有50件.若销售1件该产品,一等品的利润为200元,二等品的利润为100元,次品直接销毁,亏损200元.
(1)用样本估计总体,估计该制造企业随机销售1件产品的利润的期望值.
(2)根据统计,该制造企业在2021年12月至2022年5月的产量(万件)与月份编号(记2021年12月,2022年1月,编号分别为近似满足关系式,相关统计量的值如下:.根据所给的统计量,求关于的回归方程,并估计该制造企业2022年8月份的利润为多少万元.(结果精确到)
附:对于一组数据,其回归直线的斜率和截距的最小二乘估计分别为
【答案】(1)165元
(2),估计该制造企业2022年8月份的利润为万元
(1)因为该制造企业生产的产品中一等品 二等品和次品的频率分别为,
所以该制造企业随机销售1件产品的利润的分布列为
200 100
所以,
即估计该制造企业随机销售1件产品的利润的期望值为165元.
(2)因为,所以.
令,则.
因为,
所以,
因为,所以,所以回归方程为.
当时,,
故估计该制造企业2022年8月份的利润为万元.
4.(2022·海南中学高三阶段练习)设某幼苗从观察之日起,第x天的高度为,测得的一些数据如下表所示:
第x天 1 4 9 16 25 36 49
高度 0 4 7 9 11 12 13
作出这组数据的散点图发现:与x(天)之间近似满足关系式,其中a,b均为大于0的常数.
(1)在这组数据的散点图中,甲同学随机圈取了其中的3个点,记这3个点中幼苗的高度大于的点的个数为,其中为表格中所给的幼苗高度的平均数,求的分布列和数学期望;
(2)试借助一元线性回归模型,根据所给数据,求出y关于x的经验回归方程.
附:线性回归方程中,,其中为样本平均量.
【答案】(1)分布列见解析,
(2)
(1),
7天中幼苗高度大于的有4天,小于等于8的有3天,从散点图中任取3个点,即从这7天中任取3天,所以这3个点中幼苗的高度大于的点的个数的取值为0,1,2,3,
;;;;
所以随机变量的分布列为:
随机变量的期望值.
(2)令,则,根据已知数据表得到如下表:
x
y

通过上表计算可得:,
因为回归直线过点,所以,
故y关于的回归方程.第04讲 拓展一:非线性经验回归方程 (精讲)
目录
第一部分:知识点精准记忆
第二部分:典型例题剖析
题型一:指数型
题型二:对数型
题型三:幂函数型
知识点一:非线性经验回归
当经验回归方程并非形如()时,称之为非线性经验回归方程,当两个变量不呈线性相关关系时,依据样本点的分布选择合适的曲线方程来模拟,常见的非线性经验回归方程的转换方式总结如下:
曲线方程 变换公式 变换后的线性关系式
建立非线性经验回归模型的基本步骤
1.确定研究对象,明确哪个是解释变量,哪个是响应变量;
2.由经验确定非线性经验回归方程的模型;
3.通过变换(一般题目都有明显的暗示如何换元,换元成什么变量),将非线性经验回归模型转化为线性经验回归模型(特别注意:使用线性回归方程的公式,注意代入变换后的变量);
4.按照公式计算经验回归方程中的参数,得到经验回归方程;
5.消去新元,得到非线性经验回归方程;
6.得出结果后分析残差图是否有异常 .
知识点二:非线性经验回归类型
非线性回归方程主要分为三大类,指数型,对数型,幂函数型,做题关键在于变量之间的转换
1、指数型:
①类型一,,处理方式是对方程两边取对数(具体取什么对数观察参考数据,自然对数和常用对数用的较多),比如e为底数,取ln,则现在方程变为,,将进行换元,,则非线性回归方程变成线性回归直线方程;
②类型二,,此为类型一的变式,多了常数项部分,常见的变化形式为(具体取什么对数观察参考数据,自然对数和常用对数用的较多),令,则非线性回归方程变成线性回归直线方程
2、对数型:
①类型一,形如,则令,则非线性回归方程变成线性回归直线方程
②类型二,,两边同时消掉对数,(取什么底数判断方法同上)取,令,则非线性回归方程变成线性回归直线方程
3、幂函数型:
①类型一,,,等等,处理方式是将方程中幂函数部分换成一个新变量,比如,,,然后将非线性回归方程变成线性回归直线方程
②类型二,,做法同指数型,变化方式为两边取对数(底数判断方式同上),令,则非线性回归方程变成线性回归直线方程
题型一:指数型
典型例题
例题1.(2022·辽宁·鞍山一中模拟预测)用模型拟合一组数,若,,设,得变换后的线性回归方程为,则( )
A.12 B. C. D.7
例题2.(2022·广西桂林·模拟预测(文))一只红铃虫产卵数和温度有关,现测得一组数据,可用模型拟合,设,其变换后的线性回归方程为,若,,为自然常数,则________.
例题3.(2022·河南商丘·高二期末(文))网络是指第五代移动网络通讯技术,它的主要特点是传输速度快,峰值传输速度可达每秒钟数十.作为新一代移动通讯技术,它将要支持的设备远不止智能手机,而是会扩展到未来的智能家居,智能穿戴等设备.某科技创新公司基于领先技术的支持,经济收入在短期内逐月攀升,该公司1月份至6月份的经济收入(单位:万元)关于月份的数据如下表所示,并根据数据绘制了如图所示的散点图.
月份 1 2 3 4 5 6
收入 6 11 23 37 72 124
(1)根据散点图判断,与(均为常数)哪一个更适合作为经济收入关于月份的回归方程类型(给出判断即可,不必说明理由)?
(2)根据(1)的结果及表中数据,求出关于的回归方程(结果保留两位小数);
(3)根据(2)所求得的回归方程,预测该公司7月份的经济收入(结果保留两位小数).
参考公式及参考数据:回归方程中斜率和截距的最小二乘估计公式为:,;
3.5 45.5 3.34 17.5 393.5 10.63 239.85
其中,().
例题4.(2022·福建三明·高二期末)在国家大力发展新能源汽车产业的政策下,我国新能源汽车的产销量高速增长.已知某地区2014年底到2021年底新能源汽车保有量的数据统计表如下:
年份(年) 2014 2015 2016 2017 2018 2019 2020 2021
年份代码 1 2 3 4 5 6 7 8
保有量/千辆 1.95 2.92 4.38 6.58 9.87 15.00 22.50 33.70
(1)根据统计表中的数据判断,与哪一个更适合作为关于的经验回归方程(给出判断即可,不必说明理由),并根据你的判断结果建立关于的经验回归方程;
(2)假设每年新能源汽车保有量按(1)中求得的函数模型增长,且传统能源汽车保有量每年下降的百分比相同.若2021年底该地区传统能源汽车保有量为500千辆,预计到2026年底传统能源汽车保有量将下降10%.试估计到哪一年底新能源汽车保有量将超过传统能源汽车保有量.
参考数据:
,,,其中,,,.
参考公式:
对于一组数据(,),(,),…,(,),其经验回归直线的斜率和截距的
最小二乘估计公式分别为;
同类题型归类练
1.(2022·全国·高二期末)某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x(单位:千元)对年销售量y(单位:t)的影响,对近8年的年宣传费xi和年销售量 数据作了初步处理,得到下面的散点图:
由此散点图可得,下面四个回归方程类型中最适宜作为年销售量y与年宣传费x的回归方程类型是( )
A. B. C. D.
2.(2022·全国·高二课时练习)一组数据如下表所示:
1 2 3 4
已知变量关于的回归方程为,若,则预测的值可能为
A. B. C. D.
3.(2022·黑龙江·尚志市尚志中学高二阶段练习)近期,某公交公司分别推出支付宝和微信扫码支付乘车活动,活动设置了一段时间的推广期,由于推广期优惠力度较大,吸引越来越多的人开始使用扫码支付.某线路公交车队统计了活动刚推出一周内每一天使用扫码支付的人次,用表示活动推出的天数,表示每天使用扫码支付的人次(单位:十人次),统计数据如表1所示:
表1:
1 2 3 4 5 6 7
6 11 21 34 66 101 196
根据以上数据,绘制了如图1所示的散点图.
参考数据:
62.14 1.54 2535 50.12 3.47
其中
参考公式:
对于一组数据,其回归直线的斜率和截距的最小二乘估计分别为.
(1)根据散点图判断,在推广期内,与 (均为大于零的常数)哪一个适宜作为扫码支付的人次关于活动推出天数的回归方程类型?(给出判断即可,不必说明理由)
(2)根据(1)的判断结果及表1中的数据,求关于的回归方程,并预测活动推出第8天使用扫码支付的人次;
4.(2022·江西·南城县第二中学高二阶段练习(理))为了研究某种细菌随时间x变化,繁殖的个数,收集数据如下:
天数x/天 1 2 3 4 5 6
繁殖个数y/个 6 12 25 49 95 190
(1)用天数作解释变量,繁殖个数作预报变量,与y=哪一个作为繁殖的个数y关于时间x变化的回归方程类型为最佳?(给出判断即可,不必说明理由)
3.5 62.83 3.53 17.5 596.505 12.04
其中;
(2)根据(1)的判断最佳结果及表中的数据,建立y关于x 的回归方程.
参考公式:,
题型二:对数型
典型例题
例题1.(2022·河南郑州·高二期末(文))目前,新冠病毒引起的疫情仍在全球肆虐,在党中央的正确领导下,全国人民团结一心,使我国疫情得到了有效的控制.为了应对最新型的奥密克戎病毒,各大药物企业积极投身到新疫苗的研发中.某药企为评估一款新药的药效和安全性,组织一批志愿者进行临床用药实验,结果显示临床疗效评价指标的数量与连续用药天数具有相关关系.刚开始用药时,指标的数量变化明显,随着天数增加,的变化趋缓.根据志愿者的临床试验情况,得到了一组数据,,表示连续用药天,表示相应的临床疗效评价指标的数值.该药企为了进一步研究药物的临床效果,建立了关于的两个回归模型:
模型①:由最小二乘公式可求得与的线性回归方程:;
模型②:由样本点的分布,可以认为样本点集中在曲线:的附近,令,则有,,,.
(1)根据所给的统计量,求模型②中关于的回归方程;
(2)根据下列表格中的数据,说明哪个模型的预测值精度更高、更可靠;
(3)根据(2)中精确度更高的模型,预测用药一个月后,临床疗效评价指标相对于用药半个月的变化情况(一个月以30天计,结果保留两位小数).
回归模型 模型① 模型②
残差平方和 102.28 36.19
参考数据:.
例题2.(2022·内蒙古·赤峰二中模拟预测(理))受北京冬奥会的影响,更多人开始关注滑雪运动,但由于室外滑雪场需要特殊的气候环境,为了满足日益增长的消费需求,国内出现了越来越多的室内滑雪场.某投资商抓住商机,在某大学城附近开了一家室内滑雪场.经过6个季度的经营,统计该室内滑雪场的季利润数据如下:
第个季度 1 2 3 4 5 6
季利润(万元) 2.2 3.6 4.3 4.9 5.3 5.5
根据上面的数据得到的一些统计量如下:
4.3 0.5 101.4 14.1 1.8
表中,.
(1)若用方程拟合该室内滑雪场的季利润与季度的关系,试根据所给数据求出该方程;
(2)利用(1)中得到的方程预测该室内滑雪场从第几个季度开始季利润超过6.5万元;
附:线性回归方程中,,.参考数据:
同类题型归类练
1.(2022·福建省尤溪第一中学高二期末)目前,新冠病毒引起的疫情仍在全球肆虐,在党中央的正确领导下,全国人民团结一心,使我国疫情得到了有效的控制.其中,各大药物企业积极投身到新药的研发中.汕头某药企为评估一款新药的药效和安全性,组织一批志愿者进行临床用药实验,结果显示临床疗效评价指标A的数量y与连续用药天数x具有相关关系.刚开始用药时,指标A的数量y变化明显,随着天数增加,y的变化趋缓.根据志愿者的临床试验情况,得到了一组数据,,2,3,4,5,…,10,表示连续用药i天,表示相应的临床疗效评价指标A的数值.该药企为了进一步研究药物的临床效果,建立了y关于x的两个回归模型:
模型①:由最小二乘公式可求得y与x的线性回归方程:;
模型②:由图中样本点的分布,可以认为样本点集中在曲线:的附近,令,则有,,,.
(1)根据所给的统计量,求模型②中y关于x的回归方程;
(2)根据下列表格中的数据,说明哪个模型的预测值精度更高、更可靠.
(3)根据(2)中精确度更高的模型,预测用药一个月后,疗效评价指标相对于用药半个月的变化情况(一个月以30天计,结果保留两位小数).
回归模型 模型① 模型②
残差平方和 102.28 36.19
附:样本(,2,…,n)的最小二乘估计公式为,;相关指数,参考数据:.
2.(2022·全国·高二课时练习)发展扶贫产业,找准路子是关键,重庆市石柱土家族自治县中益乡华溪村不仅找准了路,还将当地打造成了种植中药材黄精的产业示范基地.通过种植黄精,华溪村村民的收入逐年递增.以下是2014年至2020年华溪村村民每户平均可支配收入的统计数据:
年份 2014 2015 2016 2017 2018 2019 2020
年份代码 1 2 3 4 5 6 7
每户平均可支配收入(千元) 4 15 22 26 29 31 32
根据以上数据,绘制如图所示的散点图:
(1)根据散点图判断,与哪一个更适宜作为每户平均可支配收入(千元)关于年份代码的回归方程模型(给出判断即可,不必说明理由),并建立关于的回归方程(结果保留1位小数);
(2)根据(1)建立的回归方程,试预测要到哪一年华溪村的每户平均可支配收入才能超过35(千元);
参考数据:
22.7 1.2 759 235.1 13.2 8.2
其中,.
参考公式:线性回归方程中,,.
题型三:幂函数型
典型例题
例题1.(2022·全国·高二期末)某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费(单位:千元)对年销售量(单位:t)的影响,对近8年的年宣传费和年销售量 数据作了初步处理,得到下面的散点图:
由此散点图可得,下面四个回归方程类型中最适宜作为年销售量与年宣传费的回归方程类型是( )
A. B. C. D.
例题2.(2022·河南信阳·高二期末(文))设关于某产品的明星代言费(百万元)和其销售额(千万元),有如下表的统计表格:
1 2 3 4 5 合计
(百万元) 1.26 1.44 1.59 1.71 1.82 7.82
(百万元) 2.00 2.99 4.02 5.00 6.03 20.04
(百万元) 3.20 4.80 6.50 7.50 8.00 30.00
,,,,,,
表中.
(1)在坐标系中,作出销售额y关于广告费x的回归方程的散点图;
(2)根据散点图指出:,哪一个适合作销售额关于明星代言费的回归方程(不需要说明理由),并求出此回归方程.
附:对于一组数据,,……,,其回归线的斜率和截距的最小二乘估计分别为:,.
例题3.(2022·四川雅安·高二期末(理))某城市选用某种植物进行绿化,设其中一株幼苗从观察之日起,第天的高度为 cm,测得一些数据如下表所示:
第天 1 4 9 16 25 36 49
高度/cm 0 4 7 9 11 12 13
作出这组数的散点图如下
(1)请根据散点图判断,与中哪一个更适宜作为幼苗高度y关于时间x的回归方程类型?(给出判断即可,不必说明理由)
(2)根据(1)的判断结果及表中数据,建立y关于x的回归方程,并预测第196天这株幼苗的高度(结果保留整数).
附:, 参考数据:
140 28 56 283
例题4.(2022·辽宁·高二阶段练习)某企业积极响应“碳达峰”号召,研发出一款性能优越的新能源汽车,备受消费者青睐.该企业为了研究新能源汽车在某地区每月销售量(单位:千辆)与月份的关系,统计了今年前5个月该地区的销售量,得到下面的散点图及一些统计量的值.
表中.
(1)根据散点图判断两变量的关系用与哪一个比较合适?(给出判断即可,不必说明理由)
(2)根据(1)的判断结果及表中数据,建立关于的回归方程(的值精确到),并预测从今年几月份起该地区的月销售量不低于万辆?
附:对于一组数据,其回归直线方程的斜率和截距的最小二乘法估计分别为.
同类题型归类练
1.(2022·山东聊城·高二期末)网民的智慧与活力催生新业态,网络购物,直播带货,APP买菜等进入我们的生活,改变了我们的生活方式,随之电信网络诈骗犯罪形势也非常严峻.自“国家反诈中心APP”推出后,某地区采取多措并举的推广方式,努力为人民群众构筑一道防诈反诈的“防火墙”.经统计,该地区网络诈骗月报案数与推广时间有关,并记录了经推广x个月后月报案件数y的数据.
x(个) 1 2 3 4 5 6 7
y(件) 891 888 351 220 200 138 112
(1)根据以上数据,判断与哪一个适宜作为回归方程模型?根据判断结果,求出y关于x的回归方程;
(2)分析该地区一直推广下去,两年后能否将网络诈骗月报案数降至75件以下.
参考数据(其中,,,,.
参考公式:对于一组数据,其回归直线的斜率和截距的最小二乘估计公式分别为:,.
2.(2022·湖北·高二期末)快递业的迅速发展导致行业内竞争日趋激烈.某快递网点需了解一天中收发一件快递的平均成本(单位:元)与当天揽收的快递件数即揽件量(单位:千件)之间的关系,对该网点近天的每日揽件量(单位:千件)与当日收发一件快递的平均成本(单位:元)()的数据进行了初步处理,得到散点图及一些统计量的值.
表中,.
(1)根据散点图判断与哪一个更适宜作为关于的经验回归方程类型?并根据判断结果及表中数据求出关于的经验回归方程;
(2)已知该网点每天的揽件量(单位:千件)与单件快递的平均价格(单位:元)之间的关系是,收发一件快递的利润等于单件的平均价格减去平均成本,根据(1)中建立的经验回归方程解决以下问题:
①预测该网点某天揽件量为千件时可获得的总利润;
②单件快递的平均价格为何值时,该网点一天内收发快递所获利润的预报值最大?
附:对于一组具有线性相关关系的数据,其经验回归直线的斜率和截距的最小二乘估计分别为,.
3.(2022·河北承德·高二阶段练习)某制造企业从生产的产品中随机抽查了1000件,经检验,其中一等品有800件,二等品有150件,次品有50件.若销售1件该产品,一等品的利润为200元,二等品的利润为100元,次品直接销毁,亏损200元.
(1)用样本估计总体,估计该制造企业随机销售1件产品的利润的期望值.
(2)根据统计,该制造企业在2021年12月至2022年5月的产量(万件)与月份编号(记2021年12月,2022年1月,编号分别为近似满足关系式,相关统计量的值如下:.根据所给的统计量,求关于的回归方程,并估计该制造企业2022年8月份的利润为多少万元.(结果精确到)
附:对于一组数据,其回归直线的斜率和截距的最小二乘估计分别为
4.(2022·海南中学高三阶段练习)设某幼苗从观察之日起,第x天的高度为,测得的一些数据如下表所示:
第x天 1 4 9 16 25 36 49
高度 0 4 7 9 11 12 13
作出这组数据的散点图发现:与x(天)之间近似满足关系式,其中a,b均为大于0的常数.
(1)在这组数据的散点图中,甲同学随机圈取了其中的3个点,记这3个点中幼苗的高度大于的点的个数为,其中为表格中所给的幼苗高度的平均数,求的分布列和数学期望;
(2)试借助一元线性回归模型,根据所给数据,求出y关于x的经验回归方程.
附:线性回归方程中,,其中为样本平均量.

展开更多......

收起↑

资源列表