资源简介 (共93张PPT)9.1 线性回归分析9.1.2 一元线性回归模型探究点一 求经验回归方程探究点二 残差及残差分析探究点三 非线性回归分析◆◆◆◆课前预习课中探究备课素材练习册答案核查【导】答案核查【练】【学习目标】1.结合具体实例,了解一元线性回归模型的含义,了解模型参数的统计意义.2.了解最小二乘原理,掌握一元线性回归模型参数的最小二乘估计方法,会使用相关的统计软件.3.针对实际问题,会用一元线性回归模型进行预测.知识点一 一元线性回归模型(1)随机误差具有线性相关关系的两个变量,,其中的值不能由 确定,可将,之间的关系表示为 ,其中_______是确定性函数,__称为随机误差.(2)随机误差产生的主要原因①所用的确定性函数不恰当引起的误差;②忽略了某些因素的影响;③存在观测误差.(3)___________称为一元线性回归模型.其中, 称为________或__________, 称为________或__________.因变量响应变量自变量解释变量【诊断分析】判断正误.(请在括号中打“√”或“×”)(1)随机误差是一个随机变量,产生的原因是多方面的.( )√(2)在一元线性回归模型中,是与真实值 的随机误差,它是一个可观测的量.( )×知识点二 经验回归方程与最小二乘法1.经验回归方程把,的估计值记为, ,则,_______由此得到的直线称为这 对数据的经验回归直线,此直线方程称为关于的经验回归方程,其中称为__________, 称为__________, 称为________.回归截距回归系数回归值.上述求经验回归方程的方法称为“____________”,由此求得的,分别叫作, 的______________.注意:在经验回归直线中,是斜率, 是截距.一般地,当时,说明两个变量正相关,它的意义是当 每增加一个单位时,平均增加个单位;当 时,说明两个变量负相关,它的意义是当每增加一个单位时,平均减小 个单位.最小二乘法最小二乘估计2.残差与残差分析(1)残差:对于响应变量 ,通过观测得到的数据称为观测值,通过经验回归方程得到的 称为估计值,________与对应的________之差称为残差.观测值估计值(2)残差分析:残差是随机误差 的估计结果,通过对残差的分析可以判断模型刻画数据的效果,以及判断原始数据中是否存在可疑数据等,这方面工作称为残差分析.其步骤为:计算残差 画出残差图→在残差图中分析残差特性.【诊断分析】判断正误.(请在括号中打“√”或“×”)(1)通过经验回归方程求出的 是精确值.( )×(2)用最小二乘法求出的 可能是正的,也可能是负的.( )√(3)经验回归直线一定经过点 .( )√(4)残差平方和越大,线性回归模型的拟合效果越好.( )×探究点一 求经验回归方程例1 [2025·辽宁辽阳高二期末]某产品的广告费用 (单位:万元)与销售额 (单位:万元)的一组统计数据如表:广告费用 1.8 2.2 3 5销售额 7 14 16根据表格中数据得到与的经验回归方程为 ,则___.3[解析] 依题意,得, ,所以,解得 .变式 某制药厂今年前5个月某药品的产量 (单位:万盒)与月份代码的一组数据如表所示,若, 线性相关,经验回归方程为,则当时, 的预测值为____万盒.1 2 3 4 55 6 5 6 87.8[解析] 由题意知, ,所以,解得,所以,当 时, (万盒).例2 [2025·江苏启东中学高二月考]某种产品2020年到2024年的年投资金额(单位:万元)与年利润 (单位:万元)的一组数据如下.年份 2020 2021 2022 2023 2024年投资金额 1 2 3 4 5年利润 2.4 2.7 6.4 7.9由散点图知,与 之间的关系可以用一元线性回归模型拟合,已知5年利润的平均值是4.7.(1)求表中实数 的值;解:由题意得,解得 .例2 [2025·江苏启东中学高二月考]某种产品2020年到2024年的年投资金额(单位:万元)与年利润 (单位:万元)的一组数据如下.年份 2020 2021 2022 2023 2024年投资金额 1 2 3 4 5年利润 2.4 2.7 6.4 7.9由散点图知,与 之间的关系可以用一元线性回归模型拟合,已知5年利润的平均值是4.7.(2)求关于的经验回归方程 .解:由题意得, ,,,则 ,则 ,故所求经验回归方程为 .变式 [2025·陕西渭南高二期末]某地区积极响应“节能减排,低碳生活”的号召,采取了一系列的措施控制碳排放.环保部门收集到2020年至2024年内新增碳排放量的一组数据,如表所示,其中 表示年份代号, (单位:万吨)表示新增碳排放量.年份 2020 2021 2022 2023 2024年份代号 1 2 3 4 5新增碳排放量 6.1 5.2 4.9 4 3.8(1)请计算样本相关系数,并说明与 之间具有较强的线性相关程度(若,则与 之间具有较强的线性相关程度);解:依题意得,因为,所以与 之间具有较强的线性相关程度.(2)求关于 的经验回归方程,并据此估计该地区2025年的新增碳排放量.参考数据:,,, ,,, .解: ,,所以 .当时, (万吨),所以估计该地区2025年新增碳排放量为3.06万吨.[素养小结]求经验回归方程的基本步骤:(1)作出散点图,从直观上分析数据间是否存在线性相关关系;(2)计算,,,;(3)代入公式求出中参数,的值;(4)写出经验回归方程.探究点二 残差及残差分析例3 某研究机构对高三年级学生的记忆力和判断力 进行统计分析,所得数据如表:6 8 10 122 3 5 6(1)已知与 之间具有较强的线性相关关系,请根据表中提供的数据,用最小二乘法求出关于的经验回归方程 .解:由题意知, ,,,则, ,所以关于的经验回归方程为 .例3 某研究机构对高三年级学生的记忆力和判断力 进行统计分析,所得数据如表:6 8 10 122 3 5 6(2)统计学中常通过计算残差的平方和来判断模型的拟合效果.在本题中若残差平方和小于 ,则认为拟合效果符合要求.请判断(1)中求得的经验回归方程的拟合效果是否符合要求,并说明理由.解:将,8,10,12分别代入经验回归方程 ,得,,, ,所以残差平方和为,因为 ,所以(1)中求得的经验回归方程的拟合效果符合要求.变式 [2025·江苏淮州中学高二期中]某工厂为研究某种产品的产量(单位:吨)与所需某种原材料的质量 (单位:吨)之间的关系,在生产过程中收集了4对数据,如表所示.3 4 5 62.5 3 4根据表中数据,得出关于的经验回归方程为 .据此计算出样本点对应的残差为,则表中 的值为____.4.5[解析] 由题意可得当时的预测值为 ,则,解得,则 .又, ,所以,解得 .[素养小结]残差平方和越小,模型的拟合效果越好;残差平方和越大,模型的拟合效果越差.探究点三 非线性回归分析例4 [2025·江苏淮安高二期末]某乡政府为提高当地农民的收入,指导农民种植药材,取得较好的效果.以下是某农户2020年至2024年种植某种药材的年收入(单位:千元)的一组统计数据:年份 2020 2021 2022 2023 2024年份代码 1 2 3 4 5年收入 59 61 64 68 73(1)根据表中数据,现有与 两种模型可以拟合与 之间的关系,请分别求出两种模型的回归方程.(结果保留一位小数)解:根据题意得 ,,所以, ,则, .设,则 ,所以,则, .所以两种模型的回归方程分别为, .(2)统计学中常通过比较残差平方和来比较两个模型的拟合效果,请根据残差平方和说明上述两个方程哪一个拟合效果更好?并据此预测2025年该农户种植该种药材的年收入.参考数据: ,,其中 .解:当回归方程为时,将 值代入方程,可得估计值依次为58,,65, ,72,则残差平方和为.当回归方程为时,将 值代入方程,可得估计值依次为59,,,68, ,则残差平方和为 .因为,所以回归方程 拟合效果更好,应选择该方程进行拟合.当时, ,故预测2025年该农户种植该种药材的年收入为80千元,即8万元.变式 [2025·山东青岛高二期中改编]某市为繁荣地方经济,大力实行人才引进政策,为了解政策的效果,有关部门统计了2019年至2024年人才引进的数量 (单位:万人),并根据统计数据绘制了如图所示的散点图(其中 表示年份代码,年份代码1,2,3,4,5,6分别代表2019,2020,2021,2022,2023,2024年).(1)根据散点图判断与,,,均为常数哪一个适合作为关于 的回归方程类型;(给出结论即可,不必说明理由)解:根据散点图可知,更适合作为 关于 的回归方程类型.(2)根据(1)的结果及表中的数据,求出关于 的回归方程,并预测该市2026年引进人才的数量.参考数据:5.15 1.55 17.5 20.95 3.85其中,,, .解:因为,所以两边同时取常用对数,得 .设,则,先求关于 的经验回归方程.因为 ,所以 ,,所以 .把代入上式,得 ,故预测该市2026年引进人才的数量为12.68万人.[素养小结]求解非线性回归分析问题一般先换元,再根据线性回归模型的方法求解.常见的非线性回归方程的换元方法总结如下.非线性回归方程 变换公式 变换后的线性回归方程, ,,, ,1.一元线性回归模型(1)经验回归直线过点 .(2)用最小二乘法求经验回归方程的前提是所给数据具有线性相关关系(可利用散点图来判断),否则求出的经验回归方程无意义.2.求经验回归方程的方法——最小二乘法设,的一组观测值为 ,且经验回归方程为.(1)当取时,的观测值为 ,取,则差刻画了实际观测值 与经验回归直线上相应点的纵坐标之间的偏离程度.我们希望与的 个偏差构成的总偏差越小越好,这样所求得的直线是最贴近已知点的.(2)这个总偏差不能用个偏差之和 来表示,通常用偏差的平方和,即 作为总偏差,并使之达到最小,从而得到经验回归方程.3.刻画回归效果的方式(1)残差图法作图时纵坐标为残差,横坐标为解释变量的取值,这样作出的图形称为残差图.若残差点比较均匀地落在水平的带状区域内,带状区域越窄,则说明拟合效果越好.(2)残差平方和法残差平方和 ,残差平方和越小,模型拟合效果越好,残差平方和越大,模型拟合效果越差.(3)利用 刻画回归效果决定系数 是度量模型拟合效果的一个指标,在线性回归模型中,它代表解释变量刻画预报变量的能力.,越大,则模型拟合效果越好, 越小,则模型拟合效果越差.(4)辨析决定系数与样本相关系数在含有一个解释变量的线性回归模型中,决定系数 恰好等于样本相关系数 的平方.4.解非线性回归模型问题的一般步骤有些非线性回归分析问题需要拟合方程,这时我们可以根据已知数据画出散点图,并与学过的各种函数(幂函数、指数函数、对数函数等)的图象进行比较,挑选一种跟这些散点拟合得最好的函数,用适当的变量进行变换,把问题转化为线性回归模型问题,使之得到解决.一般步骤为:1.残差的分析例1 红铃虫是棉花的主要害虫之一,一只红铃虫的产卵数与温度有关.现收集了7组观测数据.用4种模型分别进行拟合.由此得到相应的经验回归方程并进行残差分析,进一步得到如图所示的4幅残差图,根据残差图分析,拟合效果最好的模型是( )A.模型一 B.模型二 C.模型三 D.模型四√[解析] 当残差点比较均匀地落在水平的带状区域内时,说明选用的模型比较合适,这样的带状区域的宽度越窄,说明拟合精度越高,拟合效果越好,对比4个残差图,可知模型四的残差图的带状区域的宽度最窄.故选D.2.比较两种模型的拟合效果例2 [2024·大连二十四中高二期中]当前人工智能技术以前所未有的速度迅猛发展,并逐步影响我们的方方面面.某公司在这个领域逐年加大投入,以下是近年来该公司对产品研发年投入额 (单位:百万元)与其年销售量 (单位:千件)的一组数据.1 2 3 4 5 60.5 1 1.5 3 6 120 0.4 1.1 1.8 2.5(1)公司拟分别用和作为年销售量 关于年投入额 的回归模型,请根据已知数据,确定方案①和②的经验回归方程.(,,, 计算过程中保留到小数点后两位,最后结果保留到小数点后一位)解:.对于模型①, ,所以, ,所以由模型①得到的关于的经验回归方程为 .对于模型②,由,得,即 ,可得,则, ,所以,则由模型②得到的关于 的经验回归方程为.(2)根据下表数据,用决定系数 (只需比较出大小)比较两种模型的拟合效果,并选择拟合效果较好的模型,预测年投入额为7百万元时,产品的年销售量是多少 经验回归方程残差平方和 18.29 10.06参考公式及数据:,, ,,, .解: .对于,;对于 ,.因为 ,所以模型②的拟合效果较好.对于,当时, ,所以预测年投入额为7百万元时,产品的年销售量是16.4千件.练习册1.[2025·江苏南通中学高二期中]某产品的广告费用 (单位:万元)与销售额 (单位:万元)之间的一组数据如下:2 4 5 6 830 40 50 60已知与的经验回归方程为,则 等于( )A.68 B.69 C.70 D.71√[解析] 由题意可知 ,因为经验回归直线过点,所以 ,所以,解得 .故选C.2.[2025·江苏徐州高二期末]已知经验回归方程 ,若变量增加1个单位,则变量 ( )A.平均增加2.5个单位 B.平均增加2个单位C.平均减少2.5个单位 D.平均减少2个单位[解析] 由经验回归方程的意义知,当变量增加1个单位时,变量平均减少2.5个单位.故选C.√3.变量与 之间的一组数据如表所示.3 4 5 6 74 2.5 2 1.5根据表中数据,得出关于的经验回归方程为 .据此计算出样本点的残差为,则表中 的值为( )A.1 B.1.2 C.2.2 D.2.5√[解析] 因为样本点的残差为 ,所以,解得 ,所以经验回归方程为,因为 ,,所以,解得 .故选A.4.[2025·福建福州高二期末]某种病毒传播中期的感染人数和天数 的散点图如图所示,下列最适宜作为感染人数和天数 的回归方程类型的是( )A. B.C. D.[解析] 由题图可知,随着 的增大而增大,且增长速度有越来越快的趋势,结合选项,可判断最适宜作为感染人数 和时间 的回归方程的类型.故选B.√5.[2025·江苏连云港高二期末]恩格尔系数是食品支出总额占个人消费支出总额的比值,恩格尔系数越小,消费结构越完善,生活水平越高.某学校社会调查小组通过调查得到年个人消费总额(单位:万元)与恩格尔系数 之间的一组数据,如下表:1 1.5 2 2.5 30.9 0.8 0.5 0.2 0.1若与 之间具有线性相关系,老张年个人消费总额为2.8万元,据此估计其恩格尔系数为( )A.0.148 B.0.138 C.0.248 D.0.238√[解析] ,, ,故,则 ,所以估计老张的恩格尔系数为 .故选A.6.(多选题)[2025·江苏盐城高二期末]下列说法中正确的是( )A.经验回归直线必过点B.当样本相关系数 时,两个变量正相关C.两个变量的线性相关性越强,则样本相关系数就越接近于1D.残差图中残差点所在的水平带状区域越宽,回归方程的预报精确度越低√√√[解析] 经验回归直线必过点,故A正确;当样本相关系数 时,两个变量正相关,当样本相关系数 时,两个变量负相关,故B正确;样本相关系数满足 ,若两个变量的线性相关性越强,则样本相关系数的绝对值 就越接近于1,故C错误;残差图中残差点所在的水平带状区域越窄,回归方程的预报精确度越高,水平带状区域越宽,回归方程的预报精确度越低,D正确.故选 .7.[2025·安徽蚌埠高二期中]根据一组样本数据, ,,求得与的经验回归方程为 ,则样本点 的残差为_____.2.45[解析] 把代入 ,得,所以样本点 的残差为 .8.[2025·江苏常州月考]已知变量与 具有线性相关关系,在研究变量与之间的关系时,得到一组样本数据, ,, ,, ,利用此样本数据求得的经验回归方程为,现发现数据和 误差较大,剔除这两对数据后,求得的经验回归方程为,且 ,则____.16[解析] 设没剔除两对数据前,的平均数分别为, ,剔除两对数据后,的平均数分别为,,因为 ,所以,则.因为剔除的两对数据为 和,所以 ,所以 ,所以,解得 .9.(13分)[2025·江苏徐州高二期末]已知由变量, 的一组数据绘制的散点图如图所示.(1)根据散点图计算,的样本相关系数 ,并据此判断是否可以用一元线性回归模型拟合与的关系;(若 ,则线性相关关系显著,可用一元线性回归模型拟合)解:由题意得 ,,, ,,所以 ,所以可用一元线性回归模型拟合与 的关系.9.(13分)[2025·江苏徐州高二期末]已知由变量, 的一组数据绘制的散点图如图所示.(2)求关于的经验回归方程,并估计当时对应的 值.参考数据: .解:因为,, ,所以,所以关于的经验回归方程为 .将代入经验回归方程可得 .10.[2025·江苏灌南期中]两个相关变量和 的一组数据如下表:1 2 3 4 51 2 8 8 16已知相关变量和的关系可用非线性回归方程 来拟合,则当时,的估计值为(参考数据:, )( )A.33 B.37 C.65 D.73√[解析] 令,则 ,由题意得, ,所以,则 ,故,当时, .故选B.11.(多选题)[2025·江苏泰州高二期末]已知, 的一组数据如下表:0 1 2 3 42.3 4.3 4.4 4.8从散点图分析可知与 线性相关,可求得经验回归方程为,则下列说法正确的是( )A. 的值为6.2B.经验回归直线必过点C.样本点 的残差为0.1D.将此表中的样本点去掉后,样本相关系数 不变√√√[解析] 由题意可知, ,,将 代入,可得,解得 ,故A正确;由,得,所以经验回归直线必过点 ,故B正确;当时,,则样本点 的残差为,故C错误;因为, ,所以, ,又样本相关系数,所以将表中的样本点 去掉后,样本相关系数不变,故D正确.故选 .12.(多选题)[2025·江苏镇江高二期末]某课外兴趣小组在探究学习活动中,测得 的10对样本数据如下表:165 168 170 172 173 174 175 177 179 18255 89 61 65 67 70 75 75 78 80由最小二乘法计算得到的经验回归方程为 ,样本相关系数为;经过观察散点图,分析残差,把数据 去掉后,再用剩下的9对数据计算得到的经验回归方程为 ,样本相关系数为 ,则( )A. B.C. D.,√√√[解析] 变量 的平均数为,因为离群点的横坐标168小于平均数 ,纵坐标89相对较大,所以去掉离群点后经验回归直线的截距变小且斜率变大,所以, 故A错误,B正确;去掉离群点后成对样本数据的线性相关程度更强,所以,则 ,故C正确;由表格中数据可知,随着的增大,增大,所以, ,所以D正确.故选 .13.[2025·宁夏石嘴山高二期中]红铃虫是棉花的主要害虫之一,其产卵数与温度有关.现收集到一只红铃虫的产卵数 (单位:个)和温度(单位: )的8对观测数据,制成如图①所示的散点图.现用模型, 分别进行拟合,由此得到相应的经验回归方程并进行残差分析,进一步得到如图②所示的残差图.根据收集到的数据,计算得到如下统计量的值:25 2.9 64 6 168 422 688 50.4 70 308表中,,, .根据残差图,比较模型①,②的拟合效果,模型____(填“①”或“②”)比较合适,对应的经验回归方程为____________.[解析] 因为模型①的残差点比较均匀地落在水平的带状区域中,且带状区域的宽度比模型②的带状区域宽度窄,所以模型①的拟合精度更高,故选模型①比较合适.令,则与 可以用线性回归方程 来拟合.可得,,则关于 的经验回归方程为,即,所以产卵数关于温度 的经验回归方程为 .14.(15分)直播带货是扶贫助农的一种新模式,这种模式是利用主流媒体的公信力,聚合销售主播的力量助力打通农产品产销链条,切实助力农民增收.某网络平台助力赣南某县脐橙的销售,下表统计了该平台2024年1月1日至5日直播销售脐橙的箱数(其中脐橙每箱):日期 1 2 3 4 5售价 (元/箱) 60 56 58 57 54销售量 (千箱) 5 9 7 10 9(1)求样本相关系数(精确度为0.01),并判断销售量 与脐橙的售价是否有较强的线性相关关系(当 时,可以认为两个变量有较强的线性相关关系;否则,没有较强的线性相关关系).解:由已知数据可得, ,,,,所以样本相关系数 ,因为,所以与 有较强的线性相关关系.14.(15分)直播带货是扶贫助农的一种新模式,这种模式是利用主流媒体的公信力,聚合销售主播的力量助力打通农产品产销链条,切实助力农民增收.某网络平台助力赣南某县脐橙的销售,下表统计了该平台2024年1月1日至5日直播销售脐橙的箱数(其中脐橙每箱):日期 1 2 3 4 5售价 (元/箱) 60 56 58 57 54销售量 (千箱) 5 9 7 10 9(2)建立关于 的经验回归方程,并估计当售价为50元/箱时,该脐橙的销售量为多少千箱?解:因为 ,,所以关于的经验回归方程为 ,当时, ,故估计当售价为50元/箱时,该脐橙的销售量为12.9千箱.(3)若脐橙的成本为 元/箱,不考虑其他费用,由(2)中结论,当脐橙售价为多少时,可使得直播销售脐橙获利最大?(该结果保留整数)参考数据: .解:设直播销售脐橙的利润为 元,则,当时, 取得最大值,即当商品售价为54元/箱时,可使得直播销售脐橙获利最大.15.(15分)[2025·江苏海门月考]某创业者计划在某旅游景区附近租赁一套农房发展成特色“农家乐”,为了确定未来发展方向,此创业者对该景区附近五家“农家乐”跟踪调查了100天,这五家“农家乐”的收费标准互不相同,得到的统计数据如表,其中 为收费标准(单位:元/日), 为入住天数(单位:天),以频率作为各自的入住率,收费标准与入住率 的散点图如图.100 150 200 300 45090 65 45 30 20(1)令,由散点图判断与 ,哪个更合适于此模型(给出判断即可,不必说明理由)?并根据你的判断结果求关于的经验回归方程,的结果精确到解:由散点图可知,散点并非均匀分布在一条直线的两侧,而是大致分布在一条曲线的两侧,所以 更合适于此模型.由题意得 ,则 ,因为 ,所以 ,所以关于的经验回归方程为 .(2)根据第(1)问所求得的经验回归方程估计收费标准为多少时,100天销售额最大?(100天销售额 入住率×收费标准 )本题参考数据:,, ,,,,, ,.解:由题意得 ,则,当时,解得 ,当,即 时,函数单调递减,当,即 时,函数单调递增,所以函数在 处取得最大值,所以估计收费标准约为150元/天时,100天销售额 最大.快速核答案(导学案)课前预习 知识点一(1) (3) 因变量 响应变量自变量 解释变量 【诊断分析】 (1)√ (2)×知识点二 1. 回归截距 回归系数 回归值 最小二乘法 最小二乘估计2.(1)观测值 估计值 【诊断分析】 (1)× (2)√ (3)√ (4)×课中探究 例1 3 变式 7.8 例2 (1) (2)变式 (1),与之间具有较强的线性相关程度(2),估计该地区2025年新增碳排放量为3.06万吨.例3 (1)/m>(2)(1)中求得的经验回归方程的拟合效果符合要求.变式 4.5例4 (1)两种模型的回归方程分别为,.(2)回归方程拟合效果更好,预测2025年该农户种植该种药材的年收入为8万元.变式 (1)(2),预测该市2026年引进人才的数量为12.68万人.快速核答案(练习册)1.C 2.C 3.A 4.B 5.A 6.ABD 7.2.45 8.169.(1),可用一元线性回归模型拟合与的关系.(2).将代入经验回归方程可得.10.B 11.ABD 12.BCD 13. 14.(1),与有较强的线性相关关系.(2),估计当售价为50元/箱时,该脐橙的销售量为12.9千箱.(3)当商品售价为54元/箱时,可使得直播销售脐橙获利最大.15.(1)更合适于此模型..(2)估计收费标准约为150元/天时,100天销售额最大.9.1.2 一元线性回归模型【课前预习】知识点一(1)a+bx ε (3)a+bx+ε 因变量 响应变量 自变量解释变量诊断分析(1)√ (2)×知识点二1.- 回归截距 回归系数 回归值 最小二乘法最小二乘估计2.(1)观测值 估计值 诊断分析(1)× (2)√ (3)√ (4)×【课中探究】探究点一例1 3 [解析] 依题意,得==3,=,所以=3.75×3-1.25,解得t=3.变式 7.8 [解析] 由题意知==3,==6,所以6=0.6×3+,解得=4.2,所以=0.6x+4.2,当x=6时,=0.6×6+4.2=3.6+4.2=7.8(万盒).例2 解:(1)由题意得=4.7=,解得t=4.1.(2)由题意得==3,=4.7,故所求经验回归方程为=1.47x+0.29.变式 解:(1)探究点二例3 解:(1)由题意知==9,==4,(2)将x=6,8,10,12分别代入经验回归方程=0.7x-2.3,得=1.9,3.3,4.7,6.1,所以残差平方和为(2-1.9)2+(3-3.3)2+(5-4.7)2+(6-6.1)2=0.2,因为0.2<0.5,所以(1)中求得的经验回归方程的拟合效果符合要求.变式 4.5 [解析] 由题意可得当x=4时的预测值为3-(-0.15)=3.15,则3.15=0.7×4+,解得=0.35,则=0.7x+0.35.又==4.5,==,所以=0.7×4.5+0.35,解得m=4.5.探究点三例4 解:(1)根据题意得=×(1+2+3+4+5)=3,=×(59+61+64+68+73)=65,故预测2025年该农户种植该种药材的年收入为80千元,即8万元.变式 解:(1)根据散点图可知,y=ec+dx更适合作为y关于x的回归方程类型.(2)因为y=ec+dx,所以两边同时取常用对数,得ln y=c+dx.设w=ln y,则w=c+dx,先求w关于x的经验回归方程.因为==3.5,故预测该市2026年引进人才的数量为12.68万人.9.1.2 一元线性回归模型1.C [解析] 由题意可知=×(2+4+5+6+8)=5,因为经验回归直线=7x+15过点(,),所以=7×5+15=50,所以×(30+40+50+60+a)=50,解得a=70.故选C.2.C [解析] 由经验回归方程的意义知,当变量x增加1个单位时,变量y平均减少2.5个单位.故选C.3.A [解析] 因为样本点(4,2.5)的残差为-0.4,所以2.5-(-0.7×4+)=-0.4,解得=5.7,所以经验回归方程为=-0.7x+5.7,因为==5,==,所以=-0.7×5+5.7,解得m=1.故选A.4.B [解析] 由题图可知,y随着x的增大而增大,且增长速度有越来越快的趋势,结合选项,可判断y=a+bex最适宜作为感染人数y和时间x的回归方程的类型.故选B.5.A [解析] 则=-0.44x+1.38,所以估计老张的恩格尔系数为-0.44×2.8+1.38=0.148.故选A.6.ABD [解析] 经验回归直线必过点(,),故A正确;当样本相关系数r>0时,两个变量正相关,当样本相关系数r<0时,两个变量负相关,故B正确;样本相关系数r满足-1≤r≤1,若两个变量的线性相关性越强,则样本相关系数r的绝对值|r|就越接近于1,故C错误;残差图中残差点所在的水平带状区域越窄,回归方程的预报精确度越高,水平带状区域越宽,回归方程的预报精确度越低,D正确.故选ABD.7.2.45 [解析] 把x=165代入=0.85x-85.7,得=0.85×165-85.7=54.55,所以样本点(165,57)的残差为57-54.55=2.45.8.16 [解析] 设没剔除两对数据前x,y的平均数分别为,,所以'==3=,解得m=16.9.解:(1)由题意得==5,==10,将x=15代入经验回归方程可得=0.8×15+6=18.10.B [解析] 令zi=log2yi,则=x+,由题意得=×(0+1+3+3+4)=2.2,=×(1+2+3+4+5)=3,故选B.11.ABD [解析] 由题意可知,=×(0+1+2+3+4)=2,=×(2.3+4.3+4.4+4.8+m)=×(15.8+m),将代入=0.83x+2.74,可得=0.83×2+2.74,解得m=6.2,故A正确;由m=6.2,得=4.4,所以经验回归直线必过点(2,4.4),故B正确;当x=4时,=0.83×4+2.74=6.06,则样本点(4,6.2)的残差为6.2-6.06=0.14,故C错误;因为=2,=4.4,所以x3-=2-2=0,y3-=4.4-4.4=0,又样本相关系数所以将表中的样本点(2,4.4)去掉后,样本相关系数r不变,故D正确.故选ABD.12.BCD [解析] 变量x的平均数为×(165+168+170+172+173+174+175+177+179+182)=173.5,因为离群点(168,89)的横坐标168小于平均数173.5,纵坐标89相对较大,所以去掉离群点后经验回归直线的截距变小且斜率变大,所以>,<故A错误,B正确;去掉离群点后成对样本数据的线性相关程度更强,所以|r1|<|r2|,则<,故C正确;由表格中数据可知,随着x的增大,y增大,所以>0,>0,所以D正确.故选BCD.13.① =e0.3x-4.6 [解析] 因为模型①的残差点比较均匀地落在水平的带状区域中,且带状区域的宽度比模型②的带状区域宽度窄,所以模型①的拟合精度更高,故选模型①比较合适.令z=ln y,则z与x可以用线性回归方程=+x来拟合.14.解:(1)由已知数据可得==57,==8,(3)设直播销售脐橙的利润为Z元,则Z=1000(x-0.5x-20)(-0.7x+47.9)=50(-7x2+759x-19 160),当x=≈54时,Z取得最大值,即当商品售价为54元/箱时,可使得直播销售脐橙获利最大.15.解:(1)由散点图可知,散点并非均匀分布在一条直线的两侧,而是大致分布在一条曲线的两侧,所以=z+更合适于此模型.由题意得=×(0.9+0.65+0.45+0.3+0.2)=0.5,所以估计收费标准约为150元/天时,100天销售额L最大.9.1.2 一元线性回归模型【学习目标】 1.结合具体实例,了解一元线性回归模型的含义,了解模型参数的统计意义. 2.了解最小二乘原理,掌握一元线性回归模型参数的最小二乘估计方法,会使用相关的统计软件. 3.针对实际问题,会用一元线性回归模型进行预测.◆ 知识点一 一元线性回归模型(1)随机误差具有线性相关关系的两个变量x,y,其中y的值不能由x确定,可将x,y之间的关系表示为y=a+bx+ε,其中 是确定性函数, 称为随机误差. (2)随机误差产生的主要原因①所用的确定性函数不恰当引起的误差;②忽略了某些因素的影响;③存在观测误差.(3)y= 称为一元线性回归模型.其中,y称为 或 ,x称为 或 . 【诊断分析】 判断正误.(请在括号中打“√”或“×”)(1)随机误差是一个随机变量,产生的原因是多方面的. ( )(2)在一元线性回归模型中,ε是bx+a与真实值y的随机误差,它是一个可观测的量. ( )◆ 知识点二 经验回归方程与最小二乘法1.经验回归方程把a,b的估计值记为,,则由此得到的直线=+x称为这n对数据的经验回归直线,此直线方程称为y关于x的经验回归方程,其中称为 ,称为 ,称为 . 上述求经验回归方程的方法称为“ ”,由此求得的,分别叫作b,a的 . 注意:在经验回归直线=+x中,是斜率,是截距.一般地,当>0时,说明两个变量正相关,它的意义是当x每增加一个单位时,y平均增加个单位;当<0时,说明两个变量负相关,它的意义是当x每增加一个单位时,y平均减小||个单位.2.残差与残差分析(1)残差:对于响应变量y,通过观测得到的数据称为观测值,通过经验回归方程得到的称为估计值, 与对应的 之差称为残差. (2)残差分析:残差是随机误差ε的估计结果,通过对残差的分析可以判断模型刻画数据的效果,以及判断原始数据中是否存在可疑数据等,这方面工作称为残差分析.其步骤为:计算残差→画出残差图→在残差图中分析残差特性.【诊断分析】 判断正误.(请在括号中打“√”或“×”)(1)通过经验回归方程=x+求出的是精确值. ( )(2)用最小二乘法求出的可能是正的,也可能是负的. ( )(3)经验回归直线一定经过点(,). ( )(4)残差平方和越大,线性回归模型的拟合效果越好. ( )◆ 探究点一 求经验回归方程例1 [2025·辽宁辽阳高二期末] 某产品的广告费用x(单位:万元)与销售额y(单位:万元)的一组统计数据如表:广告费用x 1.8 2.2 3 5销售额y t 7 14 16根据表格中数据得到y与x的经验回归方程为=3.75x-1.25,则t= . 变式 某制药厂今年前5个月某药品的产量y(单位:万盒)与月份代码x的一组数据如表所示,若x,y线性相关,经验回归方程为=0.6x+,则当x=6时,y的预测值为 万盒. x 1 2 3 4 5y 5 6 5 6 8例2 [2025·江苏启东中学高二月考] 某种产品2020年到2024年的年投资金额x(单位:万元)与年利润y(单位:万元)的一组数据如下.年份 2020 2021 2022 2023 2024年投资金额x 1 2 3 4 5年利润y 2.4 2.7 t 6.4 7.9由散点图知,y与x之间的关系可以用一元线性回归模型拟合,已知5年利润的平均值是4.7.(1)求表中实数t的值;(2)求y关于x的经验回归方程=x+.变式 [2025·陕西渭南高二期末] 某地区积极响应“节能减排,低碳生活”的号召,采取了一系列的措施控制碳排放.环保部门收集到2020年至2024年内新增碳排放量的一组数据,如表所示,其中x表示年份代号,y(单位:万吨)表示新增碳排放量.年份 2020 2021 2022 2023 2024年份代号x 1 2 3 4 5新增碳排放量y 6.1 5.2 4.9 4 3.8(1)请计算样本相关系数r,并说明x与y之间具有较强的线性相关程度(若|r|>0.5,则x与y之间具有较强的线性相关程度);(2)求y关于x的经验回归方程,并据此估计该地区2025年的新增碳排放量.参考数据:=3,=4.8,xiyi=66.2,=55,=118.7,≈1.87,≈5.92.[素养小结]求经验回归方程的基本步骤:(1)作出散点图,从直观上分析数据间是否存在线性相关关系;(2)计算,,,xiyi;(3)代入公式求出=x+中参数,的值;(4)写出经验回归方程.◆ 探究点二 残差及残差分析例3 某研究机构对高三年级学生的记忆力x和判断力y进行统计分析,所得数据如表:x 6 8 10 12y 2 3 5 6(1)已知y与x之间具有较强的线性相关关系,请根据表中提供的数据,用最小二乘法求出y关于x的经验回归方程=+x.(2)统计学中常通过计算残差的平方和来判断模型的拟合效果.在本题中若残差平方和小于0.5,则认为拟合效果符合要求.请判断(1)中求得的经验回归方程的拟合效果是否符合要求,并说明理由.变式 [2025·江苏淮州中学高二期中] 某工厂为研究某种产品的产量x(单位:吨)与所需某种原材料的质量y(单位:吨)之间的关系,在生产过程中收集了4对数据,如表所示.x 3 4 5 6y 2.5 3 4 m根据表中数据,得出y关于x的经验回归方程为=0.7x+.据此计算出样本点(4,3)对应的残差为-0.15,则表中m的值为 . [素养小结]残差平方和越小,模型的拟合效果越好;残差平方和越大,模型的拟合效果越差.◆ 探究点三 非线性回归分析例4 [2025·江苏淮安高二期末] 某乡政府为提高当地农民的收入,指导农民种植药材,取得较好的效果.以下是某农户2020年至2024年种植某种药材的年收入(单位:千元)的一组统计数据:年份 2020 2021 2022 2023 2024年份代码x 1 2 3 4 5年收入y 59 61 64 68 73(1)根据表中数据,现有y=a+bx与y=c+dx2两种模型可以拟合y与x之间的关系,请分别求出两种模型的回归方程.(结果保留一位小数)(2)统计学中常通过比较残差平方和来比较两个模型的拟合效果,请根据残差平方和说明上述两个方程哪一个拟合效果更好 并据此预测2025年该农户种植该种药材的年收入.参考数据:(ti-)(yi-)=217,=374,其中ti=.变式 [2025·山东青岛高二期中改编] 某市为繁荣地方经济,大力实行人才引进政策,为了解政策的效果,有关部门统计了2019年至2024年人才引进的数量y(单位:万人),并根据统计数据绘制了如图所示的散点图(其中x表示年份代码,年份代码1,2,3,4,5,6分别代表2019,2020,2021,2022,2023,2024年).(1)根据散点图判断y=bln x+a与y=ec+dx(a,b,c,d均为常数)哪一个适合作为y关于x的回归方程类型;(给出结论即可,不必说明理由)(2)根据(1)的结果及表中的数据,求出y关于x的回归方程,并预测该市2026年引进人才的数量.参考数据:(xi- )2 (xi- )(yi-) (xi- )(wi-)5.15 1.55 17.5 20.95 3.85其中=wi,wi=ln yi,e2.44≈11.47,e2.54≈12.68.[素养小结]求解非线性回归分析问题一般先换元,再根据线性回归模型的方法求解.常见的非线性回归方程的换元方法总结如下.非线性回归方程 变换公式 变换后的线性回归方程y=axb c=ln a,v=ln x,u=ln y u=c+bvy=aex c=ln a,u=ln y u=c+xy=a c=ln a,v=,u=ln y u=c+bvy=a+bln x v=ln x y=a+bvy=a+b v= y=a+bv9.1.2 一元线性回归模型1.[2025·江苏南通中学高二期中] 某产品的广告费用x(单位:万元)与销售额y(单位:万元)之间的一组数据如下:x 2 4 5 6 8y 30 40 50 60 a已知y与x的经验回归方程为=7x+15,则a等于 ( ) A.68 B.69 C.70 D.712.[2025·江苏徐州高二期末] 已知经验回归方程=2-2.5x,若变量x增加1个单位,则变量y ( )A.平均增加2.5个单位B.平均增加2个单位C.平均减少2.5个单位D.平均减少2个单位3.变量x与y之间的一组数据如表所示.x 3 4 5 6 7y 4 2.5 2 1.5 m根据表中数据,得出y关于x的经验回归方程为=-0.7x+.据此计算出样本点(4,2.5)的残差为-0.4,则表中m的值为 ( )A.1 B.1.2 C.2.2 D.2.54.[2025·福建福州高二期末] 某种病毒传播中期的感染人数y和天数x的散点图如图所示,下列最适宜作为感染人数y和天数x的回归方程类型的是 ( )A.y=a+bx B.y=a+bexC.y=a+bln x D.y=a+b5.[2025·江苏连云港高二期末] 恩格尔系数是食品支出总额占个人消费支出总额的比值,恩格尔系数越小,消费结构越完善,生活水平越高.某学校社会调查小组通过调查得到年个人消费总额x(单位:万元)与恩格尔系数y之间的一组数据,如下表:x 1 1.5 2 2.5 3y 0.9 0.8 0.5 0.2 0.1若y与x之间具有线性相关系,老张年个人消费总额为2.8万元,据此估计其恩格尔系数为( )A.0.148 B.0.138C.0.248 D.0.2386.(多选题)[2025·江苏盐城高二期末] 下列说法中正确的是 ( )A.经验回归直线必过点(,)B.当样本相关系数r>0时,两个变量正相关C.两个变量的线性相关性越强,则样本相关系数就越接近于1D.残差图中残差点所在的水平带状区域越宽,回归方程的预报精确度越低7.[2025·安徽蚌埠高二期中] 根据一组样本数据(x1,y1),(x2,y2),…,(xn,yn)求得y与x的经验回归方程为=0.85x-85.7,则样本点(165,57)的残差为 . 8.[2025·江苏常州月考] 已知变量x与y具有线性相关关系,在研究变量x与y之间的关系时,得到一组样本数据(x1,y1),(x2,y2),…,(x5,y5),(6,28),(0,28),利用此样本数据求得的经验回归方程为=x+,现发现数据(6,28)和(0,28)误差较大,剔除这两对数据后,求得的经验回归方程为=4x+m,且yi=140,则m= . 9.(13分)[2025·江苏徐州高二期末] 已知由变量x,y的一组数据绘制的散点图如图所示.(1)根据散点图计算x,y的样本相关系数r,并据此判断是否可以用一元线性回归模型拟合y与x的关系;(若|r|>0.5,则线性相关关系显著,可用一元线性回归模型拟合)(2)求y关于x的经验回归方程,并估计当x=15时对应的y值.参考数据:≈0.447.10.[2025·江苏灌南期中] 两个相关变量x和y的一组数据如下表:x 1 2 3 4 5y 1 2 8 8 16已知相关变量x和y的关系可用非线性回归方程=来拟合,则当x=6时,y的估计值为(参考数据:25.2≈37,25.5≈45) ( )A.33 B.37 C.65 D.7311.(多选题)[2025·江苏泰州高二期末] 已知x,y的一组数据如下表:x 0 1 2 3 4y 2.3 4.3 4.4 4.8 m从散点图分析可知y与x线性相关,可求得经验回归方程为=0.83x+2.74,则下列说法正确的是 ( )A.m的值为6.2B.经验回归直线必过点(2,4.4)C.样本点(4,m)的残差为0.1D.将此表中的样本点(2,4.4)去掉后,样本相关系数r不变12.(多选题)[2025·江苏镇江高二期末] 某课外兴趣小组在探究学习活动中,测得(x,y)的10对样本数据如下表:x 165 168 170 172 173 174 175 177 179 182y 55 89 61 65 67 70 75 75 78 80由最小二乘法计算得到的经验回归方程为=+x,样本相关系数为r1;经过观察散点图,分析残差,把数据(168,89)去掉后,再用剩下的9对数据计算得到的经验回归方程为=+x,样本相关系数为r2,则 ( )A.< B.<C.< D.>0,>013.[2025·宁夏石嘴山高二期中] 红铃虫是棉花的主要害虫之一,其产卵数与温度有关.现收集到一只红铃虫的产卵数y(单位:个)和温度x(单位:℃)的8对观测数据,制成如图①所示的散点图.现用模型①y=ebx+a,②y=cx2+d分别进行拟合,由此得到相应的经验回归方程并进行残差分析,进一步得到如图②所示的残差图.根据收集到的数据,计算得到如下统计量的值:(xi-)2 (ti-)2 (zi-)(xi-) (yi-)(ti-)25 2.9 646 168 422 688 50.4 70 308表中zi=ln yi,=zi,ti=,=ti.根据残差图,比较模型①,②的拟合效果,模型 (填“①”或“②”)比较合适,对应的经验回归方程为 . 14.(15分)直播带货是扶贫助农的一种新模式,这种模式是利用主流媒体的公信力,聚合销售主播的力量助力打通农产品产销链条,切实助力农民增收.某网络平台助力赣南某县脐橙的销售,下表统计了该平台2024年1月1日至5日直播销售脐橙的箱数(其中脐橙每箱5 kg):日期 1 2 3 4 5售价x(元/箱) 60 56 58 57 54销售量y(千箱) 5 9 7 10 9(1)求样本相关系数r(精确度为0.01),并判断销售量y与脐橙的售价x是否有较强的线性相关关系(当|r|∈(0.5,1]时,可以认为两个变量有较强的线性相关关系;否则,没有较强的线性相关关系).(2)建立y关于x的经验回归方程,并估计当售价为50元/箱时,该脐橙的销售量为多少千箱 (3)若脐橙的成本为(0.5x+20)元/箱,不考虑其他费用,由(2)中结论,当脐橙售价为多少时,可使得直播销售脐橙获利最大 (该结果保留整数)参考数据:≈2.236.15.(15分)[2025·江苏海门月考] 某创业者计划在某旅游景区附近租赁一套农房发展成特色“农家乐”,为了确定未来发展方向,此创业者对该景区附近五家“农家乐”跟踪调查了100天,这五家“农家乐”的收费标准互不相同,得到的统计数据如表,其中x为收费标准(单位:元/日),t为入住天数(单位:天),以频率作为各自的入住率,收费标准x与入住率y的散点图如图.x 100 150 200 300 450t 90 65 45 30 20(1)令z=ln x,由散点图判断=x+与=z+,哪个更合适于此模型(给出判断即可,不必说明理由) 并根据你的判断结果求y关于x的经验回归方程.(,的结果精确到0.1)(2)根据第(1)问所求得的经验回归方程估计收费标准为多少时,100天销售额L最大 (100天销售额L=100×入住率×收费标准x)本题参考数据:=240,=365 000,xiyi=457.5,≈5.35,≈28.57,≈144.24,ziyi≈12.72,e5≈150,e5.4≈220. 展开更多...... 收起↑ 资源列表 9.1.2 一元线性回归模型.pptx 9.1.2 一元线性回归模型 【正文】导学案.docx 9.1.2 一元线性回归模型 【正文】练习册.docx 9.1.2 一元线性回归模型 【答案】导学案.docx 9.1.2 一元线性回归模型 【答案】练习册.docx