资源简介 (共57张PPT)第八章<<<章末复习课知识网络一、线性回归分析二、独立性检验三、数形结合思想在独立性检验中的应用内容索引四、转化与化归思想在非线性回归分析中的应用线性回归分析一1.回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法.其基本步骤为通过散点图和经验选择经验回归方程的类型,然后通过一定的规则确定出相应的经验回归方程,通过一定的方法进行检验,最后应用于实际或对响应变量进行预测.2.主要培养数学建模和数据分析的素养. 某沙漠地区经过治理,生态系统得到很大改善,野生动物数量有所增加.为调查该地区某种野生动物的数量,将其分成面积相近的200个地块,从这些地块中用简单随机抽样的方法抽取20个作为样区,调查得到样本数据(xi,yi)(i=1,2,…,20),其中xi和yi分别表示第i个样区的植物覆盖面积(单位:公顷)和这例 1种野生动物的数量,并计算得xi=60,yi=1 200,(xi-)2=80,(yi-)2=9 000,(xi-)(yi-)=800.(1)求该地区这种野生动物数量的估计值(这种野生动物数量的估计值等于样区这种野生动物数量的平均数乘以地块数);由已知得样本平均数为=yi=60,从而该地区这种野生动物数量的估计值为60×200=12 000.(2)求样本(xi,yi)(i=1,2,…,20)的样本相关系数(精确到0.01);附:样本相关系数r=,≈1.414.样本(xi,yi)(i=1,2,…,20)的样本相关系数为r===≈0.94.(3)根据现有统计资料,各地块间植物覆盖面积差异很大,为提高样本的代表性以获得该地区这种野生动物数量更准确的估计,请给出一种你认为更合理的抽样方法,并说明理由.采用比例分配的分层随机抽样,根据植物覆盖面积的大小对地块分层,再对200个地块进行分层随机抽样.理由如下:由(2)知各样区的这种野生动物数量与植物覆盖面积有很强的正相关关系.由于各地块间植物覆盖面积差异很大,从而各地块间这种野生动物数量差异也很大,采用分层随机抽样的方法较好地保持了样本结构与总体结构的一致性,提高了样本的代表性,从而可以获得该地区这种野生动物数量更准确的估计.(1)画散点图.根据已知数据画出散点图.(2)判断变量的相关性并求经验回归方程.通过观察散点图,直观感知两个变量是否具有相关关系.在此基础上,利用最小二乘法求,,然后写出经验回归方程.(3)回归分析.画残差图或计算R2,进行残差分析.(4)实际应用.依据求得的经验回归方程解决实际问题.反思感悟解决回归分析问题的一般步骤跟踪训练 1 下面给出了根据某市2017年~2023年水果人均占有量y(单位:kg)和年份代码x绘制的散点图和经验回归方程的残差图(2017年~2023年的年份代码x分别为1~7).(1)根据散点图分析y与x之间的相关关系;根据散点图可知,点均匀分布在一条直线附近,且随着x的增大,y增大,故y与x成线性相关,且为正相关.(2)根据散点图相应数据计算得yi=1 074, xiyi=4 517,求y关于x的经验回归方程;依题意得,=×=4,=yi=×1 074≈153.43,=≈≈7.89,=-≈153.43-7.89×4=121.87,所以y关于x的经验回归方程为=7.89x+121.87.(3)根据经验回归方程的残差图,分析经验回归方程的拟合效果.由残差图可以看出,残差对应点分布在水平带状区域内,且宽度较窄,说明拟合效果较好,经验回归方程的预测精度较高.二独立性检验1.独立性检验研究的问题是有多大把握认为两个分类变量之间有关系.为此需先列出2×2列联表,从表格中可以直观地得到两个分类变量是否有关系.另外等高堆积条形图能更直观地反映两个分类变量之间的情况.独立性检验的思想是可以先假设二者无关系,求随机变量χ2的值,若χ2大于临界值,则拒绝假设,否则,接受假设.2.通过计算χ2的值,进而分析相关性结论的可信程度,提升数学运算、数据分析的素养.例 2 某企业为提高服务质量留住客户,从运营系统中选出300名客户,对业务水平和服务水平的评价进行统计,其中业务水平的满意率为,服务水平的满意率为,对业务水平和服务水平都满意的客户有180人.(1)完成2×2列联表;业务水平 服务水平 合计对服务水平满意人数 对服务水平不满意人数对业务水平满意人数 对业务水平不满意人数 合计 由题意可得对业务水平满意的有300×=260(人),对服务水平满意的有300×=200(人),2×2列联表如下.业务水平 服务水平 合计对服务水平满意人数 对服务水平不满意人数对业务水平满意人数 180 80 260对业务水平不满意人数 20 20 40合计 200 100 300(2)依据小概率值α=0.05的独立性检验,能否认为业务水平与服务水平有关?零假设为H0:业务水平与服务水平无关.计算得χ2==≈5.769>3.841=x0.05,依据小概率值α=0.05的独立性检验,我们推断H0不成立,即认为业务水平与服务水平有关.(1)独立性检验是一种假设检验,用于检验两个变量是否相互独立,主要依据是计算χ2的值,再利用该值与临界值xα进行比较作出判断.(2)χ2计算公式较复杂,计算时要细心.反思感悟 考察小麦种子灭菌跟黑穗病的关系,经试验观察,得到数据如表:跟踪训练 2依据小概率值α=0.05的独立性检验,能否据此推断小麦种子灭菌与发生黑穗病有关?黑穗病 种子灭菌情况 合计种子灭菌 种子未灭菌有黑穗病 26 184 210无黑穗病 50 200 250合计 76 384 460零假设为H0:小麦种子灭菌与发生黑穗病无关.由列联表的数据可得χ2=≈4.804>3.841=x0.05,根据小概率值α=0.05的独立性检验,我们推断H0不成立,可以认为小麦种子灭菌与发生黑穗病有关系.数形结合思想在独立性检验中的应用三1.数形结合思想就是在解决与几何图形有关的问题时,将图形信息转换成代数信息,利用数量特征,将其转化为代数问题;在进行回归分析时,常利用散点图、残差图等说明线性相关情况或模型的拟合效果.在独立性检验中,我们常用等高堆积条形图直观地反映数据的情况,从而可以粗略地判断两个分类变量是否有关系.2.主要培养数学抽象和数学运算的素养. 某机构为了了解患色盲是否与性别有关,随机抽取了1 000名成年人进行调查,在调查的480名男性中有38名患色盲,520名女性中有6名患色盲,分别利用图形和独立性检验(α=0.001)的方法来判断患色盲与性别是否有关.例 3根据题目所给的数据作出如下的列联表:性别 色盲 合计患色盲 未患色盲男 38 442 480女 6 514 520合计 44 956 1 000根据列联表作出相应的等高堆积条形图,如图所示.图中两个深色条的高分别表示男性和女性患色盲的频率,从图中可以看出,男性患色盲的频率明显高于女性患色盲的频率,因此我们可认为患色盲与性别有关.零假设为H0:患色盲与性别无关.根据列联表中所给的数据,得χ2=≈27.139>10.828=x0.001,根据小概率值α=0.001的独立性检验,推断H0不成立,即认为患色盲与性别有关,此推断犯错误的概率不超过0.001.反思感悟(1)两个明确:①明确两类主体;②明确研究的两个问题.(2)两个准确:①准确画出2×2列联表;②准确理解χ2.解独立性检验的应用问题的关注点 某电视传媒公司为了解某地区电视观众对某类体育节目的收视情况,随机抽取了100名观众进行调查.如图所示的是根据调查结果绘制的观众日均收看该体育节目时间的频率分布直方图.将日均收看该体育节目时间不低于40分钟的观众称为“体育迷”.跟踪训练 3(1)根据已知条件完成下面的2×2列联表,依据小概率值α=0.05的独立性检验,能否据此认为“体育迷”与性别有关?性别 “体育迷”情况 合计非体育迷 体育迷男 女 10 55合计 附:χ2=,其中n=a+b+c+d.α 0.05 0.01xα 3.841 6.635由频率分布直方图可知,在抽取的100人中,“体育迷”有25人,从而2×2列联表如下:性别 “体育迷”情况 合计非体育迷 体育迷男 30 15 45女 45 10 55合计 75 25 100零假设为H0:“体育迷”与性别无关.将2×2列联表中的数据代入公式计算,得χ2==≈3.030<3.841=x0.05,根据小概率值α=0.05的独立性检验,没有充分证据推断H0不成立,即认为“体育迷”与性别无关.(2)将上述调查所得到的频率视为概率.现在从该地区大量电视观众中,采用随机抽样方法每次抽取1名观众,抽取3次,记被抽取的3名观众中的“体育迷”人数为X.若每次抽取的结果是相互独立的,求X的分布列,均值E(X)和方差D(X).由频率分布直方图,知抽到“体育迷”的频率为0.25,将频率视为概率,即从观众中抽取一名“体育迷”的概率为.由题意知X~B,从而X的分布列为X 0 1 2 3PE(X)=3×=,D(X)=3××=.转化与化归思想在非线性回归分析中的应用四1.转化与化归思想主要体现在非线性回归分析中.在实际问题中,并非所有的变量关系均满足线性关系,故要选择适当的函数模型去拟合样本数据,再通过代数变换,把非线性问题线性化.2.主要培养数学建模和数学运算的素养. 某公司为研究某种图书每册的成本费y(单位:元)与印刷数量x(单位:千册)的关系,收集了一些数据并进行了初步处理,得到了右面的散点图及一些统计量的值.例 4(xi-)2 (xi-)·(yi-) (ui-)2 (ui-)·(yi-)15.25 3.63 0.269 2 085.5 -230.3 0.787 7.049表中ui=,=ui.(1)根据散点图判断y=a+bx与y=c+哪一个模型更适合作为该图书每册的成本费y(单位:元)与印刷数量x(单位:千册)的经验回归方程(只要求给出判断,不必说明理由);由散点图判断,y=c+更适合作为该图书每册的成本费y(单位:元)与印刷数量x(单位:千册)的经验回归方程.(2)根据(1)的判断结果及表中数据,建立y关于x的经验回归方程(结果精确到0.01);(xi-)2 (xi-)·(yi-) (ui-)2 (ui-)·(yi-)15.25 3.63 0.269 2 085.5 -230.3 0.787 7.049附:对于一组数据(ω1,υ1),(ω2,υ2),…,(ωn,υn),其经验回归直线=+ω的斜率和截距的最小二乘估计公式分别为=,=-.令u=,先建立y关于u的经验回归方程=+u,由于==≈8.96,所以=-·≈3.63-8.96×0.269≈1.22,所以y关于u的经验回归方程为=1.22+8.96u,所以y关于x的非线性经验回归方程为=1.22+.(3)若该图书每册的定价为9.22元,则至少应该印刷多少册才能使销售利润不低于80 000元?(假设能够全部售出.结果精确到1)(xi-)2 (xi-)·(yi-) (ui-)2 (ui-)·(yi-)15.25 3.63 0.269 2 085.5 -230.3 0.787 7.049假设印刷x千册,依题意得9.22x-x≥80,解得x≥11.12,所以至少印刷11 120册才能使销售利润不低于80 000元.反思感悟非线性化的回归分析问题,画出已知数据的散点图,选择跟散点图拟合得最好的函数模型进行变量代换,作出变换后样本点的散点图,用线性回归模型拟合.光伏发电是利用太阳能电池及相关设备将太阳光能直接转化为电能.近几年在国内出台的光伏发电补贴政策的引导下,某地光伏发电装机量急剧上涨,如表所示:跟踪训练 4年份 2015年 2016年 2017年 2018年 2019年 2020年 2021年 2022年年份代码x 1 2 3 4 5 6 7 8新增光伏装机量y (兆瓦) 0.4 0.8 1.6 3.1 5.1 7.1 9.7 12.2某位同学分别用两种模型:①y=bx2+a,②y=dx+c进行拟合,得到相应的经验回归方程并进行残差分析,残差图如图所示(注:残差等于yi-):经过计算得(xi-)(yi-)=72.8,(xi-)2=42,(ti-)(yi-)=686.8,(ti-)2=3 570,其中ti=,=ti.(1)根据残差图,比较模型①②的拟合效果,应该选择哪个模型?并简要说明理由.选择模型①,理由如下:根据残差图可以看出,模型①残差对应点分布在以横轴为对 称轴,宽度小于1的水平带状区域内,且模型①的残差平方和明显小于模型②,所以模型①的拟合效果相对较好.(2)根据(1)的判断结果及表中数据建立y关于x的经验回归方程,并预测该地区2025年新增光伏装机量是多少.(精确到0.01)附:经验回归直线的斜率和截距的最小二乘估计公式:=,=-.年份 2015年 2016年 2017年 2018年 2019年 2020年 2021年 2022年年份代码x 1 2 3 4 5 6 7 8新增光伏装机量y (兆瓦) 0.4 0.8 1.6 3.1 5.1 7.1 9.7 12.2由(1)知,y关于x的经验回归方程为=x2+,令t=x2,则=t+.由所给数据可得=ti=×(1+4+9+16+25+36+49+64)=25.5,=yi=×(0.4+0.8+1.6+3.1+5.1+7.1+9.7+12.2)=5,则==≈0.19,=-≈5-0.19×25.5≈0.16.所以y关于x的经验回归方程为=0.19x2+0.16.预测该地区2025年新增光伏装机量为=0.19×112+0.16=23.15(兆瓦). 一、线性回归分析1.回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法.其基本步骤为通过散点图和经验选择经验回归方程的类型,然后通过一定的规则确定出相应的经验回归方程,通过一定的方法进行检验,最后应用于实际或对响应变量进行预测.2.主要培养数学建模和数据分析的素养.例1 某沙漠地区经过治理,生态系统得到很大改善,野生动物数量有所增加.为调查该地区某种野生动物的数量,将其分成面积相近的200个地块,从这些地块中用简单随机抽样的方法抽取20个作为样区,调查得到样本数据(xi,yi)(i=1,2,…,20),其中xi和yi分别表示第i个样区的植物覆盖面积(单位:公顷)和这种野生动物的数量,并计算得xi=60,yi=1 200,(xi-)2=80,(yi-)2=9 000,(xi-)(yi-)=800.(1)求该地区这种野生动物数量的估计值(这种野生动物数量的估计值等于样区这种野生动物数量的平均数乘以地块数);(2)求样本(xi,yi)(i=1,2,…,20)的样本相关系数(精确到0.01);(3)根据现有统计资料,各地块间植物覆盖面积差异很大,为提高样本的代表性以获得该地区这种野生动物数量更准确的估计,请给出一种你认为更合理的抽样方法,并说明理由.附:样本相关系数r=,≈1.414.反思感悟 解决回归分析问题的一般步骤(1)画散点图.根据已知数据画出散点图.(2)判断变量的相关性并求经验回归方程.通过观察散点图,直观感知两个变量是否具有相关关系.在此基础上,利用最小二乘法求,,然后写出经验回归方程.(3)回归分析.画残差图或计算R2,进行残差分析.(4)实际应用.依据求得的经验回归方程解决实际问题.跟踪训练1 下面给出了根据某市2017年~2023年水果人均占有量y(单位:kg)和年份代码x绘制的散点图和经验回归方程的残差图(2017年~2023年的年份代码x分别为1~7).(1)根据散点图分析y与x之间的相关关系;(2)根据散点图相应数据计算得yi=1 074, xiyi=4 517,求y关于x的经验回归方程;(3)根据经验回归方程的残差图,分析经验回归方程的拟合效果.二、独立性检验1.独立性检验研究的问题是有多大把握认为两个分类变量之间有关系.为此需先列出2×2列联表,从表格中可以直观地得到两个分类变量是否有关系.另外等高堆积条形图能更直观地反映两个分类变量之间的情况.独立性检验的思想是可以先假设二者无关系,求随机变量χ2的值,若χ2大于临界值,则拒绝假设,否则,接受假设.2.通过计算χ2的值,进而分析相关性结论的可信程度,提升数学运算、数据分析的素养.例2 某企业为提高服务质量留住客户,从运营系统中选出300名客户,对业务水平和服务水平的评价进行统计,其中业务水平的满意率为,服务水平的满意率为,对业务水平和服务水平都满意的客户有180人.(1)完成2×2列联表;业务水平 服务水平 合计对服务水平 满意人数 对服务水平 不满意人数对业务水平 满意人数对业务水平 不满意人数合计(2)依据小概率值α=0.05的独立性检验,能否认为业务水平与服务水平有关?反思感悟 (1)独立性检验是一种假设检验,用于检验两个变量是否相互独立,主要依据是计算χ2的值,再利用该值与临界值xα进行比较作出判断.(2)χ2计算公式较复杂,计算时要细心.跟踪训练2 考察小麦种子灭菌跟黑穗病的关系,经试验观察,得到数据如表:黑穗病 种子灭菌情况 合计种子灭菌 种子未灭菌有黑穗病 26 184 210无黑穗病 50 200 250合计 76 384 460依据小概率值α=0.05的独立性检验,能否据此推断小麦种子灭菌与发生黑穗病有关?三、数形结合思想在独立性检验中的应用1.数形结合思想就是在解决与几何图形有关的问题时,将图形信息转换成代数信息,利用数量特征,将其转化为代数问题;在进行回归分析时,常利用散点图、残差图等说明线性相关情况或模型的拟合效果.在独立性检验中,我们常用等高堆积条形图直观地反映数据的情况,从而可以粗略地判断两个分类变量是否有关系.2.主要培养数学抽象和数学运算的素养.例3 某机构为了了解患色盲是否与性别有关,随机抽取了1 000名成年人进行调查,在调查的480名男性中有38名患色盲,520名女性中有6名患色盲,分别利用图形和独立性检验(α=0.001)的方法来判断患色盲与性别是否有关.反思感悟 解独立性检验的应用问题的关注点(1)两个明确:①明确两类主体;②明确研究的两个问题.(2)两个准确:①准确画出2×2列联表;②准确理解χ2.跟踪训练3 某电视传媒公司为了解某地区电视观众对某类体育节目的收视情况,随机抽取了100名观众进行调查.如图所示的是根据调查结果绘制的观众日均收看该体育节目时间的频率分布直方图.将日均收看该体育节目时间不低于40分钟的观众称为“体育迷”.(1)根据已知条件完成下面的2×2列联表,依据小概率值α=0.05的独立性检验,能否据此认为“体育迷”与性别有关?性别 “体育迷”情况 合计非体育迷 体育迷男女 10 55合计(2)将上述调查所得到的频率视为概率.现在从该地区大量电视观众中,采用随机抽样方法每次抽取1名观众,抽取3次,记被抽取的3名观众中的“体育迷”人数为X.若每次抽取的结果是相互独立的,求X的分布列,均值E(X)和方差D(X).附:χ2=,其中n=a+b+c+d.α 0.05 0.01xα 3.841 6.635四、转化与化归思想在非线性回归分析中的应用1.转化与化归思想主要体现在非线性回归分析中.在实际问题中,并非所有的变量关系均满足线性关系,故要选择适当的函数模型去拟合样本数据,再通过代数变换,把非线性问题线性化.2.主要培养数学建模和数学运算的素养.例4 某公司为研究某种图书每册的成本费y(单位:元)与印刷数量x(单位:千册)的关系,收集了一些数据并进行了初步处理,得到了下面的散点图及一些统计量的值.(xi-)2 (xi-)·(yi-) (ui-)2 (ui-)·(yi-)15.25 3.63 0.269 2 085.5 -230.3 0.787 7.049表中ui=,=ui.(1)根据散点图判断y=a+bx与y=c+哪一个模型更适合作为该图书每册的成本费y(单位:元)与印刷数量x(单位:千册)的经验回归方程(只要求给出判断,不必说明理由);(2)根据(1)的判断结果及表中数据,建立y关于x的经验回归方程(结果精确到0.01);(3)若该图书每册的定价为9.22元,则至少应该印刷多少册才能使销售利润不低于80 000元?(假设能够全部售出.结果精确到1)附:对于一组数据(ω1,υ1),(ω2,υ2),…,(ωn,υn),其经验回归直线=+ω的斜率和截距的最小二乘估计公式分别为=,=-.反思感悟 非线性化的回归分析问题,画出已知数据的散点图,选择跟散点图拟合得最好的函数模型进行变量代换,作出变换后样本点的散点图,用线性回归模型拟合.跟踪训练4 光伏发电是利用太阳能电池及相关设备将太阳光能直接转化为电能.近几年在国内出台的光伏发电补贴政策的引导下,某地光伏发电装机量急剧上涨,如表所示:年份 2015年 2016年 2017年 2018年 2019年 2020年 2021年 2022年年份代码x 1 2 3 4 5 6 7 8新增光伏装机量y(兆瓦) 0.4 0.8 1.6 3.1 5.1 7.1 9.7 12.2某位同学分别用两种模型:①y=bx2+a,②y=dx+c进行拟合,得到相应的经验回归方程并进行残差分析,残差图如图所示(注:残差等于yi-):经过计算得(xi-)(yi-)=72.8,(xi-)2=42,(ti-)(yi-)=686.8,(ti-)2=3 570,其中ti=,=ti.(1)根据残差图,比较模型①②的拟合效果,应该选择哪个模型?并简要说明理由.(2)根据(1)的判断结果及表中数据建立y关于x的经验回归方程,并预测该地区2025年新增光伏装机量是多少.(精确到0.01)附:经验回归直线的斜率和截距的最小二乘估计公式:=,=-.答案精析例1 解 (1) 由已知得样本平均数为=yi=60,从而该地区这种野生动物数量的估计值为60×200=12 000.(2)样本(xi,yi)(i=1,2,…,20)的样本相关系数为r===≈0.94.(3)采用比例分配的分层随机抽样,根据植物覆盖面积的大小对地块分层,再对200个地块进行分层随机抽样.理由如下:由(2)知各样区的这种野生动物数量与植物覆盖面积有很强的正相关关系.由于各地块间植物覆盖面积差异很大,从而各地块间这种野生动物数量差异也很大,采用分层随机抽样的方法较好地保持了样本结构与总体结构的一致性,提高了样本的代表性,从而可以获得该地区这种野生动物数量更准确的估计.跟踪训练1 解 (1)根据散点图可知,点均匀分布在一条直线附近,且随着x的增大,y增大,故y与x成线性相关,且为正相关.(2)依题意得,=×=4,=yi=×1 074≈153.43,=≈≈7.89,=-≈153.43-7.89×4=121.87,所以y关于x的经验回归方程为=7.89x+121.87.(3)由残差图可以看出,残差对应点分布在水平带状区域内,且宽度较窄,说明拟合效果较好,经验回归方程的预测精度较高.例2 解 (1)由题意可得对业务水平满意的有300×=260(人),对服务水平满意的有300×=200(人),2×2列联表如下.业务水平 服务水平 合计对服务水平满意人数 对服务水平 不满意人数对业务水平满意人数 180 80 260对业务水平不满意人数 20 20 40合计 200 100 300(2)零假设为H0:业务水平与服务水平无关.计算得χ2==≈5.769>3.841=x0.05,依据小概率值α=0.05的独立性检验,我们推断H0不成立,即认为业务水平与服务水平有关.跟踪训练2 解 零假设为H0:小麦种子灭菌与发生黑穗病无关.由列联表的数据可得χ2=≈4.804>3.841=x0.05,根据小概率值α=0.05的独立性检验,我们推断H0不成立,可以认为小麦种子灭菌与发生黑穗病有关系.例3 解 根据题目所给的数据作出如下的列联表:性别 色盲 合计患色盲 未患色盲男 38 442 480女 6 514 520合计 44 956 1 000根据列联表作出相应的等高堆积条形图,如图所示.图中两个深色条的高分别表示男性和女性患色盲的频率,从图中可以看出,男性患色盲的频率明显高于女性患色盲的频率,因此我们可认为患色盲与性别有关.零假设为H0:患色盲与性别无关.根据列联表中所给的数据,得χ2=≈27.139>10.828=x0.001,根据小概率值α=0.001的独立性检验,推断H0不成立,即认为患色盲与性别有关,此推断犯错误的概率不超过0.001.跟踪训练3 解 (1)由频率分布直方图可知,在抽取的100人中,“体育迷”有25人,从而2×2列联表如下:性别 “体育迷”情况 合计非体育迷 体育迷男 30 15 45女 45 10 55合计 75 25 100零假设为H0:“体育迷”与性别无关.将2×2列联表中的数据代入公式计算,得χ2==≈3.030<3.841=x0.05,根据小概率值α=0.05的独立性检验,没有充分证据推断H0不成立,即认为“体育迷”与性别无关.(2)由频率分布直方图,知抽到“体育迷”的频率为0.25,将频率视为概率,即从观众中抽取一名“体育迷”的概率为.由题意知X~B,从而X的分布列为X 0 1 2 3PE(X)=3×=,D(X)=3××=.例4 解 (1)由散点图判断,y=c+更适合作为该图书每册的成本费y(单位:元)与印刷数量x(单位:千册)的经验回归方程.(2)令u=,先建立y关于u的经验回归方程=+u,由于==≈8.96,所以=-·≈3.63-8.96×0.269≈1.22,所以y关于u的经验回归方程为=1.22+8.96u,所以y关于x的非线性经验回归方程为=1.22+.(3)假设印刷x千册,依题意得9.22x-x≥80,解得x≥11.12,所以至少印刷11 120册才能使销售利润不低于80 000元.跟踪训练4 解 (1)选择模型①,理由如下:根据残差图可以看出,模型①残差对应点分布在以横轴为对 称轴,宽度小于1的水平带状区域内,且模型①的残差平方和明显小于模型②,所以模型①的拟合效果相对较好.(2)由(1)知,y关于x的经验回归方程为=x2+,令t=x2,则=t+.由所给数据可得=ti=×(1+4+9+16+25+36+49+64)=25.5,=yi=×(0.4+0.8+1.6+3.1+5.1+7.1+9.7+12.2)=5,则==≈0.19,=-≈5-0.19×25.5≈0.16.所以y关于x的经验回归方程为=0.19x2+0.16.预测该地区2025年新增光伏装机量为=0.19×112+0.16=23.15(兆瓦). 展开更多...... 收起↑ 资源列表 章末复习课(导学案,含答案).docx 第八章 章末复习课.pptx