资源简介 第八章 成对数据的统计分析第二练 数学思想训练【试题来源】来自名校、重点市区的月考、期中、期末的优质试题.【试题难度】难度中等,配合第二课的题型训练,加强考点的理解和扩展.【目标分析】1.会利用函数思想、方程思想解题,培养数学抽象,如第2题.2.会利用数形结合思想解题,锻炼数学建模能力,如第1,3题.(2024·四川成都·二模)1.对变量有观测数据,得散点图1;对变量有观测数据,得散点图2.表示变量之间的线性相关系数,表示变量之间的线性相关系数,则下列说法正确的是( )A.变量与呈现正相关,且 B.变量与呈现负相关,且C.变量与呈现正相关,且 D.变量与呈现负相关,且2.已知变量与的一组数据如下表所示,根据数据得到关于的回归方程为.1 2 3 4若,则( )A.6 B.7 C.8 D.(2024·四川广安·二模)3.某公司收集了某商品销售收入(万元)与相应的广告支出(万元)共10组数据(),绘制出如下散点图,并利用线性回归模型进行拟合.若将图中10个点中去掉点后再重新进行线性回归分析,则下列说法正确的是( )A.决定系数变小 B.残差平方和变小C.相关系数的值变小 D.解释变量与预报变量相关性变弱(23-24高三下·上海浦东新·期中)4.通过随机抽样,我们绘制了如图所示的某种商品每千克价格(单位:百元)与该商品消费者年需求量(单位:千克)的散点图.若去掉图中右下方的点后,下列说法正确的是( )A.“每千克价格”与“年需求量”这两个变量由负相关变为正相关B.“每千克价格”与“年需求量”这两个变量的线性相关程度不变C.“每千克价格”与“年需求量”这两个变量的线性相关系数变大D.“每千克价格”与“年需求量”这两个变量的线性相关系数变小(23-24高二下·江西赣州·期中)5.给定两个随机变量的5组成对数据:,,,,.通过计算,得到关于的线性回归方程为,则( )A.1 B.1.1 C.0.9 D.1.156.已知在最小二乘法原理下,具有相关关系的变量x,y之间的线性回归方程为,且变量x,y之间的相关数据如表所示,则下列说法正确的是( )x 6 8 10 12y 6 m 3 2A.变量x,y之间呈现正相关关系 B.可以预测,当时,C.可求得表中 D.由表格数据知,该回归直线必过点(2023·武汉调研)7.某班级学生开展课外数学探究活动,将一杯冷水从冰箱中取出后静置,在的室温下测量水温单位随时间(单位:)的变化关系,在测量了15个数据后,根据这些实验数据得到如下的散点图:现需要选择合适的回归方程进行回归分析,则根据散点图,合适的回归方程类型有( )A. B.C. D.(2024·湖北·一模)8.某校为了解高一新生对数学是否感兴趣,从400名女生和600名男生中通过分层抽样的方式随机抽取100名学生进行问卷调查,将调查的结果得到如下等高堆积条形图和列联表,则( )性别 数学兴趣 合计感兴趣 不感兴趣女生男生合计 100参考数据:本题中0.1 0.05 0.01 0.005 0.0012.706 3.841 6.635 7.879 10.828A.表中B.可以估计该校高一新生中对数学不感兴趣的女生人数比男生多C.根据小概率值的独立性检验,可以认为性别与对数学的兴趣有差异D.根据小概率值的独立性检验,可以认为性别与对数学的兴趣没有差异9.已知x和y的散点图如图所示,在相关关系中,若用拟合时的决定系数为,用拟合时的决定系数为,则,中较大的是 .10.2019年7月15日,某市物价部门对本市的5家商场的某商品的一天销售量及其价格进行调查,5家商场的售价元和销售量件之间的一组数据如下表所示:价格 9 9.5 10.5 11销售量 11 8 6 5可知,销售量与价格之间有较强的线性相关关系,其线性回归方程是,且,则其中的 .(2023高三上·全国·专题练习)11.如图是我国2014年至2020年年生活垃圾无害化处理量(单位:亿吨)的折线图.注:年份代码1~7分别对应年份2014~2020.由折线图看出,可用线性回归模型拟合y与t的关系,请用相关系数加以说明.参考数据:=9.32,=40.17,=0.55,≈2.646.参考公式:相关系数(2024·宁夏吴忠·模拟预测)12.配速是马拉松运动中常使用的一个概念,是速度的一种,是指每公里所需要的时间,相比配速,把心率控制在一个合理水平是安全理性跑马拉松的一个重要策略.图1是一名马拉松跑者的心率(单位:次/分钟)和配速(单位:分钟/公里)的散点图,图2是一次马拉松比赛(全程约42公里)前3000名跑者成绩(单位:分钟)的频率分布直方图.(1)由散点图看出,可用线性回归模型拟合与的关系,求与的线性回归方程;(2)该跑者如果参加本次比赛,将心率控制在160次/分钟左右跑完全程,估计他跑完全程花费的时间,并估计他能获得的名次,参考公式:线性回归方程中,,.13.在国家积极推动美丽乡村建设的政策背景下,各地根据当地生态资源打造了众多特色纷呈的乡村旅游胜地.某人意图将自己位于乡村旅游胜地的房子改造成民宿用于出租,在旅游淡季随机选取100天,对当地已有的六间不同价位的民宿进行跟踪,统计其出租率,设民宿租金为(单位:元/日),得到如图的数据散点图.(1)若用“出租率”近似估计旅游淡季民宿每天租出去的概率,求租金为388元的那间民宿在淡季内的3天中至少有2天闲置的概率.(2)(i)根据散点图判断,与哪个更适合此模型(给出判断即可,不必说明理由)?根据判断结果求经验回归方程.(ii)若该地一年中旅游淡季约为280天,在此期间无论民宿是否出租,每天都要付出的固定成本,若民宿出租,则每天需要再付出的日常支出成本.试用(i)中模型进行分析,旅游淡季民宿租金定为多少元时,该民宿在这280天的收益达到最大.附:记,,,,,,,,,,.【易错题目】第题【复盘要点】非线性回归方程问题【典例】为了更好地指导青少年健康饮食,某机构调查了本地区不同身高的未成年男性,得到他们的体重的平均值,并对数据作了初步处理,得到下面的散点图及一些统计量的值.13531.63.440001.62413.580注:表中.(1)根据散点图判断,可采用作为这个地区未成年男性体重y(千克)与身高x(厘米)的回归方程.利用表中数据建立y关于x的回归方程.(2)若体重超过相同身高男性体重平均值的1.2倍为偏胖,低于0.8倍为偏瘦,那么该地区一名身高为175厘米,体重为78千克的在校男生的体重是否正常?参考数据:,,.参考公式:对于一组数据,,…,,其经验回归直线的斜率和截距的最小二乘估计分别为,.【解】(1)由,得.设,则由表格中数据,得,,则,,,,所以y关于x的回归方程为.(2)当时,,因为,所以该名在校男生的体重偏胖.【解题策略】本题考查了非线性回归模型,对两边取对数得,再利用换元法转化为求方程,把非线性回归模型转化为一元线性回归模型,利用最小二乘法可求解.【易错警示】回归分析问题的类型及解题方法(1)求经验回归方程(i)当两个系数均未知时,可利用公式法求解;(ii)当两个系数已知一个求另一个时,可利用经验回归直线过样本点的中心求解.(2)利用经验回归方程进行预测,把经验回归方程看作一次函数,求函数值.(3)经验回归方程的拟合效果可以利用相关系数判断,当|r|越趋近于1时,两变量的线性相关性越强.【复盘训练】(23-24高二下·吉林长春·阶段练习)14.用模型拟合一组数,若,,设,得变换后的线性回归方程为,则( )A.20240 B. C. D.2024(23-24高三下·山东·开学考试)15.为研究某池塘中水生植物的覆盖水塘面积(单位:)与水生植物的株数(单位:株)之间的相关关系,收集了4组数据,用模型去拟合与的关系,设与的数据如表格所示:得到与的线性回归方程,则( )3 4 6 72 2.5 4.5 7A.-2 B.-1 C. D.(23-24高三上·内蒙古呼和浩特·期末)16.用模型拟合一组数据组,其中,设,得变换后的线性回归方程为,则( )A. B. C.35 D.21(23-24高二下·河南驻马店·阶段练习)17.以曲线拟合一组数据时,经代换后的线性回归方程为,则 , .(21-22高三上·四川成都·期末)18.为帮助乡村脱贫,某勘探队计划了解当地矿脉某金属的分布情况,测得了平均金属含量(单位:)与样本对原点的距离(单位:m)的数据,并作了初步处理,得到了下面的一些统计理的值.(表中,)6 97.90 0.21 60 0.14 14.12 26.13(1)利用样本相关系数的知识,判断与哪一个更适宜作为平均金属含量关于样本对原点的距离的回归方程类型?(2)根据(1)的结果回答下列问题:①建立关于的回归方程;②样本对原点的距离时,金属含量的预报值是多少?附:对于一组数据,其线性相关系数,其回归直线的斜率和截距的最小二乘估计分别为:,.(23-24高三上·湖南衡阳·阶段练习)19.为了加快实现我国高水平科技自立自强,某科技公司逐年加大高科技研发投入.下图1是该公司2013年至2022年的年份代码x和年研发投入y(单位:亿元)的散点图,其中年份代码1 10分别对应年份2013 2022. 根据散点图,分别用模型①,②作为年研发投入y(单位:亿元)关于年份代码x的经验回归方程模型,并进行残差分析,得到图2所示的残差图.结合数据,计算得到如下表所示的一些统计量的值:75 2.25 82.5 4.5 120 28.35表中,.(1)根据残差图,判断模型①和模型②哪一个更适宜作为年研发投入y(单位:亿元)关于年份代码x的经验回归方程模型 并说明理由;(2)(i)根据(1)中所选模型,求出y关于x的经验回归方程;(ii)设该科技公司的年利润(单位:亿元)和年研发投入y(单位:亿元)满足(且),问该科技公司哪一年的年利润最大 附:对于一组数据,,…,,其经验回归直线的斜率和截距的最小二乘估计分别为,.(2024·甘肃·一模)20.下表是2017年至2021年连续5年全国研究生在学人数的统计表:年份序号 1 2 3 4 5人数(万人) 263 273 286 314 334(1)现用模型作为回归方程对变量与的关系进行拟合,发现该模型的拟合度很高.请计算该模型所表示的回归方程(与精确到0.01);(2)已知2021年全国硕士研究生在学人数约为267.2万人,某地区在学硕士研究生人数占该地在学研究生的频率值与全国的数据近似.当年该地区要在本地区在学研究生中进行一项网络问卷调查,每位在学研究生均可进行问卷填写.某天某时段内有4名在学研究生填写了问卷,X表示填写问卷的这4人中硕士研究生的人数,求X的分布列及数学期望.参考公式及数据:对于回归方程试卷第1页,共3页试卷第1页,共3页参考答案:1.C【分析】利用散点图,结合相关系数的知识可得答案.【详解】由题意可知,变量的散点图中,随的增大而增大,所以变量与呈现正相关;再分别观察两个散点图,图比图点更加集中,相关性更好,所以线性相关系数.故选:C.2.B【分析】令,则,因为满足,故可求出,结合条件即可求得.【详解】由,得,令,则,由题意因为满足,所以,解得,所以,所以,令,解得.故选:B3.B【分析】从图中分析得到去掉点后,回归效果更好,再由决定系数,残差平方和,相关系数和相关性的概念和性质作出判断.【详解】从图中可以看出点较其他点,偏离直线远,故去掉点后,回归效果更好,故决定系数会变大,更接近于1,残差平方和变小,相关系数的绝对值,即会更接近于1,由图可得与正相关,故会更接近于1,即相关系数的值变大,解释变量与预报变量相关性变强,故A、C、D错误,B正确.故选:B.4.D【分析】根据相关系数的概念逐一判断.【详解】对于A:去掉图中右下方的点后,根据图象,两个变量还是负相关,A错误;对于BCD:去掉图中右下方的点后,相对来说数据会集中,相关程度会更高,但因为是负相关,相关系数会更接近线性相关系数会变小,故D正确,BC错误.故选:D.5.A【分析】根据回归直线必过样本中心点求解即可.【详解】因为,,所以,解得,故选:A6.D【分析】由x与y的线性回归方程中x系数的正负可判断选项A;把代入回归直线方程算出的值可判断选项B;先根据表格中的数据求出样本中心点,再将其代入线性回归方程,解之即可得m的值,从而判断C,D.【详解】解:由x与y的线性回归方程可知,,变量x,y之间呈现负相关关系,即A错误;当时,,即B错误;由表中数据可知,,,根据样本中心点必在线性回归方程上,有,解得,即C错误;,,样本中心点为,即D正确.故选:D.【点睛】本题考查结尾回归直线方程,线性回归直线必定数据的中心点,用回归直线方程可对结论进行预测,要注意预测值不是确定的结果.7.AC【分析】散点图的特点是单调递增,增长速度越来越慢,且,根据特点对选项一一判断即可.【详解】散点图的特点是单调递增,增长速度越来越慢,且对A选项,符合散点图的特点;对B选项,有不符合散点图的特点;对C选项,符合散点图的特点;对D选项,的增长速度不变,不符合散点图的特点;故选:AC8.ACD【分析】根据分层抽样的定义及等高条形图的特点即可得出的列联表中的数据,利用列联表中的数据计算观测值,再跟临界值进行比较即可求解.【详解】由题可知,抽取男生人数为人,女生抽取的人数人,由等高条形图知,抽取男生感兴趣的人数为人,抽取男生不感兴趣的人数为人,抽取女生感兴趣的人数为人,抽取女生不感兴趣的人数为人,的列联表如下性别 数学兴趣 合计感兴趣 不感兴趣女生男生合计 100由此表可知,,故A正确;女生不感兴趣的人数约为人,男生不感兴趣的人数约为人,所以估计该校高一新生中对数学不感兴趣的女生人数比男生少,故B 错误;零假设为:性别与对数学的兴趣没有差异依据小概率值的独立性检验,有充分证据推断不成立,因此可以认为不成立,即可以认为性别与对数学的兴趣有差异;故C正确;零假设为:性别与对数学的兴趣没有差异依据小概率值的独立性检验,没有充分证据推断不成立,因此可以认为成立,即可以认为性别与对数学的兴趣没有差异;故D正确.故选:ACD.9.【分析】根据散点图的分布情况判断可得.【详解】由散点图知,用拟合的效果比拟合的效果要好,所以,故较大者为.故答案为:10.10【分析】计算,代入回归直线方程,与结合,求解出的值.【详解】依题意,代入回归直线方程得①,根据题意②,解①②组成的方程组得,故填.【点睛】本小题主要考查回归直线方程过样本中心点,考查方程的思想,属于基础题.11.答案见解析【分析】根据相关系数计算即可.【详解】由折线图中数据和附注中参考数据得=4,,,,.因为y与t的相关系数近似为0.99,说明y与t的线性相关程度相当高,从而可以用线性回归模型拟合y与t的关系.12.(1)(2)210分钟,192名【分析】(1)先计算出,代入公式求出,得到线性回归方程;(2)代入,求出,计算出所花时间为分钟,频率分布直方图分析出有的跑者成绩超过该跑者,从而求出答案.【详解】(1)由散点图中数据和参考数据得,,,.关于的线性回归方程为;(2)将代入,得.该跑者跑完马拉松全程所花时间为分钟.从马拉松比赛的频率分布直方图可知成绩好于210分钟的累计频率为:,有的跑者成绩超过该跑者.则该跑者在本次比赛获得名次大约是名.13.(1)0.896;(2)(i);(ii)181.【分析】(1)由二项分布的概率公式即可求解;(2)(i)根据所给数据直接代入公式计算出即可得回归方程;(ii)根据题意表示出,然后求导,利用导数即可求解.【详解】(1)因为每天的出租率为0.2,所以每天闲置的概率为,所以3天中至少有2天闲置的概率.(2)(i)根据散点图的分布情况,各散点连线更贴近的图象,故的拟合效果更好.依题意,,,所以,所以,所以经验回归方程为.(ii)设旅游淡季民宿租金为,则淡季该民宿的出租率,所以该民宿在这280天的收益为:,所以.令,得,所以,且当时,,时,,所以在上单调递增,在上单调递减,所以当时,取得最大值.所以旅游淡季民宿租金定为181元时,该民宿在这280天的收益达到最大.14.C【分析】先计算,代入线性回归方程求得,再计算即可.【详解】由条件可知,代入,则,故C正确.故选:C15.C【分析】根据已知条件,求得,进而代入回归方程可求得,从而得出,联立,即可求得本题答案.【详解】由已知可得,,,所以,有,解得,所以,,由,得,所以,,则.故选:C.16.B【分析】求出,即,得到答案.【详解】由题意得,故,即,故,解得.故选:B17. 3【分析】利用对数的运算法则结合回归方程求解即可.【详解】因为,所以=,令,则,又因为,所以,则.故答案为:.18.(1)更适宜;(2)①;②【分析】(1)分别求出与所对应的线性相关系数,然后比较大小即可判断.(2)根据数据和公式即可求得关于的回归方程,根据回归方程代入,即可求出金属含量的预报值.【详解】(1)由题的线性相关系数,的线性相关系数,因为,所以,所以更适宜作为平均金属含量关于样本对原点的距离的回归方程类型.(2)①由(1),令,,则,所以,,则,即.②当时,金属含量的预报值19.(1)选择模型②更适宜,理由见解析(2)(i);(ii)该公司2028年的年利润最大【分析】(1)根据残差图确定;(2)根据最小二乘法求非线性回归方程即可求解;【详解】(1)根据图2可知,模型①的残差波动性很大,说明拟合关系较差;模型②的残差波动性很小,基本分布在0的附近,说明拟合关系很好,所以选择模型②更适宜.(2)(i)设,所以,所以,,所以关于的经验回归方程为(ii)由题设可得,当取对称轴即,即时,年利润L有最大值,故该公司2028年的年利润最大.20.(1)(2)分布列见解析,3.2人.【分析】(1)令,转化为线性回归方程的求法,代入公式计算即可;(2)根据题意,按公式计算概率得到分布列和期望即可.【详解】(1)可令,则与成线性回归关系,则的对应关系如下图:4 9 16 25 36263 273 286 314 334根据公式可得,则,,则,,所以,,则.(2)可求得该地区硕士研究生在学生数占总在学研究生人数的频率值为,可知,因此随机变量的分布列如下:0 1 2 3 4(人).答案第1页,共2页答案第1页,共2页第八章 成对数据的统计分析第二课 提炼本章思想题型一 数形结合思想例1下图是某地区2000年至2016年环境基础设施投资额y(单位:亿元)的折线图.为了预测该地区2018年的环境基础设施投资额,建立了y与时间变量t的两个线性回归模型.根据2000年至2016年的数据(时间变量t的值依次为1,2,…,17)建立模型①:;根据2010年至2016年的数据(时间变量t的值依次为1,2,…,7)建立模型②:.(1)分别利用这两个模型,求该地区2018年的环境基础设施投资额的预测值.(2)你认为用哪个模型得到的预测值更可靠?并说明理由.【思路分析】(1)两个线性回归方程中无参数,所以分别求2018年所对应的函数值即得结果;(2)根据折线图知2000年到2009年,与2010年到2016年间直线有明显区别,且2010年到2016年的增幅明显高于2000年到2009年的增幅,也高于模型①的增幅,因此用模型②能更好地得到2018年的预测值.【解】(1)利用模型①,该地区2018年的环境基础设施投资额的预测值为(亿元).利用模型②,该地区2018年的环境基础设施投资额的预测值为(亿元).(2)利用模型②得到的预测值更可靠.理由如下:(ⅰ)从折线图可以看出,2000年至2016年的数据对应的点没有随机散布在直线上下,这说明利用2000年至2016年的数据建立的线性模型①不能很好地描述环境基础设施投资额的变化趋势.2010年相对2009年的环境基础设施投资额有明显增加,2010年至2016年的数据对应的点位于一条直线的附近,这说明从2010年开始环境基础设施投资额的变化规律呈线性增长趋势,利用2010年至2016年的数据建立的线性模型可以较好地描述2010年以后的环境基础设施投资额的变化趋势,因此利用模型②得到的预测值更可靠.(ⅱ)从计算结果看,相对于2016年的环境基础设施投资额220亿元,由模型①得到的预测值226.1亿元的增幅明显偏低,而利用模型②得到的预测值的增幅比较合理,说明利用模型②得到的预测值更可靠.(以上给出了2种理由,答出其中任意一种或其他合理理由均可)【方法总结】数形结合“以形助数”和“以数辅形”.若已知线性回归方程,则可以直接将数值代入求得特定要求下的预测值;若线性回归方程有待定参数,则根据线性回归直线恒过点求参数.【变式训练1-1】[课标全国Ⅰ文2020·5,5分]1.某校一个课外学习小组为研究某作物种子的发芽率y和温度x(单位:°C)的关系,在20个不同的温度条件下进行种子发芽实验,由实验数据得到下面的散点图:由此散点图,在10°C至40°C之间,下面四个回归方程类型中最适宜作为发芽率y和温度x的回归方程类型的是( )A. B.C. D.【变式训练1-2】(23-24高二下·陕西西安·阶段练习)2.近年来,长安区大力发展大花卉产业,其中玫瑰既有观赏价值也能加工成食品和高档化妆品而得到环山路一带农民大面种植.已知玫瑰的株高y(单位:cm)与一定范围内的温度x(单位:)有关,现收集了玫瑰的13组观测数据,得到如下的散点图:现根据散点图利用或建立y关于x的回归方程,令,得到如下数据:10.15 109.94 3.04 0.1613.94 11.67 0.21 21.22且与的相关系数分别为,,且.(1)用相关系数说明哪种模型建立y与x的回归方程更合适;(2)根据(1)的结果及表中数据,建立y关于x的回归方程;(3)已知玫瑰的利润z与x、y的关系为,当x为何值时,z的预期最大.参考数据和公式:,,,对于一组数据,其回归直线方程的斜率和截距的最小二乘法估计分别为,,相关系数.【变式训练1-3】(2024·辽宁·模拟预测)3.土壤食物网对有机质的分解有两条途径,即真菌途径和细菌途径.在不同的土壤生态系统中,由于提供能源的有机物其分解的难易程度不同,这两条途径所起的作用也不同.以细菌分解途径为主导的土壤,有机质降解快,氮矿化率高,有利于养分供应,以真菌途径为主的土壤,氮和能量转化比较缓慢,有利于有机质存财和氮的固持.某生物实验小组从一种土壤数据中随机抽查并统计了8组数据,如下表所示:编号 1 2 3 4 5 6 7 8细菌百万个 70 80 90 100 110 120 130 140真菌百万个 8.0 10.0 12.5 15.0 17.5 21.0 27.0 39.0其散点图如下,散点大致分布在指数型函数的图象附近.(1)求关于的经验回归方程(系数精确到0.01);(2)在做土壤相关的生态环境研究时,细菌与真菌的比值能够反映土壤的碳氮循环.以样本的频率估计总体分布的概率,若该实验小组随机抽查8组数据,再从中任选4组,记真菌(单位:百万个)与细菌(单位:百万个)的数值之比位于区间内的组数为,求的分布列与数学期望.附:经验回归方程的斜率和截距的最小二乘估计公式分别为,题型二 函数方程思想例2(23-24高三下·四川绵阳·阶段练习)某车间加工零件的数量与加工时间的统计数据如表:零件数(个) 18 20 22加工时间(分) 27 33现已求得上表数据的回归方程中的值为0.9,则据此回归模型可以预测,加工100个零件所需要的加工时间约为102分钟,则的值为( )A.28 B.29 C.30 D.32【答案】C【分析】根据题意求得,再结合线性回归方程过样本中心点运算求解.【详解】由题意可知:,且当时,,解得,可知,又因为,可知点在上,即,解得.故选:C.【方法总结】1.方程的思想,就是分析数学问题中变量间的等量关系,建立方程或方程组,或者构造方程,通过解方程或方程组,或者运用方程的性质去分析、转化问题,使问题获得解决.2.函数的思想,是用运动和变化的观点,分析和研究数学中的数量关系,是对函数概念的本质认识,建立函数关系或构造函数,运用函数的图象和性质去分析问题、转化问题,从而使问题获得解决.经常利用的性质是单调性、奇偶性、周期性、最大值和最小值、图象变换等.【变式训练2-1】(2024·陕西西安·一模)4.已知变量,之间的一组相关数据如下表所示:6 8 10 126 3 2据此得到变量,之间的线性回归方程为,则下列说法不正确的是( )A.变量,之间成负相关关系 B.可以预测,当时,C. D.该回归直线必过点【变式训练2-2】(23-24高三下·重庆·开学考试)5.当前,人工智能技术以前所未有的速度迅猛发展,并逐步影响我们的方方面面,人工智能被认为是推动未来社会发展和解决人类面临的全球性问题的重要手段.某公司在这个领域逐年加大投入,以下是近年来该公司对产品研发年投入额(单位:百万元)与其年销售量y(单位:千件)的数据统计表.1 2 3 4 5 61 1.5 3 6 12(1)公司拟分别用①和②两种方案作为年销售量关于年投入额的回归分析模型,请根据已知数据,确定方案①和②的经验回归方程;(计算过程保留到小数点后两位,最后结果保留到小数点后一位)(2)根据下表数据,用决定系数(只需比较出大小)比较两种模型的拟合效果哪种更好,并选择拟合精度更高的模型,预测年投入额为百万元时,产品的销售量是多少 经验回归方程残差平方和参考公式及数据:,,,,,,,, .试卷第1页,共3页试卷第1页,共3页参考答案:1.D【分析】根据散点图的分布可选择合适的函数模型.【详解】由散点图分布可知,散点图分布在一个对数函数的图象附近,因此,最适合作为发芽率和温度的回归方程类型的是.故选:D.【点睛】本题考查函数模型的选择,主要观察散点图的分布,属于基础题.2.(1)模型更合适(2)(3)当温度为时,z的预期最大【分析】(1)求出,比较的大小即可判断哪个模型更合适;(2)直接根据回归方程的公式求解即可;(3)先写出利润函数,再利用基本不等式求最值以及最值的成立条件.【详解】(1)由已知,则,所以利用模型建立y关于x的回归方程更合适;(2)由(1)得,,则y关于x的回归方程为;(3)由已知,利润函数,由基本不等式,当且仅当,即时等号成立,所以当温度为时,z的预期最大.3.(1)(2)分布列见解析,2【分析】(1)令,将指数型回归方程转化为线性回归方程,利用最小二乘法的估计系数公式,即可求得答案;(2)确定真菌与细菌的数值之比位于区间内的组数,即可确定X的取值,求出每个值对应的概率,即可得分布列,即可求得数学期望.【详解】(1)由于,故,令,则,,则,,故,则关于的经验回归方程为;(2)由已知图表可知从第1组到第8组的真菌(单位:百万个)与细菌(单位:百万个)的数值之比依次为:,,故样本中比值位于内的组数有4组,则X的可能取值为:,则,,故X的分布列为:X 0 1 2 3 4P则.4.C【分析】由,可判断A正确;当时,得到的预测值,可判定B正确;由表格中的数据,求得样本中心,代入求得的值,可判定C不正确;由,求得,可判定D正确.【详解】对于A中,由,可得变量之间呈现负相关关系,所以A正确;对于B中,当,可得,所以B正确;对于C中,由表格中的数据,可得,则,解得,所以C不正确;对于D中,由,可得,所以该回归直线必经过点,所以D正确.故选:C.5.(1),(2)②的拟合效果好,预测销售量是千件【分析】(1)根据经验回归方程的求法求得正确答案.(2)通过计算决定系数确定拟合效果较好的方案,并由此进行预测.【详解】(1),所以,所以.由,两边取以为底的对数得,即,,所以,所以.(2),对于,;对于,,所以②的拟合效果好,当时,预测值千件.答案第1页,共2页答案第1页,共2页 展开更多...... 收起↑ 资源列表 第八章成对数据的统计分析总结第二练数学思想训练.docx 第八章成对数据的统计分析总结第二课提炼本章思想.docx