资源简介 第3节 一元线性回归模型及应用(时间:60分钟,满分:96分)[备注:单选、填空题5分,多选题6分]1.(2026·湖北武昌质量检测)下列说法不正确的是( )A.具有相关关系的两个变量不是函数关系B.经验回归直线=x+一定过样本点中心(,)C.样本相关系数r越大,两个变量的线性相关性越强D.在残差的散点图中,残差分布的水平带状区域的宽度越窄,其模型的拟合效果越好2.根据如表样本数据:x 2 3 4 5 6y 4 2.5 -0.5 -2 -3得到的经验回归方程为=x+,则( )A.>0,>0 B.>0,<0C.<0,>0 D.<0,<03.甲、乙、丙、丁四位同学各自对A,B两个变量的线性相关性做试验,并用回归分析方法分别求得样本相关系数r与残差平方和m,如下表:甲 乙 丙 丁r 0.82 0.78 0.69 0.85m 106 115 124 103则哪位同学的试验结果体现A,B两个变量有更强的线性相关性( )A.甲 B.乙C.丙 D.丁4.已知y关于x的经验回归方程为=2x-10,且v=2x,则y关于v的经验回归方程为( )A.=v-10 B.=2v-5C.=4v-10 D.=v-205.(2026·河北“五个一”联盟联考)某医院为了提高服务水平和病人满意度,对一周前出院的病人进行电话回访,主要涉及住院期间护士的服务态度、医生是否收取红包、对医院有什么建议等问题.某天上午回访的5人中,通话时间(单位:秒)如表所示:序号x 1 2 3 4 5时间y 37 65 21 m 32根据表中数据,得到y关于x的经验回归方程为=x+40.9.据此求出(5,32)残差为-7.4,则m=( )A.45 B.25C.37 D.76.〔多选〕某公司过去五个月的广告费支出x(万元)与销售额y(万元)之间有下列对应数据:x 2 4 5 6 8y ▲ 40 60 50 70工作人员不慎将表格中y的第一个数据丢失.已知y与x呈线性相关关系,且经验回归方程为=6.5x+17.5,则下列说法正确的有( )A.销售额y与广告费支出x正相关B.丢失的数据(表中▲处)为30C.该公司广告费支出每增加1万元,销售额一定增加6.5万元D.若该公司下月广告费支出为8万元,则预测销售额约为69.5万元7.已知两变量x与y的经验回归方程为=2x+1,而试验得到一组数据是(2,4.9),(3,7.1),(4,9.2),则残差平方和是 .8.下表是关于某设备的使用年限x(单位:年)和所支出的维修费用y(单位:万元)的统计表.x 2 3 4 5 6y 3.4 4.2 5.1 5.5 6.8由表可得经验回归方程为=0.81x+,若规定:维修费用y不超过10万元,一旦大于10万元时,该设备必须报废.据此模型预测,该设备使用年限的最大值约为 .9.(13分)为实施乡村振兴,科技兴农,某村建起了田园综合体,并从省城请来专家进行技术指导,根据统计,该田园综合体西红柿亩产量的增加量y(千克)与某种液体肥料每亩使用量x(千克)之间的对应数据如下:x(千克) 2 4 5 6 8y(千克) 300 400 400 400 500(1)由上表数据可知,可用经验回归模型拟合y与x的关系,请计算样本相关系数r并加以说明(若|r|>0.75,则线性相关程度很高,可用经验回归模型拟合);(2)求y关于x的经验回归方程,并预测当液体肥料每亩使用量为15千克时,西红柿亩产量的增加量约为多少千克?(≈3.16)10.已知变量y与x的一组数据如表所示,根据数据得到y关于x的经验回归方程为=.x 1 2 3 4y e2 e3 e5 e6若=e13,则x=( )A.6 B.7C.8 D.911.〔一题多解〕在研究性学习活动中,某位学生收集了两个变量x与y之间的几组数据如下表:x 1 2 3 4y 0 2 3 5根据上表数据所得经验回归方程为=x+.该同学又收集了两组数据x=5,y=4和x=6,y=5,利用这六组数据求得的经验回归方程为='x+',则以下结论正确的是( )A.>',>' B.<',>'C.<',<' D.>',<'12.〔多选〕已知由样本数据(xi,yi)(i=1,2,3,4,5,6)求得的经验回归方程为=2x+1,且=3.现发现一个样本数据(8,12) 误差较大,去除该数据后重新求得的经验回归直线l 的纵截距依然是1,则下列说法正确的是( )A.去除前变量x 每增加1 个单位,变量y 一定增加2个单位B.去除后剩余样本数据中x 的平均数为2C.去除后的经验回归方程为=2.5x+1D.去除后样本相关系数r 变大13.〔多选〕自然环境中,大气压受到各种因素的影响,如温度、湿度、风速和海拔等方面的改变,都将导致大气压发生相应的变化,其中以海拔的影响最为显著.如图是根据一组观测数据得到的海拔6千米~15千米的大气压强散点图,根据一元线性回归模型得到经验回归方程为=-4.0x+68.5,决定系数为=0.99;根据非线性回归模型得到经验回归方程为=132.9e-0.163x,决定系数为=0.99,则下列说法正确的是( )A.由散点图可知,大气压强与海拔高度负相关B.由方程=-4.0x+68.5可知,海拔每升高1千米,大气压强必定降低4.0 kPaC.由方程=-4.0x+68.5可知,样本点(11,22.6)的残差为-1.9D.对比两个回归模型,结合实际情况,方程=132.9e-0.163x的预报效果更好14.某校数学建模兴趣小组收集了一组恒温动物体重W(单位:克)与脉搏率f(单位:心跳次数/分钟)的对应数据(Wi,fi)(i=1,2,…,8),根据生物学常识和散点图得出f与W近似满足f=cWk(c,k为参数).令xi=ln Wi,yi=ln fi,计算得=8,=5,=214.由最小二乘法得经验回归方程为=x+7.4,则k的值为 ;为判断拟合效果,通过经验回归方程求得预测值(i=1,2,…,8),若残差平方和(yi-)2≈0.28,则决定系数R2≈ .15.(15分)为了促进锂电产业发展,市创新研究院课题组对企业研发经费的投入和企业当年的销售收入的关系进行了研究,他们收集了上一年不同企业销售收入y(单位:10万元)与一定范围内的研发经费x(单位:10万元)的数据,根据收集的13组观测数据,得到如下的散点图,分别利用y=a+b或y=c+建立y关于x的经验回归方程,令s=,t=,得到如下数据,且(si,yi)与(ti,yi)(i=1,2,3,…,13)的相关系数分别为r1,r2,且r2=-0.995 3.10.15 108.40 3.04 0.16siyi-13· tiyi-13· -13 -13 -1314.00 -2.10 11.67 0.21 21.22(1)用相关系数说明哪种模型建立y与x的经验回归方程更合适;(2)根据(1)的结果及表中数据,建立y关于x的经验回归方程;(3)已知企业的利润z满足z=y-x,试根据经验回归方程求出企业利润的最大值.参考数据和公式:0.21×21.22=4.456 2,11.67×21.22=247.637 4,≈15.7,对于一组数据(ui,vi)(i=1,2,3,…,n),其经验回归方程=+u的斜率和截距的最小二乘法估计分别为=,=-,相关系数r=.第3节 一元线性回归模型及应用1.C 2.B 3.D 4.A 5.A 6.ABD 7.0.06 8.109.解:(1)由已知数据可得==5,==400,所以(xi-)(yi-)=(-3)×(-100)+(-1)×0+0×0+1×0+3×100=600,==2,==100,所以样本相关系数r===≈0.95>0.75.所以可用经验回归模型拟合y与x的关系.(2)===30,=400-5×30=250,所以经验回归方程为=30x+250.当x=15时,=30×15+250=700,即当液体肥料每亩使用量为15千克时,西红柿亩产量的增加量约为700千克.10.B 由=,得ln =x-1,令z=ln y,则=x-1,由题意知,==2.5,==4,因为(,)满足=x-1,所以4=×2.5-1,解得=2,所以=2x-1,所以=e2x-1,令e2x-1=e13,解得x=7.11.D 法一 该同学收集了四组数据,由表中数据知=,=,∴==,=-×=-.又收集了两组数据(5,4)和(6,5)后,新的平均数为=,=,则'==,'=-×=-,∴>',<'.故选D.法二 如图,由图象知,增加两组数据后经验回归直线的斜率减小,即>',在y轴上的截距增大,即<'.故选D.12.BCD 当=3 时,=2×3+1=7,则xi=6=18,yi=6=42,去除样本数据(8,12)后的新数据,'==2,'==6,设去除样本数据(8,12)后重新求得的经验回归直线方程为=x+1,则2+1=6,解得=2.5,故去除后的经验回归方程为=2.5x+1,C对;对于A选项,去除前变量x 每增加1 个单位,变量y大约增加2 个单位,A错;对于B选项,去除后剩余样本数据中x 的平均数为2,B对;对于D选项,去除了误差较大的样本数据后,线性相关性变强,因为y关于x为正相关,则r>0,所以样本相关系数r 变大,D对.故选B、C、D.13.ACD 对于A,由题图知,海拔高度越高,大气压强越小,所以大气压强与海拔高度负相关,故A正确;对于B,经验回归方程得到的数据为估计值,而非精确值,故B错误;对于C,当x=11时,=-4.0×11+68.5=24.5,又由散点图知观测值为22.6,所以样本点(11,22.6)的残差为22.6-24.5=-1.9,故C正确;对于D,随着海拔高度的增加,大气压强越来越小,但不可能为负数,因此方程=132.9e-0.163x的预报效果更好,故D正确.14.-0.3 0.98 解析:f=cWk两边取对数可得ln f=ln c+kln W,因为xi=ln Wi,yi=ln fi,经验回归直线=x+7.4必过样本点的中心(,),所以5=8+7.4,解得=-0.3,所以k=-0.3,R2=1-=1-≈1-=0.98.15.解:(1)由题意知r2=-0.995 3,r1===≈≈0.891 7,因为|r1|<|r2|<1,所以用y=c+模型建立y与x的经验回归方程更合适.(2)令t=,经验回归方程为=+t,因为===-10,=-=108.40+10×0.16=110,所以关于x的经验回归方程为y=+t=110-10t,即=110-.(3)由题意知=-x=(110-)-x=99-(+x).+x≥2=3,当且仅当=x,即x=6时取等号,则=99-(+x)≤99-3=96,所以≤96.当且仅当x=6时等号成立,所以当研发经费投入为60万元时企业生产的利润最大,最大利润为960万元.1 / 1第3节 一元线性回归模型及应用1.了解样本相关系数的统计含义,会通过相关系数比较多组成对数据的相关性. 2.了解一元线性回归模型的含义,了解模型参数的统计意义,了解最小二乘原理,掌握一元线性回归模型参数的最小二乘估计方法. 3.针对实际问题,会用一元线性回归模型进行预测.知识梳理1.变量的相关关系(1)相关关系:若两个变量有关系,但又没有确切到可由其中的一个去精确地决定另一个的程度,这种关系称为相关关系;(2)相关关系的分类:①从整体上看,当一个变量的值增加时,另一个变量的相应值也呈现增加的趋势,就称这两个变量 ;②当一个变量的值增加时,另一个变量的相应值呈现减小的趋势,则称这两个变量 .(3)线性相关:一般地,如果两个变量的取值呈现正相关或负相关,而且散点落在 附近,就称这两个变量线性相关.提醒:注意相关关系与函数关系的区别:函数关系是一种确定的关系,而相关关系是一种非确定的关系.2.样本相关系数对于变量x和变量y,设经过随机抽样获得的成对样本数据为(x1,y1),(x2,y2),…,(xn,yn),若x与y存在线性相关关系,可用样本相关系数r定量分析它们的相关程度的强弱.(1)样本相关系数:r=;(2)样本相关系数r的性质①当r>0时,称成对样本数据 相关;当r<0时,称成对样本数据 相关;当r=0时,称成对样本数据间没有线性相关关系;②样本相关系数r的取值范围为 .当|r|越接近1时,成对样本数据的线性相关程度越 ;当|r|越接近0时,成对样本数据的线性相关程度越 .3.一元线性回归模型(1)经验回归直线:从散点图上看,如果这些点从整体上看大致分布在通过散点图中心的一条直线附近,称两个变量之间具有线性相关关系,这条直线叫做经验回归直线;(2)经验回归方程为=x+,其中==,=-;(3)通过求Q=(yi-bxi-a)2的最小值而得到经验回归直线的方法,即使得样本数据的点到回归直线的距离的平方和最小,这一方法叫做最小二乘法.4.判断回归模型的拟合效果由成对样本数据(xi,yi)(i=1,2,…,n)按照最小二乘法得到经验回归方程=x+,其中y叫做观测值,叫做预测值,残差=y-.相对于样本点(xi,yi)的随机误差=yi-=yi-(xi+).(1)残差分析法①作残差图:作图时纵坐标为 ,横坐标可以选为样本编号,或xi数据,或yi数据,这样作出的图形称为残差图;②残差分析:(ⅰ)定型分析:残差点比较均匀地落在水平的带状区域中,说明选用的模型比较合适,这样的带状区域的宽度越窄,说明模型拟合精度越高,经验回归方程的预报精度越高.(ⅱ)定量分析:利用残差平方和,残差平方和越小,模型的拟合效果越好.(2)决定系数 (R2)法:R2=1-.R2的值越趋近于1,模型的拟合效果越好.1.观察散点图判断成对样本数据的相关性 根据散点图中点的分布趋势分析两个变量之间的关系,可直观地判断并得出结论.如果散点图中变量的对应点分布在某条曲线的周围,那么这两个变量具有相关性;如果变量的对应点分布没有规律,那么这两个变量不具有相关性. 2.经验回归方程的性质 (1)经验回归直线一定过点(,); (2)y与x正相关的充要条件是>0,y与x负相关的充要条件是<0; (3)当x增大一个单位时,增大个单位.诊断自测1.判断正误.(正确的画“√”,错误的画“×”)(1)“名师出高徒”可以解释为教师的教学水平与学生的水平成正相关关系.( )(2)散点图是判断两个变量相关关系的一种重要方法和手段.( )(3)经验回归直线=x+至少经过点(x1,y1),(x2,y2),…,(xn,yn)中的一个点.( )(4)样本相关系数的绝对值越接近1,成对样本数据的线性相关程度越强.( )2.(2025·江西上饶一模)两个变量的相关关系有①正相关,②负相关,③不相关,则下列散点图从左到右反映的变量间的相关关系分别是( )A.①②③ B.②③①C.②①③ D.①③②3.对于x,y两变量,有四组成对样本数据,分别算出它们的样本相关系数r如下,则线性相关性最强的是( )A.-0.82 B.0.78C.-0.69 D.-0.874.(2026·山东潍坊模拟)在一组样本数据(x1,y1),(x2,y2),…,(xn,yn)(n≥2,x1,x2,…,xn不全相等)的散点图中,若所有样本点(xi,yi)(i=1,2,…,n)都在直线y=-x+1上,则这组样本数据的样本相关系数为( )A.-1 B.0C.- D.15.已知x,y的取值如下表,已知y与x具有线性相关关系,且经验回归方程为=0.95x+,则= .x 0 1 3 4y 2.2 4.3 4.8 6.7成对数据的相关性(基础自学过关)1.已知变量x和y满足关系=-0.1x+1,变量y与z正相关.下列结论中正确的是( )A.x与y正相关,x与z负相关B.x与y正相关,x与z正相关C.x与y负相关,x与z负相关D.x与y负相关,x与z正相关2.对四组数据进行统计,获得如图所示的散点图,关于其样本相关系数的比较,正确的是( )A.r4<r2<0<r1<r3 B.r2<r4<0<r3<r1C.r2<r4<0<r1<r3 D.r4<r2<0<r3<r13.某地经过多年的环境治理,已将荒山改造成了绿水青山.为估计一林区某种树木的总材积量,随机选取了10棵这种树木,测量每棵树的根部横截面积(单位:m2)和材积量(单位:m3),得到如下数据:样本号i 1 2 3 4 5 6 7 8 9 10 总和根部横截 面积xi 0.04 0.06 0.04 0.08 0.08 0.05 0.05 0.07 0.07 0.06 0.6材积量yi 0.25 0.40 0.22 0.54 0.51 0.34 0.36 0.46 0.42 0.40 3.9并计算得=0.038,=1.615 8,xiyi=0.247 4.(1)估计该林区这种树木平均一棵的根部横截面积与平均一棵的材积量;(2)求该林区这种树木的根部横截面积与材积量的样本相关系数(精确到0.01);(3)现测量了该林区所有这种树木的根部横截面积,并得到所有这种树木的根部横截面积总和为186 m2.已知树木的材积量与其根部横截面积近似成正比.利用以上数据给出该林区这种树木的总材积量的估计值.附:≈1.377.样本相关系数r的统计含义及应用 (1)由r的正、负可判断成对样本数据中两相关变量是正相关还是负相关; (2)可根据|r|的大小从量的角度判断成对样本数据是否具有线性相关性,进而可知能否用经验回归方程进行分析和预测; (3)当|r|≤0.25时,即便求得了经验回归方程也没有任何统计意义.回归模型(定向精析突破)考向1 一元线性回归模型某饮料店为了推广“秋天的第一杯奶茶”,需了解一天的平均气温与奶茶销量之间的关系,为此记录了周一至周五的平均气温x(℃)与奶茶销量y(杯)的数据,如表所示:x 9 11 12 10 8y 23 26 30 25 21(1)画出散点图;(2)根据上表提供的数据,求出y关于x的经验回归方程=x+;(3)试根据(2)中求出的经验回归方程,预测平均气温约为20 ℃时该饮料店的奶茶销量.一元线性回归分析问题的解题步骤 (1)求经验回归方程 ①根据散点图判断两变量是否线性相关(已知相关时不必再验证); ②利用公式,求出参数; ③利用经验回归直线过点(,)求参数. (2)利用经验回归方程进行预测,把经验回归方程看作一次函数,求函数值作为预测值.考向2 非线性回归分析(2026·浙江温州模拟)红旗淀粉厂2025年之前只生产食品淀粉,下表为年投入资金x(万元)与年收益y(万元)的8组数据:x 10 20 30 40 50 60 70 80y 12.8 16.5 19 20.9 21.5 21.9 23 25.4附:①经验回归直线=v+中斜率和截距的最小二乘估计分别为:=,=-·;②yi ln xi (ln xi)2 yiln xi161 29 20 400 109 603③ln 2≈0.7,ln 5≈1.6.(1)用y=bln x+a模拟生产食品淀粉年收益y与年投入资金x的关系,求出回归方程;(2)为响应国家“加快调整产业结构”的号召,该企业又自主研发出一种药用淀粉,预计其收益为投入的10%.2025年该企业计划投入200万元用于生产两种淀粉,求年收益的最大值.(精确到0.1万元) 有些非线性回归分析问题并不给出经验公式,这时我们可以画出已知数据的散点图,把它与学过的各种函数(幂函数、指数函数、对数函数等)的图象进行比较,挑选一种跟这些散点拟合得最好的函数,用适当的变量进行变换,如通过换元或取对数等方法,把问题化为线性回归分析问题,使之得到解决.训练1 某芯片研究团队为制定下一年的研发投入计划,需要了解年研发资金投入量x(单位:亿元)对年销售额y(单位:亿元)的影响,结合近12年的年研发资金投入量xi和年销售额yi的数据(i=1,2,…,12),该团队建立了两个模型:①y=α+βx2;②y=eλx+t,其中α,β,λ,t均为常数,e为自然对数的底数.经对历史数据的初步处理,得到散点图,如图.令ui=,vi=ln yi(i=1,2,…,12),计算得如下数据:(xi-)2 (yi-)2 (xi-)(vi-)20 66 770 200 14(ui-)2 (vi-)2 (ui-)(yi-)460 4.20 3 125 000 0.308 21 500(1)设{ui}和{yi}的相关系数为r1,{xi}和{vi}的相关系数为r2,请从相关系数的角度,选择一个拟合程度更好的模型;(2)(ⅰ)根据(1)的选择及表中数据,建立y关于x的回归方程(系数精确到0.01);(ⅱ)若下一年销售额y需达到80亿元,预测下一年的研发资金投入量x是多少亿元?(结果精确到0.01)刻画拟合效果(师生共研过关)假定小麦基本苗数x与成熟期有效穗y之间存在相关关系,今测得5组数据如下:x 15.0 25.8 30.0 36.6 44.4y 39.4 42.9 42.9 43.1 49.2若由最小二乘法计算得经验回归方程为=0.29x+34.7.(1)计算各组残差,并计算残差平方和(系数精确到0.01);(2)求R2,并说明回归模型拟合效果的好坏.参考数据:(yi-)2=50.18.刻画拟合效果的三种方法 (1)残差图法:残差点比较均匀地落在水平的带状区域内说明选用的模型比较合适; (2)残差平方和法:残差平方和(yi-)2越小,模型的拟合效果越好; (3)决定系数法:R2=1-越接近1,表明模型的拟合效果越好.训练2 (1)有一散点图如图所示,在5个数据(x,y)中去掉D(3,10)后,下列说法正确的是( )A.残差平方和变小B.样本相关系数r变小C.决定系数R2变小D.解释变量x与响应变量y的相关性变弱(2)某汽车研发公司的工程师为了解一款新型汽车在不同行驶速度x(km/h)下油耗y(L/100 km)的变化规律,进行了相关实验,记录不同速度下的油耗数据的散点图如图所示:并计算得xiyi=3 025,=45 100.①根据散点图求y关于x的经验回归方程(精确到0.01);②根据经验回归方程,绘制残差图,并分析经验回归方程的拟合效果(若残差的平方和小于0.775,则说明拟合效果良好,否则拟合效果较差).第3节 一元线性回归模型及应用【夯实必备知识】知识梳理1.(2)①正相关 ②负相关 (3)一条直线2.(2)①正 负 ②[-1,1] 强 弱4.(1)①残差诊断自测1.(1)√ (2)√ (3)× (4)√2.D 3.D 4.A 5.2.6【研透核心考点】考点11.C 2.B 3.解:(1)估计该林区这种树木平均一棵的根部横截面积===0.06,估计该林区这种树木平均一棵的材积量===0.39.(2)(xi-)(yi-)=xiyi-10=0.013 4,(xi-)2=-10()2=0.002,(yi-)2=-10()2=0.094 8,所以==≈0.01×1.377=0.013 77,所以样本相关系数r=≈≈0.97.(3)设该林区这种树木的总材积量的估计值为Y m3,由题意可知,该种树木的材积量与其根部横截面积近似成正比,所以=,所以Y==1 209,即该林区这种树木的总材积量的估计值为1 209 m3.考点2【例1】 解:(1)画出散点图如下.(2)=(9+11+12+10+8)×=10,=(23+26+30+25+21)×=25,(xi-)(yi-)=(9-10)×(23-25)+(11-10)×(26-25)+(12-10)×(30-25)+(10-10)×(25-25)+(8-10)×(21-25)=21,(xi-)2=(9-10)2+(11-10)2+(12-10)2+(10-10)2+(8-10)2=10,所以===2.1,=25-2.1×10=4,所以=2.1x+4.(3)当x=20时,=2.1×20+4=46.故预测平均气温约为20 ℃时该饮料店的奶茶销量为46杯.【例2】 解:(1)=,=,===5,∴=-=-5×=2,∴=5ln x+2.(2)设投入食品淀粉的资金为x万元,投入药用淀粉的资金为(200-x)万元,年收益为f(x),∴f(x)=5ln x+2+(200-x)=5ln x-x+22,f'(x)=-=0 x=50,当0<x<50时,f'(x)>0,f(x)单调递增;当50<x<200时,f'(x)<0,f(x)单调递减.∴f(x)max=f(50)=5ln 50-5+22=5(2ln 5+ln 2)+17≈36.5.∴年收益的最大值约为36.5万元.训练1 解:(1)由题干表格数据得r1===0.86,同理r2==≈0.91,∵0.86<0.91,即|r1|<|r2|,则从相关系数的角度,选择模型②y=eλx+t的拟合程度会更好.(2)(ⅰ)由(1)得r2≈0.91,模型②y=eλx+t,可建立v关于x的经验回归方程,则ln y=λx+t,又λ=≈0.018,∴t=-λ=4.20-0.018×20=3.84,∴=0.02x+3.84,∴ln =0.02x+3.84,即=e0.02x+3.84.(ⅱ)由(ⅰ)得=e0.02x+3.84,要使下一年销售额y达到80亿元,即80=e0.02x+3.84,e4.382 0≈80,∴0.02x+3.84=4.382,解得x=27.1,故下一年销售额y达到80亿元,预测下一年的研发资金投入量x是27.1亿元.考点3【例3】 解:(1)由=0.29xi+34.7,可以算得=yi-分别为=0.35,=0.718,=-0.5,=-2.214,=1.624,所以残差平方和为()2≈8.43.(2)(yi-)2=50.18,故R2=1-≈1-≈0.83.所以回归模型的拟合效果较好.训练2 (1)A 从散点图可分析出,若去掉D点,则解释变量x与响应变量y的线性相关性变强,且是正相关,所以样本相关系数r变大,决定系数R2变大,残差平方和变小,故选A.(2)解:①由图得==85,=×(7.5+6.8+6.2+5.7+5.4+5)=6.1,则===≈-0.05,故=6.1+0.05×85=10.35,则y关于x的经验回归方程为=-0.05x+10.35.②结合①,计算得残差如下表:行驶 速度 60 70 80 90 100 110油耗 实际值 7.5 6.8 6.2 5.7 5.4 5油耗 估计值 7.35 6.85 6.35 5.85 5.35 4.85残差 0.15 -0.05 -0.15 -0.15 0.05 0.15因此残差分布图如下:因为0.152+(-0.05)2+(-0.15)2+(-0.15)2+0.052+0.152=0.095<0.775,所以经验回归方程=-0.05x+10.35的拟合效果良好.1 / 1(共88张PPT)第3节 一元线性回归模型及应用课标要求1. 了解样本相关系数的统计含义,会通过相关系数比较多组成对数据的相关性.2. 了解一元线性回归模型的含义,了解模型参数的统计意义,了解最小二乘原理,掌握一元线性回归模型参数的最小二乘估计方法.3. 针对实际问题,会用一元线性回归模型进行预测.目录/CONTENTS夯实必备知识01研透核心考点02课时跟踪检测0301PART夯实必备知识知识梳理1. 变量的相关关系(1)相关关系:若两个变量有关系,但又没有确切到可由其中的一个去精确地决定另一个的程度,这种关系称为相关关系;(2)相关关系的分类:①从整体上看,当一个变量的值增加时,另一个变量的相应值也呈现增加的趋势,就称这两个变量 ;②当一个变量的值增加时,另一个变量的相应值呈现减小的趋势,则称这两个变量 .正相关 负相关 (3)线性相关:一般地,如果两个变量的取值呈现正相关或负相关,而且散点落在 附近,就称这两个变量线性相关.提醒:注意相关关系与函数关系的区别:函数关系是一种确定的关系,而相关关系是一种非确定的关系.一条直线 2. 样本相关系数对于变量x和变量y,设经过随机抽样获得的成对样本数据为(x1,y1),(x2,y2),…,(xn,yn),若x与y存在线性相关关系,可用样本相关系数r定量分析它们的相关程度的强弱.(1)样本相关系数r= ;①当r>0时,称成对样本数据 相关;当r<0时,称成对样本数据 相关;当r=0时,称成对样本数据间没有线性相关关系;②样本相关系数r的取值范围为 .当|r|越接近1时,成对样本数据的线性相关程度越 ;当|r|越接近0时,成对样本数据的线性相关程度越 .正 负 [-1,1] 强 弱 (2)样本相关系数r的性质3. 一元线性回归模型(1)经验回归直线:从散点图上看,如果这些点从整体上看大致分布在通过散点图中心的一条直线附近,称两个变量之间具有线性相关关系,这条直线叫做经验回归直线;(2)经验回归方程为 = x+ ,其中 = =, = - ;(3)通过求Q= (yi-bxi-a)2的最小值而得到经验回归直线的方法,即使得样本数据的点到回归直线的距离的平方和最小,这一方法叫做最小二乘法.4. 判断回归模型的拟合效果由成对样本数据(xi,yi)(i=1,2,…,n)按照最小二乘法得到经验回归方程 = x+ ,其中y叫做观测值, 叫做预测值,残差 =y- .相对于样本点(xi,yi)的随机误差 =yi- =yi-( xi+ ).(1)残差分析法②残差分析:(ⅰ)定型分析:残差点比较均匀地落在水平的带状区域中,说明选用的模型比较合适,这样的带状区域的宽度越窄,说明模型拟合精度越高,经验回归方程的预报精度越高.(ⅱ)定量分析:利用残差平方和,残差平方和越小,模型的拟合效果越好.①作残差图:作图时纵坐标为 ,横坐标可以选为样本编号,或xi数据,或yi数据,这样作出的图形称为残差图;残差 (2)决定系数 (R2)法:R2=1- .R2的值越趋近于1,模型的拟合效果越好.1. 观察散点图判断成对样本数据的相关性根据散点图中点的分布趋势分析两个变量之间的关系,可直观地判断并得出结论.如果散点图中变量的对应点分布在某条曲线的周围,那么这两个变量具有相关性;如果变量的对应点分布没有规律,那么这两个变量不具有相关性.2. 经验回归方程的性质(1)经验回归直线一定过点( , );(2)y与x正相关的充要条件是 >0,y与x负相关的充要条件是 <0;(3)当x增大一个单位时, 增大 个单位.诊断自测1. 判断正误.(正确的画“√”,错误的画“×”)(1)“名师出高徒”可以解释为教师的教学水平与学生的水平成正相关关系. ( √ )(2)散点图是判断两个变量相关关系的一种重要方法和手段.( √ )(3)经验回归直线 = x+ 至少经过点(x1,y1),(x2,y2),…,(xn,yn)中的一个点. ( × )(4)样本相关系数的绝对值越接近1,成对样本数据的线性相关程度越强. ( √ )√√×√2. (2025·江西上饶一模)两个变量的相关关系有①正相关,②负相关,③不相关,则下列散点图从左到右反映的变量间的相关关系分别是( )A. ①②③ B. ②③①C. ②①③ D. ①③②√解析: 第一个散点图中的点是从左下角区域分布到右上角区域,则是正相关;第三个散点图中的点是从左上角区域分布到右下角区域,则是负相关;第二个散点图中的点的分布没有什么规律,则是不相关,所以应该是①③②.3. 对于x,y两变量,有四组成对样本数据,分别算出它们的样本相关系数r如下,则线性相关性最强的是( )A. -0.82 B. 0.78C. -0.69 D. -0.87√解析: 由样本相关系数的绝对值越大,变量间的线性相关性越强知,各选项中r=-0.87的绝对值最大.4. (2026·山东潍坊模拟)在一组样本数据(x1,y1),(x2,y2),…,(xn,yn)(n≥2,x1,x2,…,xn不全相等)的散点图中,若所有样本点(xi,yi)(i=1,2,…,n)都在直线y=- x+1上,则这组样本数据的样本相关系数为( )A. -1 B. 0C. - D. 1√解析: 因为样本点在直线y=- x+1上,呈现完全负相关,样本相关系数为-1.5. 已知x,y的取值如下表,已知y与x具有线性相关关系,且经验回归方程为 =0.95x+ ,则 = .x 0 1 3 4y 2.2 4.3 4.8 6.7解析:∵经验回归直线必过样本点的中心( , ),又 =2, =4.5,∴代入经验回归方程,得 =2.6.2.602PART研透核心考点成对数据的相关性(基础自学过关)1. 已知变量x和y满足关系 =-0.1x+1,变量y与z正相关.下列结论中正确的是( )A. x与y正相关,x与z负相关B. x与y正相关,x与z正相关C. x与y负相关,x与z负相关D. x与y负相关,x与z正相关√解析: 因为 =-0.1x+1的斜率小于0,故x与y负相关.因为y与z正相关,可设z= y+ , >0,则z= y+ =-0.1 x+ + ,故x与z负相关.2. 对四组数据进行统计,获得如图所示的散点图,关于其样本相关系数的比较,正确的是( )A. r4<r2<0<r1<r3 B. r2<r4<0<r3<r1C. r2<r4<0<r1<r3 D. r4<r2<0<r3<r1√解析: 由散点图可知,样本相关系数r2,r4所在散点图的两个变量呈负相关,r1,r3所在散点图的两个变量呈正相关,所以r1,r3都为正数,r2,r4都为负数.r1,r2所在散点图点的分布近似在一条直线上,线性相关性比较强,样本相关系数的绝对值接近1,而r3,r4所在散点图点的分布比较分散,线性相关性比较弱,则r2<r4,r1>r3,综上所得,r2<r4<0<r3<r1.3. 某地经过多年的环境治理,已将荒山改造成了绿水青山.为估计一林区某种树木的总材积量,随机选取了10棵这种树木,测量每棵树的根部横截面积(单位:m2)和材积量(单位:m3),得到如下数据:样本号i 1 2 3 4 5 6 7 8 9 10 总和根部横截 面积xi 0.04 0.06 0.04 0.08 0.08 0.05 0.05 0.07 0.07 0.06 0.6材积量yi 0.25 0.40 0.22 0.54 0.51 0.34 0.36 0.46 0.42 0.40 3.9并计算得 =0.038, =1.615 8, xiyi=0.247 4.(1)估计该林区这种树木平均一棵的根部横截面积与平均一棵的材积量;解: 估计该林区这种树木平均一棵的根部横截面积 = = =0.06,估计该林区这种树木平均一棵的材积量= = =0.39.(2)求该林区这种树木的根部横截面积与材积量的样本相关系数(精确到0.01);解: (xi- )(yi- )= xiyi-10 =0.013 4,(xi- )2= -10( )2=0.002,(yi- )2= -10( )2=0.094 8,所以 = =≈0.01×1.377=0.013 77,所以样本相关系数r= ≈ ≈0.97.(3)现测量了该林区所有这种树木的根部横截面积,并得到所有这种树木的根部横截面积总和为186 m2.已知树木的材积量与其根部横截面积近似成正比.利用以上数据给出该林区这种树木的总材积量的估计值.附: ≈1.377.解: 设该林区这种树木的总材积量的估计值为Y m3,由题意可知,该种树木的材积量与其根部横截面积近似成正比,所以 = ,所以Y= =1 209,即该林区这种树木的总材积量的估计值为1 209 m3.样本相关系数r的统计含义及应用(1)由r的正、负可判断成对样本数据中两相关变量是正相关还是负相关;(2)可根据|r|的大小从量的角度判断成对样本数据是否具有线性相关性,进而可知能否用经验回归方程进行分析和预测;(3)当|r|≤0.25时,即便求得了经验回归方程也没有任何统计意义.回归模型(定向精析突破)考向1 一元线性回归模型某饮料店为了推广“秋天的第一杯奶茶”,需了解一天的平均气温与奶茶销量之间的关系,为此记录了周一至周五的平均气温x(℃)与奶茶销量y(杯)的数据,如表所示:x 9 11 12 10 8y 23 26 30 25 21(1)画出散点图;解: 画出散点图如下.(2)根据上表提供的数据,求出y关于x的经验回归方程 = x+ ;解: =(9+11+12+10+8)× =10, =(23+26+30+25+21)× =25,(xi- )(yi- )=(9-10)×(23-25)+(11-10)×(26-25)+(12-10)×(30-25)+(10-10)×(25-25)+(8-10)×(21-25)=21,(xi- )2=(9-10)2+(11-10)2+(12-10)2+(10-10)2+(8-10)2=10,所以 = = =2.1, =25-2.1×10=4,所以 =2.1x+4.(3)试根据(2)中求出的经验回归方程,预测平均气温约为20 ℃时该饮料店的奶茶销量.解:当x=20时, =2.1×20+4=46.故预测平均气温约为20 ℃时该饮料店的奶茶销量为46杯.一元线性回归分析问题的解题步骤(1)求经验回归方程①根据散点图判断两变量是否线性相关(已知相关时不必再验证);②利用公式,求出参数 ;③利用经验回归直线过点( , )求参数 .(2)利用经验回归方程进行预测,把经验回归方程看作一次函数,求函数值作为预测值.考向2 非线性回归分析(2026·浙江温州模拟)红旗淀粉厂2025年之前只生产食品淀粉,下表为年投入资金x(万元)与年收益y(万元)的8组数据:x 10 20 30 40 50 60 70 80y 12.8 16.5 19 20.9 21.5 21.9 23 25.4附:①经验回归直线 = v+ 中斜率和截距的最小二乘估计分别为:= , = - · ;②yi ln xi (ln xi)2 yiln xi161 29 20 400 109 603③ln 2≈0.7,ln 5≈1.6.(1)用y=bln x+a模拟生产食品淀粉年收益y与年投入资金x的关系,求出回归方程;解: = , = ,= = =5,∴ = - = -5× =2,∴ =5ln x+2.(2)为响应国家“加快调整产业结构”的号召,该企业又自主研发出一种药用淀粉,预计其收益为投入的10%.2025年该企业计划投入200万元用于生产两种淀粉,求年收益的最大值.(精确到0.1万元)解:设投入食品淀粉的资金为x万元,投入药用淀粉的资金为(200-x)万元,年收益为f(x),∴f(x)=5ln x+2+ (200-x)=5ln x- x+22,f'(x)= - =0 x=50,当0<x<50时,f'(x)>0,f(x)单调递增;当50<x<200时,f'(x)<0,f(x)单调递减.∴f(x)max=f(50)=5ln 50-5+22=5(2ln 5+ln 2)+17≈36.5.∴年收益的最大值约为36.5万元. 有些非线性回归分析问题并不给出经验公式,这时我们可以画出已知数据的散点图,把它与学过的各种函数(幂函数、指数函数、对数函数等)的图象进行比较,挑选一种跟这些散点拟合得最好的函数,用适当的变量进行变换,如通过换元或取对数等方法,把问题化为线性回归分析问题,使之得到解决.训练1 某芯片研究团队为制定下一年的研发投入计划,需要了解年研发资金投入量x(单位:亿元)对年销售额y(单位:亿元)的影响,结合近12年的年研发资金投入量xi和年销售额yi的数据(i=1,2,…,12),该团队建立了两个模型:①y=α+βx2;②y=eλx+t,其中α,β,λ,t均为常数,e为自然对数的底数.经对历史数据的初步处理,得到散点图,如图.令ui= ,vi=ln yi(i=1,2,…,12),计算得如下数据:(xi- )2 (yi- )2 (xi-)(vi- )20 66 770 200 14(ui- )2 (vi- )2 (ui-)(yi- )460 4.20 3 125 000 0.308 21 500(1)设{ui}和{yi}的相关系数为r1,{xi}和{vi}的相关系数为r2,请从相关系数的角度,选择一个拟合程度更好的模型;解: 由题干表格数据得r1= = =0.86,同理r2= = ≈0.91,∵0.86<0.91,即|r1|<|r2|,则从相关系数的角度,选择模型②y=eλx+t的拟合程度会更好.(2)(ⅰ)根据(1)的选择及表中数据,建立y关于x的回归方程(系数精确到0.01);(ⅱ)若下一年销售额y需达到80亿元,预测下一年的研发资金投入量x是多少亿元?(结果精确到0.01)解:(ⅰ)由(1)得r2≈0.91,模型②y=eλx+t,可建立v关于x的经验回归方程,则ln y=λx+t,又λ= ≈0.018,∴t= -λ =4.20-0.018×20=3.84,∴ =0.02x+3.84,∴ln =0.02x+3.84,即 =e0.02x+3.84.(ⅱ)由(ⅰ)得 =e0.02x+3.84,要使下一年销售额y达到80亿元,即80=e0.02x+3.84,e4.382 0≈80,∴0.02x+3.84=4.382,解得x=27.1,故下一年销售额y达到80亿元,预测下一年的研发资金投入量x是27.1亿元.刻画拟合效果(师生共研过关)假定小麦基本苗数x与成熟期有效穗y之间存在相关关系,今测得5组数据如下:x 15.0 25.8 30.0 36.6 44.4y 39.4 42.9 42.9 43.1 49.2若由最小二乘法计算得经验回归方程为 =0.29x+34.7.(1)计算各组残差,并计算残差平方和(系数精确到0.01);解: 由 =0.29xi+34.7,可以算得 =yi- 分别为 =0.35, =0.718, =-0.5, =-2.214, =1.624,所以残差平方和为 ( )2≈8.43.解: (yi- )2=50.18,故R2=1- ≈1- ≈0.83.所以回归模型的拟合效果较好.(2)求R2,并说明回归模型拟合效果的好坏.参考数据: (yi- )2=50.18.刻画拟合效果的三种方法(1)残差图法:残差点比较均匀地落在水平的带状区域内说明选用的模型比较合适;(2)残差平方和法:残差平方和 (yi- )2越小,模型的拟合效果越好;(3)决定系数法:R2=1- 越接近1,表明模型的拟合效果越好.训练2 (1)有一散点图如图所示,在5个数据(x,y)中去掉D(3,10)后,下列说法正确的是( )A. 残差平方和变小B. 样本相关系数r变小C. 决定系数R2变小D. 解释变量x与响应变量y的相关性变弱√解析: 从散点图可分析出,若去掉D点,则解释变量x与响应变量y的线性相关性变强,且是正相关,所以样本相关系数r变大,决定系数R2变大,残差平方和变小,故选A.(2)某汽车研发公司的工程师为了解一款新型汽车在不同行驶速度x(km/h)下油耗y(L/100 km)的变化规律,进行了相关实验,记录不同速度下的油耗数据的散点图如图所示:并计算得 xiyi=3 025, =45 100.①根据散点图求y关于x的经验回归方程(精确到0.01);②根据经验回归方程,绘制残差图,并分析经验回归方程的拟合效果(若残差的平方和小于0.775,则说明拟合效果良好,否则拟合效果较差).解:①由图得 = =85, = ×(7.5+6.8+6.2+5.7+5.4+5)=6.1,则 = = = ≈-0.05,故 =6.1+0.05×85=10.35,则y关于x的经验回归方程为 =-0.05x+10.35.②结合①,计算得残差如下表:行驶速度 60 70 80 90 100 110油耗实际值 7.5 6.8 6.2 5.7 5.4 5油耗估计值 7.35 6.85 6.35 5.85 5.35 4.85残差 0.15 -0.05 -0.15 -0.15 0.05 0.15因此残差分布图如下:因为0.152+(-0.05)2+(-0.15)2+(-0.15)2+0.052+0.152=0.095<0.775,所以经验回归方程 =-0.05x+10.35的拟合效果良好.03PART课时跟踪检测(时间:60分钟,满分:96分)[备注:单选、填空题5分,多选题6分]1. (2026·湖北武昌质量检测)下列说法不正确的是( )A. 具有相关关系的两个变量不是函数关系B. 经验回归直线 = x+ 一定过样本点中心( , )C. 样本相关系数r越大,两个变量的线性相关性越强D. 在残差的散点图中,残差分布的水平带状区域的宽度越窄,其模型的拟合效果越好123456789101112131415√解析: 对A:根据两个变量具有相关关系的概念可知A正确;对B:由= - ,故经验回归直线 = x+ 一定过样本点中心( , ),故B正确;对C:样本相关系数|r|越大,两个变量的线性相关性越强,故C错误;对D:在残差的散点图中,残差分布的水平带状区域的宽度越窄,其模型的拟合效果越好,故D正确.故选C.1234567891011121314152. 根据如表样本数据:x 2 3 4 5 6y 4 2.5 -0.5 -2 -3得到的经验回归方程为 = x+ ,则( )A. >0, >0 B. >0, <0C. <0, >0 D. <0, <0√解析: 由表中的数据可得,变量y随着x的增大而减小,则 <0, ==4, = =0.2,又经验回归方程 = x+ 经过样本点中心(4,0.2),可得 >0.1234567891011121314153. 甲、乙、丙、丁四位同学各自对A,B两个变量的线性相关性做试验,并用回归分析方法分别求得样本相关系数r与残差平方和m,如下表:甲 乙 丙 丁r 0.82 0.78 0.69 0.85m 106 115 124 103则哪位同学的试验结果体现A,B两个变量有更强的线性相关性( )A. 甲 B. 乙C. 丙 D. 丁√解析: r的绝对值越接近1,m越小,线性相关性越强.1234567891011121314154. 已知y关于x的经验回归方程为 =2x-10,且v=2x,则y关于v的经验回归方程为( )A. =v-10 B. =2v-5C. =4v-10 D. =v-20√解析: ∵v=2x,∴x= v,又∵ =2x-10,则 =v-10.故选A.1234567891011121314155. (2026·河北“五个一”联盟联考)某医院为了提高服务水平和病人满意度,对一周前出院的病人进行电话回访,主要涉及住院期间护士的服务态度、医生是否收取红包、对医院有什么建议等问题.某天上午回访的5人中,通话时间(单位:秒)如表所示:序号x 1 2 3 4 5时间y 37 65 21 m 32根据表中数据,得到y关于x的经验回归方程为 = x+40.9.据此求出(5,32)残差为-7.4,则m=( )A. 45 B. 25C. 37 D. 7√123456789101112131415解析: 由题知,当x=5时, =5 +40.9=32+7.4=39.4,解得 =-0.3,所以y关于x的经验回归方程为 =-0.3x+40.9.当x= =3时, = =-0.3×3+40.9=40,所以 ×(37+65+21+m+32)=40,解得m=45.故选A.1234567891011121314156. 〔多选〕某公司过去五个月的广告费支出x(万元)与销售额y(万元)之间有下列对应数据:x 2 4 5 6 8y ▲ 40 60 50 70工作人员不慎将表格中y的第一个数据丢失.已知y与x呈线性相关关系,且经验回归方程为 =6.5x+17.5,则下列说法正确的有( )A. 销售额y与广告费支出x正相关B. 丢失的数据(表中▲处)为30C. 该公司广告费支出每增加1万元,销售额一定增加6.5万元D. 若该公司下月广告费支出为8万元,则预测销售额约为69.5万元√√√123456789101112131415解析: 由经验回归方程 =6.5x+17.5,可知 =6.5>0,所以销售额y与广告费支出x正相关,所以A正确;设丢失的数据为m,由表中的数据可得 =5, = ,把(5, )代入经验回归方程,可得=6.5×5+17.5,解得m=30,所以B正确;该公司广告费支出每增加1万元,销售额不一定增加6.5万元,所以C不正确;当x=8时, =6.5×8+17.5=69.5(万元),所以D正确.1234567891011121314157. 已知两变量x与y的经验回归方程为 =2x+1,而试验得到一组数据是(2,4.9),(3,7.1),(4,9.2),则残差平方和是 .解析:因为 =2x+1,所以当x=2时, =5, =-0.1;当x=3时,=7, =0.1;当x=4时, =9, =0.2.所以残差平方和为 ++ =0.01+0.01+0.04=0.06.0.06 1234567891011121314158. 下表是关于某设备的使用年限x(单位:年)和所支出的维修费用y(单位:万元)的统计表.x 2 3 4 5 6y 3.4 4.2 5.1 5.5 6.8由表可得经验回归方程为 =0.81x+ ,若规定:维修费用y不超过10万元,一旦大于10万元时,该设备必须报废.据此模型预测,该设备使用年限的最大值约为 .10 123456789101112131415解析:由表格,得 = ×(2+3+4+5+6)=4, = ×(3.4+4.2+5.1+5.5+6.8)=5,因为经验回归直线恒过点( , ),所以5=0.81×4+ ,解得 =1.76,所以经验回归方程为 =0.81x+1.76,由y≤10,得0.81x+1.76≤10,解得x≤ ≈10.17,由于x∈N*,所以据此模型预测,该设备使用年限的最大值约为10.1234567891011121314159. (13分)为实施乡村振兴,科技兴农,某村建起了田园综合体,并从省城请来专家进行技术指导,根据统计,该田园综合体西红柿亩产量的增加量y(千克)与某种液体肥料每亩使用量x(千克)之间的对应数据如下:x(千克) 2 4 5 6 8y(千克) 300 400 400 400 500(1)由上表数据可知,可用经验回归模型拟合y与x的关系,请计算样本相关系数r并加以说明(若|r|>0.75,则线性相关程度很高,可用经验回归模型拟合);123456789101112131415解: 由已知数据可得 = =5,= =400,所以 (xi- )(yi- )=(-3)×(-100)+(-1)×0+0×0+1×0+3×100=600,= =2 ,123456789101112131415= =100 ,所以样本相关系数r== = ≈0.95>0.75.所以可用经验回归模型拟合y与x的关系.123456789101112131415(2)求y关于x的经验回归方程,并预测当液体肥料每亩使用量为15千克时,西红柿亩产量的增加量约为多少千克?( ≈3.16)解: = = =30, =400-5×30=250,所以经验回归方程为 =30x+250.当x=15时, =30×15+250=700,即当液体肥料每亩使用量为15千克时,西红柿亩产量的增加量约为700千克.12345678910111213141510. 已知变量y与x的一组数据如表所示,根据数据得到y关于x的经验回归方程为 = .x 1 2 3 4y e2 e3 e5 e6若 =e13,则x=( )A. 6 B. 7C. 8 D. 9√123456789101112131415解析: 由 = ,得ln = x-1,令z=ln y,则 = x-1,由题意知, = =2.5, = =4,因为( , )满足 = x-1,所以4= ×2.5-1,解得 =2,所以 =2x-1,所以 =e2x-1,令e2x-1=e13,解得x=7.12345678910111213141511. 〔一题多解〕在研究性学习活动中,某位学生收集了两个变量x与y之间的几组数据如下表:x 1 2 3 4y 0 2 3 5根据上表数据所得经验回归方程为 = x+ .该同学又收集了两组数据x=5,y=4和x=6,y=5,利用这六组数据求得的经验回归方程为 = 'x+ ',则以下结论正确的是( )A. > ', > ' B. < ', > 'C. < ', < ' D. > ', < '√123456789101112131415解析: 法一 该同学收集了四组数据,由表中数据知 = , = ,∴ = = , = - × =- .又收集了两组数据(5,4)和(6,5)后,新的平均数为 = , = ,则 '== , '= - × =- ,∴> ', < '.故选D.法二 如图,由图象知,增加两组数据后经验回归直线的斜率减小,即 > ',在y轴上的截距增大,即< '.故选D.12345678910111213141512. 〔多选〕已知由样本数据(xi,yi)(i=1,2,3,4,5,6)求得的经验回归方程为 =2x+1,且 =3.现发现一个样本数据(8,12) 误差较大,去除该数据后重新求得的经验回归直线l 的纵截距依然是1,则下列说法正确的是( )A. 去除前变量x 每增加1 个单位,变量y 一定增加2个单位B. 去除后剩余样本数据中x 的平均数为2C. 去除后的经验回归方程为 =2.5x+1D. 去除后样本相关系数r 变大√√√123456789101112131415解析: 当 =3 时, =2×3+1=7,则 xi=6 =18, yi=6=42,去除样本数据(8,12)后的新数据, '= =2, '= =6,设去除样本数据(8,12)后重新求得的经验回归直线方程为 = x+1,则2 +1=6,解得 =2.5,故去除后的经验回归方程为 =2.5x+1,C对;对于A选项,去除前变量x 每增加1 个单位,变量y大约增加2 个单位,A错;对于B选项,去除后剩余样本数据中x 的平均数为2,B对;对于D选项,去除了误差较大的样本数据后,线性相关性变强,因为y关于x为正相关,则r>0,所以样本相关系数r 变大,D对.故选B、C、D.12345678910111213141513. 〔多选〕自然环境中,大气压受到各种因素的影响,如温度、湿度、风速和海拔等方面的改变,都将导致大气压发生相应的变化,其中以海拔的影响最为显著.如图是根据一组观测数据得到的海拔6千米~15千米的大气压强散点图,根据一元线性回归模型得到经验回归方程为 =-4.0x+68.5,决定系数为 =0.99;根据非线性回归模型得到经验回归方程为 =132.9e-0.163x,决定系数为 =0.99,则下列说法正确的是( )123456789101112131415A. 由散点图可知,大气压强与海拔高度负相关B. 由方程 =-4.0x+68.5可知,海拔每升高1千米,大气压强必定降低4.0 kPaC. 由方程 =-4.0x+68.5可知,样本点(11,22.6)的残差为-1.9D. 对比两个回归模型,结合实际情况,方程 =132.9e-0.163x的预报效果更好√√√123456789101112131415解析: 对于A,由题图知,海拔高度越高,大气压强越小,所以大气压强与海拔高度负相关,故A正确;对于B,经验回归方程得到的数据为估计值,而非精确值,故B错误;对于C,当x=11时, =-4.0×11+68.5=24.5,又由散点图知观测值为22.6,所以样本点(11,22.6)的残差为22.6-24.5=-1.9,故C正确;对于D,随着海拔高度的增加,大气压强越来越小,但不可能为负数,因此方程 =132.9e-0.163x的预报效果更好,故D正确.12345678910111213141514. 某校数学建模兴趣小组收集了一组恒温动物体重W(单位:克)与脉搏率f(单位:心跳次数/分钟)的对应数据(Wi,fi)(i=1,2,…,8),根据生物学常识和散点图得出f与W近似满足f=cWk(c,k为参数).令xi=ln Wi,yi=ln fi,计算得 =8, =5, =214.由最小二乘法得经验回归方程为 = x+7.4,则k的值为 ;为判断拟合效果,通过经验回归方程求得预测值 (i=1,2,…,8),若残差平方和 (yi- )2≈0.28,则决定系数R2≈ .-0.3 0.98 123456789101112131415解析:f=cWk两边取对数可得ln f=ln c+kln W,因为xi=ln Wi,yi=lnfi,经验回归直线 = x+7.4必过样本点的中心( , ),所以5=8+7.4,解得 =-0.3,所以k=-0.3,R2=1- =1-≈1- =0.98.12345678910111213141515. (15分)为了促进锂电产业发展,市创新研究院课题组对企业研发经费的投入和企业当年的销售收入的关系进行了研究,他们收集了上一年不同企业销售收入y(单位:10万元)与一定范围内的研发经费x(单位:10万元)的数据,根据收集的13组观测数据,得到如下的散点图,分别利用y=a+b 或y=c+ 建立y关于x的经验回归方程,令s= ,t=,得到如下数据,且(si,yi)与(ti,yi)(i=1,2,3,…,13)的相关系数分别为r1,r2,且r2=-0.995 3.12345678910111213141510.15 108.40 3.04 0.16 siyi-13 · tiyi-13 · -13 -13 -1314.00 -2.10 11.67 0.21 21.22123456789101112131415(1)用相关系数说明哪种模型建立y与x的经验回归方程更合适;解: 由题意知r2=-0.995 3,r1= = = ≈ ≈0.891 7,因为|r1|<|r2|<1,所以用y=c+ 模型建立y与x的经验回归方程更合适.123456789101112131415(2)根据(1)的结果及表中数据,建立y关于x的经验回归方程;解: 令t= ,经验回归方程为 = + t,因为 = = =-10,= - =108.40+10×0.16=110,所以 关于x的经验回归方程为 = + t=110-10t,即 =110- .123456789101112131415(3)已知企业的利润z满足z= y- x,试根据经验回归方程求出企业利润的最大值.参考数据和公式:0.21×21.22=4.456 2,11.67×21.22=247.637 4,≈15.7,对于一组数据(ui,vi)(i=1,2,3,…,n),其经验回归方程 = + u的斜率和截距的最小二乘法估计分别为 =, = - ,相关系数r= .123456789101112131415解:由题意知 = - x= (110- )- x=99-( + x).+ x≥2 =3,当且仅当 = x,即x=6时取等号,则 =99-( + x)≤99-3=96,所以 ≤96.当且仅当x=6时等号成立,所以当研发经费投入为60万元时企业生产的利润最大,最大利润为960万元.123456789101112131415THANKS演示完毕 感谢观看 展开更多...... 收起↑ 资源列表 第3节 一元线性回归模型及应用.docx 第3节 一元线性回归模型及应用.pptx 第3节 一元线性回归模型及应用(练习,含解析).docx