资源简介 (共68张PPT)第2课时 非线性回归模型及回归分析目录基础知识·重落实01典型例题·精研析02知能演练·扣课标03基础知识·重落实01课前预习 必备知识梳理 设某幼苗从观察之日起,第x天的高度为y cm,测得的一些数据如下表所示:第x天 1 4 9 16 25 36 49高度y/cm 0 4 7 9 11 12 13 作出这组数据的散点图近似描述y与x的关系,很显然,这些散点不在一条直线附近.【问题】 你能求出这个函数模型吗?知识点一 非线性回归方程1. 非线性回归分析的思想研究两个变量的关系时,依据样本点画出散点图,从整体上看,如果样本点没有分布在某个带状区域内,就称这两个变量之间不具有线性相关关系,此时不能直接利用经验回归方程来建立两个变量之间的关系.2. 非线性经验回归方程当回归方程不是形如 = x+ ( , ∈R)时,称之为非线性经验回归方程.当两个变量不呈线性相关关系时,依据样本点的分布选择合适的曲线方程来拟合数据,可通过变量代换,利用线性回归模型建立两个变量间的非线性经验回归方程.知识点二 残差分析1. 残差及残差图(1)对于响应变量Y,通过观测得到的数据称为 ,通过经验回归方程得到的 称为 , 减去 所得的差称为残差;(2)作图时纵坐标为残差,横坐标可以选为样本编号,或解释变量的观测值等,这样作出的图形称为残差图.观测值 预测值 观测值 预测值 2. 残差分析是随机误差的估计结果,通过对残差的分析可以判断模型刻画数据的效果,以及判断原始数据中是否存在可疑数据等,这方面工作称为 .残差 残差分析 知识点三 对模型刻画数据效果的分析1. 残差图法:在残差图中,如果残差点比较均匀地集中在以 ,则说明经验回归方程较好地刻画了两个变量的关系,这样的带状区域的宽度越窄,说明模型拟合精度 .2. 残差平方和法:残差平方和 越小,模型的拟合效果越好.横轴为对称轴的水平带状区域内 越高 ( )2 3. 决定系数R2法:可以用R2=1- 来比较两个模型的拟合效果,R2越 ,模型的拟合效果越好,R2越 ,模型的拟合效果越差.大 小 【想一想】 利用经验回归方程求得的函数值一定是真实值吗?提示:不一定.只是真实值的一个预测值.1. 判断正误.(正确的画“√”,错误的画“×”)(1)残差平方和越接近0, 线性回归模型的拟合效果越好.( √ )(2)R2越小, 线性回归模型的拟合效果越好. ( × )(3)在残差图中,纵坐标为残差,横坐标可以选为样本编号.( √ )√×√2. 甲、乙、丙、丁四位同学在建立变量x,y的回归模型时,分别选择了4种不同模型,计算可得它们的决定系数R2如下表:甲 乙 丙 丁R2 0.98 0.78 0.50 0.85则回归模型拟合效果最好的是( )A. 甲 B. 乙C. 丙 D. 丁解析: 决定系数R2越大,表示回归模型的拟合效果越好.3. 某校数学学习兴趣小组为研究某作物种子的发芽率y和温度x(单位:℃)的关系,由试验数据得到如图所示的散点图.由此散点图,可以得出最适宜作为发芽率y和温度x的回归模型的是( )A. y=a+bx B. y=a+bln xC. y=a+bex D. y=a+bx2解析: 由散点图可知,数据分布成递增趋势,但是呈现上凸效果,即增加越来越缓慢.A中,y=a+bx是直线型,均匀增长,不符合要求;B中,y=a+bln x是对数型,增长越来越缓慢,符合要求;C中,y=a+bex是指数型,爆炸式增长,增长越来越快,不符合要求;D中,y=a+bx2是二次函数型,图象既有上升,又有下降,不符合要求.典型例题·精研析02课堂互动 关键能力提升题型一 求非线性经验回归方程【例1】 某地区不同身高x(单位:cm)的未成年男性的体重平均值y(单位:kg)如下表:身高x(cm) 60 70 80 90 100体重y(kg) 6.13 7.90 9.99 12.15 15.02身高x(cm) 110 120 130 140体重y(kg) 17.50 20.92 26.86 31.11已知ln y与x之间存在很强的线性相关性.(1)据此建立y关于x的经验回归方程;(系数保留两位小数)解: 由已知可得 =100,=100×(62+72+…+142)=96 000,∴ -9 =96 000-90 000=6 000.又 (xiln yi)≈2 522, = ≈2.67,∴ ≈ ≈0.02,=2.67-0.02×100=0.67,∴ln =0.02x+0.67,∴经验回归方程为 =e0.02x+0.67.(2)若体重超过相同身高的男性的体重平均值的1.2倍为偏胖,低于0.8倍为偏瘦,则这个地区一名身高为150 cm,体重为47 kg的男性的体重是否正常?参考数据: (xiln yi)≈2 522, ln yi≈24.02,e3.67≈39.25.解: 当x=150时, =e3.67≈39.25,而39.25×1.2=47.1>47,∴该名男性的体重是正常的.通性通法非线性经验回归方程的求法【跟踪训练】1. 若一函数模型为y=ax2+bx+c(a≠0),将y转化为t的经验回归方程,则需做变换t=( )A. x2 B. (x+a)2D. 以上都不对解析: y=ax2+bx+c=a(x+ )2+ (a≠0),可令t=(x+ )2,则y=at+ 为y关于t的经验回归方程.2. 已知变量y关于x的非线性经验回归方程为y=ebx-0.5,若对y=ebx-0.5两边取自然对数,可以发现ln y与x线性相关,现有一组数据如下表所示,x=5时,预测y值为 .x 1 2 3 4y e e3 e4 e6e7.5 解析:对y=ebx-0.5两边取对数,得ln y=bx-0.5,令z=ln y则z=bx-0.5,列表如下:x 1 2 3 4y e e3 ey4 e6z 1 3 4 6= =2.5, = =3.5 ,代入 =b -0.5得3.5=b·2.5-0.5,故b=1.6,故z=1.6x-0.5,y=e1.6x-0.5,当x=5时,y=e1.6×5-0.5=e7.5.题型二 残差与残差分析【例2】 (1)对变量x,y进行回归分析时,依据得到的4个不同的回归模型画出残差图,则下列模型拟合精度最高的是( A )A解析: 用残差图判断模型的拟合效果,残差点比较均匀地落在水平的带状区域中,说明这样的模型比较合适,带状区域的宽度越窄,说明模型的拟合精度越高.(2)已知一系列样本点(xi,yi)(i=1,2,3,…,n)的经验回归方程为 =2x+ ,若样本点(r,1)与(1,s)的残差相同,则有( C )A. r=s B. s=2rC. s=-2r+3 D. s=2r+1解析:样本点(r,1)的残差为1-2r- ,样本点(1,s)的残差为s- -2,依题意得1-2r- =s- -2,故s=-2r+3.C通性通法1. 残差点比较均匀地落在水平的带状区域中,说明选用的模型比较合适.这样的带状区域的宽度越窄,说明模型拟合精度越高,经验回归方程的预报精度越高.2. 残差是随机误差的估计值, =yi- .【跟踪训练】 已知某成对样本数据的残差图如图,则样本点数据中可能不准确的是从左到右第 个.解析:原始数据中的可疑数据往往是残差绝对值过大的那个数据,即偏离平衡位置过大.6 题型三 残差平方和与决定系数R2【例3】 已知某种商品的价格x(单位:元)与需求量y(单位:件)之间的关系有如下一组数据:x 14 16 18 20 22y 12 10 7 5 3(1)求y关于x的经验回归方程;解: = ×(14+16+18+20+22)=18,= ×(12+10+7+5+3)=7.4,所以 = = =-1.15,=7.4+1.15×18=28.1,所以所求经验回归方程是 =-1.15x+28.1.(2)借助残差平方和与R2说明回归模型拟合效果的好坏.(参考公式及数据: = , = - , =1660, xiyi=620, (yi- )2=53.2)解: 列出残差表为0 0.3 -0.4 -0.1 0.24.6 2.6 -0.4 -2.4 -4.4所以 (yi- )2=0.3,且 (yi- )2=53.2,R2=1- ≈0.994,所以回归模型的拟合效果很好.通性通法刻画回归效果的三种方法(1)残差图法:残差点比较均匀地落在水平的带状区域内说明选用的模型比较合适;(2)残差平方和法:残差平方和 (yi- )2越小,模型的拟合效果越好;(3)决定系数法:R2=1- 越接近1,表明模型的拟合效果越好.【跟踪训练】 假定小麦基本苗数x与成熟期有效穗y之间存在相关关系,今测得5组数据如下:x 15.0 25.8 30.0 36.6 44.4y 39.4 42.9 42.9 43.1 49.2若由最小二乘法计算得经验回归方程 =0.29x+34.7.(1)计算各组残差,并计算残差平方和;解: 由 = xi+ ,可以算得 =yi- .分别为 =0.35, =0.718, =-0.5, =-2.214,=1.624,所以残差平方和为 ( )2≈8.43.(2)求R2,并说明回归模型拟合效果的好坏.解: (yi- )2=50.18,故R2=1- ≈1- ≈0.832.所以回归模型的拟合效果较好.1. 某种产品的广告支出费用x(单位:万元)与销售额y(单位:万元)的数据如下表:x 2 4 5 6 8y 30 40 60 50 70已知y关于x的经验回归方程为 =6.5x+17.5,则当广告支出费用为5万元时,残差为( )A. 10万元 B. 14万元C. 23万元 D. 24万元解析: 当x=5时,销售额的预测值为 =5×6.5+17.5=50,残差为60-50=10万元.故选A.2. 在研究两个变量的相关关系时,观察散点图发现样本点集中于某一条指数曲线y=ebx+a的周围.令z=ln y,求得经验回归方程为 =0.25x-2.58,则该模型的非线性经验回归方程为 .解析:因为 =0.25x-2.58,z=ln y,所以 =e0.25x-2.58.=e0.25x-2.58 3. 中国茶文化博大精深,饮茶深受大众喜爱,茶水的口感与茶叶类型和水的温度有关,某数学建模小组为了获得茶水温度y(单位:℃)关于时间x(单位:min)的回归方程模型,通过实验收集在25 ℃室温,用同一温度的水冲泡的条件下,茶水温度随时间变化的7组数据及相应散点图,并对数据做初步处理,如下表:73.5 3.85 -95 -2.24表中:wi=ln(yi-25), = wi.假如该茶水温度y关于时间x的经验回归方程为 = ·cx+25,请求出此经验回归方程.附:(1)对于一组数据(x1,y1),(x2,y2),…,(xn,yn),其经验回归直线 = + x的斜率和截距的最小二乘估计分别为 = , = - ;(2)参考数据:e-0.08≈0.92,e4.09≈60,ln 7≈1.9,ln 3≈1.1,ln2≈0.7.解:由y=d·cx+25,得y-25=d·cx,两边取自然对数,得ln(y-25)=ln d+xln c,令w=ln(y-25),则w=ln d+xln c,= xi= =3, =(-3)2+(-2)2+(-1)2+12+22+32=28,结合表中数据,得ln c= = =-0.08,结合参考数据可得c=e-0.08≈0.92,由ln d= - ln c=3.85-3×(-0.08)=4.09,得d=e4.09≈60,所以茶水温度y关于时间x的经验回归方程为 =60×0.92x+25.知能演练·扣课标03课后巩固 核心素养落地1234567891011121. 一组数据(xi,yi)经过分析,提出了四种回归模型①②③④,四种模型的残差平方和 的值分别是1.23,0.80,0.12,1.36.则拟合效果最好的是( )A. 模型① B. 模型②C. 模型③ D. 模型④解析:C 残差平方和越小则拟合效果越好,而模型③的残差平方和最小,所以C正确.故选C.2. 已知变量y关于变量x的经验回归方程为 =bln x+0.24,其一组数据如表所示:x e e3 e4 e6 e7y 1 2 3 4 5若x=e10,则y的值大约为( )A. 4.94 B. 5.74C. 6.81 D. 8.04解析: 令t=ln x,则 =bt+0.24.由题意得, =4.2, =3,由经验回归直线过样本的中心点,有b= ,所以 = ln x+0.24,将x=e10代入得 ≈6.81.故选C.1234567891011123. 如图是一组实验数据的散点图,拟合方程为y= +c(x>0),令t= ,则y关于t的经验回归直线过点(2,5),(12,25),则当y∈(1.01,1.02)时,x的取值范围是( )A. (0.01,0.02) B. (50,100)C. (0.02,0.04) D. (100,200)123456789101112解析: 根据题意可得y=bt+c(t>0),由y关于t的经验回归直线过点(2,5),(12,25)可得:所以所以y=2t+1,由y∈(1.01,1.02)可得1.01<2t+1<1.02,所以0.005<t<0.01,所以0.005< <0.01,所以100<x<200,故选D.1234567891011124. (多选)某研究小组采集了5组数据,作出如图所示的散点图.若去掉D(3,10)后,下列说法正确的是( )A. 相关系数r变小B. 决定系数R2变大C. 残差平方和变大D. 解释变量x与预报变量y的相关性变强解析: 根据散点图可知,去掉点D(3,10)后,y与x的线性相关性加强,且为正相关,相关系数r变大,则A错,D对;去掉点D(3,10)后,残差平方和变小,则R2变大,B对,C错.故选B、D.1234567891011125. (多选)某种商品的价格x(单位:元/kg)与日需求量y(单位:kg)之间的对应数据如下表所示:x 10 15 20 25 30y 11 10 8 6 5根据表中的数据可得经验回归方程 = x+14.4,则以下说法正确的是( )A. 样本相关系数r>0C. 若该商品的价格为35元/kg,则日需求量大约为3.2 kgD. 第四个样本点对应的残差为-0.4123456789101112解析: 对于A、B,由题表中的数据,得 ==20, = =8,将 , 代入 = x+14.4得 =-0.32,所以A选项说法错误,B选项说法正确;对于C,将x=35代入 =-0.32x+14.4,得 =3.2,所以日需求量大约为3.2 kg,所以C选项说法正确;对于D,第四个样本点对应的残差为y4-=6-(-0.32×25+14.4)=-0.4,所以D选项说法正确.故选B、C、D.1234567891011126. 某种产品的广告费支出x(单位:万元)与销售额y(单位:万元)的数据如下表:x 2 4 5 6 8y 30 40 60 50 70已知y与x的经验回归方程为 =6.5x+17.5,则当广告支出5万元时,残差为 .解析:当x=5时, =6.5×5+17.5=50,表格中对应y=60,于是残差为60-50=10.10 1234567891011127. 在研究气温和热茶销售杯数的关系时,若求得决定系数R2≈0.85,则表明气温解释了 的热茶销售杯数变化,而随机误差贡献了剩余的 ,所以气温对热茶销售杯数的效应比随机误差的效应大得多.解析:由决定系数R2的意义可知,R2≈0.85表明气温解释了85%,而随机误差贡献了剩余的15%.85% 15% 1234567891011128. 共享汽车进驻城市,绿色出行引领时尚,某市有统计数据显示,某站点5天的使用汽车用户的数据如下,用两种模型①y=bx+a;②y=b +a分别进行拟合,进行残差分析得到如表所示的残差值及一些统计量的值:日期x(天) 1 2 3 4 5用户y(人) 13 22 45 55 68模型①的残差值 -1.1 -2.8 -1.2 -1.9 0.4模型②的残差值 0.3 -5.4 -3.2 -1.6 3.8123456789101112(1)残差值的绝对值之和越小说明模型拟合效果越好,根据残差,比较模型①,②的拟合效果,应选择哪一个模型?并说明理由;解: 应该选择模型①.模型①的残差值的绝对值之和为1.1+2.8+1.2+1.9+0.4=7.4,模型②的残差值的绝对值之和为0.3+5.4+3.2+1.6+3.8=14.3,∵7.4<14.3,∴模型①的拟合效果较好,应该选模型①.123456789101112(2)求出(1)中所选模型的经验回归方程.(参考数据: =55, xiyi=752)解: 由题可知: = =3, ==40.6, xiyi=752, =55.∴ = = = =14.3,= - =40.6-14.3×3=-2.3.∴y关于x的经验回归方程为 =14.3x-2.3.1234567891011129. 已知指数曲线y=aebx进行线性变换后得到的经验回归方程为u=1-x,则二次函数y=x2+bx+a的单调递增区间为( )A. (0,+∞)D. (1,+∞)123456789101112解析: ∵y=aebx,∴两边取对数,作线性变化得ln y=ln(aebx)=ln a+ln ebx=ln a+bx,由于指数曲线y=aebx进行线性变换后得到的经验回归方程为u=1-x,则u=ln y ,ln a=1,b=-1,即a=e,所以二次函数y=x2+bx+a即y=x2-x+e,抛物线开口向上,对称轴为x= ,则函数y=x2+bx+a的单调递增区间为( ,+∞),故选C.12345678910111210. (多选)某种产品的广告支出费用x(单位:万元)与销售量y(单位:万件)之间的对应数据如下表所示.广告支出费用x 2.2 2.6 4.0 5.3 5.9销售量y 3.8 5.4 7.0 11.6 12.2根据表中的数据可得经验回归方程为 =2.27x+ ,R2≈0.96,以下说法正确的是( )123456789101112B. 在该回归模型对应的残差图中,残差点比较均匀地分布在倾斜的带状区域中C. 该模型拟合效果较好D. 用该经验回归方程可以很准确地预测广告费用为20万元时的销售量123456789101112解析: 对于A项:由题意得 = =4, ==8,代入 =2.27x+ ,得 =-1.08,故=2.27x-1.08,所以 =7-(2.27×4.0-1.08)=-1,故A项正确;对于B、C项:由于R2≈0.96,所以该回归模型拟合的效果比较好,故C项正确;故对应的残差图中残差点应该比较均匀地分布在水平的带状区域中,故B项错误;对于D项:由于样本的取值范围会影响回归方程的使用范围,而广告费用20万元远大于表格中广告费用值,故用该经验回归方程预测广告费用为20万元时的销售量不一定准确,故D项错误.故选A、C.12345678910111211. 随着互联网的发展,“美团单车”“哈啰出行”等共享单车服务在我国各城市迅猛发展.为掌握共享单车在某地区的发展情况,某调查机构从该地区抽取了4个城市,分别收集和分析了共享单车的A,B两项指标数xi,yi(i=1,2,3,4),数据如表所示.由表可得y关于x的经验回归方程为 =4x2+a,则此经验回归模型中A指标数x=2的残差为( )A指标数x 1 2 3 4B指标数y 6 12 35 63A. 0 B. -1 C. -2 D. -3123456789101112解析: 因为 =4x2+a是非线性的,所以当将其看作y关于x2的函数时,即为线性方程,则 =7.5, =29,所以29=4×7.5+a,得a=-1,所以 =4x2-1.将x=2代入方程可得=15,则12-15=-3,所以残差为-3.故选D.12345678910111212. 某果园种植“糖心苹果”已有十余年,为了提高利润,该果园每年投入一定的资金,对种植、采摘、包装、宣传等环节进行改进.如图是2014年到2023年,该果园每年的投资金额x(单位:万元)与年利润增量y(单位:万元)的散点图.该果园为了预测2024年投资金额为20万元时的年利润增量,建立了y关于x的两个经验回归模型.123456789101112模型①:由最小二乘法可求得y关于x的经验回归方程为 =2.50x-2.50;模型②:由图中样本点的分布,可以认为样本点集中在曲线y=bln x+a的附近,令t=ln x,则y=b·t+a,且有 ti=22.00,yi=230, tiyi=569.00, =50.92.123456789101112(1)根据所给的统计量,求模型②中y关于x的经验回归方程;解: 由 ti=22.00, yi=230,得 =2.2, =23,所以 = = =25,= - =23-25×2.2=-32.所以模型②中,y关于x的经验回归方程为 =25ln x-32.123456789101112(2)根据下列表格中的数据,比较两种模型的决定系数R2,并选择拟合精度更高、更可靠的模型,预测投资金额为20万元时的年利润增量(结果保留两位小数).回归模型 模型① 模型②经验回归方程102.28 36.19123456789101112附: = = , = - ,R2=1- .参考数据:ln 2≈0.693 1,ln 5≈1.609 4.123456789101112解: 由表中的数据,有102.28>36.19,则1- <1- ,所以模型①的R2小于模型②的R2,说明回归模型②刻画的拟合效果更好;当x=20时,模型②的年利润增量的预测值为 =25ln 20-32=25(2ln 2+ln 5)-32≈25(2×0.693 1+1.609 4)-32=42.89(万元).123456789101112(共58张PPT)8.2 一元线性回归模型及其应用新课程标准解读 核心素养1.结合实例,了解一元线性回归模型的含义,了解模型参数的统计意义 数学抽象2.了解最小二乘法的思想,会求经验回归方程,并会用一元线性回归模型进行预测 数学运算、数学建模、数据分析3.了解随机误差、残差、残差图的概念 数学抽象、直观想象第1课时 一元线性回归模型及其参数的最小二乘估计目录基础知识·重落实01典型例题·精研析02知能演练·扣课标03基础知识·重落实01课前预习 必备知识梳理恩格尔系数是根据恩格尔定律得出的比例数,指居民家庭中食物支出占消费总支出的比重,是表示生活水平高低的一个指标.其计算公式:恩格尔系数=食物支出金额÷总支出金额. 一个家庭收入越少,家庭收入中或者家庭总支出中用来购买食物的支出所占的比例就越大,随着家庭收入的增加,家庭收入中或者家庭总支出中用来购买食物的支出所占比例将会下降.【问题】 恩格尔系数是预测生活水平高低的一个模型,那么当两个变量线性相关时,我们如何对成对样本数据建立一个模型进行预测?知识点一 一元线性回归模型 称 为Y关于x的一元线性回归模型.其中,Y称为 或 ,x称为 或 ; 称为截距参数, 称为斜率参数;e是 与 之间的随机误差,如果e= ,那么Y与x之间的关系就可以用一元线性函数模型来描述.因变量 响应变量 自变量 解释变量 a b Y bx+a 0 知识点二 最小二乘法和经验回归方程 将 = x+ 称为Y关于x的经验回归方程,也称经验回归函数或经验回归公式,其图形称为经验回归直线,这种求经验回归方程的方法叫做最小二乘法,求得的 , 叫做b,a的最小二乘估计,其中,= , = - .提醒 (1)经验回归方程不一定过成对样本数据(x1,y1),(x2,y2),…,(xn,yn)中的某一点;(2)经验回归直线一定经过样本点的中心( , );(3) = .1. 判断正误.(正确的画“√”,错误的画“×”)(1)两个变量之间产生随机误差的原因仅仅是因为测量工具产生的误差. ( × )(2)经验回归方程最能代表观测值x,y之间的线性关系,且经验回归直线过样本点的中心( , ). ( √ )(3)求经验回归方程前可以不进行相关性检验. ( × )(4)利用经验回归方程求出的值是准确值. ( × )×√××2. (多选)下列有关经验回归方程 = x+ 的叙述正确的是( )B. 反映y与x之间的函数关系D. 表示最接近y与x之间真实关系的一条直线解析: = x+ 表示 与x之间的函数关系,而不是y与x之间的函数关系,但它反映的关系最接近y与x之间的真实关系,故选A、D.3. 某地区近十年居民的年收入x与支出y之间的关系大致符合 =0.8x+0.1(单位:亿元),则预计今年该地区居民收入为15亿元时,年支出估计是 亿元.解析:∵ =0.8x+0.1,∴ =0.8×15+0.1=12.1(亿元).12.1 典型例题·精研析02课堂互动 关键能力提升题型一 一元线性回归模型的理解【例1】 在一元线性回归模型Y=bx+a+e中,下列说法正确的是( )A. Y=bx+a+e是一次函数B. 响应变量Y是由解释变量x唯一确定的C. 响应变量Y除了受解释变量x的影响外,可能还受到其他因素的影响,这些因素会导致随机误差e的产生D. 随机误差e是由于计算不准确造成的,可通过精确计算避免随机误差e的产生解析: 对于A中,一元线性回归模型Y=bx+a+e中,方程表示的不是确定性关系,因此不是一次函数,所以A错误;对于B中,响应变量Y不是由解释变量x唯一确定的,所以B错误;对于C中,响应变量Y除了受解释变量x的影响外,可能还受到其他因素的影响,这些因素会导致随机误差e的产生,所以C正确;对于D中,随机误差是不能避免的,只能将误差缩小,所以D错误.故选C.通性通法 在一元线性回归模型Y=bx+a+e中,模型中的Y也是随机变量,其值虽然不能由变量x的值确定,但是却能表示为bx+a与e的和(叠加),前一部分由x所确定,后一部分是随机的.【跟踪训练】 关于一元线性回归模型给出下列说法:①表达式Y=bx+a+e刻画的是变量Y与变量x之间的线性相关关系;②bx+a反映了由于x的变化而引起的Y的线性变化;③误差项e是一个期望值为0的随机变量,即E(e)=0;④对于所有的x值,e的方差σ2都相同.其中正确的是 (填序号).解析:根据一元线性回归模型的含义可知,以上说法均正确.①②③④ 题型二 求经验回归方程【例2】 某班5名学生的数学和物理成绩如下表:学生 A B C D E数学成绩x/分 88 76 73 66 63物理成绩y/分 78 65 71 64 61(1)画出散点图;解: 散点图如图所示.(2)求物理成绩y关于数学成绩x的经验回归方程(结果保留三位小数).参考公式: = = , = - .解: 因为 = ×(88+76+73+66+63)=73.2, =×(78+65+71+64+61)=67.8,xiyi=88×78+76×65+73×71+66×64+63×61=25 054,=882+762+732+662+632=27 174,所以 = ≈0.625,= - ≈67.8-0.625×73.2=22.050.因此y关于x的经验回归方程为 =22.050+0.625x.通性通法求经验回归方程的基本步骤(1)画出散点图,从直观上分析数据间是否存在线性相关关系;(2)计算 , , xiyi, (xi- )2, (yi- )2;(3)代入公式求出 = x+ 中参数 , 的值;(4)写出经验回归方程并对实际问题作出估计.提醒 只有在散点图大致呈线性时,求出的经验回归方程才有实际意义,否则求出的回归方程毫无意义.【跟踪训练】 入夏以来,天气炎热,某地区用电负荷连创新高,某用户随机统计了家里某4天用电量(kW·h)与当天气温(℃)的情况,数据如表:气温x(℃) 30 32 34 36用电量ykW·h) 20 26 30 36请根据提供的数据,计算 , ,并用最小二乘法求出y关于x的经验回归方程 = x+ .参考公式: = , = - .解: = =33, = =28,== =2.6,∴ =2.6x-57.8.题型三 利用经验回归方程对总体进行估计【例3】 对具有线性相关关系的变量x,y,测得一组数据如下表,根据表中数据,利用最小二乘法得到经验回归方程 =10.5x+ ,据此模型预测当x=20时,y的估计值为( )x 2 4 5 6 8y 20 40 60 70 80A. 210 B. 210.5C. 211.5 D. 212.5解析: 由题意可知, = =5, = =54.∵经验回归直线经过样本中心点,∴54=10.5×5+ , =1.5,经验回归方程为 =10.5x+1.5,当x=20时,y的估计值为10.5×20+1.5=211.5.故选C.通性通法 解题的关键是先确定两个变量y与x是线性相关关系,求出经验回归方程进行估计和预测.【跟踪训练】中医是中华民族五千年传统文化的瑰宝,是千百年医疗实践的结晶,也是世界优秀文化的精华.某中医药企业根据市场调研与模拟,得到研发投入x(亿元)与产品收益y(亿元)的数据统计如表:研发投入x(亿元) 1 2 3 4 5产品收益y(亿元) 3 7 9 10 11用最小二乘法求得y关于x的经验回归方程是 = x+2.3,当研发投入为20亿元时,相应的产品收益估计值为 亿元.40.3 解析:由表格中的数据可得 = =3, = =8,将样本中心点( , )代入经验回归方程可得3 +2.3=8,解得 =1.9,所以经验回归方程为 =1.9x+2.3,当x=20时, =1.9×20+2.3=40.3(亿元),因此,当研发投入为20亿元时,相应的产品收益估计值为40.3亿元.1. 在对两个变量x,y进行线性回归分析时一般有下列步骤:①对所求出的回归方程作出解释;②收集数据(xi,yi),i=1,2,…,n;③求线性回归方程;④根据所搜集的数据绘制散点图.若根据实际情况能够判定变量x,y具有线性相关性,则在下列操作顺序中正确的是( )A. ①②④③ B. ③②④①C. ②③①④ D. ②④③①解析: 根据实际情况能够判定变量x,y具有线性相关性的顺序为:收集数据(xi,yi),i=1,2,…,n;根据所搜集的数据绘制散点图;求线性回归方程;对所求出的回归方程作出解释;故选D.2. 用最小二乘法得到一组数据(xi,yi)(i=1,2,3,4,5,6)的经验回归方程为 =2x+3,若 xi=30,则 yi=( )A. 11 B. 13C. 63 D. 78解析: 依题意,因为 xi=30,所以 = =5,因为经验回归方程 =2x+3一定过点( , ),所以 =2 +3=2×5+3=13,所以 yi=6×13=78.故选D.3. 已知x与y之间的一组数据:x 0 1 2 3y m 3 5.5 7已求得关于y与x的经验回归方程为 =2.2x+0.7,则m=( )A. 1 B. 0.85C. 0.7 D. 0.5解析: = =1.5, = = ,将其代入=2.2x+0.7,可得m=0.5,故选D.4. 若根据5名儿童的年龄x(岁)和体重y(kg)的数据用最小二乘法得到用年龄预报体重的经验回归方程是 =2x+18,已知这5名儿童的年龄分别是3,5,2,6,4,则这5名儿童的平均体重是 kg.解析:由题意得, = =4,由于经验回归直线过样本的中心点( , ),所以 =2 +18=2×4+18=26,则这5名儿童的平均体重是26 kg.26 知能演练·扣课标03课后巩固 核心素养落地1. 在有线性相关关系的两个变量建立的经验回归方程 = + x中, ( )A. 不能小于0 B. 不能大于0C. 不能等于0 D. 只能小于0解析: 当 =0时,不具有线性相关关系,但 能大于0,也能小于0.123456789101112132. 已知某经验回归方程为 =2-3x,则当解释变量增加1个单位时,响应变量平均( )A. 增加3个单位C. 减少3个单位解析: 依题意,经验回归方程为 =2-3x,所以当解释变量增加1个单位时,响应变量平均减少3个单位.故选C.123456789101112133. 对具有线性相关关系的变量x,y,有一组观测数据(xi,yi)(i=1,2,3,…,8),其经验回归方程为 = x+ ,且x1+x2+x3+…+x8=6,y1+y2+y3+…+y8=9,则 =( )A. -2 B. 2C. -1 D. 1解析: = = , = ,由于经验回归直线过样本中心点,将 代入经验回归方程,解得 =1.123456789101112134. 对于变量x,y,经随机抽样获得一组具有线性相关关系的数据为(6,y1),(7,y2),(10,y3),(12,y4),(15,y5),其经验回归方程为 =0.7x-6.若y1,y2,y3,y4,y5成等差数列,则y3=( )A. 4 B. 3C. 2 D. 112345678910111213解析: 由题意可得, = ×(6+7+10+12+15)=10.∵经验回归方程为 =0.7x-6,∴ =0.7×10-6=1.∵y1,y2,y3,y4,y5成等差数列,∴ = (y1+y2+y3+y4+y5)=y3=1.故选D.123456789101112135. (多选)数据(x,y)的5组测量值(xi,yi)(i=1,2,3,4,5),已知 =90, xiyi=112, xi=20, yi=25.若y对x的经验回归方程记作 = x+ ,则( )C. y与x正相关D. x=8时,y的估计值为912345678910111213解析: 由已知的数据可得 = xi=4, = yi=5,= = = =1.2, = - =5-1.2×4=0.2,所以经验回归方程为 =1.2x+0.2.因为 =1.2>0,所以y与x正相关.当x=8时, =1.2×8+0.2=9.8.故A、B、C选项正确,D选项错误.123456789101112136. 如图是一组数据(x,y)的散点图,经最小二乘估计公式计算,y与x之间的经验回归方程为 = x+1,则 = .解析:由题图知 = =2, = =2.6,将(2,2.6)代入 = x+1中,解得 =0.8.0.8 123456789101112137. 为了研究某班学生的脚长x(单位:cm)和身高y(单位:cm)的关系,从该班随机抽取10名学生,根据测量数据的散点图可以看出y与x之间有线性相关关系,设其经验回归方程为 = x+ ,已知 xi=225, yi=1 600, =4.该班某学生的脚长为24,据此估计其身高为 cm.解析:由题意可知 =4x+ ,又 =22.5, =160,∴160=22.5×4+ ,得 =70,因此 =4x+70.当x=24时, =4×24+70=96+70=166.166 123456789101112138. 一项关于16艘船的研究中,已知船的吨位区间为[192,3 246](单位:吨),船员人数y与吨位x之间具有相关关系,经验回归方程为 =9.5+0.006 2x.(1)若两艘船的吨位相差1 000,求船员平均相差的人数;解: 设两艘船的吨位分别为x1,x2(x1>x2),则船员人数为 , , - =9.5+0.006 2x1-(9.5+0.0062x2)=0.006 2×1 000≈6,即船员平均相差6人.12345678910111213(2)估计吨位最大的船和最小的船的船员人数.解: 当x=3 246时, =9.5+0.006 2×3 246≈30,当x=192时, =9.5+0.006 2×192≈11.即估计吨位最大的船和最小的船的船员人数分别为30,11.123456789101112139. 根据以下样本数据x 1 3 5 7y 6 4.5 3.5 2.5得到经验回归方程为 = x+ .则( )解析: 由表中数据可得随着x的增大,y越来越小,所以 <0,又因为当x=1时,y=6,所以当x=0时,y>6,所以 >0,故选D.1234567891011121310. 若某地财政收入x与支出Y满足一元线性回归模型Y=bx+a+e(单位:亿元),其中b=0.7,a=3,|e|≤0.5,如果今年该地区财政收入10亿元,年支出预计不会超过( )A. 9亿元 B. 9.5亿元C. 10亿元 D. 10.5亿元解析: 因为财政收入x与支出Y满足一元线性回归模型Y=bx+a+e,其中b=0.7,a=3,所以Y=0.7x+3+e.当x=10时,得Y=0.7×10+3+e=10+e,又|e|≤0.5,即-0.5≤e≤0.5,所以9.5≤Y≤10.5,所以年支出预计不会超过10.5亿元.1234567891011121311. (多选)已知由样本数据(xi,yi)(i=1,2,3,…,8)组成的一个样本,得到经验回归方程为 =1.5x-0.6且 =2,去除两个异常数据(-2,7)和(2,-7)后,得到的新的经验回归直线的斜率为3,则( )A. 相关变量x,y具有正相关关系12345678910111213解析: 对于A,因为经验回归直线的斜率为正,所以相关变量x,y具有正相关关系,所以A正确;对于B,因为 =2,所以去除两个异常数据(-2,7)和(2,-7)后,得到新的 '== ,所以B错误;对于C,将 =2代入 =1.5x-0.6得=2.4,故去除两个异常数据(-2,7)和(2,-7)后, '==3.2,因为得到的新的经验回归直线的斜率为3,所以'-3 '=3.2-3× =-4.8,所以去除异常数据后的经验回归方程为 =3x-4.8,故C正确;对于D,因为经验回归直线 =3x-4.8的斜率为正数,所以变量x,y具有正相关关系,且去除异常数据后,斜率由1.5增大到3,故 值增加的速度变大,D错误.故选A、C.1234567891011121312. 为了解篮球爱好者小李的投篮命中率与打篮球时间之间的关系,下表记录了小李某月1号到5号每天打篮球时间x(单位:h)与当天投篮命中率y之间的关系:时间x 1 2 3 4 5命中率y 0.4 0.5 0.6 0.6 0.4小李这5天的平均投篮命中率为 ;用线性回归分析的方法,预测小李该月6号打6小时篮球的投篮命中率为 .0.5 0.53 12345678910111213解析:小李这5天的平均投篮命中率 = ×(0.4+0.5+0.6+0.6+0.4)=0.5, =3,计算得 = =0.01, = - =0.5-0.03=0.47.∴经验回归方程为 =0.01x+0.47,则当x=6时, =0.53.∴预测小李该月6号打6小时篮球的投篮命中率为0.53.1234567891011121313. 2023年冬季旅游一夜逆袭,“南方小土豆”“马铃薯公主”一度走红网络.哈尔滨冰雪大世界于2022年9月投入使用,总投资高达25亿元,号称“永不落幕”的冰雪游乐场,从“一季繁荣”到“四季绽放”. 2024年1月至5月的游客数以及对游客填写满意与否的调查表,统计如下:月份x 1 2 3 4 5游客人数y(万人) 130 m n 90 80满意率 0.5 0.4 0.4 0.3 0.35已知y关于x的经验回归方程为 =-11.5x+134.5.12345678910111213(1)求2月份,3月份的游客数m,n的值;解: 由题意可得 =3, = ,且 =-11.5×3+134.5=100,所以m+n=200, ①又因为 xiyi=2m+3n+890,5 =1 500,5 =45,=55,所以 = =-11.5,化简得2m+3n=495, ②联立①②得:m=105,n=95.12345678910111213(2)在1月至5月的游客中随机抽取2人进行调查,把满意率视为概率,求评价为满意的人数X的分布列与期望E(X).(参考公式: = = , = -)12345678910111213解: 任取1个人满意的概率P= = ,所以满意的人数X服从二项分布,即X~B(2, ),随机变量X的取值分别为0,1,2,从而得:P(X=0)= = ,P(X=1)== ,P(X=2)= = ,所以可得满意人数X的分布列如表所示:X 0 1 2P所以期望E(X)=0× +1× +2× = .12345678910111213 展开更多...... 收起↑ 资源列表 第1课时 一元线性回归模型及其参数的最小二乘估计.pptx 第2课时 非线性回归模型及回归分析.pptx