资源简介 1.1 直线拟合 1.2 一元线性回归方程新课程标准解读 核心素养1.结合具体实例,了解一元线性回归模型的含义,了解模型参数的统计意义,了解最小二乘原理,掌握一元线性回归模型参数的最小二乘估计方法,会使用相关的统计软件 数学抽象、数学建模、 数据分析2.针对实际问题,会用一元线性回归模型进行预测 数学建模、数学运算、 数据分析 恩格尔系数是根据恩格尔定律得出的比例数,指居民家庭中食品支出占消费总支出的比重,是表示生活水平高低的一个指标.其计算公式:恩格尔系数=食品支出金额÷总支出金额.一个家庭收入越少,家庭收入中或者家庭总支出中用来购买食品的支出所占的比例就越大,随着家庭收入的增加,家庭收入中或者家庭总支出中用来购买食品的支出所占比例将会下降.【问题】 恩格尔系数是预测生活水平高低的一个模型,那么当两个变量线性相关时,我们如何对成对样本数据建立一个模型进行预测? 知识点一 直线拟合1.散点图:在平面直角坐标系中,每个点对应的一对数据(xi,yi)称为 ,这些点构成的图称为散点图.2.曲线拟合与直线拟合(1)曲线拟合:从散点图上可以看出,如果变量之间存在着某种关系,这些点会有一个大致趋势,这种 通常可以用一条 的曲线来近似地描述.这样近似描述的过程称为曲线拟合;(2)直线拟合:若在两个变量X和Y的散点图中,所有点看上去都在 附近波动,此时就可以用一条直线来近似地描述这两个量之间的关系,称之为直线拟合.【想一想】 若两个变量X与Y的关系能用直线来拟合,则X与Y是函数关系吗?知识点二 一元线性回归方程1.最小二乘法:对于给定的两个变量X和Y,可以把其成对的观测值(x1,y1),(x2,y2),…,(xn,yn)表示为平面直角坐标系中的n个点,现在希望找到一条直线Y=a+bX,使得对每一个xi(i=1,2,…,n),由这个直线方程计算出来的值a+bxi与实际观测值yi的差异尽可能 .为此,希望[y1-(a+bx1)]2+[y2-(a+bx2)]2+…+[yn-(a+bxn)]2达到 .换句话说,我们希望a,b的取值能使上式达到最小,这个方法称为最小二乘法.2.线性回归方程、回归直线、线性回归方程的系数若变量X和Y的n对观测值为(x1,y1),(x2,y2),…,(xn,yn),使[y1-(a+bx1)]2+[y2-(a+bx2)]2+…+[yn-(a+bxn)]2达到最小的a,b取值为= ,= .其中,=(x1+x2+…+xn),=(y1+y2+…+yn).这时直线方程Y=+X称作Y关于X的线性回归方程,相应的 称作Y关于X的回归直线, 是这个线性回归方程的系数.【想一想】回归直线与样本点的中心(,)之间有什么关系?(其中,,分别是变量x1,x2,…,xn和y1,y2,…,yn的平均数)1.判断正误.(正确的画“√”,错误的画“×”)(1)散点图可以直观地分析出两个变量是否具有相关性.( )(2)选取一组数据的部分点得到的线性回归方程与由整组数据得到的线性回归方程一定相同.( )(3)根据线性回归方程得到的结论一定是可靠的.( )2.已知X,Y之间的一组数据:X 0 1 2 3Y 1 2 4 5Y关于X的线性回归方程Y=X+必过点( )A.(2,2) B.(1.5,0)C.(1,2) D.(1.5,3)3.某地区近十年居民的年收入x与支出y之间的关系大致符合=0.8x+0.1(单位:亿元),预计今年该地区居民收入为15亿元,则年支出估计是 亿元.题型一 求线性回归方程【例1】 某连锁经营公司所属5个零售店某月的销售额与利润额的有关数据如下表:商店名称 A B C D E销售额X/千万元 3 5 6 7 9利润额Y/百万元 2 3 3 4 5(1)画出销售额和利润额的散点图;(2)试用最小二乘法求出Y关于X的线性回归方程.尝试解答通性通法求线性回归方程的步骤(1)画出成对样本数据对应点的散点图,确定两变量之间的关系.若(xi,yi)对应的点都在某一条直线附近,则两变量具有线性关系;(2)当两变量线性相关已确定,在此统计意义下,利用最小二乘法公式=,求;用=-,求;得到线性回归方程Y=+X.【跟踪训练】 下表提供了某厂节能降耗技术改造后生产某产品过程中记录的产量x(吨)与相应的生产能耗y(吨标准煤)的几组对应数据.x 3 4 5 6y 2.5 3 4 4.5(1)画出散点图;(2)请根据上表提供的数据,用最小二乘法求出y关于x的线性回归方程=x+.题型二 一元线性回归方程的应用【例2】 为研究某城镇居民家庭月人均生活费支出和月人均收入的关系,随机抽取10户进行调查,其结果如下:月人均收入X/元 300 390 420 520 570月人均生活费 支出Y/元 255 324 335 360 450月人均收入X/元 700 760 800 850 1 080月人均生活费 支出Y/元 520 580 600 630 750试预测月人均收入为1 100元和月人均收入为1 200元的两个家庭的月人均生活费支出.尝试解答通性通法一元线性回归方程的应用(1)可以利用一元线性回归方程Y=+X预测在x0取某一个值时,y0的估计值;(2)线性关系确立之后,Y=+X具有了统计意义,可用线性回归方程进行预测和控制.【跟踪训练】 某种产品的广告费用支出X(单位:百万元)与销售额Y(单位:百万元)之间有如下的对应数据:广告费用支出X/百万元 2 4 5 6 8销售额Y/百万元 30 40 60 50 70(1)画出散点图;(2)试用最小二乘法求出Y关于X的线性回归方程;(3)试预测广告费用支出为10百万元时,销售额多大?1.以下四个散点图中,两个变量的关系适合用线性回归模型刻画的是( )A.①② B.①③C.②③ D.③④2.由变量x与y相对应的一组数据(1,y1),(5,y2),(7,y3),(13,y4),(19,y5)得到的线性回归方程为=2x+45,则=( )A.135 B.90C.67 D.633.已知X,Y的取值如下表所示,若变量Y与X能用直线拟合,且Y=0.95X+,则=( )X 0 1 3 4Y 2.2 4.3 4.8 6.7A.2.2 B.2.9C.2.8 D.2.64.(多选)下列有关线性回归方程=x+叙述正确的是( )A.反映与x之间的函数关系B.反映y与x之间的函数关系C.表示与x之间不确定关系D.表示最接近y与x之间真实关系的一条直线5.若根据5名儿童的年龄x(岁)和体重y(kg)的数据用最小二乘法得到用年龄预报体重的线性回归方程是=2x+18,已知这5名儿童的年龄分别是3,5,2,6,4,则这5名儿童的平均体重是 kg. 非线性回归模型 1.非线性回归分析的思想研究两个变量的关系时,依据样本点画出散点图,从整体上看,如果样本点没有分布在某个带状区域内,就称这两个变量之间不具有线性相关关系,此时不能直接利用线性回归方程来建立两个变量之间的关系.2.非线性回归方程当回归方程不是形如=x+(,∈R)时,称之为非线性回归方程.当两个变量不呈线性相关关系时,依据样本点的分布选择合适的曲线方程来拟合数据,可通过变量代换,利用线性回归模型建立两个变量间的非线性回归方程.3.非线性回归问题的处理方法(1)指数函数型y=ebx+a①函数y=ebx+a的图象,如图(ⅰ);②处理方法:两边取对数得ln y=ln ebx+a,即ln y=bx+a.令z=ln y,把原始数据(x,y)转化为(x,z),再根据求一元线性回归模型的方法求出a,b.(2)对数函数型y=bln x+a①函数y=bln x+a的图象,如图(ⅱ);②处理方法:设x'=ln x,原方程可化为y=bx'+a,再根据求一元线性回归模型的方法求出a,b.(3)二次函数型y=bx2+a处理方法:设x'=x2,原方程可化为y=bx'+a,再根据求一元线性回归模型的方法求出a,b.【例】 下表为收集到的一组数据:x 21 23 25 27 29 32 35y 7 11 21 24 66 115 325(1)作出x与y的散点图,并猜测x与y之间的关系;(2)通过x与y的关系,建立回归模型;(3)利用所得模型,预测x=40时y的值.尝试解答方法总结解非线性回归分析问题的一般步骤 有些非线性回归分析问题并不给出函数,这时我们可以根据已知数据画出散点图,与学过的各种函数(幂函数、指数函数、对数函数等)的图象进行比较,挑选一种跟这些散点拟合得最好的函数,用适当的变量进行变换,把问题转化为线性回归分析问题,使之得到解决.一般步骤为:【迁移应用】 数独是源自18世纪瑞士的一种数学游戏,玩家需要根据9×9盘面上的已知数字,推理出所有剩余空格的数字,并满足每一行、每一列、每一个粗线宫(3×3)内的数字均含1~9,不重复.数独爱好者小明打算报名参加“丝路杯”全国数独大赛初级组的比赛,赛前小明在某数独APP上进行一段时间的训练,每天的解题平均速度y(秒)与训练天数x(天)有关,经统计得到如表的数据:x(天) 1 2 3 4 5 6 7y(秒) 990 990 450 320 300 240 210(1)现用y=a+作为回归模型,请利用表中数据,求出该回归方程;(2)请用第(1)题的结论预测,小明经过100天训练后,每天解题的平均速度y约为多少秒?参考数据:tiyi=1 845,=0.37,-7=0.55.参考公式:对于一组数据(u1,v1),(u2,v2),…,(un,vn),其回归直线=+u的斜率和截距分别为:=,=-·.1.1 直线拟合1.2 一元线性回归方程【基础知识·重落实】知识点一1.成对数据2.(1)趋势 光滑 (2)一条直线想一想 提示:不一定是.知识点二1.小 最小2. - 直线 ,想一想 提示:由=-可知,回归直线一定经过样本点的中心(,).自我诊断1.(1)√ (2)× (3)×2.D 回归直线必过样本点的中心(,),由表中数据可知=1.5,=3.3.12.1 解析:∵=0.8x+0.1,∴=0.8×15+0.1=12.1(亿元).【典型例题·精研析】【例1】 解:(1)散点图如下:(2)数据如下表:i xi yi xiyi1 3 2 9 62 5 3 25 153 6 3 36 184 7 4 49 285 9 5 81 45合计 30 17 200 112可以求得=6,=,==0.5,=-=0.4.线性回归方程为Y=0.5X+0.4.跟踪训练 解:(1)由题设所给数据,可得散点图如图,y与x成线性相关关系.(2)由表中数据计算得=86,==4.5,==3.5,xiyi=66.5,所以由最小二乘法确定的线性回归方程的系数为===0.7,=-=3.5-0.7×4.5=0.35.因此,所求线性回归方程为=0.7x+0.35.【例2】 解:作出散点图(如图所示),由图可知,月人均生活费支出与人均收入之间能用直线拟合.通过计算可得=639,=480.4,=4 610 300,=2 540 526,xiyi=3 417 560,∴=≈0.659 9,=-≈58.723 9.∴线性回归方程为Y=0.659 9X+58.723 9.将x1=1 100代入得y1≈784.61(元);将x2=1 200代入得y2≈850.60(元).故预测月人均收入分别为1 100元和1 200元的两家庭的月人均生活费支出分别为784.61元和850.60元.跟踪训练 解:(1)散点图如图所示.(2)列出下表,i 1 2 3 4 5 合计xi 2 4 5 6 8 25yi 30 40 60 50 70 250xiyi 60 160 300 300 560 1 3804 16 25 36 64 145所以==5,==50,=145,xiyi=1 380.于是可得===6.5,=-=50-6.5×5=17.5.所以所求的线性回归方程为Y=6.5X+17.5.(3)根据上面求得的线性回归方程,当广告费用支出为10百万元时,销售额估计为6.5×10+17.5=82.5(百万元).即广告费用支出为10百万元时,销售额大约为82.5百万元.随堂检测1.B ①③中的点分布在一条直线附近,适合线性回归模型.2.D ∵=(1+5+7+13+19)=9,=2+45,∴=2×9+45=63,故选D.3.D 由表格得=×(0+1+3+4)=2,=×(2.2+4.3+4.8+6.7)=4.5,因为回归直线过样本点的中心(2,4.5),所以4.5=0.95×2+,所以=2.6.4.AD =x+表示与x之间的函数关系,而不是y与x之间的函数关系,但它反映的关系最接近y与x之间的真实关系,故选A、D.5.26 解析:由题意:==4,由于回归直线过样本的中心点(,),所以=2+18=2×4+18=26,则这5名儿童的平均体重是26 kg.拓视野 非线性回归模型【例1】 解:(1)作出散点图如图,从散点图可以看出x与y不具有线性相关关系,数形结合可猜测样本点分布在某一指数型函数y=c1的周围,其中c1,c2为待定的参数,即x与y之间的关系为y=c1.(2)对(1)中猜测结果两边取对数把指数关系变为线性关系,令z=ln y,则变换后的样本点应分布在直线z=bx+a(a=ln c1,b=c2)的周围,这样就可以利用线性回归模型来建立y与x之间的非线性回归方程了,数据可以转化为x 21 23 25 27 29 32 35z 1.946 2.398 3.045 3.178 4.190 4.745 5.784求得线性回归方程为=0.272x-3.849,∴=e0.272x-3.849.(3)当x=40时,=e0.272×40-3.849≈1 131.迁移应用 解:(1)由题意得=×(990+990+450+320+300+240+210)=500,令t=,设y关于t的线性回归方程为=t+,则有===1 000,=500-1 000×0.37=130,所以=1 000t+130,又t=,所以y关于x的回归方程为=+130.(2)当x=100时,=140,所以经过100天训练后,小明每天解题的平均速度约为140秒.1 / 3(共89张PPT)1.1 直线拟合1.2 一元线性回归方程新课程标准解读 核心素养1.结合具体实例,了解一元线性回归模型的含义,了解模型参数的统计意义,了解最小二乘原理,掌握一元线性回归模型参数的最小二乘估计方法,会使用相关的统计软件 数学抽象、数学建模、数据分析2.针对实际问题,会用一元线性回归模型进行预测 数学建模、数学运算、数据分析目录基础知识·重落实01典型例题·精研析02知能演练·扣课标03基础知识·重落实01课前预习 必备知识梳理恩格尔系数是根据恩格尔定律得出的比例数,指居民家庭中食品支出占消费总支出的比重,是表示生活水平高低的一个指标.其计算公式:恩格尔系数=食品支出金额÷总支出金额.一个家庭收入越少,家庭收入中或者家庭总支出中用来购买食品的支出所占的比例就越大,随着家庭收入的增加,家庭收入中或者家庭总支出中用来购买食品的支出所占比例将会下降.【问题】 恩格尔系数是预测生活水平高低的一个模型,那么当两个变量线性相关时,我们如何对成对样本数据建立一个模型进行预测? 知识点一 直线拟合1. 散点图:在平面直角坐标系中,每个点对应的一对数据( xi , yi )称为 ,这些点构成的图称为散点图.2. 曲线拟合与直线拟合(1)曲线拟合:从散点图上可以看出,如果变量之间存在着某种关系,这些点会有一个大致趋势,这种 通常可以用一条 的曲线来近似地描述.这样近似描述的过程称为曲线拟合;成对数据 趋势 光滑 (2)直线拟合:若在两个变量 X 和 Y 的散点图中,所有点看上去都在 附近波动,此时就可以用一条直线来近似地描述这两个量之间的关系,称之为直线拟合.【想一想】 若两个变量 X 与 Y 的关系能用直线来拟合,则 X 与 Y 是函数关系吗?提示:不一定是.一条直线 知识点二 一元线性回归方程1. 最小二乘法:对于给定的两个变量 X 和 Y ,可以把其成对的观测值( x1, y1),( x2, y2),…,( xn , yn )表示为平面直角坐标系中的 n 个点,现在希望找到一条直线 Y = a + bX ,使得对每一个 xi( i =1,2,…, n ),由这个直线方程计算出来的值 a + bxi 与实际观测值 yi 的差异尽可能 .为此,希望[ y1-( a + bx1)]2+[ y2-( a + bx2)]2+…+[ yn -( a + bxn )]2达到 .换句话说,我们希望 a , b 的取值能使上式达到最小,这个方法称为最小二乘法.小 最小 2. 线性回归方程、回归直线、线性回归方程的系数若变量 X 和 Y 的 n 对观测值为( x1, y1),( x2, y2),…,( xn ,yn ),使[ y1-( a + bx1)]2+[ y2-( a + bx2)]2+…+[ yn -( a +bxn )]2达到最小的 a , b 取值为= , = . - 其中, = ( x1+ x2+…+ xn ), = ( y1+ y2+…+yn ).这时直线方程 Y = + X 称作 Y 关于 X 的线性回归方程,相应的 称作 Y 关于 X 的回归直线, 是这个线性回归方程的系数.直线 , 【想一想】回归直线与样本点的中心( , )之间有什么关系?(其中,, 分别是变量 x1, x2,…, xn 和 y1, y2,…, yn 的平均数)提示:由 = - 可知,回归直线一定经过样本点的中心( ,).1. 判断正误.(正确的画“√”,错误的画“×”)(1)散点图可以直观地分析出两个变量是否具有相关性.( √ )(2)选取一组数据的部分点得到的线性回归方程与由整组数据得到的线性回归方程一定相同. ( × )(3)根据线性回归方程得到的结论一定是可靠的. ( × )√××2. 已知 X , Y 之间的一组数据:X 0 1 2 3Y 1 2 4 5Y 关于 X 的线性回归方程 Y = X + 必过点( )A. (2,2) B. (1.5,0)C. (1,2) D. (1.5,3)解析: 回归直线必过样本点的中心( , ),由表中数据可知=1.5, =3.3. 某地区近十年居民的年收入 x 与支出 y 之间的关系大致符合 =0.8 x+0.1(单位:亿元),预计今年该地区居民收入为15亿元,则年支出估计是 亿元.解析:∵ =0.8 x +0.1,∴ =0.8×15+0.1=12.1(亿元).12.1 典型例题·精研析02课堂互动 关键能力提升题型一 求线性回归方程【例1】 某连锁经营公司所属5个零售店某月的销售额与利润额的有关数据如下表:商店名称 A B C D E销售额X/千万元 3 5 6 7 9利润额Y/百万元 2 3 3 4 5(1)画出销售额和利润额的散点图;解:散点图如下:(2)试用最小二乘法求出 Y 关于 X 的线性回归方程.解:数据如下表:i xi yi xiyi1 3 2 9 62 5 3 25 153 6 3 36 184 7 4 49 285 9 5 81 45合计 30 17 200 112可以求得 =6, = , = =0.5,= - =0.4.线性回归方程为 Y =0.5 X +0.4.通性通法求线性回归方程的步骤(1)画出成对样本数据对应点的散点图,确定两变量之间的关系.若( xi , yi )对应的点都在某一条直线附近,则两变量具有线性关系;(2)当两变量线性相关已确定,在此统计意义下,利用最小二乘法公式 = ,求 ;用 = - ,求 ;得到线性回归方程 Y = + X .【跟踪训练】 下表提供了某厂节能降耗技术改造后生产某产品过程中记录的产量 x (吨)与相应的生产能耗 y (吨标准煤)的几组对应数据.x 3 4 5 6y 2.5 3 4 4.5(1)画出散点图;解:由题设所给数据,可得散点图如图, y 与 x 成线性相关关系.(2)请根据上表提供的数据,用最小二乘法求出 y 关于 x 的线性回归方程 = x + .解:由表中数据计算得 =86, = =4.5, ==3.5, xiyi =66.5,所以由最小二乘法确定的线性回归方程的系数为= = =0.7,= - =3.5-0.7×4.5=0.35.因此,所求线性回归方程为 =0.7 x +0.35.题型二 一元线性回归方程的应用【例2】 为研究某城镇居民家庭月人均生活费支出和月人均收入的关系,随机抽取10户进行调查,其结果如下:月人均收入X/元 300 390 420 520 570月人均生活费 支出Y/元 255 324 335 360 450月人均收入X/元 700 760 800 850 1 080月人均生活费 支出Y/元 520 580 600 630 750试预测月人均收入为1 100元和月人均收入为1 200元的两个家庭的月人均生活费支出.解:作出散点图(如图所示),由图可知,月人均生活费支出与人均收入之间能用直线拟合.通过计算可得 =639, =480.4, =4 610 300,=2 540 526, xiyi =3 417 560,∴ = ≈0.659 9, = - ≈58.723 9.∴线性回归方程为 Y =0.6599 X +58.723 9.将 x1=1 100代入得 y1≈784.61(元);将 x2=1200代入得 y2≈850.60(元).故预测月人均收入分别为1100元和1 200元的两家庭的月人均生活费支出分别为784.61元和850.60元.通性通法一元线性回归方程的应用(1)可以利用一元线性回归方程 Y = + X 预测在 x0取某一个值时, y0的估计值;(2)线性关系确立之后, Y = + X 具有了统计意义,可用线性回归方程进行预测和控制.【跟踪训练】 某种产品的广告费用支出 X (单位:百万元)与销售额 Y (单位:百万元)之间有如下的对应数据:广告费用支出 X/百万元 2 4 5 6 8销售额Y/百万元 30 40 60 50 70(1)画出散点图;解:散点图如图所示.(2)试用最小二乘法求出 Y 关于 X 的线性回归方程;解:列出下表,i 1 2 3 4 5 合计xi 2 4 5 6 8 25yi 30 40 60 50 70 250xiyi 60 160 300 300 560 1 380 4 16 25 36 64 145所以 = =5, = =50, =145, xiyi =1 380.于是可得 = = =6.5, = - =50-6.5×5=17.5.所以所求的线性回归方程为 Y =6.5 X +17.5.(3)试预测广告费用支出为10百万元时,销售额多大?解:根据上面求得的线性回归方程,当广告费用支出为10百万元时,销售额估计为6.5×10+17.5=82.5(百万元).即广告费用支出为10百万元时,销售额大约为82.5百万元.1. 以下四个散点图中,两个变量的关系适合用线性回归模型刻画的是( )A. ①② B. ①③C. ②③ D. ③④解析: ①③中的点分布在一条直线附近,适合线性回归模型.2. 由变量 x 与 y 相对应的一组数据(1, y1),(5, y2),(7,y3),(13, y4),(19, y5)得到的线性回归方程为 =2 x +45,则 =( )A. 135 B. 90 C. 67 D. 63解析: ∵ = (1+5+7+13+19)=9, =2 +45,∴ =2×9+45=63,故选D.3. 已知 X , Y 的取值如下表所示,若变量 Y 与 X 能用直线拟合,且 Y =0.95 X + ,则 =( )X 0 1 3 4Y 2.2 4.3 4.8 6.7A. 2.2 B. 2.9C. 2.8 D. 2.6解析: 由表格得 = ×(0+1+3+4)=2, = ×(2.2+4.3+4.8+6.7)=4.5,因为回归直线过样本点的中心(2,4.5),所以4.5=0.95×2+ ,所以 =2.6.4. (多选)下列有关线性回归方程 = x + 叙述正确的是( )A. 反映 与 x 之间的函数关系B. 反映 y 与 x 之间的函数关系C. 表示 与 x 之间不确定关系D. 表示最接近 y 与 x 之间真实关系的一条直线解析: = x + 表示 与 x 之间的函数关系,而不是 y 与 x 之间的函数关系,但它反映的关系最接近 y 与 x 之间的真实关系,故选A、D.5. 若根据5名儿童的年龄 x (岁)和体重 y (kg)的数据用最小二乘法得到用年龄预报体重的线性回归方程是 =2 x +18,已知这5名儿童的年龄分别是3,5,2,6,4,则这5名儿童的平均体重是 kg.解析:由题意: = =4,由于回归直线过样本的中心点( , ),所以 =2 +18=2×4+18=26,则这5名儿童的平均体重是26 kg.26 1. 非线性回归分析的思想研究两个变量的关系时,依据样本点画出散点图,从整体上看,如果样本点没有分布在某个带状区域内,就称这两个变量之间不具有线性相关关系,此时不能直接利用线性回归方程来建立两个变量之间的关系. 非线性回归模型2. 非线性回归方程当回归方程不是形如 = x + ( , ∈R)时,称之为非线性回归方程.当两个变量不呈线性相关关系时,依据样本点的分布选择合适的曲线方程来拟合数据,可通过变量代换,利用线性回归模型建立两个变量间的非线性回归方程.3. 非线性回归问题的处理方法(1)指数函数型 y =e bx+ a①函数 y =e bx+ a 的图象,如图(ⅰ);②处理方法:两边取对数得ln y =ln e bx+ a ,即ln y = bx + a .令z =ln y ,把原始数据( x , y )转化为( x , z ),再根据求一元线性回归模型的方法求出 a , b .(2)对数函数型 y = b ln x + a①函数 y = b ln x + a 的图象,如图(ⅱ);②处理方法:设x'=ln x ,原方程可化为 y =bx'+ a ,再根据求一元线性回归模型的方法求出 a , b .(3)二次函数型 y = bx2+ a处理方法:设x'= x2,原方程可化为 y =bx'+ a ,再根据求一元线性回归模型的方法求出 a , b .【例】 下表为收集到的一组数据:x 21 23 25 27 29 32 35y 7 11 21 24 66 115 325(1)作出 x 与 y 的散点图,并猜测 x 与 y 之间的关系;解:作出散点图如图,从散点图可以看出 x 与 y 不具有线性相关关系,数形结合可猜测样本点分布在某一指数型函数 y = c1的周围,其中 c1, c2为待定的参数,即 x 与 y 之间的关系为 y = c1 .(2)通过 x 与 y 的关系,建立回归模型;解:对(1)中猜测结果两边取对数把指数关系变为线性关系,令 z =ln y ,则变换后的样本点应分布在直线 z = bx + a( a =ln c1, b = c2)的周围,这样就可以利用线性回归模型来建立 y 与 x 之间的非线性回归方程了,数据可以转化为x 21 23 25 27 29 32 35z 1.946 2.398 3.045 3.178 4.190 4.745 5.784求得线性回归方程为 =0.272 x -3.849,∴ =e0.272 x-3.849.(3)利用所得模型,预测 x =40时 y 的值.解:当 x =40时, =e0.272×40-3.849≈1 131.方法总结解非线性回归分析问题的一般步骤 有些非线性回归分析问题并不给出函数,这时我们可以根据已知数据画出散点图,与学过的各种函数(幂函数、指数函数、对数函数等)的图象进行比较,挑选一种跟这些散点拟合得最好的函数,用适当的变量进行变换,把问题转化为线性回归分析问题,使之得到解决.一般步骤为:【迁移应用】 数独是源自18世纪瑞士的一种数学游戏,玩家需要根据9×9盘面上的已知数字,推理出所有剩余空格的数字,并满足每一行、每一列、每一个粗线宫(3×3)内的数字均含1~9,不重复.数独爱好者小明打算报名参加“丝路杯”全国数独大赛初级组的比赛,赛前小明在某数独APP上进行一段时间的训练,每天的解题平均速度 y (秒)与训练天数 x (天)有关,经统计得到如表的数据:x (天) 1 2 3 4 5 6 7y (秒) 990 990 450 320 300 240 210(1)现用 y = a + 作为回归模型,请利用表中数据,求出该回归方程;解:由题意得 = ×(990+990+450+320+300+240+210)=500,令 t = ,设 y 关于 t 的线性回归方程为 = t + ,则有 = = =1 000,=500-1 000×0.37=130,所以 =1 000 t +130,又 t = ,所以 y 关于 x 的回归方程为 = +130.(2)请用第(1)题的结论预测,小明经过100天训练后,每天解题的平均速度 y 约为多少秒?参考数据 : tiyi =1 845, =0.37, -7=0.55.参考公式:对于一组数据( u1, v1),( u2, v2),…,( un ,vn ),其回归直线 = + u 的斜率和截距分别为: =, = - · .解:当 x =100时, =140,所以经过100天训练后,小明每天解题的平均速度约为140秒.知能演练·扣课标03课后巩固 核心素养落地1. 对于给定的两个变量的统计数据,下列说法正确的是( )A. 都可以分析出两个变量的关系B. 都可以用一条直线近似地表示两者的关系C. 都可以画出散点图D. 都可以用确定的表达式表示两者的关系解析: 给出两个变量的统计数据,总可以画出相应的散点图,但不一定能分析出两个变量的关系,更不一定能得出两个变量有线性相关关系或函数关系.故选C.1234567891011121314152. 一位母亲记录了自己儿子3~9岁的身高数据(略),由此建立的身高与年龄的线性回归方程为 Y =7.19 X +73.93,用这个方程预测这个孩子10岁时的身高,则正确的叙述是( )A. 身高一定是145.83 cmB. 身高在145.83 cm以上C. 身高在145.83 cm左右D. 身高在145.83 cm以下解析: 由线性回归方程可得 y0=7.19×10+73.93=145.83,所以预测这个孩子10岁时的身高在145.83 cm左右.1234567891011121314153. 最小二乘法的原理是( )A. 使得 [ yi -( a + bxi )]最小B. 使得 [ yi -( a + bxi )2]最小C. 使得 [ -( a + bxi )2]最小D. 使得 [ yi -( a + bxi )]2最小解析: 原理为“使得样本数据的点到回归直线的距离的平方和最小”,故选D.1234567891011121314154. 某产品的广告费用 X 与销售额 Y 的统计数据如下表:广告费用X/万元 4 2 3 5销售额Y/万元 49 26 39 54根据上表可得线性回归方程 Y = X + 中的 为9.4,则 Y 关于 X 的线性回归方程为( )A. Y =9.4 X +9.1 B. Y =9.4 X -9.1C. Y =-9.4 X +9.1 D. Y =-9.4 X -9.1123456789101112131415解析: 由表可计算 = = , = =42,因为点 在回归直线 Y = X + 上,且 为9.4,所以42=9.4× + ,解得 =9.1,故线性回归方程为 Y =9.4 X +9.1.1234567891011121314155. 某校一个课外学习小组为研究某作物种子的发芽率 y 和温度 x (单位:℃)的关系,在20个不同的温度条件下进行种子发芽实验,由实验数据( xi , yi )( i =1,2,…,20)得到下面的散点图:123456789101112131415A. y = a + bx B. y = a + bx2C. y = a + b e x D. y = a + b ln x解析: 根据散点图,用光滑的曲线把图中各点依次连起来(图略),由图并结合选项可排除A、B、C,故选D.由此散点图,在10 ℃至40 ℃之间,下面四个回归方程类型中最适宜作为发芽率 y 和温度 x 的回归方程类型的是( )1234567891011121314156. (多选)月亮公转与自转的周期大约为30天,阴历就是以月相变化为依据的.人们根据长时间的观测,统计了月亮出来的时间 y (简称“月出时间”,单位:时)与天数 x ( x 为阴历日数, x ∈N+,且0≤ x≤30)的有关数据,如下表所示,并且根据表中数据,求得 y 关于 x的线性回归方程为 =0.8 x + .x 2 4 7 10 15 22y 8.1 9.4 12 14.4 18.5 24123456789101112131415A. 回归直线过点(10,14.4)B. =6.8C. 预测月出时间为16时的那天是阴历13日D. 预测阴历27日的月出时间为阴历28日早上4:00其中,阴历22日是分界线,从阴历22日开始月亮就要到第二天(即23日0:00)才升起.则( )123456789101112131415解析: = =10, ==14.4,故回归直线过点(10,14.4),选项A正确;将(10,14.4)代入 =0.8 x + ,得 =6.4,故选项B错误;∵ =0.8 x +6.4,当 =16时, x =12,∴月出时间为阴历12日,选项C错误;∵阴历27日时,即 x =27,代入线性回归方程得 =0.8×27+6.4=28,∴日出时间应该为28日早上4:00,选项D正确.1234567891011121314157. 若施化肥量 x (千克/亩)与水稻产量 y (千克/亩)的线性回归方程为 =5 x +250,当施化肥量为80千克/亩时,预计水稻产量为亩产 千克左右.解析:当 x =80时, =400+250=650.650 1234567891011121314158. 对具有线性相关关系的变量 x , y ,测得相关数据如下表:x 2 4 5 6 8y 20 40 60 70 80根据上表,利用最小二乘法求得它们的线性回归方程为 =10.5 x +,据此模型来预测当 x =20时, y 的估计值为 .解析:由已知得 =5, =54,则(5,54)满足线性回归方程=10.5 x + ,解得 =1.5,因此 =10.5 x +1.5.当 x =20时, =10.5×20+1.5=211.5.211.5 1234567891011121314159. 如图是一组数据( x , y )的散点图,用最小二乘法计算,变量 Y 与X 之间的线性回归方程为 Y = X +1,则 = .0.8 解析:由题图知 = =2,= =2.6,将(2,2.6)代入 Y = X +1中,解得 =0.8.12345678910111213141510. 某工厂为了对新研发的一种产品进行合理定价,将该产品按事先拟定的价格进行试销,得到如下数据:单价 x (元) 8 8.2 8.4 8.6 8.8 9销量 y (件) 90 84 83 80 75 68123456789101112131415(1)求线性回归方程 = x + ,其中 =-20;解:由于 = =8.5,= =80.所以 = - =80+20×8.5=250,从而线性回归方程为 =-20 x +250.123456789101112131415(2)预计在今后的销售中,销量与单价仍然服从(1)中的关系,且该产品的成本是4元/件,为使工厂获得最大利润,该产品的单价应定为多少元?(利润=销售收入-成本)解:设工厂获得的利润为 L 元,依题意得 L = x (-20 x+250)-4(-20 x +250)=-20 x2+330 x -1 000=-20( x -8.25)2+361.25.当且仅当 x =8.25时, L 取得最大值,故当单价定为8.25元时,工厂可获得最大利润.12345678910111213141511. 为了考查两个变量 x 和 y 之间的线性相关性,甲、乙两位同学各自独立地做了100次和150次试验,并且利用最小二乘法求得的回归直线分别为 l1和 l2.已知两个人在试验中发现对变量 x 的观测数据的平均值都是 s ,对变量 y 的观测数据的平均值都是 t ,那么下列说法中正确的是( )A. l1与 l2有交点( s , t )B. l1与 l2相交,但交点不一定是( s , t )C. l1与 l2必定平行D. l1与 l2必定重合解析: 回归直线 l1, l2都过点( s , t ),但它们的斜率不确定,故选A.12345678910111213141512. “学习强国”学习平台是由中宣部主管,以深入学习宣传习近平新时代中国特色社会主义思想为主要内容,立足全体党员、面向全社会的优质平台,现日益成为老百姓了解国家动态、紧跟时代脉搏的热门APP.123456789101112131415为了解某单位职工“学习强国”每天的学习时长与所得积分之间的关系,现从该单位随机抽取10名职工,统计他们某天的学习时长 X (单位:min)得到条形图形如图所示,该10名职工的学习积分分别为 yi ( i =1,2,…,10),若学习时长 X 与所得积分 Y 之间的线性回归方程为 Y= X + .已知 yi =350, = .若该单位某人在一天的学习时长为40 min,据此估计其所得积分为( )A. 25 B. 28C. 29 D. 30123456789101112131415解析: = =50, = =35,又 =,∴ =35- ×50=5,∴ Y = X +5,取 x0=40,得 y0= ×40+5=29.故选C.12345678910111213141513. (多选)某公司过去五个月的广告费支出 x (单位:万元)与销售额 y (单位:万元)之间有下列对应数据:x 2 4 5 6 8y ▲ 40 60 50 70123456789101112131415A. 丢失的数据(表中▲处)为30B. 该公司广告费支出每增加1万元,销售额约增加6.5万元C. 该公司广告费支出每增加1万元,销售额增加17.5万元D. 若该公司下月广告费支出为8万元,则销售额约为75万元工作人员不慎将表格中 y 的第一个数据丢失.已知 y 关于 x 的线性回归方程为 =6.5 x +17.5,则下列说法正确的是( )123456789101112131415解析: 设丢失的数据为 m ,由表中的数据可得 =5, =,把点 代入线性回归方程,可得 =6.5×5+17.5,解得 m =30,所以A正确;该公司广告费支出每增加1万元,销售额约增加6.5万元,所以B正确,C不正确;若该公司下月广告费支出为8万元,则销售额约为 =6.5×8+17.5=69.5(万元),所以D不正确.故选A、B.12345678910111213141514. 为了解篮球爱好者小李的投篮命中率与打篮球时间之间的关系,下表记录了小李某月1号到5号每天打篮球时间 X (单位:h)与当天投篮命中率 Y 之间的关系:时间 X 1 2 3 4 5命中率 Y 0.4 0.5 0.6 0.6 0.4小李这5天的平均投篮命中率为 ;用线性回归分析的方法,预测小李该月6号打6小时篮球的投篮命中率为 .0.50.53123456789101112131415解析:小李这5天的平均投篮命中率 = ×(0.4+0.5+0.6+0.6+0.4)=0.5, =3, = =0.01, = - =0.5-0.03=0.47.∴线性回归方程为 Y =0.01 X +0.47,则当 x0=6时, y0=0.53.∴预测小李该月6号打6小时篮球的投篮命中率为0.53.12345678910111213141515. 随着网络的普及,网上购物的方式已经受到越来越多年轻人的青睐,某家网络店铺商品的成交量 x (单位:件)与店铺的浏览量 y(单位:次)之间的对应数据如下表所示:x/件 2 4 5 6 8y/次 30 40 50 60 70(1)根据表中数据画出散点图;解:散点图如图所示.123456789101112131415(2)根据表中的数据,求出 y 关于 x 的线性回归方程;解:根据散点图可得,变量 x 与 y 之间具有线性相关关系,设线性回归方程为 = x + .根据数据可知, =5, =50, xiyi =1 390,=145,代入公式得 = = =7,= - =50-7×5=15.故所求的线性回归方程是 =7 x +15.123456789101112131415(3)当这种商品的成交量突破100件(含100件)时,预测这家店铺的浏览量至少为多少?解:根据上面求出的线性回归方程,当成交量突破100件(含100件),即 x = ≥100时, ≥715,所以预测这家店铺的浏览量至少为715次.123456789101112131415谢 谢 观 看!1234567891011121314151.1 直线拟合 1.2 一元线性回归方程1.对于给定的两个变量的统计数据,下列说法正确的是( )A.都可以分析出两个变量的关系B.都可以用一条直线近似地表示两者的关系C.都可以画出散点图D.都可以用确定的表达式表示两者的关系2.一位母亲记录了自己儿子3~9岁的身高数据(略),由此建立的身高与年龄的线性回归方程为Y=7.19X+73.93,用这个方程预测这个孩子10岁时的身高,则正确的叙述是( )A.身高一定是145.83 cmB.身高在145.83 cm以上C.身高在145.83 cm左右D.身高在145.83 cm以下3.最小二乘法的原理是( )A.使得[yi-(a+bxi)]最小B.使得[yi-(a+bxi)2]最小C.使得[-(a+bxi)2]最小D.使得[yi-(a+bxi)]2最小4.某产品的广告费用X与销售额Y的统计数据如下表:广告费用X/万元 4 2 3 5销售额Y/万元 49 26 39 54根据上表可得线性回归方程Y=X+中的为9.4,则Y关于X的线性回归方程为( )A.Y=9.4X+9.1 B.Y=9.4X-9.1C.Y=-9.4X+9.1 D.Y=-9.4X-9.15.某校一个课外学习小组为研究某作物种子的发芽率y和温度x(单位:℃)的关系,在20个不同的温度条件下进行种子发芽实验,由实验数据(xi,yi)(i=1,2,…,20)得到下面的散点图:由此散点图,在10 ℃至40 ℃之间,下面四个回归方程类型中最适宜作为发芽率y和温度x的回归方程类型的是( )A.y=a+bx B.y=a+bx2C.y=a+bex D.y=a+bln x6.(多选)月亮公转与自转的周期大约为30天,阴历就是以月相变化为依据的.人们根据长时间的观测,统计了月亮出来的时间y(简称“月出时间”,单位:时)与天数x(x为阴历日数,x∈N+,且0≤x≤30)的有关数据,如下表所示,并且根据表中数据,求得y关于x的线性回归方程为=0.8x+.x 2 4 7 10 15 22y 8.1 9.4 12 14.4 18.5 24其中,阴历22日是分界线,从阴历22日开始月亮就要到第二天(即23日0:00)才升起.则( )A.回归直线过点(10,14.4)B.=6.8C.预测月出时间为16时的那天是阴历13日D.预测阴历27日的月出时间为阴历28日早上4:007.若施化肥量x(千克/亩)与水稻产量y(千克/亩)的线性回归方程为=5x+250,当施化肥量为80千克/亩时,预计水稻产量为亩产 千克左右.8.对具有线性相关关系的变量x,y,测得相关数据如下表:x 2 4 5 6 8y 20 40 60 70 80根据上表,利用最小二乘法求得它们的线性回归方程为=10.5x+,据此模型来预测当x=20时,y的估计值为 .9.如图是一组数据(x,y)的散点图,用最小二乘法计算,变量Y与X之间的线性回归方程为Y=X+1,则= .10.某工厂为了对新研发的一种产品进行合理定价,将该产品按事先拟定的价格进行试销,得到如下数据:单价x(元) 8 8.2 8.4 8.6 8.8 9销量y(件) 90 84 83 80 75 68(1)求线性回归方程=x+,其中=-20;(2)预计在今后的销售中,销量与单价仍然服从(1)中的关系,且该产品的成本是4元/件,为使工厂获得最大利润,该产品的单价应定为多少元?(利润=销售收入-成本)11.为了考查两个变量x和y之间的线性相关性,甲、乙两位同学各自独立地做了100次和150次试验,并且利用最小二乘法求得的回归直线分别为l1和l2.已知两个人在试验中发现对变量x的观测数据的平均值都是s,对变量y的观测数据的平均值都是t,那么下列说法中正确的是( )A.l1与l2有交点(s,t)B.l1与l2相交,但交点不一定是(s,t)C.l1与l2必定平行D.l1与l2必定重合12.“学习强国”学习平台是由中宣部主管,以深入学习宣传习近平新时代中国特色社会主义思想为主要内容,立足全体党员、面向全社会的优质平台,现日益成为老百姓了解国家动态、紧跟时代脉搏的热门APP.为了解某单位职工“学习强国”每天的学习时长与所得积分之间的关系,现从该单位随机抽取10名职工,统计他们某天的学习时长X(单位:min)得到条形图形如图所示,该10名职工的学习积分分别为yi(i=1,2,…,10),若学习时长X与所得积分Y之间的线性回归方程为Y=X+.已知yi=350,=.若该单位某人在一天的学习时长为40 min,据此估计其所得积分为( )A.25 B.28 C.29 D.3013.(多选)某公司过去五个月的广告费支出x(单位:万元)与销售额y(单位:万元)之间有下列对应数据:x 2 4 5 6 8y ▲ 40 60 50 70工作人员不慎将表格中y的第一个数据丢失.已知y关于x的线性回归方程为=6.5x+17.5,则下列说法正确的是( )A.丢失的数据(表中▲处)为30B.该公司广告费支出每增加1万元,销售额约增加6.5万元C.该公司广告费支出每增加1万元,销售额增加17.5万元D.若该公司下月广告费支出为8万元,则销售额约为75万元14.为了解篮球爱好者小李的投篮命中率与打篮球时间之间的关系,下表记录了小李某月1号到5号每天打篮球时间X(单位:h)与当天投篮命中率Y之间的关系:时间X 1 2 3 4 5命中率Y 0.4 0.5 0.6 0.6 0.4小李这5天的平均投篮命中率为 ;用线性回归分析的方法,预测小李该月6号打6小时篮球的投篮命中率为 .15.随着网络的普及,网上购物的方式已经受到越来越多年轻人的青睐,某家网络店铺商品的成交量x(单位:件)与店铺的浏览量y(单位:次)之间的对应数据如下表所示:x/件 2 4 5 6 8y/次 30 40 50 60 70(1)根据表中数据画出散点图;(2)根据表中的数据,求出y关于x的线性回归方程;(3)当这种商品的成交量突破100件(含100件)时,预测这家店铺的浏览量至少为多少?1.1 直线拟合1.2 一元线性回归方程1.C 给出两个变量的统计数据,总可以画出相应的散点图,但不一定能分析出两个变量的关系,更不一定能得出两个变量有线性相关关系或函数关系.故选C.2.C 由线性回归方程可得y0=7.19×10+73.93=145.83,所以预测这个孩子10岁时的身高在145.83 cm左右.3.D 原理为“使得样本数据的点到回归直线的距离的平方和最小”,故选D.4.A 由表可计算==,==42,因为点( ,42)在回归直线Y=X+上,且为9.4,所以42=9.4×+,解得=9.1,故线性回归方程为Y=9.4X+9.1.5.D 根据散点图,用光滑的曲线把图中各点依次连起来(图略),由图并结合选项可排除A、B、C,故选D.6.AD ==10,==14.4,故回归直线过点(10,14.4),选项A正确;将(10,14.4)代入=0.8x+,得=6.4,故选项B错误;∵=0.8x+6.4,当=16时,x=12,∴月出时间为阴历12日,选项C错误;∵阴历27日时,即x=27,代入线性回归方程得=0.8×27+6.4=28,∴日出时间应该为28日早上4:00,选项D正确.7.650 解析:当x=80时,=400+250=650.8.211.5 解析:由已知得=5,=54,则(5,54)满足线性回归方程=10.5x+,解得=1.5,因此=10.5x+1.5.当x=20时,=10.5×20+1.5=211.5.9.0.8 解析:由题图知==2,==2.6,将(2,2.6)代入Y=X+1中,解得=0.8.10.解:(1)由于==8.5,==80.所以=-=80+20×8.5=250,从而线性回归方程为=-20x+250.(2)设工厂获得的利润为L元,依题意得L=x(-20x+250)-4(-20x+250)=-20x2+330x-1 000=-20(x-8.25)2+361.25.当且仅当x=8.25时,L取得最大值,故当单价定为8.25元时,工厂可获得最大利润.11.A 回归直线l1,l2都过点(s,t),但它们的斜率不确定,故选A.12.C ==50,==35,又=,∴=35-×50=5,∴Y=X+5,取x0=40,得y0=×40+5=29.故选C.13.AB 设丢失的数据为m,由表中的数据可得=5,=,把点代入线性回归方程,可得=6.5×5+17.5,解得m=30,所以A正确;该公司广告费支出每增加1万元,销售额约增加6.5万元,所以B正确,C不正确;若该公司下月广告费支出为8万元,则销售额约为=6.5×8+17.5=69.5(万元),所以D不正确.故选A、B.14.0.5 0.53 解析:小李这5天的平均投篮命中率=×(0.4+0.5+0.6+0.6+0.4)=0.5,=3,==0.01,=-=0.5-0.03=0.47.∴线性回归方程为Y=0.01X+0.47,则当x0=6时,y0=0.53.∴预测小李该月6号打6小时篮球的投篮命中率为0.53.15.解:(1)散点图如图所示.(2)根据散点图可得,变量x与y之间具有线性相关关系,设线性回归方程为=x+.根据数据可知,=5,=50,xiyi=1 390,=145,代入公式得===7,=-=50-7×5=15.故所求的线性回归方程是=7x+15.(3)根据上面求出的线性回归方程,当成交量突破100件(含100件),即x=≥100时,≥715,所以预测这家店铺的浏览量至少为715次.1 / 3 展开更多...... 收起↑ 资源列表 1.1 直线拟合 1.2 一元线性回归方程.docx 1.1 直线拟合 1.2 一元线性回归方程.pptx 1.1 直线拟合1.2 一元线性回归方程(练习,含解析).docx