资源简介 4.2 课时1 回归直线方程【学习目标】1.了解最小二乘法的思想及意义.(数学抽象)2.会根据给出的回归方程的系数公式求一元线性回归方程.(数学运算、数据分析)【自主预习】1.什么是回归分析 【答案】 由散点图求出回归直线并进行统计推断的过程.2.求回归直线方程的主要方法是什么 【答案】 最小二乘法.3.任何一组数据都可以由最小二乘法得出回归方程吗 【答案】 用最小二乘法求回归方程的前提是先判断所给数据是否具有线性相关关系(可利用散点图来判断),否则求出的回归方程是无意义的.1.判断下列结论是否正确.(正确的打“√”,错误的打“×”)(1)对于任意给定的两个变量的统计数据,都可以作出散点图. ( )(2)线性回归方程最能代表观测值x,y之间的线性关系,且回归直线过样本中心(,). ( )(3)利用线性回归方程求出的值是准确值. ( )(4)若回归系数是负的,则y的值随x的增大而减小. ( )【答案】 (1)√ (2)√ (3)× (4)√2.变量y对x的回归方程的意义是( ).A.表示y与x之间的函数关系B.表示y与x之间的线性关系C.反映y与x之间的真实关系D.反映y与x之间的真实关系达到最大限度的吻合【答案】 D【解析】 线性回归方程最能代表观测值x,y之间的线性相关关系,反映y与x之间的真实关系达到最大限度的吻合.3.设有一个线性回归方程为y=-1.5x+2,则变量x每增加1个单位,( ).A.y平均增加1.5个单位B.y平均增加2个单位C.y平均减少1.5个单位D.y平均减少2个单位【答案】 C【解析】 因为回归方程的斜率为-1.5,所以变量x每增加1个单位,y平均减少1.5个单位.4.某工厂对某产品的产量与成本的资料分析后有如下数据:产量x/千件 2 3 5 6成本y/万元 7 8 9 12由表中数据得到的线性回归方程=x+中=1.1,则预测当产量为9千件时,成本约为 万元. 【答案】 14.5【解析】 由表中数据得=4,=9,代入线性回归方程得=4.6,∴当x=9时,=1.1×9+4.6=14.5.【合作探究】探究1 回归直线方程问题1:在一元线性回归模型中,变量y由变量x唯一确定吗 【答案】 不唯一.y值由x和随机误差e共同确定,即自变量x只能解释部分y的变化.问题2:在一元线性回归模型yi=+xi+ei中,随机误差ei产生的主要原因有哪些 【答案】 (1)所用的确定性函数不恰当;(2)忽略了某些因素的影响;(3)存在观测误差.问题3:回归分析中,利用线性回归方程求出的函数值一定是真实值吗 为什么 【答案】 不一定是真实值.利用线性回归方程求的值,在很多时候是个预测值.例如,人的体重与身高存在一定的线性关系,但体重除了受身高的影响外,还受其他因素的影响,如饮食习惯,是否喜欢运动等.新知生成1.回归直线、回归直线方程找出与散点图中各点散布趋势相似的直线,使各点经过或充分靠近该直线,这样所得到的直线叫作回归直线,这条直线的方程叫作回归直线方程.2.回归分析由散点图求出回归直线并进行统计推断的过程叫作回归分析.3.一元线性回归方程在回归分析中,被预测或被解释的变量称为因变量,用y表示.用来预测或解释因变量的变量称为自变量,用x表示.如果具有相关关系的两个变量x,y可用方程y=a+bx来近似刻画,那么称y=a+bx为y关于x的一元线性回归方程,其中a,b称为回归系数.由于我们是利用样本数据(一组观测值)去估计总体的回归直线方程,得到估计的回归直线方程形式为=+x.4.一元线性回归模型我们把yi=+xi+ei(i=1,2,…,n)这一描述因变量y如何依赖于自变量 x和随机误差ei的方程称为一元线性回归模型.新知运用例1 某公司为了预测下月的产品销售情况,找出了近7个月的产品销售量y(单位:万件)的统计表:月份代码t 1 2 3 4 5 6 7销售量y/万件 y1 y2 y3 y4 y5 y6 y7 但其中数据被污损看不清,经查证yi=9.32,tiyi=40.17,=0.55.(1)请用相关系数r说明销售量y与月份代码t之间有很强的线性相关关系(当>0.8时,认为两个变量有很强的线性相关关系);(2)若=0.10t+0.93,公司经营期间的广告宣传费(单位:万元)xi=(i=1,2,…),每件产品的销售价为10元,预测第8个月的毛利润能否突破15万元,并说明理由(毛利润=销售金额-广告宣传费).参考数据:≈2.65,≈1.41.【解析】 (1)由题意得=4,=28,(ti-)(yi-)=tiyi-yi=40.17-4×9.32=2.89. ∴rty=≈≈0.99>0.8,∴销售量y与月份代码t之间有很强的线性相关关系.(2)不能,理由如下:当t=8时,=0.10×8+0.93=1.73,而10×1.73-≈17.3-2×1.41=14.48万元<15万元,∴第8个月的毛利润不能突破15万元.【方法总结】 用线性回归方程估计总体的一般步骤:(1)先判断相关关系,作出散点图判断或利用相关系数判断;(2)根据线性回归方程对总体进行估计.一台机器按不同的转速生产出来的某机械零件有一些会有缺点,每小时生产有缺点的零件的多少随机器运转速度的变化而变化,下表为抽样试验的结果:转速x/(转/秒) 16 14 12 8每小时生产有缺点的零件数y/件 11 9 8 5 (1)画出散点图;(2)如果y与x有线性相关关系,请画出一条直线近似地表示这种线性关系;(3)在实际生产中,若它们的关系可用方程y=x-来近似刻画,允许每小时生产的产品中有缺点的零件最多为10件,那么机器的运转速度应控制在什么范围内 【解析】 (1)散点图如图所示:(2)近似直线如图所示:(3)由y≤10得x-≤10,解得x≤≈14.9.所以机器的运转速度应控制在14转/秒内.探究2 最小二乘法问题1:一个好的线性关系与散点图中各点的位置应具有怎样的关系 【答案】 整体上最接近.问题2:设直线方程为y=a+bx,任意给定一个样本点A(xi,yi),用什么样的方法刻画点与直线的距离更方便有效 【答案】 如图,(法一)点到直线的距离公式d=.(法二)[yi-(a+bxi)]2.显然法二比法一更方便计算,所以我们用它表示二者之间的接近程度.问题3: 线性回归方程是否经过定点 【答案】 线性回归方程过定点(,).新知生成1.最小二乘法使“随机误差平方和最小”的方法叫作最小二乘法.2.,的计算公式==,=-b.此时,用最小二乘法得到的回归直线方程为=x+,其中是回归直线在y轴上的截距,是回归直线的斜率.新知运用例2 某研究机构对高三学生的记忆力x和判断力y进行统计分析,得下表数据:x 6 8 10 12y 2 3 5 6 (1)请画出上表数据的散点图;(2)请根据上表提供的数据,用最小二乘法求出y关于x的回归直线方程=x+;(3)试根据求出的回归直线方程,预测记忆力为13的同学的判断力.【解析】 (1)散点图如图所示:(2)==9,==4,=62+82+102+122=344,xiyi=6×2+8×3+10×5+12×6=158,===0.7,=-=4-0.7×9=-2.3,故回归直线方程为=0.7x-2.3.(3)由(2)中回归直线方程可知,当x=13时,=0.7×13-2.3=6.8,即预测记忆力为13的同学的判断力为6.8.【方法总结】 求解线性回归方程及预测的步骤:(1)利用散点图判断两个变量是否具有线性相关关系;(2)列表求出,, , xiyi;(3)利用相应的公式计算,的值;(4)写出线性回归方程,并利用线性回归方程进行预测. 从中国教育在线官方公布的考研动机调查来看,本科生扎堆考研的原因大概集中在这6个方面:本科就业压力大,提升竞争力;通过考研选择真正感兴趣的专业;为了获得学历;继续深造;随大流;有名校情结.如图,这是2015—2019年全国硕士研究生报考人数趋势图(单位:万人)的折线图.(1)求y关于t的线性回归方程;(2)根据(1)中的回归方程,预测2023年全国硕士研究生的报考人数.参考数据:(ti-)(yi-)=311.参考公式:回归方程=+t中斜率和截距的最小二乘估计公式分别是=,=-.【解析】 (1)由题中数据计算得=×(1+2+3+4+5)=3,==214.2,=(-2)2+(-1)2+02+12+22=10,所以===31.1,所以=-=214.2-31.1×3=120.9,故y关于t的线性回归方程为=31.1t+120.9.(2)将2023年对应的t=9代入线性回归方程得=31.1×9+120.9=400.8,所以预测2023年全国硕士研究生的报考人数为400.8万人.【随堂检测】1.已知两个变量x和y之间有线性相关关系,经调查得到如下样本数据:x 3 4 5 6 7y 3.5 2.4 1.1 -0.2 -1.3根据表格中的数据求得回归方程=x+,则下列说法正确的是( ).A.>0,>0 B.>0,<0C.<0,>0 D.<0,<0【答案】 B【解析】 由已知数据,可知y随着x的增大而减小,故变量x和变量y之间存在负相关关系,∴<0,当x=0时,=>3.5>0,即>0,<0.2.在一次试验中,测得(x,y)的四组值分别为(1,2),(2,3),(3,4),(4,5),则y与x之间的回归直线方程为( ).A.y=x+1 B.y=x+2C.y=2x+1 D.y=x-1【答案】 A【解析】 由题意得==2.5,==3.5,因为回归直线过样本中心(,),故A正确.3.由变量x与y相对应的一组成对样本数据(1,y1),(5,y2),(7,y3),(13,y4),(19,y5)得到的回归直线方程为=2x+45,则= . 【答案】 63【解析】 ∵=×(1+5+7+13+19)=9,=2+45,∴=2×9+45=63.4.某公司对广告费用x和销售额y进行统计分析,得下表数据:x 6 8 10 12y 2 4 8 10已知广告费用x和销售额y是线性相关的,求y关于x的回归直线方程. 【解析】 由已知得==9,==6,=62+82+102+122=344,xiyi=6×2+8×4+10×8+12×10=244,则===1.4,=-=6-1.4×9=-6.6,故所求的回归直线方程为y=1.4x-6.6.24.2 课时1 回归直线方程【学习目标】1.了解最小二乘法的思想及意义.(数学抽象)2.会根据给出的回归方程的系数公式求一元线性回归方程.(数学运算、数据分析)【自主预习】1.什么是回归分析 2.求回归直线方程的主要方法是什么 3.任何一组数据都可以由最小二乘法得出回归方程吗 1.判断下列结论是否正确.(正确的打“√”,错误的打“×”)(1)对于任意给定的两个变量的统计数据,都可以作出散点图. ( )(2)线性回归方程最能代表观测值x,y之间的线性关系,且回归直线过样本中心(,). ( )(3)利用线性回归方程求出的值是准确值. ( )(4)若回归系数是负的,则y的值随x的增大而减小. ( )2.变量y对x的回归方程的意义是( ).A.表示y与x之间的函数关系B.表示y与x之间的线性关系C.反映y与x之间的真实关系D.反映y与x之间的真实关系达到最大限度的吻合3.设有一个线性回归方程为y=-1.5x+2,则变量x每增加1个单位,( ).A.y平均增加1.5个单位B.y平均增加2个单位C.y平均减少1.5个单位D.y平均减少2个单位4.某工厂对某产品的产量与成本的资料分析后有如下数据:产量x/千件 2 3 5 6成本y/万元 7 8 9 12由表中数据得到的线性回归方程=x+中=1.1,则预测当产量为9千件时,成本约为 万元. 【合作探究】探究1 回归直线方程问题1:在一元线性回归模型中,变量y由变量x唯一确定吗 问题2:在一元线性回归模型yi=+xi+ei中,随机误差ei产生的主要原因有哪些 问题3:回归分析中,利用线性回归方程求出的函数值一定是真实值吗 为什么 新知生成1.回归直线、回归直线方程找出与散点图中各点散布趋势相似的直线,使各点经过或充分靠近该直线,这样所得到的直线叫作回归直线,这条直线的方程叫作回归直线方程.2.回归分析由散点图求出回归直线并进行统计推断的过程叫作回归分析.3.一元线性回归方程在回归分析中,被预测或被解释的变量称为因变量,用y表示.用来预测或解释因变量的变量称为自变量,用x表示.如果具有相关关系的两个变量x,y可用方程y=a+bx来近似刻画,那么称y=a+bx为y关于x的一元线性回归方程,其中a,b称为回归系数.由于我们是利用样本数据(一组观测值)去估计总体的回归直线方程,得到估计的回归直线方程形式为=+x.4.一元线性回归模型我们把yi=+xi+ei(i=1,2,…,n)这一描述因变量y如何依赖于自变量 x和随机误差ei的方程称为一元线性回归模型.新知运用例1 某公司为了预测下月的产品销售情况,找出了近7个月的产品销售量y(单位:万件)的统计表:月份代码t 1 2 3 4 5 6 7销售量y/万件 y1 y2 y3 y4 y5 y6 y7 但其中数据被污损看不清,经查证yi=9.32,tiyi=40.17,=0.55.(1)请用相关系数r说明销售量y与月份代码t之间有很强的线性相关关系(当>0.8时,认为两个变量有很强的线性相关关系);(2)若=0.10t+0.93,公司经营期间的广告宣传费(单位:万元)xi=(i=1,2,…),每件产品的销售价为10元,预测第8个月的毛利润能否突破15万元,并说明理由(毛利润=销售金额-广告宣传费).参考数据:≈2.65,≈1.41.【方法总结】 用线性回归方程估计总体的一般步骤:(1)先判断相关关系,作出散点图判断或利用相关系数判断;(2)根据线性回归方程对总体进行估计.一台机器按不同的转速生产出来的某机械零件有一些会有缺点,每小时生产有缺点的零件的多少随机器运转速度的变化而变化,下表为抽样试验的结果:转速x/(转/秒) 16 14 12 8每小时生产有缺点的零件数y/件 11 9 8 5 (1)画出散点图;(2)如果y与x有线性相关关系,请画出一条直线近似地表示这种线性关系;(3)在实际生产中,若它们的关系可用方程y=x-来近似刻画,允许每小时生产的产品中有缺点的零件最多为10件,那么机器的运转速度应控制在什么范围内 探究2 最小二乘法问题1:一个好的线性关系与散点图中各点的位置应具有怎样的关系 问题2:设直线方程为y=a+bx,任意给定一个样本点A(xi,yi),用什么样的方法刻画点与直线的距离更方便有效 问题3: 线性回归方程是否经过定点 新知生成1.最小二乘法使“随机误差平方和最小”的方法叫作最小二乘法.2.,的计算公式==,=-b.此时,用最小二乘法得到的回归直线方程为=x+,其中是回归直线在y轴上的截距,是回归直线的斜率.新知运用例2 某研究机构对高三学生的记忆力x和判断力y进行统计分析,得下表数据:x 6 8 10 12y 2 3 5 6 (1)请画出上表数据的散点图;(2)请根据上表提供的数据,用最小二乘法求出y关于x的回归直线方程=x+;(3)试根据求出的回归直线方程,预测记忆力为13的同学的判断力.【方法总结】 求解线性回归方程及预测的步骤:(1)利用散点图判断两个变量是否具有线性相关关系;(2)列表求出,, , xiyi;(3)利用相应的公式计算,的值;(4)写出线性回归方程,并利用线性回归方程进行预测. 从中国教育在线官方公布的考研动机调查来看,本科生扎堆考研的原因大概集中在这6个方面:本科就业压力大,提升竞争力;通过考研选择真正感兴趣的专业;为了获得学历;继续深造;随大流;有名校情结.如图,这是2015—2019年全国硕士研究生报考人数趋势图(单位:万人)的折线图.(1)求y关于t的线性回归方程;(2)根据(1)中的回归方程,预测2023年全国硕士研究生的报考人数.参考数据:(ti-)(yi-)=311.参考公式:回归方程=+t中斜率和截距的最小二乘估计公式分别是=,=-.【随堂检测】1.已知两个变量x和y之间有线性相关关系,经调查得到如下样本数据:x 3 4 5 6 7y 3.5 2.4 1.1 -0.2 -1.3根据表格中的数据求得回归方程=x+,则下列说法正确的是( ).A.>0,>0 B.>0,<0C.<0,>0 D.<0,<02.在一次试验中,测得(x,y)的四组值分别为(1,2),(2,3),(3,4),(4,5),则y与x之间的回归直线方程为( ).A.y=x+1 B.y=x+2C.y=2x+1 D.y=x-13.由变量x与y相对应的一组成对样本数据(1,y1),(5,y2),(7,y3),(13,y4),(19,y5)得到的回归直线方程为=2x+45,则= . 4.某公司对广告费用x和销售额y进行统计分析,得下表数据:x 6 8 10 12y 2 4 8 10已知广告费用x和销售额y是线性相关的,求y关于x的回归直线方程. 2 展开更多...... 收起↑ 资源列表 4.2 课时1 回归直线方程 - 副本.docx 4.2 课时1 回归直线方程.docx