资源简介 8.2 一元线性回归模型及其应用第1课时 一元线性回归模型及其应用(概念课逐点理清式教学)课时目标1.了解最小二乘原理,掌握一元线性回归模型参数的最小二乘估计方法,建立一元线性回归模型进行预测.2.了解随机误差、残差、残差图的概念.3.会通过残差分析一元线性回归模型的拟合效果.逐点清(一) 一元线性回归模型[多维度理解] 我们称为Y关于x的 模型.其中,Y称为 或 ,x称为 或 ;a和b为模型的未知参数,a称为 参数,b称为 参数;e是Y与bx+a之间的 . [细微点练明]1.[多选]在线性回归模型Y=bx+a+e中,下列说法不正确的是 ( )A.Y=bx+a+e是一次函数B.响应变量Y是由解释变量x唯一确定的C.响应变量Y除了受解释变量x的影响外,可能还受到其他因素的影响,这些因素会导致随机误差e的产生D.随机误差e是由于计算不准确造成的,可通过精确计算避免随机误差e的产生2.某地的财政收入x与支出y满足线性回归方程=bx+a+e(单位:亿元),其中b=0.8,a=2,|e|≤0.5,如果今年该地区财政收入10亿元,则今年支出预计不会超过 亿. 3.判断下列变量间哪些能用函数模型刻画,哪些能用回归模型刻画 (1)某公司的销售收入和广告支出;(2)某城市写字楼的出租率和每平方米月租金;(3)航空公司的顾客投诉次数和航班正点率;(4)某地区的人均消费水平和人均国内生产总值(GDP);(5)学生期末考试成绩和考前用于复习的时间;(6)一辆汽车在某段路程中的行驶速度和行驶时间;(7)正方形的面积与周长.逐点清(二) 最小二乘法和经验回归方程[多维度理解] 我们将=x+称为Y关于x的 ,也称经验回归函数或经验回归公式,其图形称为 .这种求经验回归方程的方法叫做最小二乘法,求得的,叫做b,a的最小二乘估计,其中 微点助解(1)经验回归直线过点(,).(2)经验回归直线的截距和斜率都是通过样本估计而得的,存在着误差,这种误差可能导致预报结果的偏差.(3)经验回归方程=+x中的表示x增加1个单位时,y的平均变化量为,而表示y不随x的变化而变化的部分.[细微点练明]1.某单位为了了解办公楼用电量y(度)与气温x(℃)之间的关系,随机统计了四个工作日的用电量与当天平均气温,并制作了对照表:气温x/℃ 18 13 10 -1用电量y/度 24 34 38 64由表中数据得到经验回归方程=-2x+,则当气温为-3 ℃时,预测用电量为 ( )A.68度 B.66度C.28度 D.12度2.若根据变量x与y的对应关系(如表),求得y关于x的经验回归方程为=6.5x+17.5,则表中m的值为 ( )x 2 4 5 6 8y 30 40 m 50 70A.60 B.55C.50 D.453.某地随着经济的发展,居民收入逐年增长,该地一银行连续五年年底的储蓄存款情况如表所示.年份x 2019 2020 2021 2022 2023储蓄存款额 y/千亿元 5 6 7 8 10为了计算方便,工作人员将上表的数据进行了处理,令t=x-2 018,z=y-5,得到下表.t 1 2 3 4 5z 0 1 2 3 5(1)作z关于t的散点图,求z关于t的经验回归方程;(2)通过(1)中的方程,求出y关于x的回归方程.逐点清(三) 线性回归分析[多维度理解]1.残差与残差分析(1)对于响应变量Y,通过观测得到的数据称为观测值,通过经验回归方程得到的称为预测值,观测值减去预测值所得到的差称为 .残差是随机误差的估计结果,通过残差的分析可以判断模型刻画数据的效果,以及判断原始数据中是否存在可疑数据等,这方面工作称为 . (2)残差图中,若残差点比较均匀地落在水平的带状区域内,带状区域 ,则说明拟合效果越好. 微点助解 在使用经验回归方程进行预测时,需要注意的问题:(1)经验回归方程只适用于所研究的样本的总体.(2)所建立的经验回归方程一般都有时效性.(3)解释变量的取值不能离样本数据的范围太远.一般解释变量的取值在样本数据范围内,经验回归方程的预报效果会比较好,超出这个范围越远,预报的效果越差.(4)不能期望经验回归方程得到的预报值就是响应变量的精确值.2.决定系数(1)残差平方和 (yi-)2越 ,模型的拟合效果越 . (2) R2的计算公式为R2=1-.在R2表达式中, (yi-)2与经验回归方程无关,残差平方和 (yi-i)2与经验回归方程有关.因此R2越大,表示残差平方和 ,即模型的拟合效果 ;R2越小,表示残差平方和越大,即模型的拟合效果 . [细微点练明]1.[多选]对变量y和x的一组成对样本数据(x1,y1),(x2,y2),…,(xn,yn)进行回归分析,建立回归模型,则 ( )A.残差平方和越大,模型的拟合效果越好B.在做线性回归分析时,残差图中残差点分布的带状区域的宽度越窄表示回归效果越好C.用决定系数R2来刻画回归效果,R2越小,说明模型的拟合效果越好D.若y和x的样本相关系数r=-0.95,则y和x之间具有很强的负线性相关关系2.对变量x,y进行回归分析时,依据得到的4个不同的回归模型画出残差图,则下列模型拟合精度最高的是 ( )3.已知一系列样本点(xi,yi)(i=1,2,3,…,n)的经验回归方程为=2x+a,若样本点(r,1)与(1,s)的残差相同,则有 ( )A.r=s B.s=2rC.s=-2r+3 D.s=2r+14.假定小麦基本苗数x与成熟期有效穗y之间存在相关关系,今测得5组数据如下:x 15.0 25.8 30.0 36.6 44.4y 39.4 42.9 42.9 43.1 49.2若由最小二乘法计算得经验回归方程=0.29x+34.7.(1)计算各组残差,并计算残差平方和;(2)求R2,并说明回归模型拟合效果的好坏.第1课时 一元线性回归模型及其应用[逐点清(一)][多维度理解] 一元线性回归 因变量 响应变量 自变量 解释变量 截距 斜率 随机误差[细微点练明]1.选ABD 对于A,线性回归模型Y=bx+a+e中,方程表示的不是确定性关系,因此不是一次函数,所以A错误;对于B,响应变量Y不是由解释变量x唯一确定的,所以B错误;对于C,响应变量Y除了受解释变量x的影响外,可能还受到其他因素的影响,这些因素会导致随机误差e的产生,所以C正确;对于D,随机误差是不能避免的,只能将误差缩小,所以D错误.2.解析:由题设,=0.8x+2+e,∴当x=10时,=10+e,又|e|≤0.5,即-0.5≤e≤0.5,∴9.5≤≤10.5,故今年支出预计不会超过10.5亿.答案:10.53.解:(1)(2)(3)(4)(5)属于回归模型,(6)(7)属于函数模型.[逐点清(二)][多维度理解] 经验回归方程 经验回归直线 -[细微点练明]1.选B 由表中数据可知==10,==40,所以经验回归直线=-2x+过点(10,40),即40=-2×10+,得=60,则经验回归方程为=-2x+60,当x=-3时,=-2×(-3)+60=66.2.选A 由表中数据,得=×(2+4+5+6+8)=5,=×(30+40+m+50+70)=38+,因为经验回归直线=6.5x+17.5过点,所以38+=6.5×5+17.5,解得m=60.3.解:(1)作散点图,直观看z与t具有线性相关关系.根据z关于t的表格数据,得=×(1+2+3+4+5)=3,=×(0+1+2+3+5)=2.2,且tizi=45,t=55,所以===1.2,=-=2.2-1.2×3=-1.4.所以z关于t的经验回归方程为=1.2t-1.4.(2)由(1)知=1.2t-1.4,代入t=x-2 018,z=y-5,得-5=1.2(x-2 018)-1.4,即=1.2x-2 418.故y关于x的回归方程为=1.2x-2 418.[逐点清(三)][多维度理解] 1.(1)残差 残差分析 (2)越窄 2.(1)小 好 (2)越小 越好 越差[细微点练明]1.选BD 因为残差平方和越小,模型的拟合效果越好,故A错误;在做线性回归分析时,残差图中残差点分布的带状区域的宽度越窄表示回归效果越好,故B正确;因为决定系数R2越接近1,说明模型的拟合效果越好,故C错误;由样本相关系数为负且接近-1,可知y和x之间具有很强的负线性相关关系,故D正确.2.选A 用残差图判断模型的拟合效果,残差点比较均匀地落在水平的带状区域中,说明这样的模型比较合适,带状区域的宽度越窄,说明模型的拟合精度越高.3.选C 样本点(r,1)的残差为1-2r-a,样本点(1,s)的残差为s-a-2.依题意得1-2r-a=s-a-2,故s=-2r+3.4.解: (1)由i=xi+,可以算得i=yi-i.分别为1=0.35,2=0.718,3=-0.5,4=-2.214,5=1.624,所以残差平方和为 (i)2≈8.43.(2)因为 (yi-)2=50.18,故R2=1-≈1-≈0.832,所以回归模型的拟合效果较好.1 / 4(共64张PPT)8.2一元线性回归模型及其应用一元线性回归模型及其应用(概念课——逐点理清式教学)第1课时课时目标1.了解最小二乘原理,掌握一元线性回归模型参数的最小二乘估计方法,建立一元线性回归模型进行预测.2.了解随机误差、残差、残差图的概念.3.会通过残差分析一元线性回归模型的拟合效果.CONTENTS目录123逐点清(一) 一元线性回归模型逐点清(二) 最小二乘法和经验回归方程逐点清(三) 线性回归分析4课时跟踪检测逐点清(一) 一元线性回归模型01多维度理解我们称为Y关于x的______________模型.其中,Y称为_________或___________,x称为________或___________;a和b为模型的未知参数,a称为______参数,b称为_______参数;e是Y与bx+a之间的___________.一元线性回归因变量响应变量自变量解释变量截距斜率随机误差细微点练明1.[多选]在线性回归模型Y=bx+a+e中,下列说法不正确的是 ( )A.Y=bx+a+e是一次函数B.响应变量Y是由解释变量x唯一确定的C.响应变量Y除了受解释变量x的影响外,可能还受到其他因素的影响,这些因素会导致随机误差e的产生D.随机误差e是由于计算不准确造成的,可通过精确计算避免随机误差e的产生√√√解析:对于A,线性回归模型Y=bx+a+e中,方程表示的不是确定性关系,因此不是一次函数,所以A错误;对于B,响应变量Y不是由解释变量x唯一确定的,所以B错误;对于C,响应变量Y除了受解释变量x的影响外,可能还受到其他因素的影响,这些因素会导致随机误差e的产生,所以C正确;对于D,随机误差是不能避免的,只能将误差缩小,所以D错误.2.某地的财政收入x与支出y满足线性回归方程=bx+a+e(单位:亿元),其中b=0.8,a=2,|e|≤0.5,如果今年该地区财政收入10亿元,则今年支出预计不会超过_______亿. 解析:由题设,=0.8x+2+e,∴当x=10时,=10+e,又|e|≤0.5,即-0.5≤e≤0.5,∴9.5≤≤10.5,故今年支出预计不会超过10.5亿.10.53.判断下列变量间哪些能用函数模型刻画,哪些能用回归模型刻画 (1)某公司的销售收入和广告支出;(2)某城市写字楼的出租率和每平方米月租金;(3)航空公司的顾客投诉次数和航班正点率;(4)某地区的人均消费水平和人均国内生产总值(GDP);(5)学生期末考试成绩和考前用于复习的时间;(6)一辆汽车在某段路程中的行驶速度和行驶时间;(7)正方形的面积与周长.解:(1)(2)(3)(4)(5)属于回归模型,(6)(7)属于函数模型.逐点清(二) 最小二乘法和经验回归方程02多维度理解我们将=x+称为Y关于x的________________,也称经验回归函数或经验回归公式,其图形称为________________.这种求经验回归方程的方法叫做最小二乘法,求得的,叫做b,a的最小二乘估计, 其中经验回归方程经验回归直线微点助解(1)经验回归直线过点(,).(2)经验回归直线的截距和斜率都是通过样本估计而得的,存在着误差,这种误差可能导致预报结果的偏差.(3)经验回归方程=+x中的表示x增加1个单位时,y的平均变化量为,而表示y不随x的变化而变化的部分.细微点练明1.某单位为了了解办公楼用电量y(度)与气温x(℃)之间的关系,随机统计了四个工作日的用电量与当天平均气温,并制作了对照表:由表中数据得到经验回归方程=-2x+,则当气温为-3 ℃时,预测用电量为( )A.68度 B.66度 C.28度 D.12度气温x/℃ 18 13 10 -1用电量y/度 24 34 38 64√解析:由表中数据可知==10,==40,所以经验回归直线=-2x+过点(10,40),即40=-2×10+,得=60,则经验回归方程为=-2x+60,当x=-3时,=-2×(-3)+60=66.2.若根据变量x与y的对应关系(如表),求得y关于x的经验回归方程为=6.5x+17.5,则表中m的值为( )√x 2 4 5 6 8y 30 40 m 50 70A.60 B.55C.50 D.45解析:由表中数据,得=×(2+4+5+6+8)=5,=×(30+40+m+50+70)=38+,因为经验回归直线=6.5x+17.5过点,所以38+=6.5×5+17.5,解得m=60.3.某地随着经济的发展,居民收入逐年增长,该地一银行连续五年年底的储蓄存款情况如表所示.年份x 2019 2020 2021 2022 2023储蓄存款额 y/千亿元 5 6 7 8 10为了计算方便,工作人员将上表的数据进行了处理,令t=x-2 018,z=y-5,得到下表.t 1 2 3 4 5z 0 1 2 3 5(1)作z关于t的散点图,求z关于t的经验回归方程;解:作散点图,直观看z与t具有线性相关关系.根据z关于t的表格数据,得=×(1+2+3+4+5)=3,=×(0+1+2+3+5)=2.2,(2)通过(1)中的方程,求出y关于x的回归方程.解:由(1)知=1.2t-1.4,代入t=x-2 018,z=y-5,得-5=1.2(x-2 018)-1.4,即=1.2x-2 418.故y关于x的回归方程为=1.2x-2 418.逐点清(三) 线性回归分析03多维度理解1.残差与残差分析(1)对于响应变量Y,通过观测得到的数据称为观测值,通过经验回归方程得到的称为预测值,观测值减去预测值所得到的差称为______.残差是随机误差的估计结果,通过残差的分析可以判断模型刻画数据的效果,以及判断原始数据中是否存在可疑数据等,这方面工作称为___________.(2)残差图中,若残差点比较均匀地落在水平的带状区域内,带状区域_____,则说明拟合效果越好.残差残差分析越窄微点助解 在使用经验回归方程进行预测时,需要注意的问题:(1)经验回归方程只适用于所研究的样本的总体.(2)所建立的经验回归方程一般都有时效性.(3)解释变量的取值不能离样本数据的范围太远.一般解释变量的取值在样本数据范围内,经验回归方程的预报效果会比较好,超出这个范围越远,预报的效果越差.(4)不能期望经验回归方程得到的预报值就是响应变量的精确值.R2越大,表示残差平方和______,即模型的拟合效果_____;R2越小,表示残差平方和越大,即模型的拟合效果______.小好越小越好越差1.[多选]对变量y和x的一组成对样本数据(x1,y1),(x2,y2),…,(xn,yn)进行回归分析,建立回归模型,则 ( )A.残差平方和越大,模型的拟合效果越好B.在做线性回归分析时,残差图中残差点分布的带状区域的宽度越窄表示回归效果越好C.用决定系数R2来刻画回归效果,R2越小,说明模型的拟合效果越好D.若y和x的样本相关系数r=-0.95,则y和x之间具有很强的负线性相关关系细微点练明√√解析:因为残差平方和越小,模型的拟合效果越好,故A错误;在做线性回归分析时,残差图中残差点分布的带状区域的宽度越窄表示回归效果越好,故B正确;因为决定系数R2越接近1,说明模型的拟合效果越好,故C错误;由样本相关系数为负且接近-1,可知y和x之间具有很强的负线性相关关系,故D正确.2.对变量x,y进行回归分析时,依据得到的4个不同的回归模型画出残差图,则下列模型拟合精度最高的是 ( )√解析:用残差图判断模型的拟合效果,残差点比较均匀地落在水平的带状区域中,说明这样的模型比较合适,带状区域的宽度越窄,说明模型的拟合精度越高.3.已知一系列样本点(xi,yi)(i=1,2,3,…,n)的经验回归方程为=2x+a,若样本点(r,1)与(1,s)的残差相同,则有( )A.r=s B.s=2rC.s=-2r+3 D.s=2r+1解析:样本点(r,1)的残差为1-2r-a,样本点(1,s)的残差为s-a-2.依题意得1-2r-a=s-a-2,故s=-2r+3.√4.假定小麦基本苗数x与成熟期有效穗y之间存在相关关系,今测得5组数据如下:x 15.0 25.8 30.0 36.6 44.4y 39.4 42.9 42.9 43.1 49.2若由最小二乘法计算得经验回归方程=0.29x+34.7.(1)计算各组残差,并计算残差平方和;(2)求R2,并说明回归模型拟合效果的好坏.课时跟踪检测041345678910111221.在两个变量y与x的回归模型中,分别选择了4个不同的模型,它们的R2如下,其中拟合效果最好的模型是 ( )√模型 模型1 模型2 模型3 模型4R2 0.98 0.80 0.50 0.25A.模型1 B.模型2C.模型3 D.模型4解析:决定系数R2=0.98最大,拟合效果最好.1567891011122342.在一次试验中,测得(x,y)的四组值分别是(1,2),(2,3),(3,4),(4,5),则y关于x的经验回归方程为 ( )A.=x+1 B.=x+2C.=2x+1 D.=x-1解析:易求=2.5,=3.5,且=1,所以=3.5-1×2.5=1,因此经验回归方程为=x+1.√1567891011123423.两个线性相关变量x与y的统计数据如表所示:其经验回归方程是=x+40,则相对应于点(11,5)的残差为( )A.0.1 B.0.2C.0.3 D.0.4√x 9 9.5 10 10.5 11y 11 10 8 6 5156789101112342解析:由于=x+40过样本中心点(10,8),所以8=10+40,则=-3.2,因此=-3.2x+40.当x=11时,=-3.2×11+40=4.8,所以残差=5-=5-4.8=0.2.1567891011123424.根据变量Y和x的成对样本数据,由一元线性回归模型得到经验回归方程=x+,对应的残差如图所示,模型误差( )156789101112342A.满足一元线性回归模型的所有假设B.满足回归模型E(e)=0的假设C.满足回归模型D(e)=σ2的假设D.不满足回归模型E(e)=0和D(e)=σ2的假设解析:由残差图可以看出,图中的残差点不能拟合成一条直线,且不满足D(e)=σ2.√1567891011123425.[多选]已知变量x,y之间的经验回归方程为=-0.7x+10.3,且变量x,y之间的一组相关数据如下表所示,则下列说法正确的是( )√x 6 8 10 12y 6 m 3 2A.变量x,y之间呈负相关关系B.m=4C.可以预测,当x=11时,y约为2.6D.由表格数据知,该经验回归直线必过点(9,4)√√156789101112342解析:由=-0.7x+10.3,得=-0.7,故x,y呈负相关关系,则A正确.==9,=-0.7×9+10.3=4=,解得m=5,B错误.当x=11时,y的预测值为2.6,故C正确.=9,=4,故经验回归直线必过点(9,4),则D正确.156789101112342√1567891011123421567891011123427.[多选]设(x1,y1),(x2,y2),…,(x2 024,y2 024)是变量x和y的2 024个样本点,直线l是由这些样本点通过最小二乘法得到的经验回归直线,如图所示,下列结论正确的是 ( )A.直线l过点(,)B.直线l过点(x1 012,y1 012)C.x和y的样本相关系数在区间[-1,0)上D.因为2 024是偶数,所以分布在直线l两侧的样本点的个数一定相同√√156789101112342解析:经验回归直线一定过样本中心点,但不一定过某个样本点,故A正确,B错误;由题图可知x和y的样本相关系数在区间[-1,0)上,故C正确;不能因为2 024是偶数就断定分布在直线l两侧的样本点的个数相同,故D错误.1567891011123428.[多选]已知两个变量y与x线性相关,为研究其具体的线性关系进行了10次试验.试验中不慎丢失2个数据点,根据剩余的8个数据点求得的经验回归方程为=3x+4.5,且=4,又增加了2次试验,得到2个数据点(2,11),(6,22),根据这10个数据点重新求得经验回归方程为=mx+n(其中m,n∈R),则( )156789101112342A.变量y与x正相关B.m<3C.n<4.5D.经验回归直线=mx+n经过点(4,16.5)√√√156789101112342解析:设A(2,11),B(6,22),由kAB=<3,而8个数据点的经验回归方程中=3,∴0==16.5,∴经验回归直线过定点(4,16.5),则16.5=4m+n,n=16.5-4m,0<16.5,即4.51567891011123429.为了解篮球爱好者小李的投篮命中率与打篮球时间之间的关系,下表记录了小李某月1号到5号每天打篮球时间x(单位:h)与当天投篮命中率y之间的关系:时间x 1 2 3 4 5命中率y 0.4 0.5 0.6 0.6 0.4小李这5天的平均投篮命中率为______,用线性回归分析的方法,预测小李该月6号打6 h篮球的投篮命中率为_______. 0.50.53156789101112342解析:===0.5,==3.由公式得=0.01,从而=-=0.5-0.01×3=0.47,所以经验回归方程为=0.47+0.01x,所以当x=6时,=0.47+0.01×6=0.53.15678910111234210.某工厂为研究某种产品产量x(吨)与所需某种原料y(吨)的相关性,在生产过程中收集4组对应数据(x,y)如表所示:x 3 4 6 7y 2.5 3 4 m根据表中数据,得出y关于x的经验回归方程为=0.7x+.据此计算出在样本(4,3)处的残差为-0.15,则表中m的值为______. 5.9156789101112342解析:根据样本(4,3)处的残差为-0.15,即3-(0.7×4+)=-0.15,可得=0.35,故经验回归方程为=0.7x+0.35,又由样本数据的平均数为==5,=,所以0.7×5+0.35=,解得m=5.9.156789101112342156789101112342156789101112342(2)判断变量x与y之间是正相关还是负相关;解:由于变量y的值随x值的增加而增加(=0.3>0),故x与y之间是正相关.156789101112342解:将x=7代入经验回归方程可以预测该家庭的月储蓄为=0.3×7-0.4=1.7(千元).15678910111234212.假设关于某设备的使用年限x(单位:年)和支出的维修费用y(单位:万元),有如表的统计资料:使用年限x/年 2 3 4 5 6维修费用y/万元 2.2 3.8 5.5 6.5 7.0若由资料知y对x呈线性相关关系,试求:(1)经验回归方程=x+;156789101112342156789101112342(2)估计使用年限为10年时,维修费用是多少 156789101112342(3)计算残差平方和;156789101112342(4)求R2并说明模型的拟合效果.课时跟踪检测(二十四) 一元线性回归模型及其应用1.在两个变量y与x的回归模型中,分别选择了4个不同的模型,它们的R2如下,其中拟合效果最好的模型是 ( )模型 模型1 模型2 模型3 模型4R2 0.98 0.80 0.50 0.25A.模型1 B.模型2C.模型3 D.模型42.在一次试验中,测得(x,y)的四组值分别是(1,2),(2,3),(3,4),(4,5),则y关于x的经验回归方程为 ( )A.=x+1 B.=x+2C.=2x+1 D.=x-13.两个线性相关变量x与y的统计数据如表所示:x 9 9.5 10 10.5 11y 11 10 8 6 5其经验回归方程是=x+40,则相对应于点(11,5)的残差为 ( )A.0.1 B.0.2C.0.3 D.0.44.根据变量Y和x的成对样本数据,由一元线性回归模型得到经验回归方程=x+,对应的残差如图所示,模型误差 ( )A.满足一元线性回归模型的所有假设B.满足回归模型E(e)=0的假设C.满足回归模型D(e)=σ2的假设D.不满足回归模型E(e)=0和D(e)=σ2的假设5.[多选]已知变量x,y之间的经验回归方程为=-0.7x+10.3,且变量x,y之间的一组相关数据如下表所示,则下列说法正确的是 ( )x 6 8 10 12y 6 m 3 2A.变量x,y之间呈负相关关系B.m=4C.可以预测,当x=11时,y约为2.6D.由表格数据知,该经验回归直线必过点(9,4)6.为了研究某班学生的听力成绩x(单位:分)与笔试成绩y(单位:分)的关系,从该班随机抽取20名学生,根据散点图发现x与y之间有线性关系,设其经验回归方程为=x+,已知xi=400,yi=1 580,=-1,若该班某学生的听力成绩为26,据此估计其笔试成绩约为 ( )A.99 B.101 C.103 D.1057.[多选]设(x1,y1),(x2,y2),…,(x2 024,y2 024)是变量x和y的2 024个样本点,直线l是由这些样本点通过最小二乘法得到的经验回归直线,如图所示,下列结论正确的是 ( )A.直线l过点(,)B.直线l过点(x1 012,y1 012)C.x和y的样本相关系数在区间[-1,0)上D.因为2 024是偶数,所以分布在直线l两侧的样本点的个数一定相同8.[多选]已知两个变量y与x线性相关,为研究其具体的线性关系进行了10次试验.试验中不慎丢失2个数据点,根据剩余的8个数据点求得的经验回归方程为=3x+4.5,且=4,又增加了2次试验,得到2个数据点(2,11),(6,22),根据这10个数据点重新求得经验回归方程为=mx+n(其中m,n∈R),则 ( )A.变量y与x正相关B.m<3C.n<4.5D.经验回归直线=mx+n经过点(4,16.5)9.为了解篮球爱好者小李的投篮命中率与打篮球时间之间的关系,下表记录了小李某月1号到5号每天打篮球时间x(单位:h)与当天投篮命中率y之间的关系:时间x 1 2 3 4 5命中率y 0.4 0.5 0.6 0.6 0.4小李这5天的平均投篮命中率为 ,用线性回归分析的方法,预测小李该月6号打6 h篮球的投篮命中率为 . 10.某工厂为研究某种产品产量x(吨)与所需某种原料y(吨)的相关性,在生产过程中收集4组对应数据(x,y)如表所示:x 3 4 6 7y 2.5 3 4 m根据表中数据,得出y关于x的经验回归方程为=0.7x+.据此计算出在样本(4,3)处的残差为-0.15,则表中m的值为 . 11.从某居民区随机抽取10个家庭,获得第i个家庭的月收入xi(单位:千元)与月储蓄yi(单位:千元)的数据资料, 算得xi=80,yi=20,xiyi=184,x=720.(1)求家庭的月储蓄y对月收入x的经验回归方程=x+;(2)判断变量x与y之间是正相关还是负相关;(3)若该居民区某家庭月收入为7千元,预测该家庭的月储蓄.附:经验回归方程=x+中,=,=-,其中,为样本平均值.12.假设关于某设备的使用年限x(单位:年)和支出的维修费用y(单位:万元),有如表的统计资料:使用年限x/年 2 3 4 5 6维修费用y/万元 2.2 3.8 5.5 6.5 7.0若由资料知y对x呈线性相关关系,试求:(1)经验回归方程=x+;(2)估计使用年限为10年时,维修费用是多少 (3)计算残差平方和;(4)求R2并说明模型的拟合效果.参考数据:xiyi=112.3, (yi-)2=15.78.课时跟踪检测(二十四)1.选A 决定系数R2=0.98最大,拟合效果最好.2.选A 易求=2.5,=3.5,且=1,所以=3.5-1×2.5=1,因此经验回归方程为=x+1.3.选B 由于=x+40过样本中心点(10,8),所以8=10+40,则=-3.2,因此=-3.2x+40.当x=11时,=-3.2×11+40=4.8,所以残差=5-=5-4.8=0.2.4.选D 由残差图可以看出,图中的残差点不能拟合成一条直线,且不满足D(e)=σ2.5.选ACD 由=-0.7x+10.3,得=-0.7,故x,y呈负相关关系,则A正确.==9,=-0.7×9+10.3=4=,解得m=5,B错误.当x=11时,y的预测值为2.6,故C正确.=9,=4,故经验回归直线必过点(9,4),则D正确.6. 选C xi=400,故==20;yi=1 580,故==79,故点(20,79)在经验回归直线上,即79=20-1,得=4,即=4x-1,当x=26时,代入计算得到=103.7.选AC 经验回归直线一定过样本中心点,但不一定过某个样本点,故A正确,B错误;由题图可知x和y的样本相关系数在区间[-1,0)上,故C正确;不能因为2 024是偶数就断定分布在直线l两侧的样本点的个数相同,故D错误.8.选ABD 设A(2,11),B(6,22),由kAB=<3,而8个数据点的经验回归方程中=3,∴09.解析:===0.5,==3.由公式得=0.01,从而=-=0.5-0.01×3=0.47,所以经验回归方程为=0.47+0.01x,所以当x=6时,=0.47+0.01×6=0.53.答案:0.5 0.5310.解析:根据样本(4,3)处的残差为-0.15,即3-(0.7×4+)=-0.15,可得=0.35,故经验回归方程为=0.7x+0.35,又由样本数据的平均数为==5,=,所以0.7×5+0.35=,解得m=5.9.答案:5.911.解: (1)由题意,知n=10,=xi==8,=yi==2,又x-102=720-10×82=80,xiyi-10 =184-10×8×2=24,则==0.3,=-=2-0.3×8=-0.4,故所求经验回归方程为=0.3x-0.4.(2)由于变量y的值随x值的增加而增加(=0.3>0),故x与y之间是正相关.(3)将x=7代入经验回归方程可以预测该家庭的月储蓄为=0.3×7-0.4=1.7(千元).12.解: (1)由统计表格,易知=4,=5,x=90.又xiyi=112.3.设经验回归方程为=x+,于是有===1.23,=-=5-1.23×4=0.08,所以经验回归方程是=1.23x+0.08.(2)当x=10时,=1.23×10+0.08=12.38,估计使用年限为10年时维修费用是12.38万元.(3)因为1=2.46+0.08=2.54,2=3.77,3=5,4=6.23,5=7.46,所以残差平方和 (yi-i)2=0.651.(4)R2=1-=1-≈0.958 7,模型的拟合效果较好.4 / 4 展开更多...... 收起↑ 资源列表 8.2 第1课时 一元线性回归模型及其应用.docx 8.2 第1课时 一元线性回归模型及其应用.pptx 课时跟踪检测(二十四) 一元线性回归模型及其应用.docx