资源简介 §1 一元线性回归1.1 直线拟合1.2 一元线性回归方程[教材要点]要点一 直线拟合1.散点图每个点对应的一对数据(xi,yi),称为成对数据.这些点构成的图称为散点图.2.曲线拟合从散点图上可以看出,如果变量之间存在着某种关系,这些点会有一个大致趋势,这种趋势通常可以用一条光滑的曲线来近似地描述.这样近似描述的过程称为曲线拟合.3.直线拟合若在两个变量X和Y的散点图中,所有点看上去都在一条________附近波动,此时就可以用一条________来近似地描述这两个量之间的关系,称之为直线拟合.要点二 一元线性回归方程1.最小二乘法对于给定的两个变量X和Y,可以把其成对的观测值(x1,y1),(x2,y2),…,(xn,yn)表示为平面直角坐标系中的n个点.由直线方程Y=a+bX计算出来的值a+bxi(x=1,2,…n),与实际观测值yi的差异尽可能小.换句话说,a,b的取值使[y1-(a+bx1)]2+[y2-(a2+bx2)]2+…+[yn-(a+bxn)]2达到最小.这个方法称为最小二乘法.2.线性回归方程直线方程Y=________称作Y关于X的线性回归方程,相应的直线称作Y关于X的回归直线,,是这个线性回归方程的系数.其中[基础自测]1.思考辨析(正确的画“√”,错误的画“×”)(1)利用散点图可以直观判断两个变量的关系是否可以用线性表示.( )(2)线性回归方程适用于一切样本和总体.( )(3)线性回归方程一般都有局限性.( )(4)线性回归方程一定过样本中的某一点.( )2.如果记录了x,y的几组数据分别为(0,1),(1,3),(2,5),(3,7),那么y关于x的线性回归直线必过点( )A.(2,2) B.(1.5,2) C.(1,2) D.(1.5,4)3.随机抽样中测得四个样本点为(1,2),(2,3),(3,4),(4,5),则y与x之间的线性回归方程为( )A.y=x+1 B.y=x+2C.y=2x+1 D.y=x-14.已知变量x,y线性相关,由观测数据算得样本的平均数=4,=5,线性回归方程=x+中的系数,满足+=4,则线性回归方程为________.题型一 一元线性回归方程的特性例1 已知x,y的取值如下表:x 0 1 4 5 6 8y 1.3 1.8 5.6 6.1 7.4 9.3由所给数据在散点图上的位置分析可知y与x线性相关,且线性回归方程为=0.95x+,则=( )A.1.45 B.1.55 C.1.65 D.1.80方法归纳(1)线性回归直线过点(),通过把()代入线性回归方程可求出线性回归方程的系数,以及列表中的参数,这是方程思想的应用,是求线性回归方程的逆向应用.(2)=x+中,的实际意义是x每增加一个单位,y的平均变化量,的实际意义是不受x影响的部分.另外,当x=m时应求得=m+,即x为m时的y的平均值.跟踪训练1 某工厂某产品产量x(千件)与单位成本y(元)满足线性回归方程=77.36-1.82x,则以下说法中正确的是( )A.产量每增加1千件,单位成本约下降1.82元B.产量每减少1千件,单位成本约下降1.82元C.当产量为1千件时,单位成本为75.54元D.当产量为2千件时,单位成本为73.72元题型二 求线性回归方程例2 某种产品的广告费用支出x(单位:百万元)与销售额y(单位:百万元)之间有如下的对应数据:x/百万元 2 4 5 6 8y/百万元 30 40 60 50 70(1)画出散点图;(2)求线性回归方程;(3)试预测广告费用支出为10百万元时,销售额是多少.(参考数据:=145,=1 380)状元随笔 注意线性回归方程中的一次项系数为,常数项为,这与一次函数的表示习惯不同.方法归纳求线性回归方程的步骤(1)画散点图:由样本点是否呈条状分布来判断两个变量是否具有近似的线性关系.(2)求回归系数:若存在近似的线性关系,则求回归系数.(3)写方程:写出线性回归方程,并利用线性回归方程进行预测说明.跟踪训练2 某个体服装店经营某种服装在某周内获得的纯利润y(元)与该周每天销售这种服装的件数x之间有如下一组数据:x 3 4 5 6 7 8 9y 66 69 73 81 89 90 91已知=280,=45 309,=3 487.(1)求;(2)求纯利润y与每天销售件数x的线性回归方程;(3)估计每天销售10件这种服装时,纯利润是多少元?题型三 线性回归分析例3 某项研究发现某地的PM10浓度与车流量之间有线性相关关系.现采集到该地一周内车流量x与PM10浓度y的数据如下表:时间 车流量x(单位:万辆) PM10浓度y(单位:μg/m3)星期一 25.4 35.7星期二 24.6 34.5星期三 23.5 35.2星期四 24.4 33.6星期五 25.8 36.1星期六 19.7 30.9星期日 20.3 29.4(1)在如图所示的坐标系中作出表中数据的散点图.(2)根据表中的统计数据,求出线性回归方程=x+ (精确到0.01).(3)为净化空气,该地决定在工作日(星期一至星期五)限号.假设限号时每个工作日的车流量为表中对应工作日车流量的.试预测开始限号第一周星期三的PM10浓度(精确到0.1).参考数据:=23.4,=33.6,=34.5,=35.5.方法归纳线性回归分析的注意事项(1)求解线性回归方程时,需要进行复杂的计算,采用列表法会使计算更有条理.首先把原数据表格右边增加,xiyi,下边增加合计、平均等栏目.将需要计算的量列在表格中,再按照公式求解线性回归方程即可.如果题目给出有关数据,要注意根据数据选择求解公式.(2)利用线性回归方程预测时要注意所得的值为估计值,不是精确值.跟踪训练3 某公司为了预测下月产品销售情况,找出了近7个月的产品销售量y(单位:万件)的统计表:月份代码t 1 2 3 4 5 6 7销售量y(万件) y1 y2 y3 y4 y5 y6 y7但其中数据污损不清,经查证=9.32,=40.17,=0.55.(1)求y关于t的线性回归方程(系数精确到0.01);(2)公司经营期间的广告宣传费xi=(单位:万元)(i=1,2,…,7),每件产品的销售价为10元,预测第8个月的毛利润能否突破15万元,请说明理由.(毛利润等于销售金额减去广告宣传费)参考公式及数据:≈1.414,≈2.646.易错辨析 缺失基本解题步骤致错例4 在一次抽样检查中,抽得5个样本点,数据如下表:x 0.25 0.5 1 2 4y 16 12 5 2 1试建立y关于x的回归方程.解析:作出散点图,如图(1)所示,由散点图可以看出,图象近似反比例函数在第一象限的部分,因此令u=,由已知数据,可得变换后的样本数据:u 4 2 1 0.5 0.25y 16 12 5 2 1作出散点图,如图(2)所示,可以看出,变换后的样本点分布在一条直线的附近,因此可以用线性回归方程拟合.计算得=1.55,=7.2,=94.25,=21.312 5,则=≈4.13,=-≈0.8.从而得到y关于u的回归方程为=4.13u+0.8,则y关于x的回归方程为=+0.8.【易错警示】易错原因 纠错心得解决此题易出现如下错误:根据数据计算得=1.55,=7.2,=23,=21.312 5,代入公式计算得≈-3.53,≈12.67,从而得到y关于x的回归方程为=-3.53x+12.67. 事实上,由散点图可知样本点并没有呈线状分布,两个变量不具有很强的线性相关关系.错解是由于没有按照建立回归模型的基本步骤解题,忽略了画散点图,没有观察数据之间的关系造成错误. (1)解决这类问题必须严格按照建立回归模型的基本步骤,不能主观臆断,必须按部就班,依照步骤解题.(2)一些非线性回归问题可通过中间量变换,转化为线性回归问题求解.[课堂十分钟]1.为了规定工时定额,需要确定加工某种零件所需的时间,为此进行了5次试验,得到5组数据:(x1,y1),(x2,y2),(x3,y3),(x4,y4),(x5,y5),由最小二乘法求得线性回归方程为=0.67x+54.9.若已知x1+x2+x3+x4+x5=150,则y1+y2+y3+y4+y5=( )A.75 B.155.4C.375 D.466.22.某服装厂引进新技术,其生产服装的产量x(百件)与单位成本y(元)满足回归直线方程=100.36-14.2x,则以下说法正确的是( )A.产量每增加100件,单位成本约下降14.2元B.产量每减少100件,单位成本约上升100.36元C.产量每增加100件,单位成本约上升14.2元D.产量每减少100件,单位成本约下降14.2元3.某公司某件产品的定价x与销量y之间的数据统计表如下.根据数据,用最小二乘法得出y与x的线性回归直线方程为:y=6.5x+17.5,则表格中n的值应为( )x 2 4 5 6 8y 30 40 n 50 70A.45 B.50C.55 D.604.某设备的使用年限x与所支出的维修费用y的统计数据如下表:使用年限x(单位:年) 2 3 4 5 6维修费用y(单位:万元) 1.5 4.5 5.5 6.5 7.0根据上表可得回归直线方程为=1.3x+,据此模型预测,若使用年限为14年,估计维修费约为________万元.5.某班5名学生的数学和物理成绩如下表:学生 学科 A B C D E数学成绩(x) 88 76 73 66 63物理成绩(y) 78 65 71 64 61(1)作出散点图;(2)求物理成绩y对数学成绩x的线性回归方程;(3)一名学生的数学成绩是96,试预测他的物理成绩.§1 一元线性回归1.1 直线拟合1.2 一元线性回归方程新知初探·课前预习要点一3.直线 直线要点二1.+X[基础自测]1.(1)√ (2)× (3)√ (4)×2.解析:因为==1.5,==4,所以样本点的中心为(1.5,4),而直线过样本点的中心.故选D.答案:D3.解析:====,∴回归直线过,代入验证即可.故选A.答案:A4.解析:线性回归方程=x+过样本中心点(4,5),所以4+=5;又+=4,解方程组得=,=,所以线性回归方程为:=x+.答案:=x+题型探究·课堂解透例1 解析:由题意,得==4,==5.25.∵y与x线性相关,且=0.95x+,∴5.25=0.95×4+,解得=1.45.故选A.答案:A跟踪训练1 解析:在线性回归方程=x+中,的实际意义是x每增加一个单位,y的平均变化量,的实际意义是不受x影响的部分.∵=-1.82,∴产量每增加1千件,单位成本约下降1.82元.故选A.答案:A例2 解析:(1)散点图如图所示.(2)==5,==50.∴===6.5,=-=50-6.5×5=17.5,所以所求的线性回归方程为=6.5x+17.5.(3)根据(2)中求得的线性回归方程,当x=10时,=6.5×10+17.5=82.5,即广告费用支出为10百万元时,销售额大约为82.5百万元.跟踪训练2 解析:(1)=(3+4+5+6+7+8+9)=6,=(66+69+73+81+89+90+91)≈79.86.(2)设线性回归方程为=x+,则==≈4.75=-=79.86-4.75×6=51.36.∴所求线性回归方程为=4.75x+51.36.(3)当x=10时,y∧=98.86,估计每天销售10件这种服装时,可获纯利润为98.86元.例3 解析:(1)如图所示.(2)==≈0.97,=-=33.6-0.97×23.4≈10.90.所以y关于x的线性回归方程为=0.97x+10.90.(3)开始限号第一周星期三的车流量预计为23.5×=18.8(万辆),PM10浓度预测值=0.97×18.8+10.90≈29.1(μg/m3).跟踪训练3 解析:(1)由题中和附注中的参考数据,得=4,=28, =0.55,==40.17-4×9.32=2.89,又=≈1.331,∴==≈0.103,=-≈1.331-0.103×4≈0.92,所以y关于t的线性回归方程为=0.10t+0.92.(2)当t=8时,代入线性回归方程,得=0.10×8+0.92=1.72(万件),所以第8个月的毛利润为z=10×1.72-=17.2-2×1.414=14.372(万元).因为14.372<15,所以预测第8个月的毛利润不能突破15万元.[课堂十分钟]1.解析:由题意,得==30,代入线性回归方程,得=0.67×30+54.9=75,所以y1+y2+y3+y4+y5=5×=375.故选C.答案:C2.解析:=-14.2<0表示产量每增加100件,单位成本约下降14.2元,故选A.答案:A3.解析:由题得样本中心点,所以=6.5×5+17.5,∴n=60.故选D.答案:D4.解析:==4,==5,则中心点为(4,5),代入回归直线方程可得=5-1.3×4=-0.2,=1.3x-0.2.当x=14时,=1.3×14-0.2=18(万元),即估计使用14年时,维修费用是18万元.答案:185.解析:(1)散点图如图.(2)由图看出变量x、y具有明显的线性相关关系,因此可用线性回归方程刻画它们的关系.=×(88+76+73+66+63)=73.2,=×(78+65+71+64+61)=67.8.=88×78+76×65+73×71+66×64+63×61=25 054.=882+762+732+662+632=27 174.所以==≈0.625.=-≈67.8-0.625×73.2=22.05.所以y对x的回归直线方程是y=0.625x+22.05.(3)x=96,则y=0.625×96+22.05≈82,即可以预测他的物理成绩是82. 展开更多...... 收起↑ 资源预览