资源简介 4.3 统计模型4.3.1 一元线性回归模型最新课程标准 1.通过对典型案例的探究,了解回归分析的基本思想、方法及其初步应用.2.会求回归直线方程,并用回归直线方程进行预报.(重点、难点)知识点一 相关关系1.两个变量之间有一定的关系,但没有达到可以相互决定的程度,他们之间的关系具有一定的随机性,统计学上称为相关关系.2.线性相关:如果变量x与变量y之间的关系可以近似地用一次函数来刻画,则称x与y线性相关.3.如果一个变量增大,另一个变量大体上也增大,则称这两个变量正相关.如果一个变量增大,另一个变量大体上减少,则称这两个变量负相关.知识点二 回归直线方程知识点三 回归直线方程的性质1.回归直线过样本点的中心(,);2.一次函数=x+的单调性由的符号决定,函数递增的充要条件是>0.这说明x与y正相关的充要条件是>0;x与y负相关的充要条件是<0.3.回归方程中的实际意义是,当x增大一个单位时,增大 个单位.知识点四 相关系数计算 r==性质 范围 |r|≤1且x与y正相关的充要条件是r>0x与y负相关的充要条件是r<0线性相关程度 |r|越接近1,线性相关性越强|r|越接近0,线性相关性越弱|r|=1的充要条件是成对数据构成的点都在回归直线上知识点五 非线性回归两个变量x与y的关系,不再是线性相关关系,成为非线性相关关系,所得到的方程成为非线性回归方程(也简称回归方程),一般地,非线性回归方程的曲线类型可以通过做出散点图进行猜测,而回归方程有时可以通过变量替换后,借助求回归直线的过程确定.当然,确定了非线性回归方程之后,也可以利用它进行预测.[基础自测]1.设某大学的女生体重y(单位:kg)与身高x(单位:cm)具有线性相关关系.根据一组样本数据(xi,yi)(i=1,2,…,n),用最小二乘法建立的回归方程为=0.85x-85.71,则下列结论中正确的是________.(填序号)①y与x具有正的线性相关关系;②回归直线过样本点的中心(,);③若该大学某女生身高增加1 cm,则其体重约增加0.85 kg;④若该大学某女生身高为170 cm,则可断定其体重必为58.79 kg.2.下列判断正确的____________(1)求回归直线方程前必须进行相关性检验.(2)两个变量的相关系数越大,它们的相关程度越强.(3)若相关系数r=0,则两变量x,y之间没有关系.3.下列结论正确的是( )①函数关系是一种确定性关系;②相关关系是一种非确定性关系;③回归分析是对具有函数关系的两个变量进行统计分析的一种方法;④回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法.A.①② B.①②③C.①②④ D.①②③④4.下表是x和y之间的一组数据,则y关于x的线性回归方程必过点( )x 1 2 3 4y 1 3 5 7A.(2,3) B.(1.5,4)C.(2.5,4) D.(2.5,5)题型一 回归分析的有关概念例1 (1)有下列说法:①线性回归分析就是由样本点去寻找一条直线,使之贴近这些样本点的数学方法;②利用样本点的散点图可以直观判断两个变量的关系是否可以用线性关系表示;③通过回归方程=x+,可以估计和观测变量的取值和变化趋势;④因为由任何一组观测值都可以求得一个线性回归方程,所以没有必要进行相关性检验.其中正确命题的个数是( )A.1 B.2C.3 D.4(2)关于变量y与x之间的回归直线方程,叙述正确的是( )A.表示y与x之间的一种确定性关系B.表示y与x之间的相关关系C.表示y与x之间的最真实的关系D.表示y与x之间真实关系的一种效果最好的拟合(3)如果某地的财政收入x与支出y满足线性回归方程=x++ε(单位:亿元),其中=0.8,=2,|ε|≤0.5,如果今年该地区财政收入10亿元,则今年支出预计不会超过________亿.方法归纳1.在分析两个变量的相关关系时,可根据样本数据散点图确定两个变量之间是否存在相关关系,然后利用最小二乘法求出回归直线方程.2.由线性回归方程给出的是一个预报值而非精确值.3.随机误差的主要来源.(1)线性回归模型与真实情况引起的误差;(2)省略了一些因素的影响产生的误差;(3)观测与计算产生的误差.跟踪训练1 下列有关线性回归的说法,不正确的是________(填序号).①自变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系叫做相关关系;②在平面直角坐标系中,用描点的方法得到表示具有相关关系的两个量的一组数据的图形叫做散点图;③线性回归方程最能代表观测值x,y之间的关系;④任何一组观测值都能得到具有代表意义的回归直线方程.题型二 线性回归分析例2 为研究拉力x(N)对弹簧长度y(cm)的影响,对不同拉力的6根弹簧进行测量,测得如下表中的数据:x 5 10 15 20 25 30y 7.25 8.12 8.95 9.9 10.9 11.8(1)画出散点图;(2)如果散点图中的各点大致分布在一条直线的附近,求y与x之间的回归直线方程. →→方法归纳1.散点图是定义在具有相关关系的两个变量基础上的,对于性质不明确的两组数据,可先作散点图,在图上看它们有无关系,关系的密切程度,然后再进行相关回归分析.2.求回归直线方程时,首先应注意到,只有在散点图大致呈线性时,求出的回归直线方程才有实际意义,否则,求出的回归直线方程毫无意义.跟踪训练2 本例条件不变,若x增加2个单位,增加多少?题型三 非线性回归分析 1.如何解答非线性回归问题?[提示] 非线性回归问题有时并不给出经验公式.这时我们可以画出已知数据的散点图,把它与学过的各种函数(幂函数、指数函数、对数函数等)图象作比较,挑选一种跟这些散点拟合得最好的函数,然后采用适当的变量变换,把问题化为线性回归分析问题,使之得到解决.其一般步骤为:2.已知x和y之间的一组数据,则下列四个函数中,哪一个作为回归模型最好?x 1 2 3y 3 5.99 12.01①y=3×2x-1;②y=log2x;③y=4x;④y=x2.[提示] 观察散点图中样本点的分布规律可判断样本点分布在曲线y=3×2x-1附近.①作为回归模型最好.例3 某地区不同身高的未成年男性的体重平均值如下表:身高x(cm) 60 70 80 90 100 110体重y(kg) 6.13 7.90 9.99 12.15 15.02 17.50身高x(cm) 120 130 140 150 160 170体重y(kg) 20.92 26.86 31.11 38.85 47.25 55.05(1)试建立y与x之间的回归直线方程;(2)如果一名在校男生身高为168 cm,预测他的体重约为多少? 先由散点图确定相应的函数模型,再通过对数变换将非线性相关转化为线性相关的两个变量来求解.方法归纳两个变量不具有线性关系,不能直接利用线性回归方程建立两个变量的关系,可以通过变换的方法转化为线性回归模型,如y=c1ec2x,我们可以通过对数变换把指数关系变为线性关系,令z=ln y,则变换后样本点应该分布在直线z=bx+a(a=ln c1,b=c2)的周围.跟踪训练3 有一个测量水流量的实验装置,测得试验数据如下表:i 1 2 3 4 5 6 7水深h(厘米) 0.7 1.1 2.5 4.9 8.1 10.2 13.5流量Q(升/分钟) 0.082 0.25 1.8 11.2 37.5 66.5 134根据表中数据,建立Q与h之间的回归方程.教材反思4.3 统计模型4.3.1 一元线性回归模型新知初探·自主学习知识点二i i -[基础自测]1.解析:回归方程中x的系数为0.85>0,因此y与x具有正的线性相关关系,①正确;由回归方程系数的意义可知回归直线过样本点的中心(,),②正确;依据回归方程中的含义可知,x每变化1个单位,相应变化约0.85个单位,③正确;用回归方程对总体进行估计不能得到肯定结论,故④不正确.答案:①②③2.解析:(1)正确,相关性检验是了解成对数据的变化规律的,所以求回归方程前必须进行相关性检验.(2)错误,相关系数|r|越接近1,线性相关程度越强;|r|越接近0,线性相关程度越弱.(3)错误,若r=0是指x,y之间的相关关系弱,但并不能说没有关系.答案:(1)3.解析:函数关系和相关关系的区别是前者是确定性关系,后者是非确定性关系,故①②正确;回归分析是对具有相关关系的两个变量进行统计分析的一种方法,故③错误,④正确.答案:C4.解析:线性回归方程必过样本点的中心(,),即(2.5,4),故选C.答案:C课堂探究·素养提升例1 【解析】 (1)①反映的正是最小二乘法思想,故正确.②反映的是画散点图的作用,也正确.③解释的是回归方程=x+的作用,故也正确.④是不正确的,在求回归方程之前必须进行相关性检验,以发现两变量的关系.(2)回归直线方程能最大可能地反映y与x之间的真实关系,故选项D正确.(3)由题意可得:=0.8x+2+ε,当x=10时,=0.8×10+2+ε=10+ε,又|ε|≤0.5,∴9.5≤≤10.5.故今年支出预计不会超过10.5亿.【答案】 (1)C (2)D (3)10.5跟踪训练1 解析:只有具有线性相关的两个观测值才能得到具有代表意义的回归直线方程.答案:④例2 【解析】 (1)散点图如图所示.(2)将已知表中的数据列成下表:xi 5 10 15 20 25 30yi 7.25 8.12 8.95 9.9 10.9 11.8xiyi 36.25 81.2 134.25 198 272.5 354x 25 100 225 400 625 900=17.5,≈9.49,iyi=1 076.2,=2 275.∴==≈0.18,=-=9.49-0.18×17.5=6.34,∴回归直线方程为=0.18x+6.34.跟踪训练2 解析:若x增加2个单位,则=0.18(x+2)+6.34=0.18x+6.34+0.36,故增加0.36个单位.例3 【解析】 (1)根据表中的数据画出散点图,如下:由图看出,这些点分布在某条指数型函数曲线y=c1ec2x的周围,于是令z=ln y,列表如下:x 60 70 80 90 100 110z 1.81 2.07 2.30 2.50 2.71 2.86x 120 130 140 150 160 170z 3.04 3.29 3.44 3.66 3.86 4.01作出散点图,如下:由表中数据可求得z与x之间的回归直线方程为=0.693+0.020x,则有=e0.693+0.020x.(2)由(1)知,当x=168时,=e0.693+0.020×168≈57.57,所以在校男生身高为168 cm,预测他的体重约为57.57 kg.跟踪训练3 解析:由表中测得的数据可以作出散点图,如图.观察散点图中样本点的分布规律,可以判断样本点分布在某一条曲线附近,表示该曲线的函数模型是Q=m·hn(m,n是正的常数).两边取常用对数,则lg Q=lg m+n·lg h,令y=lg Q,x=lg h,那么y=nx+lg m,即为线性函数模型y=bx+a的形式(其中b=n,a=lg m).由下面的数据表,用最小二乘法可求得≈2.509 7,=-0.707 7,所以n≈2.51,m≈0.196.i hi Qi xi=lg hi yi=lg Qi x xiyi1 0.7 0.082 -0.154 9 -1.086 2 0.024 0.168 32 1.1 0.25 0.041 4 -0.602 1 0.001 7 -0.024 93 2.5 1.8 0.397 9 0.255 3 0.158 3 0.101 64 4.9 11.2 0.690 2 1.049 2 0.476 4 0.724 25 8.1 37.5 0.908 5 1.574 0 0.825 4 1.430 06 10.2 66.5 1.008 6 1.822 8 1.017 3 1.838 57 13.5 134 1.130 3 2.127 1 1.277 6 2.404 3∑ 41 251.332 4.022 5.140 1 3.780 7 6.642于是所求得的回归方程为Q=0.196·h2.51. 展开更多...... 收起↑ 资源预览