资源简介 (共9张PPT)如果变量之间存在着某种关系,那么其散点图中的点会有一个大致趋势,这种趋势通常可以用一条光滑的曲线来近似地描述.这样近似描述的过程称为曲线拟合.若在两个变量X和Y的散点图中,所有点看上去都在一条直线附近波动,此时就可以用一条直线来近似地描述这两个量之间的关系,称之为直线拟合.§1 一元线性回归知识点 1 曲线拟合和直线拟合知识 清单破1.最小二乘法 对于给定的两个变量X和Y,可以把其成对的观测值(x1,y1),(x2,y2),…,(xn,yn)表示为平面直角坐标系中的n个点.现在希望找到一条直线Y=a+bX,使得对每一个xi(i=1,2,…,n),由这个直线方程计算出来的值a+bxi与实际观测值yi的差异尽可能小.为此,希望[y1-(a+bx1)]2+[y2-(a+bx2)]2+…+[yn-(a+bxn)]2达到最小.换句话说,我们希望a,b的取值能使上式达到最小.这个方法称为最小二乘法.2.线性回归方程直线方程Y= + X称作Y关于X的线性回归方程,相应的直线称作Y关于X的回归直线, , 是这个线性回归方程的系数. 其中, = 知识点 2 一元线性回归方程 = , = - , = (x1+x2+…+xn), = (y1+y2+…+yn).知识辨析判断正误,正确的画“√”,错误的画“ ”.1.散点图是判断两个变量是否相关的一种重要方法和手段. ( )2.回归直线Y=a+bX至少经过点(x1,y1),(x2,y2),…,(xn,yn)中的一个. ( )3.对于散点图中的点没有均匀分布在某条直线附近或成无规则排列的两个变量,用最小二乘法求不出对应的回归直线. ( )√ 提示提示因为散点图可以形象直观地展示两个变量的关系,通过散点图判断两个变量更近似于什么样的函数关系,以确定是否能直接用线性回归模型来拟合原始数据.通过线性回归方程求出的值是一个估计值,因此这些点不一定在回归直线上,故错误.1.确定研究对象,明确哪个变量是X,哪个变量是Y.2.画出X和Y的散点图,观察它们之间是否存在线性关系.3.若数据呈线性关系,则选用线性回归方程.4.按一定规则(如最小二乘法)估计回归方程的系数.5.对变量值的预测,即X取某值时,对Y的值进行预测.讲解分析疑难 情境破疑难 线性回归方程的求解与运用典例 随着经济的发展,农民收入逐年增长,下表是某地一农商银行连续五年的储蓄存款(年底余额):年份x 2019 2020 2021 2022 2023储蓄存款y (百亿元) 6 7.5 8 9.5 11为了让研究时计算方便,工作人员将上表中的数据进行了处理,令t=x-2 018,z=y-6,得到下表:时间代号t 1 2 3 4 5z 0 1.5 2 3.5 5(1)求z关于t的线性回归方程 = t+ ;(2)通过(1)中的方程,求出y关于x的线性回归方程;(3)用所求回归方程预测到2026年年底,该农商银行的储蓄存款可达多少.附:对于线性回归方程 = x+ ,其系数 = , = - .解析 (1)依题意,得 =3, = ,所以 = = = = , = - = - ×3=- ,所以z关于t的线性回归方程为 = t- .(2)由(1)可知 = t- ,因为t=x-2 018,z=y-6,所以 -6= (x-2 018)- ,整理得 = x- ,即y关于x的线性回归方程为 = x- .(3)当x=2026时, = =14.4,因此,预测到2026年年底,该农商银行的储蓄存款可达14.4百亿元.第七章 统计案例§1 一元线性回归1.1 直线拟合 1.2 一元线性回归方程基础过关练 题组一 线性回归的相关概念的理解1.下列四个散点图中,两个变量的关系适合用线性回归模型刻画的是( )A.①② B.①③ C.②③ D.③④2.两个变量x与y之间的回归方程( )A.表示x与y之间的函数关系B.表示x与y之间的不确定关系C.反映x与y之间的真实关系D.是反映x与y之间的真实关系的一种最佳拟合3.下列两个变量中能够具有相关关系的是( )A.人所站的高度与视野B.人眼的近视程度与身高C.正方体的体积与棱长D.某同学的学籍号与考试成绩题组二 线性回归方程及其应用4.根据下表中的数据,用最小二乘法得到y与x的线性回归方程为=14x-14,则表中n的值为( )x 2 3 4 5 6y 20 n 40 60 70A.15.5 B.20 C.20.5 D.255.某地区调查了2~9岁儿童的身高,由此建立的身高y(cm)与年龄x(岁)的回归方程为=8.25x+60.13,下列叙述正确的是( )A.该地区一个10岁儿童的身高为142.63 cmB.该地区2~9岁的儿童每年身高约增加8.25 cmC.该地区9岁儿童的平均身高是134.38 cmD.利用这个模型可以准确计算该地区每个2~9岁儿童的身高6.已知x与y之间的几组数据如下表:x 1 2 3 4 5 6y 0 2 1 3 3 4假设根据上表数据所得线性回归方程为,若某同学根据上表中的前两组数据(1,0)和(2,2)求得的直线方程为y=b'x+a',则下列结论正确的是( )A.>a' B.C.>a' D.7.对有关数据的分析可知,每立方米混凝土的水泥用量x(单位:kg)与28天后混凝土的抗压强度y(单位:kg/cm2)之间具有线性相关关系,其线性回归方程为=0.30x+9.99.根据建设项目的需要,28天后混凝土的抗压强度不得低于89.7 kg/cm2,则每立方米混凝土的水泥用量最少应为 kg. 8.在一项关于16艘轮船的研究中,船的吨位区间为[192,3 246],船员的人数区间为[5,32],由船员人数y关于吨位x的回归分析得到=9.5+0.006 2x,假定2艘轮船的吨位相差1 000 t,则船员的平均人数相差 ,估计最小的船的船员人数是 ,最大的船的船员人数是 . 9.为了研究某班学生的脚长x(单位:厘米)和身高y(单位:厘米)的关系,从该班随机抽取10名学生,根据测量数据的散点图可以看出y与x之间有线性相关关系,设其线性回归方程为,已知yi=1 600,=4.该班某学生的脚长为24厘米,据此估计其身高为 厘米. 10.销售费用预算是以销售收入预算为基础,通过分析销售收入、销售利润和销售费用的关系,力求实现销售费用的最有效使用.根据往年的相关数据显示,某高新技术企业的年销售费用占年销售收入的8%~10%为合理区间,当年销售费用超出年销售收入的10%时,说明企业的销售环节出现一定的问题,需要加强销售管理.该企业的年销售费用x(单位:千万元)和年销售收入y(单位:千万元)的相关数据如下表所示:2018 2019 2020 2021 2022 2023x 3 5 6 8 9 11y 31 50 54 86 85 114(1)通过数据分析,该企业的年销售费用x与年销售收入y之间符合线性相关关系,求出线性回归方程;(2)若该企业2024年预算年销售费用为12千万元,试预测2024年的年销售收入,并判断2024年的年销售费用预测值是否在合理区间内.(精确到0.01千万元)参考数据:xiyi=3 374.参考公式:中,.11.一台还可以用的机器由于使用的时间较长,按不同的转速生产出来的某机械零件有一些会有缺陷,每小时生产有缺陷零件的数量随机器转速的变化而变化,下表为抽样试验结果:转速x(转/秒) 16 14 12 8每小时生产有缺陷 零件的数量y(个) 11 9 8 5(1)画出散点图;(2)如果变量x和y线性相关,求y关于x的线性回归方程;(3)若实际生产中,允许每小时生产的产品中有缺陷的零件最多有10个,则机器的转速应控制在什么范围内 附:线性回归方程中,.能力提升练 题组 线性回归模型的综合应用1.某公司为了增加某种商品的销售利润,调查并统计了该商品投入的广告费用x与销售利润y的相关数据,如下表:广告费用x/万元 2 3 5 6销售利润y/万元 5 7 9 11由表中数据得回归直线l的方程为,则下列结论错误的是( )A.>0 B.>0C.直线l过点(4,8) D.直线l过点(2,5)2.某学习小组用计算机软件对一组数据(xi,yi)(i=1,2,3,…,8)进行回归分析,甲同学首先求出线性回归方程=2x+5,样本点的中心为(2,m).乙同学对甲的计算过程进行检查,发现甲将数据(3,7)误输成(7,3),数据(4,6)误输成(4,-6),将这两个数据改正后得到线性回归方程x+k,则实数k=( )A.-6 B.- C. D.3.某商家对一种新产品进行试销,得到如下数据:单价x/元 16 16.4 16.8 17.2 17.6 18销售量y/件 180 168 166 160 150 136通过绘制散点图,得知y与x具有线性相关关系.若该产品每件成本9元,要使该产品的销售总利润最大,则单价应为 元.(销售总利润=(单价-成本)×销售量) 附:(1)参考公式:回归直线y=bx+a中,斜率和截距的最小二乘估计分别为;(2)参考数据:xiyi=16 264,=1 736.8.4.某二手汽车经销商对其所经营的某型号二手汽车的使用年数x(0使用年数x 2 4 6 8 10销售价格y/万元 16 13 9 7 5根据表中数据,用最小二乘法求y关于x的线性回归方程;(2)已知每辆该型号汽车的收购价格w(万元)与使用年数x(0附:回归直线y=bx+a中,斜率和截距的最小二乘估计公式分别为.答案与分层梯度式解析第七章 统计案例§1 一元线性回归1.1 直线拟合1.2 一元线性回归方程基础过关练1.B 2.D 3.A 对于A,人所站的高度越高视野越开阔,具有相关关系,故A正确;对于B,人眼的近视程度与身高不具有相关关系,故B错误;对于C,正方体的体积与棱长是一种确定关系,故C错误;对于D,某同学的学籍号与考试成绩不具有相关关系,故D错误.故选A.4.B 由题表中的数据计算可得,,因为回归直线=14x-14过点,所以=14×4-14,解得n=20.故选B.5.B 由=8.25x+60.13知=8.25,说明该地区2~9岁的儿童年龄每增加一岁,身高约增加8.25 cm.故选B.6.C 由题意得b'=,∴>a'.故选C.7.答案 265.7解析 由题意,0.30x+9.99≥89.7,解得x≥265.7,故每立方米混凝土的水泥用量最少应为265.7 kg.8.答案 6;10;29解析 由线性回归方程知船的吨位每增加1 000 t,人数增加0.006 2×1 000≈6.令x=192,得=10.690 4,令x=3 246,得=29.625 2,又人数为整数,所以估计最小的船的船员人数为10,最大的船的船员人数为29.9.答案 166解析 根据题意,得×225=22.5,×1 600=160,=4,由点(22.5,160)在回归直线上,得160=4×22.5+,解得=70,故=4x+70,令x=24,得=4×24+70=166,即该学生身高约为166厘米.10.解析 (1)由已知得,=70.又xiyi=3 374,=336,所以,所以,所以该企业的年销售费用x与年销售收入y之间的线性回归方程为.(2)2024年的年销售收入的预测值≈121.67(千万元).因为12÷121.67×100%≈9.9%,所以2024年的年销售费用预测值在合理区间内.11.解析 (1)画出散点图,如图所示:(2)由题表中数据易得=660,∴≈0.728 6,=8.25-0.728 6×12.5=-0.857 5.故线性回归方程为=0.728 6x-0.857 5.(3)要使y≤10,则0.728 6x-0.857 5≤10,即x≤≈14.9.故机器的转速应不超过14.9转/秒.能力提升练1.D 由题表中数据可得×(5+7+9+11)=8,所以直线l经过点(4,8),故C正确;又)=(-2)×(-3)+(-1)×(-1)+1×1+2×3=14,)2=(-2)2+(-1)2+12+22=10,所以=1.4,故A正确;=8-1.4×4=2.4,故B正确;回归直线l的方程为=1.4x+2.4,当x=2时,=1.4×2+2.4=5.2,∴直线l过点(2,5.2),故D错误.2.D 样本点的中心为(2,m),将其代入=2x+5,可得m=2×2+5=9,假设甲输入的(x1,y1)为(7,3),(x2,y2)为(4,-6),则7+4+x3+x4+…+x8=2×8=16,3-6+y3+y4+…+y8=9×8=72,得x3+x4+…+x8=5,y3+y4+…+y8=75,改为正确数据后,得3+4+x3+x4+…+x8=12,7+6+y3+y4+…+y8=88,此时样本点的中心为,将其代入x+k,可得k=11-.故选D.3.答案 17解析 ×960=160,又xiyi=16 264,=1 736.8,∴=-20,=160-(-20)×17=500.∴y关于x的线性回归方程为=-20x+500.则产品的销售总利润=(x-9)(-20x+500)=-20x2+680x-4 500.当x==17时,该产品的销售总利润最大.4.解析 (1)由题表中的数据得,xiyi=2×16+4×13+6×9+8×7+10×5=244,所以=10+1.4×6=18.4,所以y关于x的线性回归方程为=-1.4x+18.4.(2)z=在z=-0.05x2+0.3x+1.3(0在z=0.05x+0.8(6显然1.75>1.3,所以当x=3时,利润z最大,且最大利润是1.75万元.1 展开更多...... 收起↑ 资源列表 §1 一元线性回归.docx §1 一元线性回归.pptx