资源简介 中小学教育资源及组卷应用平台2025人教A版数学选择性必修第三册8.2 一元线性回归模型及其应用8.2.1 一元线性回归模型 8.2.2 一元线性回归模型参数的最小二乘估计A级 必备知识基础练1.[探究点一]如图所示,已知两个线性相关的变量x,y的统计数据如下:x 6 8 10 12y 6 5 3 2其经验回归方程为x+10.3,则=( ) A.-0.7 B.0.7 C.-0.5 D.-22.[探究点二]红铃虫是棉花的主要害虫之一,一只红铃虫的产卵数和温度有关.现收集了7组观测数据,用4种模型分别进行拟合.由此得到相应的经验回归方程并进行残差分析,进一步得到如图4幅残差图,根据残差图,拟合效果最好的模型是( )A.模型一 B.模型二C.模型三 D.模型四3.[探究点一]随着居民家庭收入的不断提高,人们对居住条件的改善的需求也在逐渐升温.某城市统计了最近5个月的房屋交易量,如下表所示:时间x 1 2 3 4 5交易量y/万套 0.5 0.8 1.0 1.2 1.5若y与x满足一元线性回归模型,且经验回归方程为=0.24x+,则下列说法错误的是( )A.变量y与x正相关B.=0.28C.可以预测当x=6时,房屋交易量约为1.72万套D.当x=5时,残差为-0.024.[探究点二]某公司收集了某商品销售收入y(单位:万元)与相应的广告支出x(单位:万元)的10组数据(xi,yi)(i=1,2,3,…,10),绘制出如下散点图,并利用线性回归模型进行拟合.若将图中10个点中去掉点A后再重新进行线性回归分析,则下列说法正确的是( )A.决定系数R2变小B.残差平方和变小C.相关系数r的值变小D.解释变量x与响应变量y相关性变弱5.[探究点三·2024吉林长春高二阶段练习]用模型y=aekx拟合一组数(xi,yi)(i=1,2,…,2 024),若x1+x2+…+x2 024=2 024,y1y2…y2 024=e20 240,设z=ln y,得变换后的经验回归方程为x+6,则ak=( )A.20 240 B.6e4C.4e6 D.2 0246.[探究点一]某工厂为了对新研发的一种产品进行合理定价,将该产品按事先拟定的价格进行试销,得到如下数据:单价x/元 8 8.2 8.4 8.6 8.8 9销量y/件 90 84 83 80 75 68(1)已知y与x线性相关,求销量y关于单价x的经验回归方程x+,其中=-20,;(2)预计在今后的销售中,销量与单价仍然服从(1)中的关系,且该产品的成本是4元/件,为使工厂获得最大利润,该产品的单价应定为多少元 (利润=销售收入-成本)7.[探究点二]在一段时间内,某网店一种商品的销售价格x(单位:元)和日销售量y(单位:件)之间的一组数据如下表:价格x/元 22 20 18 16 14日销售量y/件 37 41 43 50 56求出y关于x的经验回归方程,并用R2说明拟合效果.参考数据:xiyi=3 992,=1 660.参考公式:,R2=1-.B级 必备知识基础练8.研究表明蟋蟀鸣叫的频率x(每分钟鸣叫的次数)与气温y(单位:℃)存在着较强的线性相关关系.某地观测人员根据如表的观测数据,建立了y关于x的经验回归方程=0.27x+,则下列说法不正确的是( )x/(次数/分钟) 20 30 40 50 60y/℃ 25 27.5 29 32.5 36A.的值是19.2B.变量x,y正相关C.若x的值增加1,则y的值约增加0.27D.当蟋蟀以52次/分钟的频率鸣叫时,该地当时的气温预测值为33.5 ℃9.(多选题)下列说法正确的是( )A.经验回归直线一定经过点()B.若两个具有线性相关关系的变量的相关程度越强,则样本相关系数r的值越接近于1C.在残差图中,残差分布的水平带状区域越窄,说明模型的拟合精度越高D.在线性回归模型中,决定系数R2越接近于1,说明回归模型的拟合效果越好10.[2024河南南阳高二阶段练习]某同学在研究变量x,y之间的相关关系时,得到以下数据:x 4.8 5.8 7 8.3 9.1y 2.8 4.1 7.2 9.1 11.8并采用最小二乘法得到了经验回归方程y=x+,则 0.(填“>”或“<”) 11.某校数学建模兴趣小组收集了一组恒温动物体重W(单位:克)与脉搏率f(单位:心跳次数/分钟)的对应数据(Wi,fi)(i=1,2,…,8),根据生物学常识和散点图得出f与W近似满足f=cWk(c,k为参数).令xi=ln Wi,yi=ln fi,计算得=8,=5,=214.由最小二乘法得经验回归方程为x+7.4,则k的值为 ;为判断拟合效果,通过经验回归方程求得预测值(i=1,2,…,8),若残差平方和≈0.28,则决定系数R2≈ .参考公式:决定系数R2=1- 12.流感每年在世界各地均有传播,在我国北方通常呈冬春季流行,南方有冬春季和夏季两个流行高峰.某幼儿园将去年春季该园患流感小朋友按照年龄与人数统计,得到如下数据:年龄x 2 3 4 5 6患病人数y 22 22 17 14 10(1)已知y与x线性相关,求y关于x的经验回归方程;(2)计算样本相关系数r(计算结果精确到0.01),并回答是否可以认为该幼儿园去年春季患流感人数与年龄负相关很强.(若|r|∈[0.75,1],则x,y相关性很强;若|r|∈[0.3,0.75),则x,y相关性一般;若|r|∈[0,0.25],则x,y相关性较弱)参考数据:≈5.477.参考公式:,样本相关系数r=.13.噪声污染已经成为影响人们身体健康和生活质量的严重问题,为了了解声音强度D(单位:分贝)与声音能量I(单位:W/cm2)之间的关系,将测量得到的声音强度Di和声音能量Ii(i=1,2,…,10)数据作了初步处理,得到如下散点图及一些统计量的值.(Ii-)2 (Ei-)21.04×10-11 45.7 -11.5 1.56×10-21 0.51(Ii-)(Di-) (Ei-)(Di-)6.88×10-11 5.1表中Ei=lg Ii,Ei.(1)根据散点图判断,D=a1+b1I与D=a2+b2lg I(a1,b1,a2,b2均为常数)哪一个适宜作为声音强度D关于声音能量的经验回归方程类型 (给出判断即可,不必说明理由)(2)根据表中数据,求声音强度D关于声音能量I的经验回归方程.附:对于一组数据(u1,v1),(u2,v2),…,(un,vn),其经验回归直线u的斜率和截距的最小二乘估计分别为 .14.某医疗科研团队攻坚克难研发出一种新型防疫产品,该产品的成本由原料成本及非原料成本组成,每件产品的非原料成本y(单位:元)与生产该产品的数量x(单位:千件)有关,根据已经生产的统计数据,绘制了如图所示的散点图.观察散点图,两个变量不具有线性相关关系,现考虑用函数y=a+对两个变量的关系进行拟合.参考数据如下其中ui=:yi uiyi0.41 0.168 1 1.492 306 20 858.44 173.8 50.39(1)求y关于x的非线性经验回归方程,并求y关于u的样本相关系数(精确到0.01).(2)该产品采取订单生产模式(根据订单数量进行生产,即产品全部售出).根据市场调研数据,若该产品单价定为80元,则签订9千件订单的概率为0.7,签订10千件订单的概率为0.3;若单价定为70元,则签订10千件订单的概率为0.3,签订11千件订单的概率为0.7.已知每件产品的原料成本为30元,根据(1)的结果,要想获得更高利润,产品单价应选择80元还是70元 请说明理由.参考公式:对于一组数据(u1,v1),(u2,v2),…,(un,vn),其经验回归方程v=α+βu的斜率和截距的最小二乘估计分别为,相关系数r= .C级 学科素养创新练15.某IT公司在1月份至6月份的5G经济收入y(单位:百万元)关于月份x的数据如下表所示,并根据数据绘制了如图所示的散点图.月份x 1 2 3 4 5 6收入y/百万元 6.6 8.6 16.1 21.6 33.0 41.0(1)根据散点图判断,y=ax+b与y=cedx(a,b,c,d均为常数)哪一个更适宜作为5G经济收入y关于月份x的经验回归方程类型;(给出判断即可,不必说明理由)(2)根据(1)中的结果及表中的数据,求出y关于x的经验回归方程,并预测该公司7月份的5G经济收入;(结果保留小数点后两位)(3)从前6个月的收入中抽取2个,记收入超过2 000万元的个数为X,求X的分布列和数学期望.参考数据:(xi-)2 (xi-)(yi-) (xi-)(ui-) e1.52 e2.663.50 21.15 2.85 17.5 125.35 6.73 4.57 14.30其中,u=ln y,ui=ln yi(i=1,2,3,4,5,6).参考公式:对于一组具有线性相关关系的数据(xi,vi)(i=1,2,3,…,n),其经验回归直线x+的斜率和截距的最小二乘估计分别为.参考答案8.2 一元线性回归模型及其应用8.2.1 一元线性回归模型8.2.2 一元线性回归模型参数的最小二乘估计1.A 由表格中数据可得=9,=4,则=-0.7.故选A.2.D 当残差比较均匀地落在水平的带状区域时,说明选用的模型比较合适,这样的带状区域的宽度越窄,说明拟合效果越好,对比4个残差图,可知模型四的图对应的带状区域的宽度最窄.3.D 对于B,依题意(1+2+3+4+5)=3,(0.5+0.8+1+1.2+1.5)=1,所以1=0.24×3+,解得=0.28,故B正确;对于A,因为经验回归方程为=0.24x+0.28,所以变量y与x正相关,故A正确;对于C,当x=6时,=0.24×6+0.28=1.72,所以可以预测当x=6时,房屋交易量约为1.72万套,故C正确;对于D,当x=5时,=0.24×5+0.28=1.48,所以当x=5时,残差为1.5-1.48=0.02,故D错误.故选D.4.B 从图中可以看出,点A较其他点偏离直线远,故去掉点A后,回归效果更好,故决定系数R2会变大,更接近于1,残差平方和变小,样本相关系数r的绝对值会更接近于1,由图可得x与y正相关,故r的值会更接近于1,即样本相关系数r的值变大,解释变量x与响应变量y相关性变强,故A,C,D错误,B正确.故选B.5.C 由条件可知=1,ln yi=10,则10=+6,解得=4.z=ln y=ln a+kx,则k=4,a=e6,故C正确.故选C.6.解(1)因为(8+8.2+8.4+8.6+8.8+9)=8.5,(90+84+83+80+75+68)=80,所以=80+20×8.5=250.所以经验回归方程为=-20x+250.(2)设工厂获得的利润为L(单位:元),依题意得L=x(-20x+250)-4(-20x+250)=-20x2+330x-1 000=-20+361.25.当且仅当x==8.25时,L取得最大值.故当单价定为8.25元时,工厂可获得最大利润.7.解作出散点图(图略),观察散点图可知这些点散布在一条直线的附近,故可知x与y线性相关.因为=18,=45.4.所以=-2.35,=45.4-(-2.35)×18=87.7.所以经验回归方程为=-2.35x+87.7.yi-与yi-的值如下表:yi- 1 0.3 -2.4 -0.1 1.2yi- -8.4 -4.4 -2.4 4.6 10.6计算得(yi-)2=8.3,(yi-)2=229.2,所以R2=1-0.964.因为0.964很接近于1,所以该模型的拟合效果比较好.8.D 由题意,得(20+30+40+50+60)=40,(25+27.5+29+32.5+36)=30,则-0.27=30-0.27×40=19.2,故A正确;由经验回归方程可知,变量x,y呈正相关关系,故B正确;若x的值增加1,则y的值约增加0.27,故C正确;当x=52时,=0.27×52+19.2=33.24,故D错误.9.ACD 对于A,经验回归直线一定经过点(),故A正确;对于B,由样本相关系数的绝对值越趋近于1,相关程度越强可知,若两个变量负线性相关,其线性相关程度越强,则样本相关系数r的值越接近于-1,故B错误;对于C,因为在残差图中,残差分布的水平带状区域越窄,说明模型的拟合精度越高,故C正确;对于D,因为在线性回归模型中,决定系数R2越接近于1,说明线性回归模型的拟合效果越好,故D正确.10.< 画出散点图如下:从而可以看出,在y=x+中,<0.11.-0.3 0.98 因为f=cWk,两边取对数可得ln f=ln c+kln W,又xi=ln Wi,yi=ln fi,依题意经验回归直线x+7.4必过样本中心(),所以5=8+7.4,解得=-0.3,所以k=-0.3.R2=1-=1-1-=0.98.12.解(1)由题意可得=4,=17,==-3.2,=17+3.2×4=29.8.故y关于x的经验回归方程为=-3.2x+29.8.(2)r=-0.97,由r<0,可知x,y负相关.又因为|r|∈[0.75,1],所以x,y相关性很强.因此,可以认为该幼儿园去年春季患流感人数与年龄负相关很强.13.解 (1)由散点图知,成对样本数据散点在曲线附近,因此利用D=a2+b2Ig I模型更适合.(2)令E=lg I,先建立D关于E的经验回归方程E.由统计表格知,(Ei-)(Di-)=5.1,(Ei-)2=0.51,则=10,=45.7-10×(-11.5)=160.7,∴D关于E的经验回归方程是=10E+160.7,故声音强度D关于声音能量I的非线性经验回归方程是=10lg I+160.7.14.解(1)令u=,先建立y关于u的经验回归方程.因为=51,所以=100.所以=51-100×0.41=10.所以=10+100u.所以y关于x的非线性经验回归方程为=10+y关于u的样本相关系数为r==0.96.(2)(方法一)(ⅰ)若产品单价为80元,记企业利润为X(单位:元).当订单为9千件时,每件产品的成本为10++30=(元),企业的利润为80-40+×9 000=260 000(元).当订单为10千件时,每件产品的成本为10++30=50(元),企业的利润为(80-50)×10 000=300 000(元).所以企业利润X的分布列为X 260 000 300 000P 0.7 0.3E(X)=260 000×0.7+300 000×0.3=272 000.(ⅱ)若产品单价为70元,记企业利润为Y(单位:元).当订单为10千件时,每件产品的成本为10++30=50(元),企业的利润为(70-50)×10 000=200 000(元).当订单为11千件时,每件产品的成本为10++30=(元),企业的利润为70-40+×11 000=230 000(元).所以企业利润Y的分布列为Y 200 000 230 000P 0.3 0.7E(Y)=200 000×0.3+230 000×0.7=221 000.所以E(X)>E(Y),故企业要想获得更高利润,产品单价应选择80元.(方法二)(ⅰ)若产品单价为80元,记企业的产量为X(单位:千件),其分布列为X 9 10P 0.7 0.3所以E(X)=9×0.7+10×0.3=9.3,企业的利润为80-40+×9 300=272 000(元).(ⅱ)若产品单价为70元,记企业的产量为Y(单位:千件),其分布列为Y 10 11P 0.3 0.7所以E(Y)=10×0.3+11×0.7=10.7,企业的利润为70-40+×10 700=221 000(元).因为272 000>221 000,所以企业要想获得更高利润,产品单价应选择80元.15.解(1)根据散点图判断,y=cedx更适宜作为5G经济收入y关于月份x的经验回归方程类型.(2)由(1)得y=cedx,则两边同时取常用对数得ln y=ln c+dx,设u=ln y,则u=ln c+dx.=3.50,=2.85,0.38,2.85-0.38×3.50=1.52,=1.52+0.38x,=e1.52+0.38x.令x=7,则=e1.52+0.38×7=e1.52×e2.66≈4.57×14.30≈65.35,故预测该公司7月份的5G经济收入大约为65.35百万元.(3)前6个月的收入中,收入超过2 000万元的有3个,∴随机变量X的可能取值为0,1,2,∴P(X=0)=,P(X=1)=,P(X=2)=,故X的分布列为X 0 1 2P∴E(X)=0+1+2=1.21世纪教育网 www.21cnjy.com 精品试卷·第 2 页 (共 2 页)21世纪教育网(www.21cnjy.com) 展开更多...... 收起↑ 资源预览