资源简介 §2 成对数据的线性相关性2.1 相关系数2.2 成对数据的线性相关性分析【课前预习】知识点2.[-1,1] 越强 越弱诊断分析(1)①√ ②√ ③×(2)解:把数学成绩作为横坐标,相应的物理成绩作为纵坐标,在直角坐标系中描点(xi,yi)(i=1,2,…,5),作出散点图(图略).从图中可以直观地看出数学成绩和物理成绩具有相关关系,且数学成绩和物理成绩正相关.【课中探究】例1 C变式 D [解析] 由散点图知,变量X与变量Y负相关,即r<0,故C错误;去掉点P后,|r|进一步接近1,所以r变小,故A错误;去掉点P后,Y与X的线性相关程度变强,故B错误,D正确.故选D.例2 解:(1)根据表中的数据画出散点图,如图.(2)从(1)中散点图可知,数学学习时间与数学平均成绩之间线性相关.由已知数据求得=17.4,=74.9,≈0.920.由样本相关系数知,数学学习时间与数学平均成绩之间正相关,因为r≈0.920与1接近,所以数学学习时间与数学平均成绩之间的线性相关程度很强,且随着数学学习时间的增加,相应的学习成绩升高.变式 0.78 [解析] 由题得=×(110+120+90+100+140+95+105)=,=×(80+85+75+80+90+85+78)=,∴7名幼儿的智力测验成绩与阅读能力测验成绩的样本相关系数约为0.78.例3 解:(1)散点图如下:(2)由Y=ebX+a得ln Y=bX+a,令Z=ln Y,得Z=bX+a.由已知得==0.5,==3,所以Z=0.59X-1.27,即Y=e0.59X-1.27,故年销售量Y关于年投资额X的非线性回归方程为Y=e0.59X-1.27.变式 解:(1)由题中所给散点图可以判断,y=c+d更适宜作为年销售量Y关于年宣传费X的回归方程类型.(2)令W=,则Y=c+d可转化为Y=c+dW,则Y与W之间为线性相关关系.则==68,=- =563-68×6.8=100.6,所以Y=100.6+68W,因此Y=100.6+68.(3)(i)由(2)知,当X=49时,Y=100.6+68=576.6(千元),Z=576.6×0.2-49=66.32(千元).(ii)由(2)知,Z=0.2(100.6+68)-X=-X+13.6+20.12,所以当==6.8,即X=46.24时,Z取得最大值.故年宣传费为46.24千元时,年利润的预测值最大.§2 成对数据的线性相关性2.1 相关系数2.2 成对数据的线性相关性分析1.D [解析] 当两个变量之间具有确定的关系时,两个变量之间是函数关系,而不是相关关系,故A错误;球的体积与该球的半径之间是函数关系,故B错误;农作物的产量与施化肥量之间的关系是相关关系,是一种非确定性关系,故C错误;一个学生的数学成绩与物理成绩之间的关系是相关关系,是一种非确定性关系,故D正确.故选D.2.C [解析] ∵r1=0.785>0,r2=-0.983<0,∴X和Y正相关,U和V负相关,∵|r2|>|r1|,∴X和Y之间的线性相关程度弱于U和V之间的线性相关程度,故选C.3.B [解析] 由散点图的变化趋势可得,y=bax+c更适合作为Y关于X的回归方程类型.故选B.4.D [解析] 根据题意作出散点图,如图所示,由图可知,Y与X正相关.易知去掉一对数据(5,13)后,Y与X仍正相关,相关性变强,所以样本相关系数变大.故选D.5.B [解析] 由题意知,==25,==3,由=0.2+,可得=3-0.2×25=-2.∵Z=ln Y,∴ln Y=0.2X-2,∴Y=e-2·e0.2X,可得=e-2.故选B.6.D [解析] 对于A,若所有样本数据对应的点都在直线y=x+上,则变量间的样本相关系数r的绝对值为1,样本相关系数r=±1,故A错误;对于B,回归直线必过点(,),但样本数据对应的点可能都不在回归直线上,故B错误;对于C,样本数据对应的点可能在回归直线y=x+上,即可能存在xi(i=1,2,3,…,30),使得对应的预测值xi+与实际值yi没有误差,故C错误;对于D,样本相关系数r与的符号相同,若回归直线y=x+的斜率>0,则r>0,变量x与y正相关,故D正确.故选D.7.ABC [解析] 样本相关系数可用来衡量两个变量之间的线性相关程度,样本相关系数是一个绝对值小于或等于1的量,并且它的绝对值越大就说明相关程度越强.故选ABC.8.CD [解析] 由散点图可知这两个变量负相关,所以r1,r2<0.因为剔除数据(10,21)后,剩下的数据线性相关性更强,所以|r2|比|r1|更接近1,所以-19.②④ [解析] 对于①,正方形的边长a和面积S之间的关系是函数关系,不是相关关系;对于②,一般情况下,一个人的身高h和右手一拃长x正相关;对于③,真空中的自由落体运动其下落的距离h和下落的时间t之间的关系是函数关系,不是相关关系;对于④,一般情况下,一个人的身高h和他的体重x正相关.故填②④.10.正相关 [解析] 根据所给数据画出散点图如图所示.由散点图可知,该学生的做题时间与题数正相关.11.e41 [解析] 因为回归直线Z=X+5恒过点(,),且x1+x2+…+x7=6,所以==,=+5=+5=,即===,所以ln(y1y2…y7)=41,即y1y2…y7=e41.12.e7.5 [解析] ∵y=ebx-0.5,∴ln y=bx-0.5,令z=ln y,则z=bx-0.5,根据题意列出表格如下,x 1 2 3 4z 1 3 4 6故==2.5,==3.5,易知3.5=2.5b-0.5,解得b=1.6,则z=1.6x-0.5,故当x=5时,z=ln y=1.6×5-0.5=7.5,此时y=e7.5.13.解:(1)由题意得,==4,==17,==-3.2,=- =17-(-3.2)×4=29.8,故Y关于X的线性回归方程为Y=-3.2X+29.8.(2)(xi-)(yi-)=(2-4)×(22-17)+(3-4)×(22-17)+(4-4)×(17-17)+(5-4)×(14-17)+(6-4)×(10-17)=-32,(xi-)2=(2-4)2+(3-4)2+(4-4)2+(5-4)2+(6-4)2=10,(yi-)2=(22-17)2+(22-17)2+(17-17)2+(14-17)2+(10-17)2=108,则r=-=-≈-0.97,∴r<0,说明X与Y负相关,又|r|∈[0.75,1],说明X与Y的线性相关性很强,∴可以认为该幼儿园去年春季患流感的人数与年龄的负相关性很强.14.解:(1)依题意可得==4,==5,xiyi=2×2.2+3×3.8+4×5.5+5×6.5+6×7=112.3,=22+32+42+52+62=90,∴==1.23,=5-1.23×4=0.08,∴Y关于X的线性回归方程为Y=1.23X+0.08.(2)在(1)中求得的线性回归方程中,令X=10,可得Y=1.23×10+0.08=12.38,故预测当使用年限为10年时的维修费用是12.38万元.15.ACD [解析] 因为==3.5,=2.5,所以两条回归直线均过点(3.5,2.5),即两条回归直线的交点为(3.5,2.5),故选项A正确.当m=2时,由=2.5,可得n=3,xiyi-4·=2×1.5+3×2+4×3+5×3.5-4×3.5×2.5=3.5,-4=22+32+42+52-4×3.52=5,所以===0.7,=-=2.5-0.7×3.5=0.05;当m=2.5时,由=2.5,可得n=2.5,xiyi-4·=2×1.5+3×2.5+4×2.5+5×3.5-4×3.5×2.5=3,所以===0.6,=-=2.5-0.6×3.5=0.4.所以<,>,故选项B错误,选项C正确.当m=2,n=3时,-4=1.52+22+32+3.52-4×2.52=2.5,所以r1==≈0.99;当m=2.5,n=2.5时,-4=1.52+2.52+2.52+3.52-4×2.52=2,所以r2==≈0.95.则r1>r2,故选项D正确.故选ACD.16.解:(1)由题意知,=×(1+2+3+4+5+6+7)=4,(xi-)2=(1-4)2+(2-4)2+(3-4)2+(4-4)2+(5-4)2+(6-4)2+(7-4)2=28.对于模型y=a+bx,相关系数r=≈≈0.996,对于模型y=c+dx2,令w=x2,则y=c+dw,相关系数r'=≈≈0.968,因为0.996>0.968,所以y=a+bx更适宜作为年收入Y关于年份代码X的回归方程类型.(2)由(1)可知Y关于X的线性回归方程为Y=+X,由已知数据及公式可得===≈4.71,=-=-×4≈49.71.所以Y关于X的线性回归方程为Y=4.71X+49.71.易知2024年对应的年份代码为8,当X=8时,Y=4.71×8+49.71=87.39(千元),所以预测2024年该农户种植药材的收入为87.39千元.§2 成对数据的线性相关性2.1 相关系数2.2 成对数据的线性相关性分析【学习目标】 1.结合实例,了解样本相关系数的统计含义,了解样本相关系数与标准化数据向量夹角的关系. 2.结合实例,会通过相关系数比较多组成对数据的相关性.◆ 知识点 相关系数1.定义:一般地,设随机变量X,Y的n组观测值分别为(x1,y1),(x2,y2),…,(xn,yn),其中x1,x2,…,xn和y1,y2,…,yn的均值分别为和,记r==,则称r为随机变量X和Y的样本(线性)相关系数,其中,当r>0时,称两个随机变量正相关,当r<0时,称两个随机变量负相关.2.样本相关系数与成对数据线性相关性强弱的关系:r∈ ,|r|值越接近1,随机变量之间的线性相关程度 ;|r|值越接近0,随机变量之间的线性相关程度 . 【诊断分析】 (1) 判断正误.(请在括号中打“√”或“×”)①样本相关系数r的符号反映了相关关系的正负性. ( )②一般地,样本容量越大,用样本相关系数估计两个随机变量的线性相关性的效果越好. ( )③r=0表明两个随机变量不存在相关关系. ( )(2)5名学生的数学和物理成绩(单位:分)如下表:学生 成绩 学科 A B C D E数学 80 75 70 65 60物理 70 66 68 64 62画出散点图,并判断它们是否具有相关关系.如果具有相关关系,是正相关,还是负相关 ◆ 探究点一 相关系数例1 某统计部门对四组数据进行统计分析后,获得如图所示的散点图,下列关于样本相关系数的比较正确的是 ( )A.r4B.r2C.r2D.r4变式 在如图所示的散点图中,若去掉点P,则下列说法正确的是 ( )A.样本相关系数r变大B.变量X与变量Y的线性相关程度变弱C.变量X与变量Y正相关D.变量X与变量Y的线性相关程度变强[素养小结]利用样本相关系数r判断两个随机变量之间线性相关程度的步骤:(1)利用公式计算样本相关系数r;(2)用样本相关系数r的绝对值的大小判断两个随机变量之间的线性相关程度.◆ 探究点二 成对数据的线性相关性分析例2 某校高三(1)班的学生每周的数学学习时间X(单位:h)与数学平均成绩Y(单位:分)的数据如下表所示.X 24 15 23 19 16 11 20 16 17 13Y 92 79 97 89 64 47 83 68 71 59(1)画出散点图;(2)请判断数学学习时间与数学平均成绩之间的相关关系的类型、相关程度和变化趋势的特征.变式 通过随机抽样得到的7名幼儿的智力测验成绩X和阅读能力测验成绩Y的一组数据如下:智力测验成绩 110 120 90 100 140 95 105阅读能力测验成绩 80 85 75 80 90 85 78则7名幼儿的智力测验成绩与阅读能力测验成绩的样本相关系数约为 .(计算结果保留两位小数) [素养小结]判断变量的相关性通常有两种方式:一是散点图;二是样本相关系数r.前者只能粗略地说明变量间具有相关性,而后者能从定量的角度分析变量相关性的强弱.◆ 探究点三 非线性回归模型的应用例3 [2024·广东东莞高二期末] 某公司近5年的产品研发年投资额X(单位:百万元)与年销售量Y(单位:千件)的数据统计表如下:年投资额X 1 2 3 4 5年销售量Y 0.5 1 1.5 3 5.5(1)根据上表数据画出年投资额X与年销售量Y的散点图;(2)该公司计划用y=ebx+a作为年销售量Y关于年投资额X的回归方程类型,并对年销售量取自然对数,得到如下数据表(Z=ln Y):年销售量Y 0.5 1 1.5 3 5.5Z -0.7 0 0.4 1.1 1.7请根据表中数据,建立Y关于X的非线性回归方程.变式 若某公司要确定下一年度投入某种产品的宣传费,需了解年宣传费X(单位:千元)对年销售量Y(单位:吨)和年利润Z(单位:千元)的影响.对近8年的年宣传费xi和年销售量yi(i=1,2,…,8)的数据进行初步处理,得到如图所示的散点图及下表所示的一些统计量的值.(xi- )2 (wi- )2 (xi- )·(yi- ) (wi- )·(yi- )46.6 563 6.8 289.8 1.6 1469 108.8表中wi=,=wi.(1)根据散点图判断,y=a+bx与y=c+d哪一个模型更适宜作为年销售量Y关于年宣传费X的回归方程类型 (给出判断即可,不必说明理由)(2)根据(1)的判断结果及表中数据,建立Y关于X的回归方程.(3)已知这种产品的年利润Z与X,Y的关系为Z=0.2Y-X.根据(2)的结果回答下列问题:(i)当X=49时,预测年销售量及年利润分别是多少 (ii)年宣传费为多少时,年利润的预测值最大 [素养小结]求解非线性回归方程的一般步骤:(1)画散点图:通过观察散点图并与学过的函数(幂函数、指数函数、对数函数、二次函数)图象进行比较,选取拟合效果好的函数模型;(2)变量置换:通过变量置换把非线性回归问题转化为线性回归问题;(3)求解线性回归方程,进而得原变量的非线性回归方程.(共37张PPT)2 成对数据的线性相关性2.1 相关系数2.2 成对数据的线性相关性分析◆ 课前预习◆ 课中探究◆ 备课素材◆ 备用习题【学习目标】1.结合实例,了解样本相关系数的统计含义,了解样本相关系数与标准化数据向量夹角的关系.2.结合实例,会通过相关系数比较多组成对数据的相关性.知识点 相关系数1.定义:一般地,设随机变量,的组观测值分别为,, , ,其中,, ,和,, ,的均值分别为和 ,记,则称为随机变量和 的样本(线性)相关系数,其中,当时,称两个随机变量正相关,当 时,称两个随机变量负相关.2.样本相关系数与成对数据线性相关性强弱的关系:_______,值越接近1,随机变量之间的线性相关程度______; 值越接近0,随机变量之间的线性相关程度______.越强越弱【诊断分析】(1) 判断正误.(请在括号中打“√”或“×”)①样本相关系数 的符号反映了相关关系的正负性.( )√②一般地,样本容量越大,用样本相关系数估计两个随机变量的线性相关性的效果越好.( )√③ 表明两个随机变量不存在相关关系.( )×(2)5名学生的数学和物理成绩(单位:分)如下表:学生 成绩 学科数学 80 75 70 65 60物理 70 66 68 64 62画出散点图,并判断它们是否具有相关关系.如果具有相关关系,是正相关,还是负相关?解:把数学成绩作为横坐标,相应的物理成绩作为纵坐标,在直角坐标系中描点 ,作出散点图(图略).从图中可以直观地看出数学成绩和物理成绩具有相关关系,且数学成绩和物理成绩正相关.探究点一 相关系数例1 某统计部门对四组数据进行统计分析后,获得如图所示的散点图,下列关于样本相关系数的比较正确的是( )CA.B.C.D.变式 在如图所示的散点图中,若去掉点 ,则下列说法正确的是( )DA.样本相关系数 变大B.变量与变量 的线性相关程度变弱C.变量与变量 正相关D.变量与变量 的线性相关程度变强[解析] 由散点图知,变量与变量负相关,即,故C错误;去掉点 后,进一步接近1,所以变小,故A错误;去掉点后,与 的线性相关程度变强,故B错误,D正确.故选D.[素养小结]利用样本相关系数 判断两个随机变量之间线性相关程度的步骤:(1)利用公式计算样本相关系数 ;(2)用样本相关系数 的绝对值的大小判断两个随机变量之间的线性相关程度.探究点二 成对数据的线性相关性分析例2 某校高三(1)班的学生每周的数学学习时间单位:与数学平均成绩(单位:分)的数据如下表所示.24 15 23 19 16 11 20 16 17 1392 79 97 89 64 47 83 68 71 59(1)画出散点图;解:根据表中的数据画出散点图,如图.(2)请判断数学学习时间与数学平均成绩之间的相关关系的类型、相关程度和变化趋势的特征.解:从(1)中散点图可知,数学学习时间与数学平均成绩之间线性相关.由已知数据求得,,, ,,所以样本相关系数 .由样本相关系数知,数学学习时间与数学平均成绩之间正相关,因为 与1接近,所以数学学习时间与数学平均成绩之间的线性相关程度很强,且随着数学学习时间的增加,相应的学习成绩升高.变式 通过随机抽样得到的7名幼儿的智力测验成绩和阅读能力测验成绩 的一组数据如下:智力测验成绩 110 120 90 100 140 95 105阅读能力测验成绩 80 85 75 80 90 85 78则7名幼儿的智力测验成绩与阅读能力测验成绩的样本相关系数约为_____.(计算结果保留两位小数)0.78[解析] 由题得 ,, ,,,,名幼儿的智力测验成绩与阅读能力测验成绩的样本相关系数约为0.78.[素养小结]判断变量的相关性通常有两种方式:一是散点图;二是样本相关系数 .前者只能粗略地说明变量间具有相关性,而后者能从定量的角度分析变量相关性的强弱.探究点三 非线性回归模型的应用例3 [2024·广东东莞高二期末] 某公司近5年的产品研发年投资额 (单位:百万元)与年销售量 (单位:千件)的数据统计表如下:年投资额 1 2 3 4 5年销售量 0.5 1 1.5 3 5.5(1)根据上表数据画出年投资额与年销售量 的散点图;解:散点图如下:(2)该公司计划用作为年销售量关于年投资额 的回归方程类型,并对年销售量取自然对数,得到如下数据表年销售量 0.5 1 1.5 3 5.50 0.4 1.1 1.7请根据表中数据,建立关于 的非线性回归方程.解:由得,令,得 .由已知得, ,,,则 ,,所以,即,故年销售量关于年投资额 的非线性回归方程为 .变式 若某公司要确定下一年度投入某种产品的宣传费,需了解年宣传费(单位:千元)对年销售量(单位:吨)和年利润 (单位:千元)的影响.对近8年的年宣传费 和年销售量 的数据进行初步处理,得到如图所示的散点图及下表所示的一些统计量的值.46.6 563 6. 8 289.8 1.6 1469 108.8表中, .(1)根据散点图判断,与 哪一个模型更适宜作为年销售量关于年宣传费 的回归方程类型 (给出判断即可,不必说明理由)解:由题中所给散点图可以判断,更适宜作为年销售量 关于年宣传费的回归方程类型.(2)根据(1)的判断结果及表中数据,建立关于 的回归方程.解:令,则可转化为,则与 之间为线性相关关系.则 ,,所以,因此 .(3)已知这种产品的年利润与,的关系为 .根据(2)的结果回答下列问题:(ⅰ)当 时,预测年销售量及年利润分别是多少 解: 由(2)知,当时, (千元),(千元).(ⅱ)年宣传费为多少时,年利润的预测值最大 解: 由(2)知, ,所以当 ,即时, 取得最大值.故年宣传费为46.24千元时,年利润的预测值最大.[素养小结]求解非线性回归方程的一般步骤:(1)画散点图:通过观察散点图并与学过的函数(幂函数、指数函数、对数函数、二次函数)图象进行比较,选取拟合效果好的函数模型;(2)变量置换:通过变量置换把非线性回归问题转化为线性回归问题;(3)求解线性回归方程,进而得原变量的非线性回归方程.1.样本相关系数是从数值上来判断变量间的线性相关性的一个统计量,是定量的方法.与散点图相比较,样本相关系数要精细得多.需要注意的是样本相关系数的绝对值小,只是说明线性相关性较弱,但不一定不相关,可能非线性相关.2.利用样本相关系数 来检验线性相关显著性水平时,通常与0.75作比较,若,则线性相关较为显著,否则为不显著.例1 车的重量与其每千米耗油量之间的样本相关系数是正数还是负数 为什么 解:正数.因为车的重量越大,行驶过程中消耗的能量越大,需要的燃油量越多,所以车的重量与其每千米耗油量之间的样本相关系数是正数.例2 对两个变量,进行线性相关性检验,得样本相关系数 ,对两个变量,进行线性相关性检验,得样本相关系数 ,则下列说法正确的是( )CA.变量与正相关,变量与负相关,变量与 的线性相关程度较强B.变量与负相关,变量与正相关,变量与 的线性相关程度较强C.变量与正相关,变量与负相关,变量与 的线性相关程度较强D.变量与负相关,变量与正相关,变量与 的线性相关程度较强[解析] 由样本相关系数知与 正相关,由样本相关系数知与负相关.又, 变量与的线性相关程度比 与 的线性相关程度强.故选C.例3 [2024·辽宁抚顺六校协作体高二期末](1)若成对样本数据都落在直线 上,求样本相关系数.解:因为成对样本数据都落在直线 上,直线的斜率为负数,所以样本相关系数为 .(2)现随机抽取10家航空公司,对其最近一年的航班正点率和乘客投诉次数进行调查.所得数据如下表所示:航空公司编号 1 2 3 4 5航班正点率 80 78 81 84 86乘客投诉次数 26 33 24 20 18航空公司编号 6 7 8 9 10航班正点率 90 91 93 88 89乘客投诉次数 10 9 7 12 11根据表格的数据,试问乘客投诉次数与航班正点率之间是否呈现线性相关关系?它们之间的相关程度如何?附:相关系数,当 时两个变量之间的线性相关程度较为显著, .解:由表中数据可得, ,,,,,所以,所以 ,所以乘客投诉次数与航班正点率负相关,线性相关程度较为显著.例4 在商品营销中,通过广告可以激发和引导消费,扩大产品的知名度,从而增加销量.某工厂生产的某种产品在没有广告投入的情况下,每销售一件可获得纯利润10元,该厂准备通过广告投入来增加销量,对过去一段时间的广告投入以及年销量增加情况进行了统计,得到了广告投入(单位:百万元)与年销量增量(单位:万件)的数据,如下表所示.1 2 3 4 5 6 76 11 21 34 66 101 196根据数据绘制的散点图如图所示.(1)观察散点图,可知两个变量不具有线性相关关系,拟用函数模型,且对两个变量的关系进行拟合,求出关于 的回归方程.解:由两边同时取常用对数可得 .设,,,则.由表中数据易得, ,, ,所以, ,所以 ,故 ,所以关于的回归方程为 .(2)若该厂今年准备在广告中投入8百万元,预测该厂今年能增加利润多少万元 参考数据:62.14 1.54 2535 50.12 3.47其中, .解:若投入8百万元,则能增加销售利润 (万元),则该厂今年增加的利润为 (万元).故在广告中投入8百万元,预测该厂今年能增加利润2670万元.§2 成对数据的线性相关性2.1 相关系数2.2 成对数据的线性相关性分析一、选择题1.下列说法正确的是 ( ) A.任何两个变量之间都具有相关关系B.球的体积与该球的半径之间具有相关关系C.农作物的产量与施化肥量之间是一种确定性关系D.一个学生的数学成绩与物理成绩之间是一种非确定性的关系2.已知随机变量X和Y的样本相关系数为r1,随机变量U和V的样本相关系数为r2,且r1=0.785,r2=-0.983,则 ( )A.X和Y正相关,且X和Y之间的线性相关程度强于U和V之间的线性相关程度B.X和Y负相关,且X和Y之间的线性相关程度强于U和V之间的线性相关程度C.U和V负相关,且X和Y之间的线性相关程度弱于U和V之间的线性相关程度D.U和V正相关,且X和Y之间的线性相关程度弱于U和V之间的线性相关程度3.如图是由一组试验数据作出的散点图,以下函数中适合作为Y关于X的回归方程类型的是 ( )A.y=ax+b B.y=bax+cC.y=blogax+c D.y=ax2+c4.在一次试验中,测得(X,Y)的五对数据分别为(1,3),(2,4),(4,5),(5,13),(10,12),去掉一对数据(5,13)后,下列说法正确的是 ( )A.Y与X由正相关变成负相关B.样本相关系数不变C.Y与X的相关性变弱D.样本相关系数变大5.[2024·益阳桃江高二期末] 气候变暖、干旱给蝗灾的发生创造了机会.已知蝗虫的产卵量Y与温度X的关系可以用函数y=c1来拟合(其中c1,c2为常数),设Z=ln Y,得到一组数据如下表:X 20 23 25 27 30Z 2.2 2.4 3 3.2 4.2由上表可得Z关于X的线性回归方程为Z=0.2X+,则= ( )A.-2 B.e-2 C.3 D.e36.已知一组样本数据(xi,yi),其中i=1,2,3,…,30,根据最小二乘法求得的回归直线的方程是y=x+,则下列说法正确的是 ( )A.若所有样本数据对应的点都在回归直线y=x+上,则变量间的样本相关系数为1B.至少有一个样本数据对应的点落在回归直线y=x+上C.对所有的xi(i=1,2,3,…,30),预测值xi+一定与实际值yi有误差D.若回归直线y=x+的斜率>0,则变量x与y正相关7.(多选题)下列关于样本相关系数r的说法正确的是 ( )A.r可用来衡量两个变量之间的线性相关程度B.|r|≤1,且|r|越接近0,相关程度越弱C.|r|≤1,且|r|越接近1,相关程度越强D.|r|≤1,且|r|越接近1,相关程度越弱8.(多选题)变量x,y的散点图如图所示,现对这两个变量进行直线拟合.方案一:根据图中所有数据,得到线性回归方程y=x+,样本相关系数为r1;方案二:剔除数据(10,21),根据剩下数据得到线性回归方程y=x+,样本相关系数为r2.则 ( )A.r1=r2 B.r1C.r1>r2 D.r1,r2∈(-1,0)二、填空题9.下列两个变量之间具有相关关系的是 .(填序号) ①正方形的边长a和面积S;②一个人的身高h和右手一拃长x;③真空中的自由落体运动其下落的距离h和下落的时间t;④一个人的身高h和体重x.10.某老师为了了解学生的计算能力,对某学生进行了10次测试,收集到的数据如下:题数X 5 10 15 20 25 30 35 40 45 50做题时间Y(分钟) 9 19 26 37 48 52 61 73 81 89试判断该学生的做题时间与题数 (填“正相关”或“负相关”). 11.[2024·重庆八中高二期末] 用模型y=aebx拟合一组数据(xi,yi)(i=1,2,…,7),其中x1+x2+…+x7=6.设Z=ln Y,经计算得到Z关于X的线性回归方程为Z=X+5,则y1y2…y7= . 12.已知变量y关于x的回归方程为y=ebx-0.5,若对y=ebx-0.5两边同时取自然对数,可以发现ln y与x线性相关.现有一组数据如表所示:x 1 2 3 4y e e3 e4 e6则当x=5时,预测y的值为 . 三、解答题13.流行性感冒(简称流感)是由流感病毒引起的一种急性呼吸道疾病,也是一种传染性强、传播速度快的疾病.其主要通过空气中的飞沫、人与人之间的接触或与被污染物品的接触传播.流感每年在世界各地均有传播,在我国以冬春季多见.儿童相对免疫力低,在幼儿园、学校等人员密集的地方更容易被传染.某幼儿园将去年春季该园患流感的小朋友按照年龄与人数统计,得到如下数据:年龄X(岁) 2 3 4 5 6患流感人数Y 22 22 17 14 10(1)求Y关于X的线性回归方程Y=X+;(2)计算变量X与Y的样本相关系数r(计算结果精确到0.01),并回答是否可以认为该幼儿园去年春季患流感的人数与年龄的负相关性很强.(若|r|∈[0.75,1],则X与Y的线性相关性很强;若|r|∈[0.3,0.75),则X与Y的线性相关性一般;若|r|∈[0,0.25],则X与Y的线性相关性较弱)参考数据:≈5.477.参考公式:线性回归方程Y=X+中=,=-,样本相关系数r=.14.[2024·河北唐山乐亭高平中学高二期末] 假设关于某设备的使用年限X(单位:年)和所支出的维修费用Y(单位:万元)的有关统计数据如表所示:使用年限X/年 2 3 4 5 6维修费用Y /万元 2.2 3.8 5.5 6.5 7(1)求Y关于X的线性回归方程Y=X+;(2)预测当使用年限为10年时的维修费用.参考公式:==,=-.15.(多选题)已知x与y之间的四对数据如下表:x 2 3 4 5y 1.5 m n 3.5上表数据中y的平均值为2.5.若某同学对m赋了两个值,分别为2,2.5,得到两条回归直线的方程分别为y=x+,y=x+,对应的样本相关系数分别为r1,r2,则下列结论正确的是 ( )A.两条回归直线的交点坐标为(3.5,2.5)B.>C.>D.r1>r216.某乡政府为提高当地农民收入,指导农民种植药材,并在种植药材的土地附近种草放牧,发展畜牧业.牛粪、羊粪等有机肥可以促进药材的生长,发展生态循环农业.如图所示为某农户近7年种植药材的年收入Y(单位:千元)与年份代码X的折线图,并计算得到yi=480,xiyi=2052,≈25,(xi-)(yi-)=132,wi=140,(wi-)(yi-)=1048,≈43.3,其中wi=.(1)从相关系数的角度分析,y=a+bx与y=c+dx2哪一个更适宜作为年收入Y关于年份代码X的回归方程类型,并说明理由;(2)根据(1)的判断结果及数据,建立Y关于X的回归方程(系数精确到0.01),并预测2024年该农户种植药材的收入.附:相关系数r=,回归直线的斜率和截距的最小二乘估计分别为=,=-,≈2.65. 展开更多...... 收起↑ 资源列表 2 成对数据的线性相关性 【正文】导学案.docx 2 成对数据的线性相关性 【答案】导学案.docx 2 成对数据的线性相关性 【答案】练习册.docx 2 成对数据的线性相关性.pptx 2 成对数据的线性相关性【正文】练习册.docx