资源简介 课时分层作业(四十七)1.D [分别将x的值代入解析式判断知满足y=2+ln x.]2.C [因为相关系数r=0.824 5很接近1,所以花瓣长度和花萼长度的相关性较强,并且呈正相关,所以选项A,B错误,选项C正确:因为相关系数与样本的数据有关,所以当样本发生变化时,相关系数也会发生变化,所以选项D错误.故选C.]3.D [|r|越接近于1,偏差越小,相关程度越大,|r|越接近于0,偏差越大,相关程度越小,故选D.]4.C [由题图①可知,各点整体呈递减趋势,X与Y负相关,由题图②可知,各点整体呈递增趋势,U与V正相关.]5.C [当=0时,有(xi-)(yi-)=0,故相关关系r=0.]6.r1>r2 [由第1组数据可知,两变量间成正相关,故r1>0,由第2组数据可知,两变量间成负相关,故r2<0,故r1>0>r2.]7.乙 [成对样本数据的样本相关系数的绝对值越接近于1,相关程度越强.]8.解:(1)r=≈0.980 4,因为r≈0.980 4非常接近于1,所以Y与X之间具有较强的线性相关关系.(2)设线性回归方程为Y=X+=≈35.97,所以线性回归方程为Y=0.464 6X+35.97.(3)X=73时,Y≈69.9,所以父亲身高为73英寸时,儿子的身高约为69.9英寸.9.A [由于回归直线Y=X+恒过()点,又两人对变量X的观测数据的平均值为s,对变量Y的观测数据的平均值为t,所以l1和l2恒过点(s,t).]10.ABD [由线性相关系数的定义知,只有C不正确.]11.13 正 [中位数是13.由相关性知识,根据统计资料可以看出,当年平均收入增多时,年平均支出也增多,因此两者之间具有正相关关系.]12. [令t=x2,则曲线的回归方程变为线性的回归方程,即y=bt-,此时,代入y=bt-,得,解得b=.]21世纪教育网(www.21cnjy.com)课时分层作业(四十七) 成对数据的线性相关性说明:单项选择题每题5分,多项选择题每题6分,填空题每题5分,本试卷共69分一、选择题1.下列数据x,y符合哪一种函数模型( )x 1 2 3 4 5 6 7 8 9 10y 2 2.69 3 3.38 3.6 3.8 4 4.08 4.2 4.3A.y=2+x B.y=2exC.y=2 D.y=2+ln x2.调查某种群花萼长度和花瓣长度,所得数据如图所示.其中相关系数r=0.824 5,下列说法正确的是( )A.花瓣长度和花萼长度没有相关性B.花瓣长度和花萼长度呈负相关C.花瓣长度和花萼长度呈正相关D.若从样本中抽取一部分,则这部分的相关系数一定是0.824 53.对相关系数r,下列说法正确的是( )A.r越大,相关程度越大B.r越小,相关程度越大C.|r|越大,相关程度越小,|r|越小,相关程度越大D.|r|≤1且|r|越接近于1,相关程度越大,|r|越接近0,相关程度越小4.对变量X,Y有观测数据(xi,yi)(i=1,2,…,10),得散点图①;对变量U,V有观测数据(ui,vi)(i=1,2,…,10),得散点图②.由这两个散点图可以判断( )① ②A.变量X与Y正相关,U与V正相关B.变量X与Y正相关,U与V负相关C.变量X与Y负相关,U与V正相关D.变量X与Y负相关,U与V负相关5.若线性回归方程中的回归系数=0,则相关系数为( )A.r=1 B.r=-1C.r=0 D.无法确定二、填空题6.已知第一组样本点为(-5,-8.9),(-4,-7.2),(-3,-4.8),(-2,-3.3),(-1,-0.9),其变量间的相关系数为r1;第二组样本点为(1,8.9),(2,7.2),(3,4.8),(4,3.3),(5,0.9)其变量间的相关系数为r2,则r1,r2的大小关系为________.7.现求得甲、乙、丙3组不同的成对样本数据的样本相关系数分别为0.81,-0.98,0.63,其中________组成对样本数据的线性相关程度最强(填甲、乙、丙中的一个).三、解答题8.测得10对父子身高(单位:英寸)如下:父亲 身高 (X) 60 62 64 65 66 67 68 70 72 74儿子 身高 (Y) 63.6 65.2 66 65.5 66.9 67.1 67.4 68.3 70.1 70(1)对变量Y与X进行相关性检验;(2)如果Y与X之间具有相关关系,求线性回归方程;(3)如果父亲身高为73英寸,试估计儿子的身高.参考数据:=66.8=67.01=44 794=4 494 1.93=4 462.24=4 490.34xiyi=44 842.4,9.已知两个变量X和Y之间具有线性相关性,甲、乙两个同学各自独立地做了10次和15次试验,并且利用线性回归的方法求得回归直线分别为l1和l2,已知两个人在试验中发现对变量X的观测数据的平均数都为s,对变量Y的观测数据的平均数都是t,则下列说法正确的是( )A.l1与l2一定有公共点(s,t)B.l1与l2相交,但交点一定不是(s,t)C.l1与l2必定平行D.l1与l2必定重合10.(多选题)下列说法中正确的是( )A.线性相关系数r∈[-1,1]B.在线性回归分析中,偏差越小,线性相关系数的绝对值越大C.相关系数r越小,说明变量之间的线性相关程度越小D.在散点图中,若n个点在一条直线上,|r|=111.某市居民2019~2023年家庭年平均收入X(单位:万元)与年平均支出Y(单位:万元)的统计资料如下表所示:年份 2019 2020 2021 2022 2023收入X 11.5 12.1 13 13.3 15支出Y 6.8 8.8 9.8 10 12根据统计资料,居民家庭年平均收入的中位数是________,家庭年平均收入与年平均支出有______相关关系(填“正”或“负”).12.在一组样本数据(x1,y1),(x2,y2),…,(x6,y6)的散点图中,若所有样本点(xi,yi)(i=1,2,…,6)都在曲线y=bx2-附近波动.经计算xi=12yi=14=23,则实数b的值为________.21世纪教育网(www.21cnjy.com)§2 成对数据的线性相关性2.1 相关系数2.2 成对数据的线性相关性分析学习任务 核心素养1.了解两个随机变量间的线性相关系数r,并能利用公式求出相关系数r.(重点) 2.了解正相关、负相关、不相关的概念. 3.能利用相关系数r判断两个随机变量间线性相关程度,从而判断回归直线拟合的效果.(重点) 1.通过对相关系数、正相关、负相关等概念的学习,培养数学抽象素养. 2.借助相关系数r的应用,提升数学建模与数据分析素养.利用散点图可以从形上判断两个变量是否线性相关,如何从数上判断呢?1.相关系数r的计算一般地,设随机变量X,Y的n组观测值分别为(x1,y1),(x2,y2),…,(xn,yn),则变量间线性相关系数r==2.相关系数r与线性相关程度的关系(1)r的取值范围为__________;(2)|r|值越接近1,随机变量之间的线性相关程度越__;(3)|r|值越接近0,随机变量之间的线性相关程度越__.3.相关性的分类(1)当____时,两个随机变量正相关;(2)当____时,两个随机变量负相关;(3)当____时,两个随机变量线性不相关.假设两个随机变量的相关系数r=0,这是否说明这两个随机变量不相关?_________________________________________________________________________________________________________________________________________________________________________________________________________1.思考辨析(正确的画“√”,错误的画“×”)(1)两个变量的相关系数r>0,则两个变量正相关. ( )(2)两个变量的相关系数越大,它们的相关程度越强. ( )(3)若两个变量负相关,那么其回归直线的斜率为负. ( )2.下列四个散点图中,变量X与Y之间具有线性负相关关系的是( )A BC D3.部门所属的10个工业企业生产性固定资产价值与工业增加值资料如下表(单位:百万元):固定资产价值 3 3 5 6 6 7 8 9 9 10工业增加值 15 17 25 28 30 36 37 42 40 45根据上表计算的相关系数为________.类型1 正、负相关的判断【例1】 对四组数据进行统计,获得如图所示的散点图,关于其相关系数的比较,正确的是( )(1) (2)(3) (4)A.r2C.r4[尝试解答] _________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________ 判断正、负相关的方法(1)利用散点图来判断;(2)利用线性回归系数的正负来判断;(3)利用线性相关系数r的正负来判断.[跟进训练]1.在一次对人体脂肪含量和年龄的关系的研究中,研究人员获得了一组样本数据,并制成如图所示的人体脂肪含量与年龄的关系的散点图,下列结论中正确的是( )A.人体脂肪含量与年龄正相关,且脂肪含量的中位数等于20%B.人体脂肪含量与年龄正相关,且脂肪含量的中位数小于20%C.人体脂肪含量与年龄负相关,且脂肪含量的中位数等于20%D.人体脂肪含量与年龄负相关,且脂肪含量的中位数小于20%类型2 线性相关系数及应用【例2】 维尼纶纤维的耐热水性能的好坏可以用指标“缩醛化度”Y来衡量,这个指标越高,耐热水性能就越好,而甲醛浓度是影响“缩醛化度”的重要因素,在生产中常用甲醛浓度X(克/升)去控制这一指标,为此必须找出它们之间的关系,现安排一批试验,获得如下表数据.甲醛浓度/(克/升) 18 20 22 24 26 28 30缩醛化度/克分子% 26.86 28.35 28.75 28.87 29.75 30.00 30.36求相关系数r.[思路点拨] 利用相关系数r的公式计算.[尝试解答] _________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________ 当相关系数|r|越接近1时,两个变量的线性相关程度越高,当相关系数|r|越接近0时,两个变量的线性相关程度越低.[跟进训练]2.下列是水稻产量与施化肥量的一组观测数据:施化肥量 15 20 25 30 35 40 45水稻产量 320 330 360 410 460 470 480判断施化肥量与水稻产量是否有相关关系._________________________________________________________________________________________________________________________________________________________________________________________________________类型3 非线性回归方程及应用【例3】 某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x(单位:千元)对年销售量y(单位:t)和年利润z(单位:千元)的影响,对近8年的年宣传费xi和年销售量yi(i=1,2,…,8)数据做了初步处理,得到下面的散点图及一些统计量的值.(xi-)2 (ωi-)2 (xi-) ·(yi-) (ωi-) ·(yi-)46.6 563 6.8 289.8 1.6 1 469 108.8表中ωi=ωi.(1)根据散点图判断,Y=a+bX与Y=c+d哪一个适宜作为年销售量Y关于年宣传费X的回归方程类型(给出判断即可,不必说明理由) (2)根据(1)的判断结果及表中数据,建立Y关于X的回归方程;(3)已知这种产品的年利润z与X,Y的关系为z=0.2Y-X.根据(2)的结果回答下列问题:①年宣传费X=49时,年销售量及年利润的预报值是多少?②年宣传费X为何值时,年利润的预报值最大?附:对于一组数据(u1,v1),(u2,v2),…,(un,vn),其回归直线v=+u的斜率和截距的最小二乘估计分别为:=,=-.[尝试解答] _________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________ 1.对于非线性回归分析问题,应先进行变量代换,求出代换后的线性回归方程,再求非线性回归方程.2.线性回归方程的拟合效果,可以利用相关系数判断,当|r|越趋近于1时,两变量的线性相关性越强.[跟进训练]3.为了研究某种细菌随时间x变化,繁殖的个数y的变化,收集数据如表所示:天数x/天 1 2 3 4 5 6繁殖个数y/个 6 12 25 49 95 190(1)用天数作解释变量,繁殖个数作响应变量,作出这些数据的散点图,根据散点图判断:=+x与y=c1ec2x哪一个作为繁殖的个数y关于时间x变化的回归方程类型为最佳?(给出判断即可,不必说明理由)(2)根据(1)的判断最佳结果及表中的数据,建立y关于x的回归方程.(xi-)2 (xi-)·(yi-) (xi-)·(zi-)3.5 62.83 3.53 17.5 596.505 12.04其中zi=ln yizi.参考公式:=,=-b._________________________________________________________________________________________________________________________________________________________________________________________________________(对应学生用书第218页)1.在对两个变量X,Y进行线性回归分析时,有下列步骤:①对所求出的线性回归方程作出解释;②收集数据(xi,yi),i=1,2,…,n;③求线性回归方程;④求相关系数;⑤根据所搜集的数据绘制散点图.如果根据可行性要求能够作出变量X,Y具有线性相关的结论,则在下列操作顺序中正确的是( )A.①②⑤③④ B.③②④⑤①C.②④③①⑤ D.②⑤④③①2.在一组样本数据(x1,y1),(x2,y2),…,(xn,yn)(n≥2,x1,x2,…,xn不全相等)的散点图中,若所有样本点(xi,yi)(i=1,2,…,n)都在直线y=-x+1上,则这组样本数据的样本相关系数为( )A.-1 B.0C.- D.13.已知变量X,Y之间的线性回归方程为Y=-0.7X+10.3,且变量X,Y之间的一组相关数据如下表所示,则下列说法错误的是( )X 6 8 10 12Y 6 m 3 2A.变量X,Y之间呈负相关关系B.可以预测,当X=20时,Y=-3.7C.m=4D.该回归直线必过点(9,4)4.某地区近10年居民的年收入X与年支出Y之间的关系大致符合Y=0.8X+0.1(单位:亿元),预计今年该地区居民收入为15亿元,则今年支出估计是________亿元.5.某班的健康调查小组从所在学校共选取15名男同学,其年龄、身高和体重数据如表所示(本题中身高单位:cm,体重单位:kg).年龄 (身高,体重) 年龄 (身高,体重)15 (154,48), (161,65), (168,64) 18 (166,64), (168,72), (182,74)16 (158,50), (162,59), (175,80) 19 (160,51), (172,68), (178,90)17 (161,60), (167,62), (173,68)根据表中数据,设计了两种方案预测学生身高.方案①:建立平均体重与年龄的线性回归模型,表中各年龄的体重按三名同学的平均体重计算,数据整理如下表:i 1 2 3 4 5年龄ti 15 16 17 18 19平均体重si 59 63 63.3 70 69.7方案②:建立平均体重与平均身高的线性回归模型,将所有数据按身高重新分成6组:[153,158),[158,163),[163,168),[168,173),[173,178),[178,183],并将每组的平均身高依次折算为155,160,165,170,175,180,各组的体重按平均体重计算,数据整理如下表.i 1 2 3 4 5 6平均身高xi 155 160 165 170 175 180平均体重yi 48 57 63 68 74 82(1)用方案①预测20岁男同学的平均体重和用方案②预测身高168 cm的男同学的平均体重,你认为哪个更合理?请给出理由;(2)请根据方案②建立平均体重Y与平均身高X的线性回归方程Y=X+(数据精确到0.001).附:==xiyi=66 225,=168 775,==._________________________________________________________________________________________________________________________________________________________________________________________________________1.判断变量之间的线性相关关系,一般用散点图.在作图中,由于存在误差,有时很难判断这些点是否分布在一条直线的附近,从而就很难判断两个变量之间是否具有线性相关关系,此时就必须利用线性相关系数来判断.2.相关系数r可以定量地反映出变量间的相关程度,从量上给出了有无必要建立两变量间的线性回归方程.21世纪教育网(www.21cnjy.com)§2 成对数据的线性相关性2.1 相关系数2.2 成对数据的线性相关性分析学习任务 核心素养1.了解两个随机变量间的线性相关系数r,并能利用公式求出相关系数r.(重点) 2.了解正相关、负相关、不相关的概念. 3.能利用相关系数r判断两个随机变量间线性相关程度,从而判断回归直线拟合的效果.(重点) 1.通过对相关系数、正相关、负相关等概念的学习,培养数学抽象素养. 2.借助相关系数r的应用,提升数学建模与数据分析素养.利用散点图可以从形上判断两个变量是否线性相关,如何从数上判断呢?1.相关系数r的计算一般地,设随机变量X,Y的n组观测值分别为(x1,y1),(x2,y2),…,(xn,yn),则变量间线性相关系数r==2.相关系数r与线性相关程度的关系(1)r的取值范围为[-1,1];(2)|r|值越接近1,随机变量之间的线性相关程度越强;(3)|r|值越接近0,随机变量之间的线性相关程度越弱.3.相关性的分类(1)当r>0时,两个随机变量正相关;(2)当r<0时,两个随机变量负相关;(3)当r=0时,两个随机变量线性不相关.假设两个随机变量的相关系数r=0,这是否说明这两个随机变量不相关?[提示] 只能说明这两个随机变量不线性相关,而不能说明这两个随机变量不相关.1.思考辨析(正确的画“√”,错误的画“×”)(1)两个变量的相关系数r>0,则两个变量正相关. ( )(2)两个变量的相关系数越大,它们的相关程度越强. ( )(3)若两个变量负相关,那么其回归直线的斜率为负. ( )[答案] (1)√ (2)× (3)√2.下列四个散点图中,变量X与Y之间具有线性负相关关系的是( )A BC DD [观察散点图可知,只有D选项的散点图表示的是随机变量X与Y之间具有负的线性相关关系.故选D.]3.部门所属的10个工业企业生产性固定资产价值与工业增加值资料如下表(单位:百万元):固定资产价值 3 3 5 6 6 7 8 9 9 10工业增加值 15 17 25 28 30 36 37 42 40 45根据上表计算的相关系数为________.0.991 8 [∵==6.6.==31.5.∴r==0.991 8.]类型1 正、负相关的判断【例1】 对四组数据进行统计,获得如图所示的散点图,关于其相关系数的比较,正确的是( )(1) (2)(3) (4)A.r2C.r4A [由散点图知图(1)与图(3)是正相关,故r1>0,r3>0,图(2)与图(4)是负相关,故r2<0,r4<0,且图(1)与图(2)的样本点集中在一条直线附近,因此r2 判断正、负相关的方法(1)利用散点图来判断;(2)利用线性回归系数的正负来判断;(3)利用线性相关系数r的正负来判断.[跟进训练]1.在一次对人体脂肪含量和年龄的关系的研究中,研究人员获得了一组样本数据,并制成如图所示的人体脂肪含量与年龄的关系的散点图,下列结论中正确的是( )A.人体脂肪含量与年龄正相关,且脂肪含量的中位数等于20%B.人体脂肪含量与年龄正相关,且脂肪含量的中位数小于20%C.人体脂肪含量与年龄负相关,且脂肪含量的中位数等于20%D.人体脂肪含量与年龄负相关,且脂肪含量的中位数小于20%B [观察图形,可知人体脂肪含量与年龄正相关,且脂肪含量的中位数小于20%.]类型2 线性相关系数及应用【例2】 维尼纶纤维的耐热水性能的好坏可以用指标“缩醛化度”Y来衡量,这个指标越高,耐热水性能就越好,而甲醛浓度是影响“缩醛化度”的重要因素,在生产中常用甲醛浓度X(克/升)去控制这一指标,为此必须找出它们之间的关系,现安排一批试验,获得如下表数据.甲醛浓度/(克/升) 18 20 22 24 26 28 30缩醛化度/克分子% 26.86 28.35 28.75 28.87 29.75 30.00 30.36求相关系数r.[思路点拨] 利用相关系数r的公式计算.[解] 列表如下:i xi yi xiyi1 18 26.86 324 483.48 721.459 62 20 28.35 400 567 803.722 53 22 28.75 484 632.5 826.562 54 24 28.87 576 692.88 833.476 95 26 29.75 676 773.5 885.062 56 28 30.00 784 840 9007 30 30.36 900 910.80 921.729 6∑ 168 202.94 4 144 4 900.16 5 892.013 6=24≈28.99,r==≈0.94. 当相关系数|r|越接近1时,两个变量的线性相关程度越高,当相关系数|r|越接近0时,两个变量的线性相关程度越低.[跟进训练]2.下列是水稻产量与施化肥量的一组观测数据:施化肥量 15 20 25 30 35 40 45水稻产量 320 330 360 410 460 470 480判断施化肥量与水稻产量是否有相关关系.[解] 列表如下:i xi yi xiyi1 15 320 225 102 400 4 8002 20 330 400 108 900 6 6003 25 360 625 129 600 9 0004 30 410 900 168 100 12 3005 35 460 1 225 211 600 16 1006 40 470 1 600 220 900 18 8007 45 480 2 025 230 400 21 600∑ 210 2 830 7 000 1 171 900 89 200=30≈404.286.∴r=≈0.975.由于r=0.975>0,因此施化肥量和水稻产量成线性正相关关系.类型3 非线性回归方程及应用【例3】 某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x(单位:千元)对年销售量y(单位:t)和年利润z(单位:千元)的影响,对近8年的年宣传费xi和年销售量yi(i=1,2,…,8)数据做了初步处理,得到下面的散点图及一些统计量的值.(xi-)2 (ωi-)2 (xi-) ·(yi-) (ωi-) ·(yi-)46.6 563 6.8 289.8 1.6 1 469 108.8表中ωi=ωi.(1)根据散点图判断,Y=a+bX与Y=c+d哪一个适宜作为年销售量Y关于年宣传费X的回归方程类型(给出判断即可,不必说明理由) (2)根据(1)的判断结果及表中数据,建立Y关于X的回归方程;(3)已知这种产品的年利润z与X,Y的关系为z=0.2Y-X.根据(2)的结果回答下列问题:①年宣传费X=49时,年销售量及年利润的预报值是多少?②年宣传费X为何值时,年利润的预报值最大?附:对于一组数据(u1,v1),(u2,v2),…,(un,vn),其回归直线v=+u的斜率和截距的最小二乘估计分别为:=,=-.[解] (1)由散点图可以判断,Y=c+d适宜作为年销售量Y关于年宣传费X的回归方程类型.(2)令ω=,先建立Y关于ω的线性回归方程,由于===68,==563-68×6.8=100.6,所以Y关于ω的线性回归方程为Y=100.6+68ω,因此Y关于X的回归方程为Y=100.6+68.(3)①由(2)知,当X=49时,年销售量Y的预报值Y=100.6+68=576.6,年利润z的预报值z=576.6×0.2-49=66.32.②根据(2)的结果知,年利润z的预报值z=0.2(100.6+68)-X=-X+13.6+20.12.所以当==6.8,即X=46.24时,z取得最大值.故年宣传费为46.24千元时,年利润的预报值最大. 1.对于非线性回归分析问题,应先进行变量代换,求出代换后的线性回归方程,再求非线性回归方程.2.线性回归方程的拟合效果,可以利用相关系数判断,当|r|越趋近于1时,两变量的线性相关性越强.[跟进训练]3.为了研究某种细菌随时间x变化,繁殖的个数y的变化,收集数据如表所示:天数x/天 1 2 3 4 5 6繁殖个数y/个 6 12 25 49 95 190(1)用天数作解释变量,繁殖个数作响应变量,作出这些数据的散点图,根据散点图判断:=+x与y=c1ec2x哪一个作为繁殖的个数y关于时间x变化的回归方程类型为最佳?(给出判断即可,不必说明理由)(2)根据(1)的判断最佳结果及表中的数据,建立y关于x的回归方程.(xi-)2 (xi-)·(yi-) (xi-)·(zi-)3.5 62.83 3.53 17.5 596.505 12.04其中zi=ln yizi.参考公式:=,=-b.[解] (1)作出散点图,如图所示.由散点图看出样本点分布在指数函数y=c1的周围,于是选择y=c1.(2)令z=ln y,则=c2x+ln c1=x+.由==0.688,==1.122,得=0.688x+1.122,则有=e0.688x+1.122.1.在对两个变量X,Y进行线性回归分析时,有下列步骤:①对所求出的线性回归方程作出解释;②收集数据(xi,yi),i=1,2,…,n;③求线性回归方程;④求相关系数;⑤根据所搜集的数据绘制散点图.如果根据可行性要求能够作出变量X,Y具有线性相关的结论,则在下列操作顺序中正确的是( )A.①②⑤③④ B.③②④⑤①C.②④③①⑤ D.②⑤④③①D [对两个变量进行回归分析时,首先收集数据(xi,yi),i=1,2,…,n;根据所搜集的数据绘制散点图.观察散点图的形状,判断线性相关关系的强弱,求相关系数,写出线性回归方程,最后依据所求出的线性回归方程作出解释;故正确顺序是②⑤④③①.]2.在一组样本数据(x1,y1),(x2,y2),…,(xn,yn)(n≥2,x1,x2,…,xn不全相等)的散点图中,若所有样本点(xi,yi)(i=1,2,…,n)都在直线y=-x+1上,则这组样本数据的样本相关系数为( )A.-1 B.0C.- D.1A [完全的线性关系,且为负相关,故其相关系数为-1,故选A.]3.已知变量X,Y之间的线性回归方程为Y=-0.7X+10.3,且变量X,Y之间的一组相关数据如下表所示,则下列说法错误的是( )X 6 8 10 12Y 6 m 3 2A.变量X,Y之间呈负相关关系B.可以预测,当X=20时,Y=-3.7C.m=4D.该回归直线必过点(9,4)C [由-0.7<0,得变量X,Y之间呈负相关关系,故A正确;当X=20时,Y=-0.7×20+10.3=-3.7,故B正确;由表格数据可知=×(6+8+10+12)=9,=(6+m+3+2)=,则=-0.7×9+10.3,解得m=5,故C错误;由m=5,得==4,所以该回归直线必过点(9,4),故D正确.故选C.]4.某地区近10年居民的年收入X与年支出Y之间的关系大致符合Y=0.8X+0.1(单位:亿元),预计今年该地区居民收入为15亿元,则今年支出估计是________亿元.12.1 [将X=15代入Y=0.8X+0.1,得Y=12.1.]5.某班的健康调查小组从所在学校共选取15名男同学,其年龄、身高和体重数据如表所示(本题中身高单位:cm,体重单位:kg).年龄 (身高,体重) 年龄 (身高,体重)15 (154,48), (161,65), (168,64) 18 (166,64), (168,72), (182,74)16 (158,50), (162,59), (175,80) 19 (160,51), (172,68), (178,90)17 (161,60), (167,62), (173,68)根据表中数据,设计了两种方案预测学生身高.方案①:建立平均体重与年龄的线性回归模型,表中各年龄的体重按三名同学的平均体重计算,数据整理如下表:i 1 2 3 4 5年龄ti 15 16 17 18 19平均体重si 59 63 63.3 70 69.7方案②:建立平均体重与平均身高的线性回归模型,将所有数据按身高重新分成6组:[153,158),[158,163),[163,168),[168,173),[173,178),[178,183],并将每组的平均身高依次折算为155,160,165,170,175,180,各组的体重按平均体重计算,数据整理如下表.i 1 2 3 4 5 6平均身高xi 155 160 165 170 175 180平均体重yi 48 57 63 68 74 82(1)用方案①预测20岁男同学的平均体重和用方案②预测身高168 cm的男同学的平均体重,你认为哪个更合理?请给出理由;(2)请根据方案②建立平均体重Y与平均身高X的线性回归方程Y=X+(数据精确到0.001).附:==xiyi=66 225,=168 775,==.[解] (1)对比两种方案,用方案②预测身高168 cm的男同学的平均体重更合理.因为身高和体重的相关关系强于年龄与体重的相关关系.(2)==≈1.291,又因为()在回归直线上,所以==-1.291×≈-150.909.故平均体重Y与平均身高X的线性回归方程为Y=1.291X-150.909.1.判断变量之间的线性相关关系,一般用散点图.在作图中,由于存在误差,有时很难判断这些点是否分布在一条直线的附近,从而就很难判断两个变量之间是否具有线性相关关系,此时就必须利用线性相关系数来判断.2.相关系数r可以定量地反映出变量间的相关程度,从量上给出了有无必要建立两变量间的线性回归方程.课时分层作业(四十七) 成对数据的线性相关性一、选择题1.下列数据x,y符合哪一种函数模型( )x 1 2 3 4 5 6 7 8 9 10y 2 2.69 3 3.38 3.6 3.8 4 4.08 4.2 4.3A.y=2+x B.y=2exC.y=2 D.y=2+ln xD [分别将x的值代入解析式判断知满足y=2+ln x.]2.调查某种群花萼长度和花瓣长度,所得数据如图所示.其中相关系数r=0.824 5,下列说法正确的是( )A.花瓣长度和花萼长度没有相关性B.花瓣长度和花萼长度呈负相关C.花瓣长度和花萼长度呈正相关D.若从样本中抽取一部分,则这部分的相关系数一定是0.824 5C [因为相关系数r=0.824 5很接近1,所以花瓣长度和花萼长度的相关性较强,并且呈正相关,所以选项A,B错误,选项C正确;因为相关系数与样本的数据有关,所以当样本发生变化时,相关系数也会发生变化,所以选项D错误.故选C.]3.对相关系数r,下列说法正确的是( )A.r越大,相关程度越大B.r越小,相关程度越大C.|r|越大,相关程度越小,|r|越小,相关程度越大D.|r|≤1且|r|越接近于1,相关程度越大,|r|越接近0,相关程度越小D [|r|越接近于1,偏差越小,相关程度越大,|r|越接近于0,偏差越大,相关程度越小,故选D.]4.对变量X,Y有观测数据(xi,yi)(i=1,2,…,10),得散点图①;对变量U,V有观测数据(ui,vi)(i=1,2,…,10),得散点图②.由这两个散点图可以判断( )① ②A.变量X与Y正相关,U与V正相关B.变量X与Y正相关,U与V负相关C.变量X与Y负相关,U与V正相关D.变量X与Y负相关,U与V负相关C [由题图①可知,各点整体呈递减趋势,X与Y负相关,由题图②可知,各点整体呈递增趋势,U与V正相关.]5.若线性回归方程中的回归系数=0,则相关系数为( )A.r=1 B.r=-1C.r=0 D.无法确定C [当=0时,有(xi-)(yi-)=0,故相关关系r=0.]二、填空题6.已知第一组样本点为(-5,-8.9),(-4,-7.2),(-3,-4.8),(-2,-3.3),(-1,-0.9),其变量间的相关系数为r1;第二组样本点为(1,8.9),(2,7.2),(3,4.8),(4,3.3),(5,0.9)其变量间的相关系数为r2,则r1,r2的大小关系为________.r1>r2 [由第1组数据可知,两变量间成正相关,故r1>0,由第2组数据可知,两变量间成负相关,故r2<0,故r1>0>r2.]7.现求得甲、乙、丙3组不同的成对样本数据的样本相关系数分别为0.81,-0.98,0.63,其中________组成对样本数据的线性相关程度最强(填甲、乙、丙中的一个).乙 [成对样本数据的样本相关系数的绝对值越接近于1,相关程度越强.]三、解答题8.测得10对父子身高(单位:英寸)如下:父亲 身高 (X) 60 62 64 65 66 67 68 70 72 74儿子 身高 (Y) 63.6 65.2 66 65.5 66.9 67.1 67.4 68.3 70.1 70(1)对变量Y与X进行相关性检验;(2)如果Y与X之间具有相关关系,求线性回归方程;(3)如果父亲身高为73英寸,试估计儿子的身高.参考数据:=66.8=67.01=44 794=4 494 1.93=4 462.24=4 490.34xiyi=44 842.4,[解] (1)r=≈0.980 4,因为r≈0.980 4非常接近于1,所以Y与X之间具有较强的线性相关关系.(2)设线性回归方程为Y=X+,=≈35.97,所以线性回归方程为Y=0.464 6X+35.97.(3)X=73时,Y≈69.9,所以父亲身高为73英寸时,儿子的身高约为69.9英寸.9.已知两个变量X和Y之间具有线性相关性,甲、乙两个同学各自独立地做了10次和15次试验,并且利用线性回归的方法求得回归直线分别为l1和l2,已知两个人在试验中发现对变量X的观测数据的平均数都为s,对变量Y的观测数据的平均数都是t,则下列说法正确的是( )A.l1与l2一定有公共点(s,t)B.l1与l2相交,但交点一定不是(s,t)C.l1与l2必定平行D.l1与l2必定重合A [由于回归直线Y=X+恒过()点,又两人对变量X的观测数据的平均值为s,对变量Y的观测数据的平均值为t,所以l1和l2恒过点(s,t).]10.(多选题)下列说法中正确的是( )A.线性相关系数r∈[-1,1]B.在线性回归分析中,偏差越小,线性相关系数的绝对值越大C.相关系数r越小,说明变量之间的线性相关程度越小D.在散点图中,若n个点在一条直线上,|r|=1ABD [由线性相关系数的定义知,只有C不正确.]11.某市居民2019~2023年家庭年平均收入X(单位:万元)与年平均支出Y(单位:万元)的统计资料如下表所示:年份 2019 2020 2021 2022 2023收入X 11.5 12.1 13 13.3 15支出Y 6.8 8.8 9.8 10 12根据统计资料,居民家庭年平均收入的中位数是________,家庭年平均收入与年平均支出有______相关关系(填“正”或“负”).13 正 [中位数是13.由相关性知识,根据统计资料可以看出,当年平均收入增多时,年平均支出也增多,因此两者之间具有正相关关系.]12.在一组样本数据(x1,y1),(x2,y2),…,(x6,y6)的散点图中,若所有样本点(xi,yi)(i=1,2,…,6)都在曲线y=bx2-附近波动.经计算xi=12yi=14=23,则实数b的值为________. [令t=x2,则曲线的回归方程变为线性的回归方程,即y=bt-,此时==,代入y=bt-,得=b×,解得b=.]21世纪教育网(www.21cnjy.com)(共65张PPT)第七章 统计案例§2 成对数据的线性相关性2.1 相关系数2.2 成对数据的线性相关性分析学习任务 核心素养1.了解两个随机变量间的线性相关系数r,并能利用公式求出相关系数r.(重点)2.了解正相关、负相关、不相关的概念.3.能利用相关系数r判断两个随机变量间线性相关程度,从而判断回归直线拟合的效果.(重点) 1.通过对相关系数、正相关、负相关等概念的学习,培养数学抽象素养.2.借助相关系数r的应用,提升数学建模与数据分析素养.利用散点图可以从形上判断两个变量是否线性相关,如何从数上判断呢?必备知识·情境导学探新知2.相关系数r与线性相关程度的关系(1)r的取值范围为__________;(2)|r|值越接近1,随机变量之间的线性相关程度越___;(3)|r|值越接近0,随机变量之间的线性相关程度越___.3.相关性的分类(1)当_____时,两个随机变量正相关;(2)当_____时,两个随机变量负相关;(3)当_____时,两个随机变量线性不相关.[-1,1]强弱r>0r<0r=0思考 假设两个随机变量的相关系数r=0,这是否说明这两个随机变量不相关?[提示] 只能说明这两个随机变量不线性相关,而不能说明这两个随机变量不相关.√1.思考辨析(正确的画“√”,错误的画“×”)(1)两个变量的相关系数r>0,则两个变量正相关. ( )(2)两个变量的相关系数越大,它们的相关程度越强. ( )(3)若两个变量负相关,那么其回归直线的斜率为负. ( )×√2.下列四个散点图中,变量X与Y之间具有线性负相关关系的是( )√D [观察散点图可知,只有D选项的散点图表示的是随机变量X与Y之间具有负的线性相关关系.故选D.]A BC D3.部门所属的10个工业企业生产性固定资产价值与工业增加值资料如下表(单位:百万元):根据上表计算的相关系数为________.固定资产价值 3 3 5 6 6 7 8 9 9 10工业增加值 15 17 25 28 30 36 37 42 40 450.991 8 关键能力·合作探究释疑难类型1 正、负相关的判断【例1】 对四组数据进行统计,获得如图所示的散点图,关于其相关系数的比较,正确的是( )(1) (2)A.r2C.r4√(3) (4)A [由散点图知图(1)与图(3)是正相关,故r1>0,r3>0,图(2)与图(4)是负相关,故r2<0,r4<0,且图(1)与图(2)的样本点集中在一条直线附近,因此r2[跟进训练]1.在一次对人体脂肪含量和年龄的关系的研究中,研究人员获得了一组样本数据,并制成如图所示的人体脂肪含量与年龄的关系的散点图,下列结论中正确的是( )A.人体脂肪含量与年龄正相关,且脂肪含量的中位数等于20%B.人体脂肪含量与年龄正相关,且脂肪含量的中位数小于20%C.人体脂肪含量与年龄负相关,且脂肪含量的中位数等于20%D.人体脂肪含量与年龄负相关,且脂肪含量的中位数小于20%√B [观察图形,可知人体脂肪含量与年龄正相关,且脂肪含量的中位数小于20%.]类型2 线性相关系数及应用【例2】 维尼纶纤维的耐热水性能的好坏可以用指标“缩醛化度”Y来衡量,这个指标越高,耐热水性能就越好,而甲醛浓度是影响“缩醛化度”的重要因素,在生产中常用甲醛浓度X(克/升)去控制这一指标,为此必须找出它们之间的关系,现安排一批试验,获得如下表数据.甲醛浓度/(克/升) 18 20 22 24 26 28 30缩醛化度/克分子% 26.86 28.35 28.75 28.87 29.75 30.00 30.36求相关系数r.[思路点拨] 利用相关系数r的公式计算.[解] 列表如下:i xi yi xi yi1 18 26.86 324 483.48 721.459 62 20 28.35 400 567 803.722 53 22 28.75 484 632.5 826.562 54 24 28.87 576 692.88 833.476 95 26 29.75 676 773.5 885.062 56 28 30.00 784 840 900i xi yi xi yi7 30 30.36 900 910.80 921.729 6∑ 168 202.94 4 144 4 900.16 5 892.013 6反思领悟 当相关系数|r|越接近1时,两个变量的线性相关程度越高,当相关系数|r|越接近0时,两个变量的线性相关程度越低.[跟进训练]2.下列是水稻产量与施化肥量的一组观测数据:判断施化肥量与水稻产量是否有相关关系.施化肥量 15 20 25 30 35 40 45水稻产量 320 330 360 410 460 470 480[解] 列表如下:i xi yi xi yi1 15 320 225 102 400 4 8002 20 330 400 108 900 6 6003 25 360 625 129 600 9 0004 30 410 900 168 100 12 3005 35 460 1 225 211 600 16 1006 40 470 1 600 220 900 18 800i xi yi xi yi7 45 480 2 025 230 400 21 600∑ 210 2 830 7 000 1 171 900 89 200类型3 非线性回归方程及应用【例3】 某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x(单位:千元)对年销售量y(单位:t)和年利润z(单位:千元)的影响,对近8年的年宣传费xi和年销售量yi(i=1,2,…,8)数据做了初步处理,得到下面的散点图及一些统计量的值.46.6 563 6.8 289.8 1.6 1 469 108.8反思领悟 1.对于非线性回归分析问题,应先进行变量代换,求出代换后的线性回归方程,再求非线性回归方程.2.线性回归方程的拟合效果,可以利用相关系数判断,当|r|越趋近于1时,两变量的线性相关性越强.[跟进训练]3.为了研究某种细菌随时间x变化,繁殖的个数y的变化,收集数据如表所示:天数x/天 1 2 3 4 5 6繁殖个数y/个 6 12 25 49 95 1903.5 62.83 3.53 17.5 596.505 12.04学习效果·课堂评估夯基础√1.在对两个变量X,Y进行线性回归分析时,有下列步骤:①对所求出的线性回归方程作出解释;②收集数据(xi,yi),i=1,2,…,n;③求线性回归方程;④求相关系数;⑤根据所搜集的数据绘制散点图.如果根据可行性要求能够作出变量X,Y具有线性相关的结论,则在下列操作顺序中正确的是( )A.①②⑤③④ B.③②④⑤① C.②④③①⑤ D.②⑤④③①D [对两个变量进行回归分析时,首先收集数据(xi,yi),i=1,2,…,n;根据所搜集的数据绘制散点图.观察散点图的形状,判断线性相关关系的强弱,求相关系数,写出线性回归方程,最后依据所求出的线性回归方程作出解释;故正确顺序是②⑤④③①.]√A [完全的线性关系,且为负相关,故其相关系数为-1,故选A.]3.已知变量X,Y之间的线性回归方程为Y=-0.7X+10.3,且变量X,Y之间的一组相关数据如下表所示,则下列说法错误的是( )√A.变量X,Y之间呈负相关关系B.可以预测,当X=20时,Y=-3.7C.m=4D.该回归直线必过点(9,4)X 6 8 10 12Y 6 m 3 24.某地区近10年居民的年收入X与年支出Y之间的关系大致符合Y=0.8X+0.1(单位:亿元),预计今年该地区居民收入为15亿元,则今年支出估计是________亿元.12.1 [将X=15代入Y=0.8X+0.1,得Y=12.1.]12.1 5.某班的健康调查小组从所在学校共选取15名男同学,其年龄、身高和体重数据如表所示(本题中身高单位:cm,体重单位:kg).年龄 (身高,体重) 年龄 (身高,体重)15 (154,48),(161,65),(168,64) 18 (166,64),(168,72),(182,74)年龄 (身高,体重) 年龄 (身高,体重)16 (158,50),(162,59),(175,80) 19 (160,51),(172,68),(178,90)17 (161,60),(167,62),(173,68) 根据表中数据,设计了两种方案预测学生身高.方案①:建立平均体重与年龄的线性回归模型,表中各年龄的体重按三名同学的平均体重计算,数据整理如下表:i 1 2 3 4 5年龄ti 15 16 17 18 19平均体重si 59 63 63.3 70 69.7方案②:建立平均体重与平均身高的线性回归模型,将所有数据按身高重新分成6组:[153,158),[158,163),[163,168),[168,173),[173,178),[178,183],并将每组的平均身高依次折算为155,160,165,170,175,180,各组的体重按平均体重计算,数据整理如下表.i 1 2 3 4 5 6平均身高xi 155 160 165 170 175 180平均体重yi 48 57 63 68 74 821.判断变量之间的线性相关关系,一般用散点图.在作图中,由于存在误差,有时很难判断这些点是否分布在一条直线的附近,从而就很难判断两个变量之间是否具有线性相关关系,此时就必须利用线性相关系数来判断.2.相关系数r可以定量地反映出变量间的相关程度,从量上给出了有无必要建立两变量间的线性回归方程.章末综合测评(一) 动量守恒定律题号135246879101112课时分层作业(四十七) 成对数据的线性相关性一、选择题1.下列数据x,y符合哪一种函数模型( )x 1 2 3 4 5 6 7 8 9 10y 2 2.69 3 3.38 3.6 3.8 4 4.08 4.2 4.3题号135246879101112√D [分别将x的值代入解析式判断知满足y=2+ln x.]题号2134568791011122.调查某种群花萼长度和花瓣长度,所得数据如图所示.其中相关系数r=0.824 5,下列说法正确的是( )√A.花瓣长度和花萼长度没有相关性B.花瓣长度和花萼长度呈负相关C.花瓣长度和花萼长度呈正相关D.若从样本中抽取一部分,则这部分的相关系数一定是0.824 5题号213456879101112C [因为相关系数r=0.824 5很接近1,所以花瓣长度和花萼长度的相关性较强,并且呈正相关,所以选项A,B错误,选项C正确;因为相关系数与样本的数据有关,所以当样本发生变化时,相关系数也会发生变化,所以选项D错误.故选C.]题号2134568791011123.对相关系数r,下列说法正确的是( )A.r越大,相关程度越大B.r越小,相关程度越大C.|r|越大,相关程度越小,|r|越小,相关程度越大D.|r|≤1且|r|越接近于1,相关程度越大,|r|越接近0,相关程度越小√D [|r|越接近于1,偏差越小,相关程度越大,|r|越接近于0,偏差越大,相关程度越小,故选D.]题号2134568791011124.对变量X,Y有观测数据(xi,yi)(i=1,2,…,10),得散点图①;对变量U,V有观测数据(ui,vi)(i=1,2,…,10),得散点图②.由这两个散点图可以判断( )① ②题号213456879101112A.变量X与Y正相关,U与V正相关B.变量X与Y正相关,U与V负相关C.变量X与Y负相关,U与V正相关D.变量X与Y负相关,U与V负相关√C [由题图①可知,各点整体呈递减趋势,X与Y负相关,由题图②可知,各点整体呈递增趋势,U与V正相关.]题号213456879101112√题号213456879101112二、填空题6.已知第一组样本点为(-5,-8.9),(-4,-7.2),(-3,-4.8),(-2,-3.3),(-1,-0.9),其变量间的相关系数为r1;第二组样本点为(1,8.9),(2,7.2),(3,4.8),(4,3.3),(5,0.9)其变量间的相关系数为r2,则r1,r2的大小关系为________.r1>r2 [由第1组数据可知,两变量间成正相关,故r1>0,由第2组数据可知,两变量间成负相关,故r2<0,故r1>0>r2.]r1>r2 题号2134568791011127.现求得甲、乙、丙3组不同的成对样本数据的样本相关系数分别为0.81,-0.98,0.63,其中________组成对样本数据的线性相关程度最强(填甲、乙、丙中的一个).乙 [成对样本数据的样本相关系数的绝对值越接近于1,相关程度越强.]乙 题号213456879101112三、解答题8.测得10对父子身高(单位:英寸)如下:父亲身高(X) 60 62 64 65 66 67 68 70 72 74儿子身高(Y) 63.6 65.2 66 65.5 66.9 67.1 67.4 68.3 70.1 70题号213456879101112题号213456879101112题号2134568791011129.已知两个变量X和Y之间具有线性相关性,甲、乙两个同学各自独立地做了10次和15次试验,并且利用线性回归的方法求得回归直线分别为l1和l2,已知两个人在试验中发现对变量X的观测数据的平均数都为s,对变量Y的观测数据的平均数都是t,则下列说法正确的是( )A.l1与l2一定有公共点(s,t)B.l1与l2相交,但交点一定不是(s,t)C.l1与l2必定平行D.l1与l2必定重合√题号213456879101112题号213456879101112√10.(多选题)下列说法中正确的是( )A.线性相关系数r∈[-1,1]B.在线性回归分析中,偏差越小,线性相关系数的绝对值越大C.相关系数r越小,说明变量之间的线性相关程度越小D.在散点图中,若n个点在一条直线上,|r|=1ABD [由线性相关系数的定义知,只有C不正确.]√√题号21345687910111211.某市居民2019~2023年家庭年平均收入X(单位:万元)与年平均支出Y(单位:万元)的统计资料如下表所示:根据统计资料,居民家庭年平均收入的中位数是________,家庭年平均收入与年平均支出有______相关关系(填“正”或“负”).年份 2019 2020 2021 2022 2023收入X 11.5 12.1 13 13.3 15支出Y 6.8 8.8 9.8 10 1213 正 题号21345687910111213 正 [中位数是13.由相关性知识,根据统计资料可以看出,当年平均收入增多时,年平均支出也增多,因此两者之间具有正相关关系.]题号213456879101112 题号213456879101112 展开更多...... 收起↑ 资源列表 北师大版高中数学选择性必修第一册第七章统计案例2.1相关系数2.2成对数据的线性相关性分析学案(学生用).docx 北师大版高中数学选择性必修第一册第七章统计案例2.1相关系数2.2成对数据的线性相关性分析学案(教师用).docx 北师大版高中数学选择性必修第一册第七章统计案例2.1相关系数2.2成对数据的线性相关性分析课件.ppt 北师大版高中数学选择性必修第一册课时分层作业47成对数据的线性相关性(学生用).docx 课时分层作业47答案.docx