资源简介 8.1 成对数据的统计相关性课时2 样本相关系数【学习目标】 1.了解样本相关系数公式的推导过程.(逻辑推理、直观想象) 2.掌握样本相关系数公式,并会运用.(数学运算) 3.了解样本相关系数公式与向量夹角公式之间的关系,掌握样本相关系数的范围.(逻辑推理、数学运算)【自主预习】1.样本相关系数公式是什么 2.当r>0时,y与x具有什么样的相关关系 当r<0时,y与x具有什么样的相关关系 3.r越小,说明两个变量之间的线性相关性越弱,正确吗 4.当|r|=1时,成对样本数据构成的点具有什么特点 1.判断下列结论是否正确.(正确的打“√”,错误的打“×”)(1)样本相关系数r越大,两变量的相关性越强. ( )(2)样本相关系数r越小,两变量的相关性越弱. ( )(3)线性相关强弱的判断方法有散点图法和样本相关系数法. ( )2.样本相关系数r的取值范围是( ). A.(0,1) B.[0,1]C.(-1,1) D.[-1,1]3.两个变量x,y的样本相关系数r1=0.785 9,两个变量u,v的样本相关系数r2=-0.956 8,则下列判断正确的是( ).A.变量x与y正相关,变量u与v负相关,变量x与y的线性相关性较强B.变量x与y负相关,变量u与v正相关,变量x与y的线性相关性较强C.变量x与y正相关,变量u与v负相关,变量u与v的线性相关性较强D.变量x与y负相关,变量u与v正相关,变量u与v的线性相关性较强4.已知甲、乙、丙3组数据的线性相关系数分别为0.81,-0.98,0.63,其中 (填“甲”“乙”或“丙”)组数据的线性相关性最强. 【合作探究】 样本相关系数如图所示,回答下列问题:问题1:由上图可判断出图①中,x,y是负相关,图②中,u,v是正相关,那么能否判断出图②的相关性比图①强 问题2:怎样定量刻画两个变量的线性相关程度 样本相关系数(1)我们常用样本相关系数r来确切地反映成对样本数据(xi,yi)的相关程度,其中r=.(2)相关系数是研究变量之间线性相关程度的量.足球运动是世界上普及率最高的运动之一,某国大力发展校园足球.为了了解本地区足球特色学校的发展状况,社会调查小组得到如下统计数据:年份x 2018 2019 2020 2021 2022足球特色学校y/百个 0.30 0.60 1.00 1.40 1.70根据上表数据,计算y与x的样本相关系数r,并判断y与x是正相关关系还是负相关关系.参考公式和数据:r=,(xi-)2=10,(yi-)2=1.3,≈3.605 6.【方法总结】计算样本相关系数的一般步骤:(1)先计算平均数,;(2)再计算(xi-)(yi-),·;(3)最后代入样本相关系数公式计算,注意计算要准确.共享汽车是指许多人合用一辆车,即开车人对车辆只有使用权,而没有所有权,类似于在租车行业里的短时间的租车.它手续简便,打个租车电话或在网上就可以预约订车.某市为了了解不同年龄的人对共享汽车的使用体验,随机选取了100名使用共享汽车的体验者,让他们根据体验效果进行评分.设消费者的年龄为x,对共享汽车的体验评分为y.若根据统计数据,计算得(xi-)(yi-)=1 350,且年龄x的方差为=9,评分y的方差为=25,求y与x的样本相关系数r,并据此判断对共享汽车使用体验的评分与年龄的线性相关性强弱(当|r|≥0.75时,认为线性相关性强,否则认为线性相关性弱).附:样本相关系数r=. 相关系数的性质问题1:样本相关系数r的正负能反映出成对变量的什么关系 问题2:样本相关系数r的大小与成对样本数据的相关程度有什么内在联系 问题3:当|r|=1时,成对样本数据之间具有怎样的关系呢 相关系数r的性质(1)样本相关系数r的取值范围为[-1,1];(2)若r>0,成对样本数据正相关;(3)若r<0,成对样本数据负相关;(4)|r|越接近1,成对样本数据的线性相关程度越强;(5)|r|越接近0,成对样本数据的线性相关程度越弱.假设关于某种设备的使用年限x(单位:年)与所支出的维修费用y(单位:万元)有如下统计资料:x 2 3 4 5 6y 2.2 3.8 5.5 6.5 7.0参考数据及公式:=90,=140.78,xiyi=112.3,≈12.6.样本相关系数r=.(1)求,;(2)对x,y进行线性相关性检验.【方法总结】利用样本相关系数从数值上判断变量间的线性相关程度,这种方法是定量的方法.与散点图相比较,样本相关系数要精确得多,需要注意的是样本相关系数r的绝对值小,只是说明变量线性相关程度低,但不一定不相关,可能非线性相关.近年来,随着互联网的发展,各种网约车服务在我国各城市迅猛发展,为人们出行提供了便利,但也给城市交通管理带来了一些困难.为掌握网约车在某省的发展情况,该省某调查机构从本省抽取了5个城市,分别收集和分析了网约车的A,B两项指标数xi,yi(i=1,2,3,4,5),数据如下表所示:城市1 城市2 城市3 城市4 城市5A指标数x 2 4 5 6 8B指标数y 3 4 4 4 5经计算得=2,=,试求y与x之间的样本相关系数r,并利用r说明y与x是否具有较强的线性相关关系.附:样本相关系数公式r=.参考数据:≈0.55,≈0.95.【随堂检测】1.若变量y与x之间的样本相关系数r=-0.983 2,则变量y与x之间( ).A.不具有线性相关关系B.具有线性相关关系C.线性相关关系还需要进一步确定D.相关关系很弱2.给出下列命题:①样本相关系数r∈R;②当样本相关系数r>0时,两个变量正相关;③两个变量的相关性越强,样本相关系数r就越接近于1.其中真命题的个数为( ). A.0 B.1 C.2 D.33.相关变量x,y的散点图如图所示,现对这两个变量进行线性相关性分析.方案一:根据图中所有数据,得到相关系数r1;方案二:剔除点(10,21),根据剩下的数据得到相关系数r2.则( ).A.0C.-14.关于两个变量x和y的7组数据如表所示:x 21 23 25 27 29 32 35y 7 11 21 24 66 115 325求变量y与x的样本相关系数,并判断变量y与x之间是正相关还是负相关.参考答案课时2 样本相关系数自主预习·悟新知预学忆思1.r==.2.当r>0时,y与x具有正相关关系;当r<0时,y与x具有负相关关系.3.不正确,因为r接近-1时相关性也很强.4.成对样本数据构成的点都在一条直线上.自学检测1.(1)× (2)× (3)√2.D 【解析】因为样本相关系数r=cos θ,其中θ为两个n维向量的夹角,所以-1≤r≤1,故选D.3.C 【解析】由样本相关系数r1=0.785 9>0知x与y正相关,由样本相关系数r2=-0.956 8<0知u,v负相关.又|r1|<|r2|,∴变量u与v的线性相关性比x与y的线性相关性强.故选C.4.乙 【解析】两个变量的相关系数的绝对值越接近于1,它的线性相关性越强.-0.98是这三个相关系数中绝对值最大的,即乙组数据的线性相关性最强.合作探究·提素养探究1 情境设置问题1:不能.问题2:可以用样本相关系数公式计算.新知运用例1 【解析】由题意得=2 020,=1,所以r==≈≈0.998>0,故y与x是正相关关系.巩固训练 【解析】因为==9,所以=900.因为==25,所以=2 500.又因为(xi-)(yi-)=1 350,所以样本相关系数r===0.9.因为0.9>0.75,所以可以判断对共享汽车使用体验的评分与年龄的线性相关性很强.探究2 情境设置问题1:当r>0时,称成对样本数据正相关.这时,当其中一个数据的值变小时,另一个数据的值通常也变小;当其中一个数据的值变大时,另一个数据的值通常也变大.当r<0时,称成对样本数据负相关.这时,当其中一个数据的值变小时,另一个数据的值通常会变大;当其中一个数据的值变大时,另一个数据的值通常会变小.问题2:观察r的结构,联想到二维(平面)向量、三维(空间)向量数量积的坐标表示,我们将向量的维数推广到n维,n维向量a,b的数量积仍然定义为a·b=|a||b|cos θ,其中θ为向量a,b的夹角.类似于平面或空间向量的坐标表示,对于向量a=(a1,a2,…,an)和b=(b1,b2,…,bn),我们有a·b=a1b1+a2b2+…+anbn.设“标准化”处理后的成对数据(x'1,y'1),(x'2,y'2),…,(x'n,y'n)的第一分量构成n维向量x'=(x'1,x'2,…,x'n),第二分量构成n维向量y'=(y'1,y'2,…,y'n),则有r=x'·y'=|x'||y'|cos θ.因为|x'|=|y'|=,所以样本相关系数r=cos θ,其中θ为向量x'和向量y'的夹角.由-1≤cos θ≤1,可知-1≤r≤1.问题3:成对样本数据之间满足一种线性关系.新知运用例2 【解析】(1)依题意可得==4,==5.(2)又xiyi-5=112.3-5×4×5=12.3,-5=90-5×42=10,-5=140.78-5×52=15.78,所以r===≈≈0.976.所以可以认为x与y之间具有很强的正线性相关关系.巩固训练 【解析】==5,==4,(xi-)(yi-)=6,故r===≈0.95.因为r≈0.95,所以可以推断y与x正线性相关,且具有较强的线性相关关系.随堂检测·精评价1.B 【解析】∵变量y与x之间的样本相关系数r=-0.983 2,且|r|=0.983 2,接近于1,∴变量y与x之间有较强的线性相关关系.故选B.2.B 【解析】①r∈[-1,1],故①错误;②当样本相关系数r>0时,两个变量正相关,故②正确;③两个变量的相关性越强,样本相关系数r就越接近于1或-1,故③错误.故真命题的个数为1.3.D 【解析】由散点图得y与x负相关,所以r1<0,r2<0.因为剔除点(10,21)后,剩下的数据更具有线性相关性,所以|r2|更接近1,所以-14.【解析】=×(21+23+25+27+29+32+35)≈27.4,=×(7+11+21+24+66+115+325)≈81.3,=212+232+252+272+292+322+352=5 414,xiyi=21×7+23×11+25×21+27×24+29×66+32×115+35×325=18 542,=72+112+212+242+662+1152+3252=124 393,∴r=≈≈≈0.837 5.∵r>0,∴变量y与x之间是正相关.8.1 成对数据的统计相关性课时1 变量的相关关系【学习目标】 1.了解变量间的相关关系,会画散点图.(数学抽象) 2.会根据散点图判断数据是否具有相关关系.(直观想象)【自主预习】1.什么是相关关系 2.相关关系是函数关系吗 3.相关关系按变量间的增减性如何分类 4.按变量间是否有线性特征如何分类 5.如何根据散点图判断线性相关 1.判断下列结论是否正确.(正确的打“√”,错误的打“×”)(1)函数关系是一种确定关系,而相关关系是一种不确定关系. ( )(2)当一个变量的值增加时,另一个变量的相应值呈现减小的趋势,则称这两个变量正相关. ( )(3)根据散点图可以直观地分析出两个变量是否具有相关性.( )(4)若变量x,y满足函数关系,则这两个变量线性相关. ( )2.下列两个变量中,具有相关关系的是( ).A.正方体的体积与棱长B.匀速行驶的汽车的行驶路程与时间C.人的身高与体重D.人的体重与视力3.从散点图上看,点散布在从左下角到右上角的区域内,两个变量的这种相关关系称为 . 4.根据两个变量x,y之间的成对样本数据画出的散点图如图所示,这两个变量 线性相关关系.(填“有”或“没有”) 【合作探究】 变量的相关关系小明根据自己的调查,得到下列结论和数据:(1)吸烟可导致肺癌.(2)小区对面的小卖部6天卖出热茶的杯数与当天气温的对比表如下:气温/℃ 25 18 12 10 4 0杯数 18 30 37 35 50 54 (3)正方形的面积S=x2(x是边长).问题1:吸烟一定会导致肺癌吗 吸烟与患肺癌有关吗 问题2:小卖部卖出的热茶的杯数与当天气温有关吗 两者之间是如何变化的 问题3:正方形的面积S与边长x是什么关系 1.函数关系:如果变量y是变量x的函数,那么由x就可以唯一确定y.2.两个变量有关系,但又没有确切到可由其中的一个去精确地决定另一个的程度,这种关系称为相关关系.下列关系中,属于相关关系的是 .(填序号) ①角度和它的正弦值之间的关系;②做自由落体运动的物体的质量与落地时间的关系;③降雪量与交通事故的发生率之间的关系.【方法总结】在研究两个变量之间的相关关系时,我们需要借助数据说话,即通过样本数据分析,从数据中提取信息,并构建适当的模型,再利用模型进行估计或推断.下列关系中,属于相关关系的是 .(填序号) ①圆的半径与面积之间的关系;②农作物的产量与施肥量之间的关系;③乘坐出租车的车费与行驶的里程之间的关系. 散点图与正负相关、线性相关下表是在某地搜集到的房屋的销售价格y(单位:万元)和房屋的面积x(单位:m2)的数据:x/m2 115 110 80 135 105y/万元 44.8 41.6 38.4 49.2 42问题1:以x为横坐标,y为纵坐标在平面直角坐标系中作出表示以上数据的点.问题2:这些点是大致落在一条直线附近吗 问题3:房屋的销售价格与房屋的面积有关系吗 问题4:怎样描述房屋的销售价格与房屋的面积之间的变化关系 1.散点图是描述成对样本数据之间关系的一种直观方法.2.从整体上看,当一个变量的值增加时,另一个变量的相应值也呈现增加的趋势,我们就称这两个变量正相关;当一个变量的值增加时,另一个变量的相应值呈现减小的趋势,则称这两个变量负相关.3.一般地,如果两个变量的取值呈现正相关或负相关,而且散点落在一条直线附近,我们就称这两个变量线性相关.4.一般地,如果两个变量具有相关性,但不是线性相关,那么我们就称这两个变量非线性相关或曲线相关.某个男孩的年龄与身高的统计数据如下表所示:年龄x/岁 1 2 3 4 5 6身高y/cm 78 87 98 108 115 120(1)画出散点图;(2)判断y与x是否具有线性相关关系.【方法总结】通过散点图观察它们的分布是否存在一定的规律,可以直观地判断两个变量是否具有相关关系.5个学生的数学和物理成绩如下表:学生 A B C D E数学成绩 80 75 70 65 60物理成绩 70 66 68 64 62(1)画出散点图;(2)从散点图中判断数学成绩与物理成绩之间存在什么样的关系.【随堂检测】1.下列选项图中,两个变量具有相关关系的是( ).2.下列说法不正确的是( ).A.当变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系叫作相关关系B.在平面直角坐标系中,将成对的样本数据用点表示出来,由这些点组成的统计图叫作散点图C.若x,y具有相关性,则一定是线性相关D.具有相关关系的两变量可以是曲线相关3.在以下四幅散点图中,图 中的y和x之间存在相关关系.(将正确答案的序号填在横线上) 4.某种产品的广告支出费x(单位:百万元)与销售额y(单位:百万元)之间有如下对应数据:x 2 4 5 6 8y 30 40 60 50 70(1)画出散点图;(2)从散点图中判断销售额与广告支出费之间存在什么样的关系.参考答案8.1 成对数据的统计相关性课时1 变量的相关关系自主预习·悟新知预学忆思1.两个变量有关系,但又没有确切到可由其中的一个去精确地决定另一个的程度,这种关系称为相关关系.2.不是.函数关系是唯一确定的关系.3.按变量间的增减性分为正相关和负相关.4.按变量间是否有线性特征分为线性相关和非线性相关(曲线相关).5.如果这些散点大致落在一条直线附近,就说明变量间具有线性相关关系.自学检测1.(1)√ (2)× (3)√ (4)×2.C 【解析】A选项中,正方体的体积与棱长是函数关系,不是相关关系;B选项中,匀速行驶的汽车的行驶路程与时间是函数关系,不是相关关系;C选项中,人的身高是影响体重的因素,但不是唯一因素,所以人的身高与体重是相关关系;D选项中,人的体重与视力无任何关系.3.正相关4.没有 【解析】图中的点分布杂乱,两个变量不具有线性相关关系.合作探究·提素养探究1 情境设置问题1:吸烟不一定导致肺癌,但它们有一定的关系.问题2:两者之间有关系.一般来说,随着气温的降低,卖出的热茶杯数增加.问题3:S与x之间是函数关系,是一种确定关系.新知运用例1 ③ 【解析】①不是相关关系,角度和它的正弦值之间具有函数关系;②不是相关关系,做自由落体运动的物体的质量与落地时间无关,不具有相关关系;③是相关关系,一般来说,降雪量越大,交通事故的发生率越高,具有相关关系.巩固训练 ② 【解析】①中,圆的半径与面积之间的关系是函数关系;②中,农作物的产量与施肥量之间不具有严格的函数关系,但具有相关关系;③为确定的函数关系.探究2 情境设置问题1:如图所示.问题2:是.问题3:有关系.问题4:从大体上来看,面积越大,销售价格越高,但它们不是正比例函数关系.新知运用例2 【解析】(1)散点图如图所示.(2)由图可知,所有数据点接近一条直线排列,因此认为y与x具有线性相关关系.巩固训练 【解析】(1)散点图如图所示.(2)从图中可以发现数学成绩与物理成绩之间具有相关关系,并且当数学成绩由小变大时,物理成绩也大多由小变大,图中的数据大致分布在某条直线的附近,即数学成绩与物理成绩正线性相关.随堂检测·精评价1.B 【解析】A,C是函数关系,D中的点的分布毫无规律,看不出横轴、纵轴表示的两个变量之间有什么相关性.2.C 【解析】只有当点整体上分布在一条直线附近且x,y的取值呈现正相关或负相关时,x,y才能称之为线性相关.3.(2)(3)(4) 【解析】图(2)(3)中的点成带状分布在某一直线附近,图(4)中的点分布在某一曲线附近,故图(2)(3)(4)中的y和x之间存在相关关系.4.【解析】(1)以x对应的数据为横坐标,y对应的数据为纵坐标,所作的散点图如图所示.(2)从图中可以发现广告支出费与销售额之间具有相关关系,并且当广告支出费由小变大时,销售额也大多由小变大,图中的数据大致分布在某条直线的附近,即x与y正线性相关. 展开更多...... 收起↑ 资源列表 8.1 课时1 变量的相关关系 2024-2025学年高二数学人教A版(2019)选择性必修3.docx 8.1 课时2 样本相关系数 2024-2025学年高二数学人教A版(2019)选择性必修3.docx