资源简介 专题 8.1 成对数据的统计相关性【六大题型】【人教 A 版(2019)】【题型 1 相关关系与函数关系的概念及辨析】 ....................................................................................................1【题型 2 判断两个变量是否有相关关系】 ............................................................................................................3【题型 3 判断正、负相关】 ....................................................................................................................................4【题型 4 样本相关系数大小对变量相关性的影响】 ............................................................................................6【题型 5 相关系数的计算】 ....................................................................................................................................9【题型 6 相关系数与其他知识综合】 ..................................................................................................................11【知识点 1 变量的相关关系】1.变量的相关关系(1)函数关系函数关系是一种确定性关系,常用解析式来表示.(2)相关关系两个变量有关系,但又没有确切到可由其中的一个去精确地决定另一个的程度,这种关系称为相关关系.与函数关系不同,相关关系是一种非确定性关系.2.散点图(1)散点图成对样本数据都可用直角坐标系中的点表示出来,由这些点组成的统计图叫做散点图.(2)正相关和负相关如果从整体上看,当一个变量的值增加时,另一个变量的相应值也呈现增加的趋势,我们就称这两个变量正相关;如果当一个变量的值增加时,另一个变量的相应值呈现减少的趋势,则称这两个变量负相关.3.线性相关一般地,如果两个变量的取值呈现正相关或负相关,而且散点落在一条直线附近,则称这两个变量线性相关.【题型 1 相关关系与函数关系的概念及辨析】【例 1】(24-25 高二·全国·课后作业)下列说法正确的是( )A. = 2 2 +1中的 x,y 是具有相关关系的两个变量B.正四面体的体积与棱长具有相关关系C.电脑的销售量与电脑的价格之间是一种确定性的关系D.传染病医院感染传染病的医务人员数与医院收治的传染病人数是具有相关关系的两个变量【解题思路】根据相关关系的定义、函数的定义即可判断【解答过程】A,B 均为函数关系,故 A、B 错误;C,D 为相关关系,故 C 错,D 对.故选:D.【变式 1-1】(23-24 高一下·青海海东·期末)下列说法正确的是( )A.圆的面积与半径之间的关系是相关关系B.粮食产量与施肥量之间的关系是函数关系C.一定范围内,学生的成绩与学习时间成正相关关系D.人的体重与视力成负相关关系【解题思路】函数关系是变量之间的确定关系,相关关系是变量之间确实存在关系但不具有确定性,据此判断即可.【解答过程】解:对于 A,圆的面积与半径之间的关系是确定的关系,是函数关系,所以 A 错误;对于 B,粮食产量与施肥量之间的关系是不是函数关系,是相关关系,所以 B 错误;对于 C,一定范围内,学生的成绩与学习时间是成正相关关系的,所以 C 正确;对于 D,人的体重与视力是没有相关关系的,所以 D 错误.故选:C.【变式 1-2】(23-24 高二下·四川成都·期中)下列两个量之间的关系是相关关系的是( )A.匀速直线运动中时间与位移的关系 B.学生的成绩和身高C.儿童的年龄与体重 D.物体的体积和质量【解题思路】根据相关关系和函数关系的概念即可判断【解答过程】A、D 是函数关系;B 是不相关关系;C 是相关关系,故选:C.【变式 1-3】(24-25 高二·全国·课后作业)下列两个变量间的关系,是相关关系的是( )A.任意实数和它的平方 B.圆半径和圆的周长C.正多边形的边数和内角度数之和 D.天空中的云量和下雨【解题思路】根据各选项中两个变量是确定还是非确定性关系可得结论.【解答过程】对于 ABC,两个变量之间为确定性关系,即两个变量之间均为函数关系,ABC 错误;对于 D,根据生活经验,天空中的云量和下雨之间不是确定性关系,虽然有云不一定下雨,但是如果没有云一定不下雨,说明它们之间是相关关系,D 正确.故选:D.【题型 2 判断两个变量是否有相关关系】【例 2】(24-25 高二下·宁夏固原·阶段练习)下图中的两个变量,具有相关关系的是( )A. B.C. D.【解题思路】根据相关关系的概念逐项分析判断.【解答过程】相关关系是一种非确定性关系.对于 A、C:两个变量具有函数关系,是一种确定性关系,故 A、C 错误;对于 D:图中的散点分布没有什么规律,故两个变量之间不具有相关关系,故 D 错误;对于 B:图中的散点分布在从左下角区域到右上角区域,两个变量具有相关关系,故 B 正确;故选:B.【变式 2-1】(2024 高二下·云南曲靖·学业考试)下列两个变量之间的关系是相关关系的是( )A.等边三角形的边长 与其面积 B.匀速直线行驶的电车的位移 与行驶时间 C.杂交水稻植株的高度 与土壤湿润度 D.汽车在陆地上的刹车制动时间 与洞庭湖湖面上的空气阻力 【解题思路】根据变量间的相关关系的定义求解.3【解答过程】解:A.等边三角形的边长 与其面积 的关系为 = 2,两个变量是函数关系,不符合题意;4B.匀速直线行驶的电车的位移 与行驶时间 的关系为 = ,两个变量是函数关系,不符合题意;C.杂交水稻植株的高度 与土壤湿润度 具有相关关系,符合题意;D.汽车在陆地上的刹车制动时间 与洞庭湖湖面上的空气阻力 不具有相关关系,不符合题意.故选:C.【变式 2-2】(23-24 高二下·辽宁·期中)下列变量之间的关系不是相关关系的是( )A.光照时间与大棚内蔬菜的产量 B.举重运动员所能举起的最大重量与他的体重C.某正方形的边长与此正方形的面积 D.人的身高与体重【解题思路】根据变量间的相关关系和函数关系判断即可.【解答过程】C 中的两个变量之间是确定的函数关系,A,B,D 中的两个变量之间的关系都是相关关系.故选:C.【变式 2-3】(23-24 高二下·四川乐山·期末)下列变量间的关系,不是相关关系的是( )A.一块农田的水稻产量与施肥之间的关系B.正方形的面积与边长之间的关系C.商品销售收入与其广告费支出之间的关系D.人体内的脂肪含量与年龄之间的关系【解题思路】由相关关系概念可得答案.【解答过程】A 选项,水稻产量与施肥之间没有明确的等量关系,是相关关系,故 A 错误;B 选项,正方形的面积与边长之间有着明确的等量关系,不是相关关系,故 B 正确;C 选项,商品销售收入与其广告费支出之间没有明确的等量关系,故 C 错误;D 选项,人体内的脂肪含量与年龄之间没有明确的等量关系,故 D 错误.故选:B.【题型 3 判断正、负相关】【例 3】(24-25 高二下·全国·课后作业)为制定某种产品的生产计划,某工厂统计得到生产线条数与该种产品产量的数据如下表:生产线条数 1 2 3 4 5产量 21 39 64 87 104则下列说法正确的是( )A. 与 负相关 B. 与 正相关C. 与 不相关 D. 与 成正比例关系【解题思路】由正、负相关的概念即可判断.【解答过程】由题中数据可知,y 随 x 的增大而增大,且不成比例关系,故 y 与 x 正相关.故选:B.【变式 3-1】(24-25 高二下·全国·课后作业)下列散点图中,两个变量呈负相关的个数是( )A.1 B.2 C.3 D.4【解题思路】由正、负相关的概念逐项判断即可.【解答过程】从整体上看,当一个变量的值增加时,另一个变量的相应值呈现减少的趋势,则这两个变量为负相关.结合散点图可知,①②满足题意,即两个变量呈负相关的个数为 2 个.故选:B.【变式 3-2】(24-25 高二上·广西桂林·期末)根据如下两组数据,下列说法正确的是( ) 5 6 7 8 9 10Y 5 4.8 3.5 4 3 2 2 4 6 7 91 3 4 9 71A. 和 呈正相关, 和 呈正相关B. 和 呈负相关, 和 呈负相关C. 和 呈正相关, 和 呈负相关D. 和 呈负相关, 和 呈正相关【解题思路】由正、负相关的概念得解.【解答过程】由所给数据可知,当 增大时 减小, 和 呈负相关;当 增大时和 增大, 和 呈正相关.故选:D.【变式 3-3】(24-25 高二上·河北石家庄·阶段练习)观察下列散点图,其中两个变量的相关关系判断正确的是( )A.a 为正相关,b 为负相关,c 为不相关B.a 为负相关,b 为不相关,c 为正相关C.a 为负相关,b 为正相关,c 为不相关D.a 为正相关,b 为不相关,c 为负相关【解题思路】根据给定的散点图,结合相关性,即可求解.【解答过程】根据给定的散点图,可得 a 中的数据分布在左下方到右上方的区域里,为正相关,b 中的数据分布在左上方到右下方的区域里,为负相关,c 中的数据各点分布不成带状,相关性不明确,不相关.故选:A.【知识点 2 样本相关系数】1.样本相关系数(1)对于变量 x 和变量 y,设经过随机抽样获得的成对样本数据为 ,利用相关系数 r 来衡量两个变量之间线性关系的强弱,相关系数 r 的计算公式:(其中 和的均值分别为 和 ).①当 r>0 时,称成对样本数据正相关.这时,当其中一个数据的值变小时,另一个数据的值通常也变小;当其中一个数据的值变大时,另一个数据的值通常也变大.②当 r<0 时,称成对样本数据负相关.这时,当其中一个数据的值变小时,另一个数据的值通常会变大;当其中一个数据的值变大时,另一个数据的值通常会变小.【题型 4 样本相关系数大小对变量相关性的影响】【例 4】(23-24 高二下·山西大同·期中)对两个变量 , 进行线性相关性检验,得线性相关系数 1 = 0.958,对两个变量 , 进行线性相关性检验,得线性相关系数 2 = 0.974,则下列判断正确的是( )A.变量 与变量 正相关,变量 与变量 负相关,变量 与变量 的线性相关性更强B.变量 与变量 负相关,变量 与变量 正相关,变量 与变量 的线性相关性更强C.变量 与变量 负相关,变量 与变量 正相关,变量 与变量 的线性相关性更强D.变量 与变量 正相关,变量 与变量 负相关,变量 与变量 的线性相关性更强【解题思路】根据相关系数的符号的正负决定两个变量的正相关、负相关,以及相关系数绝对值越大,两个变量的线性相关性越强,进而可得出结论.【解答过程】由线性相关系数 1 = 0.958 > 0知 与 正相关,由线性相关系数 2 = 0.974 < 0知 与 负相关,又| 1| < | 2|,所以变量 与变量 的线性相关性比变量 与变量 的线性相关性更强.故选:D.【变式 4-1】(23-24 高二下·云南曲靖·阶段练习)对四组数据进行统计,获得如图散点图,关于其相关系数的比较,正确的是( )A. 2 < 4 < 0 < 3 < 1 B. 4 < 2 < 0 < 1 < 3C. 4 < 2 < 0 < 3 < 1 D. 2 < 4 < 0 < 1 < 3【解题思路】根据散点图和相关系数的概念和性质辨析即可.【解答过程】由散点图可知,相关系数 2, 4所在散点图呈负相关, 1, 3所在散点图呈正相关,所以 1, 3都为正数, 2, 4都为负数. 1, 2所在散点图近似一条直线上,线性相关性比较强,相关系数的绝对值越接近1,而 3, 4所在散点图比较分散,线性相关性比较弱,相关系数的绝对值越远离1.综上可得: 2 < 4 < 0 < 3 < 1.故选:A.【变式 4-2】(23-24 高二下·黑龙江哈尔滨·期末)已知 5 个成对数据( , )的散点图如下,若去掉点 (4,3),则下列说法正确的是( )A.变量 x 与变量 y 呈正相关 B.变量 x 与变量 y 的相关性变强C.残差平方和变大 D.样本相关系数 r 变大【解题思路】根据已知条件,结合变量间的相关关系,结合图象分析判断即可.【解答过程】由散点图可知,去掉点 (4,3)后, 与 的线性相关加强,且为负相关,所以 B 正确,A 错误;由于 与 的线性相关加强,所以残差平方和变小,所以 C 错误,由于 与 的线性相关加强,且为负相关,所以相关系数的绝对值变大,而相关系数为负的,所以样本相关系数 r 变小,所以 D 错误.故选:B.【变式 4-3】(23-24 高二下·四川乐山·期末)对变量 x,y 由观测数据( , )( ∈ )得散点图 1;对变量 u,v由观测数据( , )( ∈ )得散点图 2. 1表示变量 x,y 之间的线性相关系数, 2表示变量 u,v 之间的线性相关系数,则下列说法正确的是( )A.变量 x 与 y 呈现正相关,且| 1| > | 2|B.变量 x 与 y 呈现负相关,且| 1| < | 2|C.变量 u 与 v 呈现正相关,且| 1| > | 2|D.变量 u 与 v 呈现负相关,且| 1| < | 2|【解题思路】利用散点图,结合相关系数的知识可得答案.【解答过程】观察散点图,得变量 x 与 y 呈现正相关,变量 u 与 v 呈现负相关,BC 错误;图 1 中各点比图 2 中各点更加集中,相关性更好,因此| 1| > | 2|,A 正确,D 错误.故选:A.【题型 5 相关系数的计算】【例 5】(24-25 高二下·全国·课后作业)某景区对 2017-2022 年景区内农家乐接待人数(单位:万人)进行了统计,得到数据如下表:年份 2017 2018 2019 2020 2021 2022年份编号 1 2 3 4 5 6接待人数 万人 4.5 5.6 6.1 6.4 6.8 7.2则接待人数与年份的相关系数约为( )(参考数据: 322 ≈ 17.94)A.0.65 B.0.71 C.0.89 D.0.97【解题思路】根据已知数据分别计算各个量得出 的值即可.6 6 6【解答过程】由题得 = 3.5, = 6.1, ( )2 = 17.5, ( 2 ) = 4.6, ( )( ) = 8.7, =1 =1 =16( ) ( ) =1 8.7 8.7所以 = 6 6 = = 2 ≈ 0.97,( )2 ( )217.5×4.6 (0.5) ×322 =1 =1故接待人数与年份的相关系数约为 0.97.故选:D.【变式 5-1】(24-25 高二下·全国·课后作业)为考察两个变量 , 的相关性,搜集数据如表,则两个变量的线性相关程度( ) 5 10 15 20 2511 11 11 103 1050 1 45 5 5(参考数据: 2 = 1375, 2 = 59051, = 8285) =1 =1 =1A.很强 B.很弱 C.无相关 D.不确定【解题思路】根据已知计算相关系数,再根据相关系数的值判断线性相关程度.【解答过程】由题可得 = 15, = 108.6,5 5 =1则 = 5 5 2 2 5 2 5 2 =1 =18285 5×15×108.6= ≈ 0.9826,1375 5×152× 59051 5×108.62因为相关系数很接近于 1,故两个变量的线性相关程度很强.故选:A.【变式 5-2】(23-24 高二上·辽宁·期末)在一组样本数据( 1, 1)、( 2, 2)、 、( , )( ≥ 2 、 1、 2、 、 不全相等)的散点图中,若所有的样本点( , )( = 1,2, , )都在直线 = 2 + 1上,则这组样本数据的相关系数为( )A.2 B. 2 C. 1 D.1【解题思路】根据相关系数的与线性相关关系可得解.【解答过程】因为所有的样本点都在直线 = 2 + 1上,所以相关系数 满足| | = 1.又因为 2 < 0,所以 < 0,所以 = 1.故选:C.【变式 5-3】(24-25 高三上·全国·阶段练习)研究数据表明,某校高中生的数学成绩与物理成绩、物理成绩与化学成绩均有正相关关系.现从该校抽取某班 50 位同学的数学、物理、化学三科成绩作为样本,设数学、12 4物理、化学成绩分别为变量 x,y,z 若 x,y 的样本相关系数为13,y,z 的样本相关系数为5,则 x、z 的样本相关系数的最大值为( ) ( )( ) =1附:相关系数 = ( )2 ( )2 =1 =1A 48 B 63 64.65 .65 C.65 D.1 ( )( ) =1【解题思路】利用相关系数公式 = ,可看成两个 维向量的夹角公式,从而把相关( )2 ( )2 =1 =1系系数问题转化为向量夹角问题,即可得解.【解答过程】设 = ( 1, 2, , ), = ( 1, 2, , ), = ( 1, 2, , ),则有 ′ = ( 1 , 2 , , ), ′ = ( 1 , 2 , , ), ′ = ( 1 , 2 , , ), ( )( ) =1由相关系数公式 = 可知: = cos ′, ′ ,( )2 ( )2 =1 =1设 ′与 ′夹角为 , ′与 ′夹角为 ,由 x,y 12 12 4的样本相关系数为13,所以cos = 13,cos = 5,由这两个夹角均为锐角且 > ,所以 ′与 ′夹角的可能性是 , + ,则 ′与 ′夹角余弦值的最大值为cos( ),此时 x 与 z 样本相关系数最大,即cos( ) = cos cos + sin sin =4 × 12 35 13 + 5 ×5 = 6313 65,故选:B.【题型 6 相关系数与其他知识综合】【例 6】(24-25 高三上·江苏南通·期中)为调查某地区学生在高中学习中错题订正整理情况与考试成绩的关系.首先对该地区所有高中学生错题订正整理情况进行分值评价,给出得分;再组织考试.从这些学生中随机抽取 20 名学生的错题订正整理情况得分 和对应的考试成绩 作为样本,得到样本数据( , )20( = 1,2, ,20),其中 2 2 和 分别表示第 个样本错题订正整理情况得分和对应的考试成绩,计算得 20 =120 20= 80, ( )2 = 9000, 20 = 800. =1 =1(1)求样本( , )( = 1,2, ,20)的相关系数(精确到 0.01),并推断考试成绩 和错题订正整理情况得分 的相关程度;(2)已知 20 个样本中有 8 个样本的考试成绩低于样本平均数 .利用频率估计概率,从该地区所有高中学生中随机抽取 4 个学生的错题订正整理情况得分和对应的考试成绩,记抽到考试成绩低于 的个数为 X,求随机变量 X 的分布列. ( ) ( ) =1附:相关系数 = , 2 ≈ 1.414.( )2 ( )2 =1 =1【解题思路】(1)根据相关系数的计算公式即可代入求解;(2)根据二项分布概率公式求解概率,即可得分布列.20 20( ) ( ) 20 =1 =1 800 8【解答过程】(1) = 2 220 20 = 20 20 = = = ≈ 0.94,( ) ( )2 2 20 ( )280×900 72 3 =1 =1 =1 =1∵ 接近1, ∴ 考试成绩 和错题订正整理情况得分 高度相关.(2)考试成绩低于样本平均数 的概率记为 , = 8则 20 =25, ∴ ~ 4,253 4 81 2 3 3 216 ( = 0) = C04 5 = 625 , ( = 1) = C14 5 × 5 = 6252 22 3 2 216 2 3 3 96 ( = 2) = C4 5 × 5 = 625 , ( = 3) = C34 5 × 5 = 6252 4 16 ( = 4) = C44 5 = 625 .x 0 1 2 3 4p 81 216 216 96 16625 625 625 625 625【变式 6-1】(24-25 高三上·山东济宁·阶段练习)某学校对高三(1)班 50 名学生的第一次模拟考试的数学50成绩和化学成绩统计得到数据如下:数学成绩的方差为 21 = 10,化学成绩的方差为 22 = 8, 2 =1= 500500,其中 , ( ∈ ,且1 ≤ ≤ 50)分别表示这 50 名学生的数学成绩和化学成绩, 关于 的线性回归方程为 = 0.4 + .(1)求 与 的样本相关系数 ;(2)从概率统计规律来看,本次考试高三(1)班学生数学成绩 服从正态分布 ( , 2),用样本平均数 作为 的估计值,用样本方差 21作为 2的估计值,试估计该校共 1600 名高三学生中,数学成绩位于区间(96.84,106.32)的人数. ( )( )附:①回归方程 = + 中, = =1 , = ;( )2 =1 ( )( ) =1②样本相关系数 = ;③ 5 ≈ 2.24, 10 ≈ 3.16;( )2 ( )2 =1 =1④若 ( , 2),则 ( ≤ ≤ + ) ≈ 0.68, ( 2 ≤ ≤ + 2 ) ≈ 0.95.【解题思路】(1)根据相关系数的求法求得正确答案.(2)先求得 ( , 2) = (100,10),然后根据正态分布的对称性求得正确答案.50( )( )【解答过程】(1)由 关于 的线性回归方程为 = 0.4 + 知 = =150 = 0.4,( )2 =150 50即 ( )( ) = 0.4 ( )2, =1 =150 50又由 21 = 10, 22 = 8可得 ( )2 = 500, ( )2 = 400, =1 =1所以 与 的样本相关系数:50 50( )( ) 0.4 ( )2 =1 =1 = 550 50 = 50 50 = ≈2.245 = 0.448.( )2 ( )2 ( )2 ( )25 =1 =1 =1 =150(2)由 2 11 = 50 2 2,10 =1 250 × 500500 ,解得 = 100,所以 (100,10), =1又由106.32 = 100 + 2 × 3.16,96.84 = 100 3.16,及 ( ≤ ≤ + ) ≈ 0.68, ( 2 ≤ ≤ + 2 ) ≈ 0.95可得: (96.84 < < 106.32) ≈ 0.68+0.952 = 0.815,于是估计该校 1600 名高三学生中,数学成绩位于区间(96.84,106.32)的人数约为1600 × 0.815 = 1304人.【变式 6-2】(24-25 高三上·重庆·阶段练习)广阳岛,作为长江上游最大的江心岛,其面积在枯水期约为10 平方公里.自 2017 年起,重庆市开始对广阳岛进行系统的生态修复,摒弃了曾经的商业开发计划,转而建设“长江风景眼,重庆生态岛”.经过数年的努力,广阳岛的生态得到了显著的改善,不仅植被丰富,生物多样性也得到了极大的提升.据监测,岛上的鸟类从生态修复前的 124 种增加到 213 种,其中包括中华秋沙鸭、游隼、白琵鹭等珍稀鸟类.为调查广阳岛某种鸟的数量,将其分成面积相近的 50 个地块,从这些地块中用简单随机抽样的方法抽取 5 个作为样区,调查得到样本数据( , )( = 1,2, ,5),其中 和 分别表示第 个样区的植被覆盖面积(单位:平方公里)和这种鸟的数量. 1 2 3 4 5 0.171 0.152 0.192 0.189 0.196 12 10 16 14 18(1)求广阳岛这种鸟数量的估计值(这种鸟数量的估计值等于样区这种鸟数量的平均数乘以地块数);(2)求样本( , )( = 1,2, ,5)的相关系数(精确到 0.01);(3)根据统计资料,各地块间植物覆盖面积差异较大.为提高样本的代表性以获得广阳岛这种鸟数量更准确的估计,请给出一种你认为更合理的抽样方法,并说明理由. =1 5 2 5 2附:相关系数 = = 0.18 ≈ 0.232 2 2, , . =1 =1 =1 =1【解题思路】(1)求出样本平均数,再乘以地块数可得出结果; ( ) ( ) =1(2)根据题中所给数据,代入 = ,可得出结果;( )2 ( )2 =1 =1(3)由(2)知知各样区的这种鸟数量与植物覆盖面积有很强的正相关,各地块间这种植物数量差异也很大,适合采用分层抽样.12+10+16+14+18【解答过程】(1)由已知得样本平均数 = 5 = 14,从而广阳岛这种鸟数量的估计值为14 × 50 = 700.(2) = 0.18, = 145 = 0.009 × 2 + 0.028 × 4 + 0.012 × 2 + 0.016 × 4 = 0.218, =10.218故样本的相关系数 ≈ 0.232 ≈ 0.94(3)分层抽样:根据植物覆盖面积的大小对地块分层,再对 50 个地块进行分层抽样.理由如下:由(2)知各样区的这种鸟数量与植物覆盖面积有很强的正相关,由于各地块间植物覆盖面积差异很大,从而各地块间这种鸟数量差异也很大,采用分层抽样的方法较好地保持了样本结构与总体结构的一致性,提高了样本的代表性,从而可以获得广阳岛这种鸟数量更准确的估计.【变式 6-3】(2024·重庆开州·模拟预测)2006 年,在国家节能减排的宏观政策指导下,科技部在“十一五”启动了“863”计划新能源汽车重大项目.自 2011 年起,国家相关部门重点扶持新能源汽车的发展,也逐步得到消费者的认可.如下表是统计的 2014 年-2023 年全国新能源汽车保有量(百万辆)数据:年份代码 1 2 3 4 5 6 7 8 9 10年份 2014 2015 2016 2017 2018 2019 2020 2021 2022 2023保有量 0.12 0.50 1.09 1.60 2.61 3.81 4.92 7.84 13.10 20.4110 10 10并计算得: 2 = 385, 2 ≈ 699, ≈ 466, = 5.5, = 5.6. =1 =1 =1(1)根据表中数据,求相关年份与全国新能源汽车保有量的样本相关系数(精确到 0.01);(2)现苏同学购买第 1 辆汽车时随机在新能源汽车和非新能源汽车中选择.如果第 1 辆购买新能源汽车,那么第 2 辆仍选择购买新能源汽车的概率为 0.6;如果第 1 辆购买非新能源汽车,那么第 2 辆购买新能源汽车的概率为 0.8,计算苏同学第 2 辆购买新能源汽车的概率;(3)某汽车网站为调查新能源汽车车主的用车体验,决定从 12 名候选车主中选 3 名车主进行访谈,已知有 4名候选车主是新能源汽车车主,假设每名候选人都有相同的机会被选到,求被选到新能源汽车车主的分布列及数学期望. ( ) ( ) =1附:相关系数: = , 31795.5 ≈ 178.( )2 ( )2 =1 =1【解题思路】(1)直接根据公式计算即可;(2)利用全概率公式即可求解;(3)设被选到新能源汽车车主人数为 ,则 可能取值为0,1,2,3,分别计算出其概率,然后列出分布列,由公式算出数学期望.10 10 10【解答过程】(1)由 2 = 385, 2 ≈ 699, ≈ 466, = 5.5, = 5.60, =1 =1 =1 ( ) ( ) =1 =1 466 10×5.5×5.6则 = = = ≈ 0.89.( )2 ( )2 2 2 2 2 (385 10×5.52)(699 10×5.62) =1 =1 =1 =1(2)设 1 = “第 1 辆购买新能源汽车”, 1 = “第 1 辆购买非新能源汽车”, 2 = “第 2 辆购买新能源汽车”, ( 1) = ( 1) = 0.5, ( 2| 1) = 0.6, ( 2| 1) = 0.8,由全概率公式得, ( 2) = ( 1) ( 2| 1) + ( 1) ( 2| 1) = 0.5 × 0.6 + 0.5 × 0.8 = 0.7,所以苏同学第 2 辆购买新能源汽车的概率为0.7.(3)设被选到新能源汽车车主人数为 ,则 可能取值为0,1,2,3, = C0C3 14 C14 8 4C28 28( = 0) C3 = , ( = 1) = 3 = ,12 55 C12 55C2C1 3 0 ( = 2) = 4 8C3 =1255, ( = 3) =C4C8 1C3 = ,12 12 55则被选到新能源汽车车主的分布列为, 0 1 2 3 14 28 12 155 55 55 5514 28 12 1所以 ( ) = 0 × 55 +1 × 55 +2 × 55 +3 × 55 = 1.专题 8.1 成对数据的统计相关性【六大题型】【人教 A 版(2019)】【题型 1 相关关系与函数关系的概念及辨析】 ....................................................................................................1【题型 2 判断两个变量是否有相关关系】 ............................................................................................................2【题型 3 判断正、负相关】 ....................................................................................................................................3【题型 4 样本相关系数大小对变量相关性的影响】 ............................................................................................4【题型 5 相关系数的计算】 ....................................................................................................................................6【题型 6 相关系数与其他知识综合】 ....................................................................................................................7【知识点 1 变量的相关关系】1.变量的相关关系(1)函数关系函数关系是一种确定性关系,常用解析式来表示.(2)相关关系两个变量有关系,但又没有确切到可由其中的一个去精确地决定另一个的程度,这种关系称为相关关系.与函数关系不同,相关关系是一种非确定性关系.2.散点图(1)散点图成对样本数据都可用直角坐标系中的点表示出来,由这些点组成的统计图叫做散点图.(2)正相关和负相关如果从整体上看,当一个变量的值增加时,另一个变量的相应值也呈现增加的趋势,我们就称这两个变量正相关;如果当一个变量的值增加时,另一个变量的相应值呈现减少的趋势,则称这两个变量负相关.3.线性相关一般地,如果两个变量的取值呈现正相关或负相关,而且散点落在一条直线附近,则称这两个变量线性相关.【题型 1 相关关系与函数关系的概念及辨析】【例 1】(24-25 高二·全国·课后作业)下列说法正确的是( )A. = 2 2 +1中的 x,y 是具有相关关系的两个变量B.正四面体的体积与棱长具有相关关系C.电脑的销售量与电脑的价格之间是一种确定性的关系D.传染病医院感染传染病的医务人员数与医院收治的传染病人数是具有相关关系的两个变量【变式 1-1】(23-24 高一下·青海海东·期末)下列说法正确的是( )A.圆的面积与半径之间的关系是相关关系B.粮食产量与施肥量之间的关系是函数关系C.一定范围内,学生的成绩与学习时间成正相关关系D.人的体重与视力成负相关关系【变式 1-2】(23-24 高二下·四川成都·期中)下列两个量之间的关系是相关关系的是( )A.匀速直线运动中时间与位移的关系 B.学生的成绩和身高C.儿童的年龄与体重 D.物体的体积和质量【变式 1-3】(24-25 高二·全国·课后作业)下列两个变量间的关系,是相关关系的是( )A.任意实数和它的平方 B.圆半径和圆的周长C.正多边形的边数和内角度数之和 D.天空中的云量和下雨【题型 2 判断两个变量是否有相关关系】【例 2】(24-25 高二下·宁夏固原·阶段练习)下图中的两个变量,具有相关关系的是( )A. B.C. D.【变式 2-1】(2024 高二下·云南曲靖·学业考试)下列两个变量之间的关系是相关关系的是( )A.等边三角形的边长 与其面积 B.匀速直线行驶的电车的位移 与行驶时间 C.杂交水稻植株的高度 与土壤湿润度 D.汽车在陆地上的刹车制动时间 与洞庭湖湖面上的空气阻力 【变式 2-2】(23-24 高二下·辽宁·期中)下列变量之间的关系不是相关关系的是( )A.光照时间与大棚内蔬菜的产量 B.举重运动员所能举起的最大重量与他的体重C.某正方形的边长与此正方形的面积 D.人的身高与体重【变式 2-3】(23-24 高二下·四川乐山·期末)下列变量间的关系,不是相关关系的是( )A.一块农田的水稻产量与施肥之间的关系B.正方形的面积与边长之间的关系C.商品销售收入与其广告费支出之间的关系D.人体内的脂肪含量与年龄之间的关系【题型 3 判断正、负相关】【例 3】(24-25 高二下·全国·课后作业)为制定某种产品的生产计划,某工厂统计得到生产线条数与该种产品产量的数据如下表:生产线条数 1 2 3 4 5产量 21 39 64 87 104则下列说法正确的是( )A. 与 负相关 B. 与 正相关C. 与 不相关 D. 与 成正比例关系【变式 3-1】(24-25 高二下·全国·课后作业)下列散点图中,两个变量呈负相关的个数是( )A.1 B.2 C.3 D.4【变式 3-2】(24-25 高二上·广西桂林·期末)根据如下两组数据,下列说法正确的是( ) 5 6 7 8 9 10Y 5 4.8 3.5 4 3 2 2 4 6 7 91 3 4 9 71A. 和 呈正相关, 和 呈正相关B. 和 呈负相关, 和 呈负相关C. 和 呈正相关, 和 呈负相关D. 和 呈负相关, 和 呈正相关【变式 3-3】(24-25 高二上·河北石家庄·阶段练习)观察下列散点图,其中两个变量的相关关系判断正确的是( )A.a 为正相关,b 为负相关,c 为不相关B.a 为负相关,b 为不相关,c 为正相关C.a 为负相关,b 为正相关,c 为不相关D.a 为正相关,b 为不相关,c 为负相关【知识点 2 样本相关系数】1.样本相关系数(1)对于变量 x 和变量 y,设经过随机抽样获得的成对样本数据为 ,利用相关系数 r 来衡量两个变量之间线性关系的强弱,相关系数 r 的计算公式:(其中 和的均值分别为 和 ).①当 r>0 时,称成对样本数据正相关.这时,当其中一个数据的值变小时,另一个数据的值通常也变小;当其中一个数据的值变大时,另一个数据的值通常也变大.②当 r<0 时,称成对样本数据负相关.这时,当其中一个数据的值变小时,另一个数据的值通常会变大;当其中一个数据的值变大时,另一个数据的值通常会变小.【题型 4 样本相关系数大小对变量相关性的影响】【例 4】(23-24 高二下·山西大同·期中)对两个变量 , 进行线性相关性检验,得线性相关系数 1 = 0.958,对两个变量 , 进行线性相关性检验,得线性相关系数 2 = 0.974,则下列判断正确的是( )A.变量 与变量 正相关,变量 与变量 负相关,变量 与变量 的线性相关性更强B.变量 与变量 负相关,变量 与变量 正相关,变量 与变量 的线性相关性更强C.变量 与变量 负相关,变量 与变量 正相关,变量 与变量 的线性相关性更强D.变量 与变量 正相关,变量 与变量 负相关,变量 与变量 的线性相关性更强【变式 4-1】(23-24 高二下·云南曲靖·阶段练习)对四组数据进行统计,获得如图散点图,关于其相关系数的比较,正确的是( )A. 2 < 4 < 0 < 3 < 1 B. 4 < 2 < 0 < 1 < 3C. 4 < 2 < 0 < 3 < 1 D. 2 < 4 < 0 < 1 < 3【变式 4-2】(23-24 高二下·黑龙江哈尔滨·期末)已知 5 个成对数据( , )的散点图如下,若去掉点 (4,3),则下列说法正确的是( )A.变量 x 与变量 y 呈正相关 B.变量 x 与变量 y 的相关性变强C.残差平方和变大 D.样本相关系数 r 变大【变式 4-3】(23-24 高二下·四川乐山·期末)对变量 x,y 由观测数据( , )( ∈ )得散点图 1;对变量 u,v由观测数据( , )( ∈ )得散点图 2. 1表示变量 x,y 之间的线性相关系数, 2表示变量 u,v 之间的线性相关系数,则下列说法正确的是( )A.变量 x 与 y 呈现正相关,且| 1| > | 2|B.变量 x 与 y 呈现负相关,且| 1| < | 2|C.变量 u 与 v 呈现正相关,且| 1| > | 2|D.变量 u 与 v 呈现负相关,且| 1| < | 2|【题型 5 相关系数的计算】【例 5】(24-25 高二下·全国·课后作业)某景区对 2017-2022 年景区内农家乐接待人数(单位:万人)进行了统计,得到数据如下表:年份 2017 2018 2019 2020 2021 2022年份编号 1 2 3 4 5 6接待人数 万人 4.5 5.6 6.1 6.4 6.8 7.2则接待人数与年份的相关系数约为( )(参考数据: 322 ≈ 17.94)A.0.65 B.0.71 C.0.89 D.0.97【变式 5-1】(24-25 高二下·全国·课后作业)为考察两个变量 , 的相关性,搜集数据如表,则两个变量的线性相关程度( ) 5 10 15 20 2511 11 11 103 1050 1 45 5 5(参考数据: 2 = 1375, 2 = 59051, = 8285) =1 =1 =1A.很强 B.很弱 C.无相关 D.不确定【变式 5-2】(23-24 高二上·辽宁·期末)在一组样本数据( 1, 1)、( 2, 2)、 、( , )( ≥ 2 、 1、 2、 、 不全相等)的散点图中,若所有的样本点( , )( = 1,2, , )都在直线 = 2 + 1上,则这组样本数据的相关系数为( )A.2 B. 2 C. 1 D.1【变式 5-3】(24-25 高三上·全国·阶段练习)研究数据表明,某校高中生的数学成绩与物理成绩、物理成绩与化学成绩均有正相关关系.现从该校抽取某班 50 位同学的数学、物理、化学三科成绩作为样本,设数学、12 4物理、化学成绩分别为变量 x,y,z 若 x,y 的样本相关系数为13,y,z 的样本相关系数为5,则 x、z 的样本相关系数的最大值为( ) ( )( ) =1附:相关系数 = ( )2 ( )2 =1 =1A 48 B 63 C 64.65 .65 .65 D.1【题型 6 相关系数与其他知识综合】【例 6】(24-25 高三上·江苏南通·期中)为调查某地区学生在高中学习中错题订正整理情况与考试成绩的关系.首先对该地区所有高中学生错题订正整理情况进行分值评价,给出得分;再组织考试.从这些学生中随机抽取 20 名学生的错题订正整理情况得分 和对应的考试成绩 作为样本,得到样本数据( , )20( = 1,2, ,20),其中 和 分别表示第 个样本错题订正整理情况得分和对应的考试成绩,计算得 2 2 20 =120 20= 80, ( )2 = 9000, 20 = 800. =1 =1(1)求样本( , )( = 1,2, ,20)的相关系数(精确到 0.01),并推断考试成绩 和错题订正整理情况得分 的相关程度;(2)已知 20 个样本中有 8 个样本的考试成绩低于样本平均数 .利用频率估计概率,从该地区所有高中学生中随机抽取 4 个学生的错题订正整理情况得分和对应的考试成绩,记抽到考试成绩低于 的个数为 X,求随机变量 X 的分布列. ( ) ( ) =1附:相关系数 = , 2 ≈ 1.414.( )2 ( )2 =1 =1【变式 6-1】(24-25 高三上·山东济宁·阶段练习)某学校对高三(1)班 50 名学生的第一次模拟考试的数学50成绩和化学成绩统计得到数据如下:数学成绩的方差为 21 = 10,化学成绩的方差为 22 = 8, 2 =1= 500500,其中 , ( ∈ ,且1 ≤ ≤ 50)分别表示这 50 名学生的数学成绩和化学成绩, 关于 的线性回归方程为 = 0.4 + .(1)求 与 的样本相关系数 ;(2)从概率统计规律来看,本次考试高三(1)班学生数学成绩 服从正态分布 ( , 2),用样本平均数 作为 的估计值,用样本方差 2 21作为 的估计值,试估计该校共 1600 名高三学生中,数学成绩位于区间(96.84,106.32)的人数. ( )( )附:①回归方程 = + 中, = =1 , = ;( )2 =1 ( )( ) =1②样本相关系数 = ;③ 5 ≈ 2.24, 10 ≈ 3.16;( )2 ( )2 =1 =1④若 ( , 2),则 ( ≤ ≤ + ) ≈ 0.68, ( 2 ≤ ≤ + 2 ) ≈ 0.95.【变式 6-2】(24-25 高三上·重庆·阶段练习)广阳岛,作为长江上游最大的江心岛,其面积在枯水期约为10 平方公里.自 2017 年起,重庆市开始对广阳岛进行系统的生态修复,摒弃了曾经的商业开发计划,转而建设“长江风景眼,重庆生态岛”.经过数年的努力,广阳岛的生态得到了显著的改善,不仅植被丰富,生物多样性也得到了极大的提升.据监测,岛上的鸟类从生态修复前的 124 种增加到 213 种,其中包括中华秋沙鸭、游隼、白琵鹭等珍稀鸟类.为调查广阳岛某种鸟的数量,将其分成面积相近的 50 个地块,从这些地块中用简单随机抽样的方法抽取 5 个作为样区,调查得到样本数据( , )( = 1,2, ,5),其中 和 分别表示第 个样区的植被覆盖面积(单位:平方公里)和这种鸟的数量. 1 2 3 4 5 0.171 0.152 0.192 0.189 0.196 12 10 16 14 18(1)求广阳岛这种鸟数量的估计值(这种鸟数量的估计值等于样区这种鸟数量的平均数乘以地块数);(2)求样本( , )( = 1,2, ,5)的相关系数(精确到 0.01);(3)根据统计资料,各地块间植物覆盖面积差异较大.为提高样本的代表性以获得广阳岛这种鸟数量更准确的估计,请给出一种你认为更合理的抽样方法,并说明理由. =1 5 5附:相关系数 = , = 0.18 22 2 , 2 ≈ 0.232. =1 =1 =1 =1【变式 6-3】(2024·重庆开州·模拟预测)2006 年,在国家节能减排的宏观政策指导下,科技部在“十一五”启动了“863”计划新能源汽车重大项目.自 2011 年起,国家相关部门重点扶持新能源汽车的发展,也逐步得到消费者的认可.如下表是统计的 2014 年-2023 年全国新能源汽车保有量(百万辆)数据:年份代码 1 2 3 4 5 6 7 8 9 10年份 2014 2015 2016 2017 2018 2019 2020 2021 2022 2023保有量 0.12 0.50 1.09 1.60 2.61 3.81 4.92 7.84 13.10 20.4110 10 10并计算得: 2 = 385, 2 ≈ 699, ≈ 466, = 5.5, = 5.6. =1 =1 =1(1)根据表中数据,求相关年份与全国新能源汽车保有量的样本相关系数(精确到 0.01);(2)现苏同学购买第 1 辆汽车时随机在新能源汽车和非新能源汽车中选择.如果第 1 辆购买新能源汽车,那么第 2 辆仍选择购买新能源汽车的概率为 0.6;如果第 1 辆购买非新能源汽车,那么第 2 辆购买新能源汽车的概率为 0.8,计算苏同学第 2 辆购买新能源汽车的概率;(3)某汽车网站为调查新能源汽车车主的用车体验,决定从 12 名候选车主中选 3 名车主进行访谈,已知有 4名候选车主是新能源汽车车主,假设每名候选人都有相同的机会被选到,求被选到新能源汽车车主的分布列及数学期望. ( ) ( ) =1附:相关系数: = , 31795.5 ≈ 178.( )2 ( )2 =1 =1 展开更多...... 收起↑ 资源列表 专题8.1 成对数据的统计相关性【六大题型】(举一反三)(人教A版2019选择性必修第三册)(原卷版)2024-2025学年高二数学举一反三系列(人教A版2019选择性必修第三册).pdf 专题8.1 成对数据的统计相关性【六大题型】(举一反三)(人教A版2019选择性必修第三册)(解析版)2024-2025学年高二数学举一反三系列(人教A版2019选择性必修第三册).pdf