【期末热点.重难点】成对数据的统计相关性(含解析)2024-2025学年人教A版(2019)选择性必修第三册数学高二下册

资源下载
  1. 二一教育资源

【期末热点.重难点】成对数据的统计相关性(含解析)2024-2025学年人教A版(2019)选择性必修第三册数学高二下册

资源简介

期末热点.重难点 成对数据的统计相关性
一.选择题(共5小题)
1.(2024秋 汕头期末)我们研究成对数据(ai,bi)(i=1,2,…,10)的相关关系,其中ai=i(i=1,2,…,10),bi=ai(i=1,2,…,9),b10=a,在集合{8,11,12,13}中取一个元素作为a的值,使得这组成对数据的相关程度最强,则a=(  )
A.8 B.11 C.12 D.13
2.(2024秋 西青区校级月考)如图所示,5个(x,y)数据,去掉D(3,10)后,下列说法正确的是(  )
A.相关系数r变小
B.决定系数R2变小
C.残差平方和变小
D.解释变量x与预报变量y的相关性变弱
3.(2024春 武强县校级期末)关于(x,y)的一组样本数据(1,0),(2,﹣1),(3,﹣2),(5,﹣4),…,(30,﹣29)的散点图中,所有样本点均在直线y=﹣x+1上,则这组样本数据的样本相关系数r为(  )
A.﹣2 B.﹣1 C.1 D.2
4.(2024秋 伊美区校级期中)在一组样本数据(x1,y1),(x2,y2),(x3,y3),…,(xn,yn)(n≥2,x1,x2,…,xn不全相等)的散点图中,若所有样本点(xi,yi)(i=1,2,3,…,n)都在直线上,则这组样本数据的样本相关系数为(  )
A.﹣1 B.0 C.1 D.
5.(2024秋 河东区校级月考)下列说法错误的是(  )
A.线性相关系数|r|越接近1,两个变量的线性相关程度越强
B.独立性检验可以100%确定两个变量之间是否具有某种关系
C.在回归分析中,可用残差图判断模型的拟合效果,残差点比较均匀地落在水平的带状区域中,说明这样的模型比较合适,带状区域的宽度越窄,说明模型的拟合精度越高
D.甲、乙两个模型的决定系数R2分别约为0.88和0.80,则模型甲的拟合效果更好
二.多选题(共4小题)
(多选)6.(2024春 大通县期末)两个具有线性相关关系的变量的一组数据为(x1,y1),(x2,y2), ,(xn,yn),则下列说法正确的是(  )
A.若相关系数r<0,则两个变量负相关
B.相关系数r的值越小,成对样本数据的线性相关程度越弱
C.决定系数R2越大,残差平方和越小,模型的拟合效果越好
D.决定系数R2越小,残差平方和越小,模型的拟合效果越好
(多选)7.(2023秋 北海期末)下列各组的两个变量中呈正相关关系的是(  )
A.学生的身高与学生的化学成绩
B.汽车行驶的里程与它的耗油量
C.人的年龄与年收入
D.水果的重量与它的总价
(多选)8.(2024秋 成都期中)对于样本相关系数,下列说法正确的是(  )
A.样本相关系数可以用来判断成对样本数据相关的正负性
B.样本相关系数可以是正的,也可以是负的
C.样本相关系数越大,成对样本数据的线型相关程度越强
D.样本相关系数r∈[﹣1,1]
(多选)9.(2024 南关区校级模拟)已知变量x和变量y的一组成对样本数据(xi,yi)(i=1,2,…,n)的散点落在一条直线附近,,,相关系数为r,线性回归方程为,则(  )
参考公式:
A.当r越大时,成对样本数据的线性相关程度越强
B.当r>0时,0
C.时,成对样本数据(xi,yi)(i=1,2,…,n,n+1)的相关系数r′满足r′=r
D.时,成对样本数据(xi,yi)(i=1,2,…,n,n+1)的线性回归方程满足
三.填空题(共3小题)
10.(2024秋 浦东新区校级期中)在研究线性回归模型时,样本数据(xi,yi)(i=1,2,3, ,n)所对应的点均在直线上,用r表示解释变量对于反应变量变化的线性相关度,则r=    .
11.(2024秋 广水市校级月考)若已知是的4倍,是的1.5倍,则相关系数r的值为    .
12.(2024 江西模拟)已知成对样本数据(x1,y1),(x2,y2),…,(xn,yn)(n≥3)中x1,x2,…,xn互不相等,且所有样本点(xi,yi)(i=1,2,…,n)都在直线上,则这组成对样本数据的样本相关系数r=   .
四.解答题(共3小题)
13.(2025 柳州一模)某购物平台为了吸引更多的顾客在线购物,推出了A和B两个套餐服务,并在购物平台上推出了优惠券活动,顾客可自由选择A和B两个套餐之一,如图是该购物平台7天销售优惠券的情况(单位:千张)的折线图:
(1)由折线图可看出,可用回归模型拟合y与t的关系,请用相关系数加以说明;
(2)假设每位顾客选择A套餐的概率为,选择B套餐的概率为,其中A包含一张优惠券,B套餐包含两张优惠券,截止某一时刻,该平台恰好销售了n张优惠券,设其概率为Pn,求Pn;
(3)记(2)中所得概率Pn的值构成数列{Pn}(n∈N*),求数列{Pn}的最值.
参考数据:,,,.
参考公式:相关系数.
14.(2024 汨罗市校级开学)国家发改委和住建部等六部门发布通知,提到:2025年,农村生活垃圾无害化处理水平将明显提升,现阶段我国生活垃圾有填埋、焚烧、堆肥等三种处理方式,随着我国生态文明建设的不断深入,焚烧处理已逐渐成为主要方式,根据国家统计局公布的数据,对2013﹣2020年全国生活垃圾焚烧无害化处理厂的个数y(单位:座)进行统计,得到如下表格:
年份 2013 2014 2015 2016 2017 2018 2019 2020
年份代码x 1 2 3 4 5 6 7 8
垃圾焚烧无害化 处理厂的个数y 166 188 220 249 286 331 389 463
(1)根据表格中的数据,可用一元线性回归模型刻画变量y与变量x之间的线性相关关系,请用相关系数加以说明(精确到0.01);
(2)求出y关于x的线性回归方程(回归方程系数精确到0.01),并预测2024年全国生活垃圾焚烧无害化处理厂的个数;
(3)对于2035年全国生活垃圾焚烧无害化处理厂的个数,还能用(2)所求的线性回归方程预测吗?请简要说明理由,
参考公式:相关系数
回归方程中斜率和截距的最小二乘法估计公式分别为
参考数据:,
15.(2024 川汇区校级开学)某个男孩的年龄与身高的统计数据如表所示.
年龄x(岁) 1 2 3 4 5 6
身高y(cm) 78 87 98 108 115 120
(1)画出散点图;
(2)判断y与x是否具有线性相关关系.
期末热点.重难点 成对数据的统计相关性
参考答案与试题解析
一.选择题(共5小题)
1.(2024秋 汕头期末)我们研究成对数据(ai,bi)(i=1,2,…,10)的相关关系,其中ai=i(i=1,2,…,10),bi=ai(i=1,2,…,9),b10=a,在集合{8,11,12,13}中取一个元素作为a的值,使得这组成对数据的相关程度最强,则a=(  )
A.8 B.11 C.12 D.13
【考点】变量间的相关关系.
【专题】转化思想;转化法;概率与统计;运算求解.
【答案】B
【分析】根据相关性与线性回归方程的关系即可得到答案.
【解答】解:由bi=ai(i=1,2, ,9)可知前9个点在直线y=x上.
∵a10=10,
∴要使相关性最强,b10应更接近10,
在集合{8,11,12,13}中取一个元素作为a的值,
四个选项中11最接近10.
故选:B.
【点评】本题主要考查变量间的相关关系,属于基础题.
2.(2024秋 西青区校级月考)如图所示,5个(x,y)数据,去掉D(3,10)后,下列说法正确的是(  )
A.相关系数r变小
B.决定系数R2变小
C.残差平方和变小
D.解释变量x与预报变量y的相关性变弱
【考点】样本相关系数.
【专题】整体思想;综合法;概率与统计;运算求解.
【答案】C
【分析】由散点图知,去掉离群点D后,x与y的相关性变强,且为正相关,由此判断即可.
【解答】解:由散点图知,去掉离群点D后,x与y的相关性变强,且为正相关,
故D错误;
所以相关系数r的值变大,决定系数R2的值变大,残差平方和变小,
故A错误,B错误,C正确.
故选:C.
【点评】本题主要考查了散点图的应用,考查了变量间的相关关系,属于基础题.
3.(2024春 武强县校级期末)关于(x,y)的一组样本数据(1,0),(2,﹣1),(3,﹣2),(5,﹣4),…,(30,﹣29)的散点图中,所有样本点均在直线y=﹣x+1上,则这组样本数据的样本相关系数r为(  )
A.﹣2 B.﹣1 C.1 D.2
【考点】样本相关系数.
【专题】整体思想;分析法;概率与统计;运算求解.
【答案】B
【分析】根据相关系数的性质,结合题意,即可判断和选择.
【解答】解:因为所有样本点均在直线上,故|r|=1,
又y=﹣x+1,
故r=﹣1.
故选:B.
【点评】本题主要考查了相关系数的性质,属于基础题.
4.(2024秋 伊美区校级期中)在一组样本数据(x1,y1),(x2,y2),(x3,y3),…,(xn,yn)(n≥2,x1,x2,…,xn不全相等)的散点图中,若所有样本点(xi,yi)(i=1,2,3,…,n)都在直线上,则这组样本数据的样本相关系数为(  )
A.﹣1 B.0 C.1 D.
【考点】样本相关系数.
【专题】转化思想;转化法;概率与统计;运算求解.
【答案】A
【分析】根据已知条件,结合相关系数的定义,即可求解.
【解答】解:所有样本点(xi,yi)(i=1,2,3,…,n)都在直线上,
则这组样本数据的样本相关系数为﹣1.
故选:A.
【点评】本题主要考查相关系数的定义,属于基础题.
5.(2024秋 河东区校级月考)下列说法错误的是(  )
A.线性相关系数|r|越接近1,两个变量的线性相关程度越强
B.独立性检验可以100%确定两个变量之间是否具有某种关系
C.在回归分析中,可用残差图判断模型的拟合效果,残差点比较均匀地落在水平的带状区域中,说明这样的模型比较合适,带状区域的宽度越窄,说明模型的拟合精度越高
D.甲、乙两个模型的决定系数R2分别约为0.88和0.80,则模型甲的拟合效果更好
【考点】样本相关系数;独立性检验.
【专题】转化思想;综合法;概率与统计;运算求解.
【答案】B
【分析】利用线性相关系数、独立性检验、残差图、决定系数等相关概念,逐一判断选项即可得出结论.
【解答】解:由线性相关系数的定义可判断A正确,故A正确;
由独立性检验是存在某种程度的错误概率的,故B错误;
由回归分析残差概念以及残差图可判断C正确,故C正确;
决定系数R2的值越大,说明拟合效果越好,显然0.88>0.80,即模型甲的拟合效果更好,故D正确.
故选:B.
【点评】本题考查线性相关系数、独立性检验的概念,是基础题.
二.多选题(共4小题)
(多选)6.(2024春 大通县期末)两个具有线性相关关系的变量的一组数据为(x1,y1),(x2,y2), ,(xn,yn),则下列说法正确的是(  )
A.若相关系数r<0,则两个变量负相关
B.相关系数r的值越小,成对样本数据的线性相关程度越弱
C.决定系数R2越大,残差平方和越小,模型的拟合效果越好
D.决定系数R2越小,残差平方和越小,模型的拟合效果越好
【考点】样本相关系数;变量间的相关关系.
【专题】整体思想;综合法;概率与统计;运算求解.
【答案】AC
【分析】根据相关系数的概念可判定AB,根据决定系数的概念可判定CD.
【解答】解:对于A:因为r的符号反映相关关系的正负性,故A正确;
对于B:根据相关系数|r|越接近1,变量相关性越强,故B错误;
对于C:决定系数R2越大,残差平方和越小,效果越好,故C正确,D错误.
故选:AC.
【点评】本题主要考查了相关系数和决定系数的性质,属于基础题.
(多选)7.(2023秋 北海期末)下列各组的两个变量中呈正相关关系的是(  )
A.学生的身高与学生的化学成绩
B.汽车行驶的里程与它的耗油量
C.人的年龄与年收入
D.水果的重量与它的总价
【考点】变量间的相关关系.
【专题】转化思想;转化法;概率与统计;运算求解.
【答案】BD
【分析】根据已知条件,结合正相关关系的定义,即可求解.
【解答】解:学生的身高与学生的化学成绩没有必然联系,故A错误;
汽车行驶的里程与它的耗油量,呈正相关关系,故B正确;
人的年龄与年收入没有必然联系,故C错误;
水果的重量与它的总价,呈正相关关系,故D正确.
故选:BD.
【点评】本题主要考查正相关关系的定义,属于基础题.
(多选)8.(2024秋 成都期中)对于样本相关系数,下列说法正确的是(  )
A.样本相关系数可以用来判断成对样本数据相关的正负性
B.样本相关系数可以是正的,也可以是负的
C.样本相关系数越大,成对样本数据的线型相关程度越强
D.样本相关系数r∈[﹣1,1]
【考点】样本相关系数.
【专题】整体思想;综合法;概率与统计;运算求解.
【答案】ABD
【分析】利用相关系数与成对样本数据间的相关关系逐项判断,可得出合适的选项.
【解答】解:对于A,样本相关系数可以用来判断成对样本数据相关的正负性,故选项A正确;
对于B,样本相关系数可以是正的,也可以是负的,故选项B正确;
对于C,样本相关系数的绝对值越大,成对样本数据的线性相关程度也越强,故选项C错误;
对于D,样本相关系数r∈[﹣1,1],故D正确.
故选:ABD.
【点评】本题主要考查了相关系数的性质,属于基础题.
(多选)9.(2024 南关区校级模拟)已知变量x和变量y的一组成对样本数据(xi,yi)(i=1,2,…,n)的散点落在一条直线附近,,,相关系数为r,线性回归方程为,则(  )
参考公式:
A.当r越大时,成对样本数据的线性相关程度越强
B.当r>0时,0
C.时,成对样本数据(xi,yi)(i=1,2,…,n,n+1)的相关系数r′满足r′=r
D.时,成对样本数据(xi,yi)(i=1,2,…,n,n+1)的线性回归方程满足
【考点】样本相关系数.
【专题】对应思想;定义法;概率与统计;运算求解.
【答案】BCD
【分析】根据相关系数的特征可判断AB,再根据相关系数和线性回归方程斜率的计算公式可判断CD.
【解答】解:对于A,当r的绝对值越接近于1时,成对样本数据的线性相关程度越强,故A错误;
对于B,当r>0时,成对样本数据正相关,相关系数与符号相同,则,故B正确;
对于C,当,时,将这组数据添加后,,不变,故相关系数r的表达式中的分子和分母均不变,故C正确;
对于D,当,时,将这组数据添加后,,不变,则线性回归方程中斜率的分子和分母均不变,故,故D正确.
故选:BCD.
【点评】本题考查相关系数的特征以及相关系数和线性回归方程斜率的计算公式,属于中档题.
三.填空题(共3小题)
10.(2024秋 浦东新区校级期中)在研究线性回归模型时,样本数据(xi,yi)(i=1,2,3, ,n)所对应的点均在直线上,用r表示解释变量对于反应变量变化的线性相关度,则r=  ﹣1 .
【考点】样本相关系数;经验回归方程与经验回归直线.
【专题】整体思想;综合法;概率与统计;运算求解.
【答案】﹣1.
【分析】根据线性相关系数的定义直接得解.
【解答】解:由题意可知,已知样本数据(xi,yi)(i=1,2,3, ,n)所对应的点均在直线上,
由相关系数的定义可知,|r|=1,
又因为,
所以变量x,y之间是负相关,即r<0,
所以r=﹣1.
故答案为:﹣1.
【点评】本题主要考查了相关系数的性质,属于基础题.
11.(2024秋 广水市校级月考)若已知是的4倍,是的1.5倍,则相关系数r的值为   .
【考点】样本相关系数.
【专题】转化思想;转化法;概率与统计;运算求解.
【答案】.
【分析】根据已知条件,结合相关系数的公式,即可求解.
【解答】解:∵是的4倍,是的1.5倍,
∴.
故答案为:.
【点评】本题主要考查相关系数的公式,属于基础题.
12.(2024 江西模拟)已知成对样本数据(x1,y1),(x2,y2),…,(xn,yn)(n≥3)中x1,x2,…,xn互不相等,且所有样本点(xi,yi)(i=1,2,…,n)都在直线上,则这组成对样本数据的样本相关系数r= ﹣1 .
【考点】样本相关系数.
【专题】转化思想;转化法;概率与统计;运算求解.
【答案】﹣1.
【分析】根据给定条件,利用相关系数的定义求解作答.
【解答】解:因为所有样本点(xi,yi)(i=1,2,…,n)都在直线上,
显然直线的斜率,
所以样本数据成负相关,相关系数为﹣1.
故答案为:﹣1.
【点评】本题主要考查相关系数的定义,属于基础题.
四.解答题(共3小题)
13.(2025 柳州一模)某购物平台为了吸引更多的顾客在线购物,推出了A和B两个套餐服务,并在购物平台上推出了优惠券活动,顾客可自由选择A和B两个套餐之一,如图是该购物平台7天销售优惠券的情况(单位:千张)的折线图:
(1)由折线图可看出,可用回归模型拟合y与t的关系,请用相关系数加以说明;
(2)假设每位顾客选择A套餐的概率为,选择B套餐的概率为,其中A包含一张优惠券,B套餐包含两张优惠券,截止某一时刻,该平台恰好销售了n张优惠券,设其概率为Pn,求Pn;
(3)记(2)中所得概率Pn的值构成数列{Pn}(n∈N*),求数列{Pn}的最值.
参考数据:,,,.
参考公式:相关系数.
【考点】样本相关系数;数列的应用.
【专题】应用题;分类讨论;对应思想;定义法;等差数列与等比数列;概率与统计;运算求解.
【答案】(1)相关系数近似为0.9632,说明y与t的相关程度相当高,可以用线性回归模型拟合y与t的关系;
(2)Pn;
(3)最大值为,最小值为.
【分析】(1)由折线图中数据和附注中参考数据,求出相关系数,判断即可;
(2)计算Pn﹣Pn﹣1,判断{Pn﹣Pn﹣1}是等比数列,求解即可;
(3)讨论n的奇偶性,求出数列{Pn}的最值.
【解答】解:(1)由折线图中数据和附注中参考数据得,,,

所以,
因为y与t的相关系数近似为0.9632,说明y与t的相关程度相当高,从而可以用线性回归模型拟合y与t的关系;
(2)依题意得,,其中,,
则,
所以{Pn﹣Pn﹣1}是以首项为,公比为的等比数列,
故成立,
则有,
所以,
又因为,
所以;
(3)当n为偶数时,,单调递减,最大值为,n→+∞,,
当n为奇数时,,单调递增,最小值为,n→+∞,,
所以数列{Pn}的最大值为,最小值为.
【点评】本题考查了线性相关性与等比数列的应用问题,是中档题.
14.(2024 汨罗市校级开学)国家发改委和住建部等六部门发布通知,提到:2025年,农村生活垃圾无害化处理水平将明显提升,现阶段我国生活垃圾有填埋、焚烧、堆肥等三种处理方式,随着我国生态文明建设的不断深入,焚烧处理已逐渐成为主要方式,根据国家统计局公布的数据,对2013﹣2020年全国生活垃圾焚烧无害化处理厂的个数y(单位:座)进行统计,得到如下表格:
年份 2013 2014 2015 2016 2017 2018 2019 2020
年份代码x 1 2 3 4 5 6 7 8
垃圾焚烧无害化 处理厂的个数y 166 188 220 249 286 331 389 463
(1)根据表格中的数据,可用一元线性回归模型刻画变量y与变量x之间的线性相关关系,请用相关系数加以说明(精确到0.01);
(2)求出y关于x的线性回归方程(回归方程系数精确到0.01),并预测2024年全国生活垃圾焚烧无害化处理厂的个数;
(3)对于2035年全国生活垃圾焚烧无害化处理厂的个数,还能用(2)所求的线性回归方程预测吗?请简要说明理由,
参考公式:相关系数
回归方程中斜率和截距的最小二乘法估计公式分别为
参考数据:,
【考点】样本相关系数;一元线性回归模型.
【专题】对应思想;定义法;概率与统计;运算求解.
【答案】(1)答案见解析;
(2),595;
(3)答案见解析.
【分析】(1)根据相关系数的公式,即可代入求值,根据相关系数的大小即可作出判断;
(2)利用参考公式及参考数据求,由此可得回归方程,利用回归方程预测2024年全国生活垃圾焚烧无害化处理厂的个数;
(3)根据相关关系不是确定的函数关系,而受多因素影响,即可求解.
【解答】解:(1),
相关系数

因为y与x的相关系数r=0.98,接近1,所以y与x的线性相关程度很高,
所以可用线性回归模型拟合y与x的关系.
(2),

又2024年对应的年份代码x=12,
当x=12时,,
所以预测2024年全国生活垃圾焚烧无害化处理厂的个数为595.
(3)对于2035年全国生活垃圾焚烧无害化处理厂的个数,不能由(2)所求的线性回归方程预测,理由如下(说出一点即可):
①线性回归方程具有时效性,不能预测较远情况;
②全国生活垃圾焚烧无害化处理厂的个数有可能达到上限,一段时间内不再新建;
③受国家政策的影响,可能产生新的生活垃圾无害化处理方式.
【点评】本题主要考查了相关系数的求解和性质,考查了利用最小二乘法求线性回归方程,属于中档题.
15.(2024 川汇区校级开学)某个男孩的年龄与身高的统计数据如表所示.
年龄x(岁) 1 2 3 4 5 6
身高y(cm) 78 87 98 108 115 120
(1)画出散点图;
(2)判断y与x是否具有线性相关关系.
【考点】变量间的相关关系.
【专题】转化思想;综合法;概率与统计;运算求解.
【答案】(1)图见解析;
(2)具有.
【分析】(1)利用表中数据描点可得出散点图.
(2)观察散点图可得y与x具有线性相关关系.
【解答】解:(1)散点图如图所示.
(2)由图知,所有数据点接近一条直线排列,因此,认为y与x具有线性相关关系.
【点评】本题主要考查变量间的相关关系,属于基础题.
21世纪教育网(www.21cnjy.com)

展开更多......

收起↑

资源预览