突破练65 成对数据的统计分析--2026全国版高中数学突破练(含答案)

资源下载
  1. 二一教育资源

突破练65 成对数据的统计分析--2026全国版高中数学突破练(含答案)

资源简介

中小学教育资源及组卷应用平台
2026全国版高中数学突破练
突破练65 成对数据的统计分析
(单项选择题每小题5分,多项选择题每小题6分)
基础·满分练
1.(2024·天津,3)下列图中,相关系数最大的是(  )
A. B.
C. D.
2.(2025·浙江温州模拟)为了研究某种商品的广告投入x(单位:万元)和收益y(单位:万元)之间的相关关系,某研究小组收集了5组样本数据如表所示,得到经验回归方程为x+0.28,则当广告投入为10万元时,收益的预测值为(  )
x/万元 1 2 3 4 5
y/万元 0.50 0.80 1.00 1.20 1.50
A.2.48万元 B.2.58万元
C.2.68万元 D.2.88万元
3.(2025·上海徐汇模拟)在研究一元线性回归模型时,若样本数据(xi,yi)(i=1,2,3,…,n)所对应的点都在直线y=-x+2上,则两组数据xi和yi(i=1,2,3,…,n)的线性相关系数为(  )
A.-1 B.1 C.- D.2
4.(2025·山东泰安三模)对于响应变量Y,通过观测得到的数据称为观测值,通过经验回归方程得到的称为预测值,观测值减去预测值称为残差.将某公司新产品自上市起的月份x与该月的对应销量y(单位:万件)整理成如下表格.
月份x 1 2 3 4 5
销量y 0.5 s 1 t 1.4
建立y与x的经验回归方程为=0.21x+0.37,则第2个月和第4个月的残差和为(  )
A.-0.919 B.-0.1 C.0.1 D.0.919
5.(2025·辽宁二模)某实验中学为调查本校高三学生的学习成绩是否与坚持体育锻炼有关,随机选取了高三300名学生的某次联考成绩进行统计,得到如下表格:
分数 是否坚持锻炼 合计
坚持锻炼 不坚持锻炼
分数≥600 100 80 180
分数<600 50 70 120
合计 150 150 300
依据小概率值α=m的独立性检验,可以认为高三学生的学习成绩与坚持进行体育锻炼有关,则m的值可能是(  )
附:χ2=,n=a+b+c+d.
α 0.1 0.05 0.01 0.005 0.001
xα 2.706 3.841 6.635 7.879 10.828
A.0.001 B.0.005
C.0.01 D.0.05
6.(多选)(2025·广东佛山模拟)某人调查了10名男大学生的身高y(单位:cm)及其父亲身高x(单位: cm)的数据(xi,yi)(i=1,2,…,10),已知其中一组数据为(182,185),且xi=1 750,求得经验回归方程为=0.65x+63,并绘制了如下残差图(残差=观测值-预测值),则(  )
A.这10名男大学生的身高的平均数为176.75
B.由残差图可判定儿子身高与父亲身高的关系不符合上述回归模型
C.数据(182,185)对应的残差为3.7
D.去掉数据(182,185)后,重新求得的经验回归直线的决定系数R2变小
7.(多选)(2025·广东揭阳模拟)为保护学生视力、促进学生身心健康发展,某中学研究型学习小组从该校学生中按男、女生比例,采用分层随机抽样的方法选取了100名学生(其中男生60人,女生40人),调查他们每日使用手机的时间.若每日使用手机时间超过40分钟,则认为该生手机成瘾.根据统计数据得到如图所示的等高堆积条形图,用样本估计总体,用频率估计概率,下列说法正确的有(  )
附:χ2=,n=a+b+c+d.
α 0.1 0.01 0.001
xα 2.706 6.635 10.828
A.该校男生和女生人数之比约为3∶2
B.根据小概率值α=0.01的独立性检验,可以认为手机是否成瘾与学生性别有关
C.从该校学生中随机抽取一名学生,则该生手机成瘾的概率为
D.从该校学生中抽到一名手机成瘾的学生,则该生是男生的概率为
8.(原创)针对“中学生追星问题”,某校团委对“学生性别和中学生追星是否有关”做了一次调查,其中女生人数是男生人数的,男生追星的人数占男生人数的,女生追星的人数占女生人数的,若根据小概率值α=0.01的独立性检验,判断中学生追星与性别有关,则男生人数至少为     .
参考公式:χ2=,其中n=a+b+c+d.
α 0.05 0.01 0.001
xα 3.841 6.635 10.828
能力·高分练
9.(2025·江西九江二模)植物的根是吸收水分和矿物养分的主要器官.已知在一定范围内,小麦对氮元素的吸收量与它的根长度具有线性相关关系.某盆栽小麦实验中,在确保土壤肥力及灌溉条件相对稳定的情况下,统计了根长度x(单位:cm)与氮元素吸收量y(单位:mg/天)的相关数据,如下表所示:
x 9.9 12.1 14.8 18.2 19.9 21.8 25.1 27.7 30.4 32.1
y 0.30 0.34 0.42 0.50 0.55 0.60 0.71 0.74 0.78 0.86
根据表中数据可得=21.2,=0.58及经验回归方程为=0.025x+,则(  )
A.=-0.05
B.变量y与x的相关系数r<0
C.在一定范围内,小麦的根长度每增加1 cm,它一天的氮元素吸收量平均增加0.025 mg
D.若对小麦的根长度与钾元素吸收量的相关数据进行统计,则对应经验回归方程不变
10.已知某独立性检验中,由χ2=,n=a+b+c+d计算出χ2=≠0,若将2×2列联表中的数据a,b,c,d分别变成4a,4b,4c,4d,计算出的χ2=,则的     倍.
11.(2025·河北邢台模拟)一组数据(xi,yi)(i=1,2,…,8)的散点图趋向于落在中间下凸且递增的某条曲线附近,现用模型y=aebx拟合数据组(xi,yi)(i=1,2,…,8),其中x1+x2+…+x8=6,设z=ln y,变换后的经验回归方程为=x+3,则ab=     ,y1y2…y8=     .
素养·提升练
12.(2025·上海浦东新区模拟)研究变量x,y得到一组成对数据(xi,yi),i=1,2,…,n,先进行一次线性回归分析,接着增加一个数据(xn+1,yn+1),其中xn+1=xi,yn+1=yi,再重新进行一次线性回归分析,则下列说法正确的是(  )
A.变量x与变量y的相关性变强
B.相关系数r的绝对值变小
C.经验回归方程x+不变
D.残差平方和变大
参考答案
1.A 观察4个选项可知,选项A中的散点分布比较集中,且基本接近某一条直线,线性回归模型拟合效果比较好,呈现明显的正相关.故选A.
2.C 由=3,
=1,可得数据的样本中心点为(3,1),代入经验回归方程得1=3+0.28,解得=0.24,所以当x=10时,y=0.24×10+0.28=2.68.故选C.
3.A 若样本数据(xi,yi)(i=1,2,3,…,n)所对应的点都在直线y=-x+2上,则两组数据xi和yi(i=1,2,3,…,n)的线性相关系数为-1.故选A.
4.C 由题意可得=3,,将其代入经验回归方程,得=1,故s+t=2.1,将x=2,x=4分别代入经验回归方程,则第2,4个月的预测值分别为=0.21×2+0.37=0.79,=0.21×4+0.37=1.21,故第2个月和第4个月的残差和为s-0.79+t-1.21=0.1.故选C.
5.D 由题意得,χ2=5.6,结合表格数据及选项,可以认为高三学生的学习成绩与坚持进行体育锻炼有关,则m的值可能是0.05.故选D.
6.AC ()满足经验回归方程,代入=175,计算可得=176.75,故A正确;从残差图中可以看到残差比较均匀地分布在以均值为0、横轴为对称轴的水平带状区域内,满足上述回归模型,故B错误;代入x=182,得=181.3,因此残差为185-181.3=3.7,故C正确;由残差图可知(182,185)是一个极端数据,去掉后重新求得的经验回归直线拟合程度会变好,决定系数R2变大,D错误.故选AC.
7.AC 根据分层随机抽样的抽样比可知,样本中男生和女生人数之比为60∶40=3∶2,用样本估计总体可知全校男生和女生人数之比约为3∶2,故A正确;样本中男生有60×0.2=12人手机成瘾,有60-12=48人不成瘾,女生有40×0.4=16人手机成瘾,有40-16=24人不成瘾,零假设H0:手机是否成瘾与学生的性别无关,故χ2=4.762<6.635=xα=0.01,根据小概率值α=0.01的独立性检验,没有充分的证据推断H0不成立,因此可以认为H0成立,即手机是否成瘾与学生的性别无关,故B错误;结合样本数据以及等高堆积条形图可知,样本的100人中有28人手机成瘾,所以样本中学生手机成瘾的频率为,用频率估计概率可知,从该校学生中随机抽取一名学生,该生手机成瘾的概率为,故C正确;根据条件概率可知,在样本中抽到一名手机成瘾的学生,该生是男生的概率为,用样本估计总体可知该校学生中抽到一名手机成瘾的学生,该生是男生的概率也为,故D错误.故选AC.
8.48 设男生人数为x,依题意可得列联表如下:
性别 喜欢追星 不喜欢追星 合计
男 x

合计
根据小概率值α=0.01的独立性检验,判断中学生追星与性别有关,则χ2≥6.635,由χ2=6.635,解得x≥44.233.由题意知,x应为6的整数倍,所以若根据小概率值α=0.01的独立性检验,判断中学生追星与性别有关,则男生至少有48人.
9.C 由经验回归方程过样本中心点()知,=0.58-0.025×21.2=0.05,故A错误;小麦对氮元素的吸收量与它的根长度具有正相关关系,故相关系数r>0,故B错误;由经验回归方程y=0.025x+a可得,在一定范围内,小麦的根长度每增加1 cm,它一天的氮元素吸收量平均增加0.025 mg,故C正确;若研究小麦的根长度与钾元素吸收量的相关关系,经验回归方程可能发生改变,故D错误.故选C.
10.4 因为,
所以=4
11.e3 e30 由y=aebx,两边同时取对数,可得ln y=ln aebx=bx+ln a,因为变换后的经验回归方程为=x+3,可得b=1,ln a=3,即a=e3,b=1,所以ab=e3.又因为x1+x2+…+x8=6,且=x+3,所以+…+=(x1+3)+(x2+3)+…+(x8+3)=6+24=30.因为z=ln y,可得y=ez,所以y1y2…y8==e30.
12.C 设变量x,y的平均数分别为,则xi,yi,即=xn+1,=yn+1,可知新数据的样本中心点不变,仍为(),则(xi-)2=(xi-)2+(yi-)2+(xi-)(yi-)=(xi-)(yi-)+(xn+1-)(yn+1-)=(xi-)(yi-),则相关系数
r=
=
可知相关系数r的值不变,变量x与变量y的相关性不变,故A,B错误;对于C,因为,所以不变,且经验回归方程过样本中心点(),即均不变,所以经验回归方程y=x+不变,故C正确;因为(xn+1,yn+1)即为样本中心点,即=yn+1,可知残差平方和不变,故D错误.故选C.
21世纪教育网 www.21cnjy.com 精品试卷·第 2 页 (共 2 页)
21世纪教育网(www.21cnjy.com)

展开更多......

收起↑

资源预览