21 统计与成对数据的统计分析--高三数学三轮冲刺(答案版)

资源下载
  1. 二一教育资源

21 统计与成对数据的统计分析--高三数学三轮冲刺(答案版)

资源简介

中小学教育资源及组卷应用平台
二十一 统计与成对数据的统计分析
题型一 样本估计总体
用频率分布直方图估计样本的数字特征
(1)平均数:(表示第个小矩形底边中点的横坐标,表示第个小矩形的面积).
(2)方差:
(3)众数:最高小矩形底边中点的横坐标
(4)中位数:把频率分布直方图划分为左右两个面积相等的部分时,分界线与横轴交点的横坐标,
(5)百分位数:类比中位数,百分位数所在直线把频率分布直方图划分为左右两个部分,左边所有矩形的面积和为p%.中位数是第50百分位数.
【例1】(2025·河南洛阳·二模)(2025·广东揭阳·二模)洛阳是我国著名的牡丹之乡,以“洛阳地脉花最宜,牡丹尤为天下奇”流传于世.某种植基地通过植株高度研究牡丹的生长情况,从同一批次牡丹中随机抽取100株的植株高度(单位:)作为样本,得到如图所示的频率分布直方图,则下列结论正确的是( )

A.基地牡丹植株高度的极差的估计值大于50
B.基地牡丹植株高度不高于70的频率估计值为30%
C.基地牡丹植株高度的众数与中位数的估计值相等
D.基地牡丹植株高度的第75百分位数的估计值小于80
【解题指导】频率分布直方图中的数据求极差判断A→计算各小组频率判断B→中位数位于→列方程→求出中位数并算众数判断C→各小组的概率知基地牡丹植株高度的第75百分位数的估计值应在内判断D
【答案】BC
【解析】对于A项,由图象可知,基地牡丹植株高度范围在之间,所以极差的估计值应不大于50,故A错误;
对于B项,基地牡丹植株高度不高于70的频率为.故B正确;
对于C项,由频率分布直方图可知,基地牡丹植株高度不高于70的频率为,不高于的频率为,所以中位数位于,设为,
则应有,计算可得.
【技巧】中位数左边和右边的小长方形的面积和相等
众数估计为的中点,也是,与中位数相同.故C正确;
【技巧】最高的小长方形底边中点的横坐标即众数
对于D项,基地牡丹植株高度不高于的频率为,不高于的频率为,
所以,基地牡丹植株高度的第75百分位数的估计值应在内.故D错误.
故选:BC.
【例2】(2024·新课标Ⅱ卷T4)某农业研究部门在面积相等的100块稻田上种植一种新型水稻,得到各块稻田的亩产量(单位:kg)并整理如下表
亩产量 [900,950) [950,1000) [1000,1050) [1050,1100) [1100,1150) [1150,1200)
频数 6 12 18 30 24 10
根据表中数据,下列结论中正确的是( )
A.100块稻田亩产量的中位数小于1050kg
B.100块稻田中亩产量低于1100kg的稻田所占比例超过80%
C.100块稻田亩产量的极差介于200kg至300kg之间
D.100块稻田亩产量的平均值介于900kg至1000kg之间
【思维探究】
看到什么 想到什么
频率分布表 对表格中数据进行观察、比较、分析
100块稻田亩产量的中位数小于1050kg 联想中位数定义,在表格中寻找相关数据进行比较和判断
100块稻田中亩产量低于1100kg的稻田所占比例超过80% 观察确定相关数据,估算相关频率
100块稻田亩产量的极差介于200kg至300kg之间 联想极差定义,利用表格数据进行计算、比较
100块稻田亩产量的平均值介于900kg至1000kg之间 由平均数定义,观察确定相关数据,进行估算、比较、判断
【答案】C
【解析】对于 A, 根据频数分布表可知, ,
所以亩产量的中位数不小于 , 故 A 错误;
对于B,亩产量不低于的频数为,
所以低于的稻田占比为,故B错误;
对于C,稻田亩产量的极差最大为,最小为,故C正确;
对于D,由频数分布表可得,平均值为,故D错误,故选C.
题型二 回归方程
【例3】(2025安徽师大质检)某研究小组为了解青少年的身高与体重的关系,随机从15岁人群中选取了9人,测得他们的身高(单位:cm)和体重(单位:kg),得到如下数据:
样本号 1 2 3 4 5 6 7 8 9 均值
身高 165 157 156 173 163 159 177 161 165 164
体重 53 46 48 56 57 49 60 45 54 52
(1)若两组变量间的样本相关系数满足,则称其为高度相关,试判断青少年身高与体重是否高度相关,说明理由(精确到0.01);
(2)建立关于的经验回归方程,并预测某同学身高为时,体重的估计值(保留整数).
参考数据:,,,,.
参考公式:样本相关系数,经验回归方程中斜率和截距最小二乘估计公式分别为:,.
【解】(1)Step 1:计算
.
Step 2:计算相关关系,从直观上分析数据间是否存在线性相关关系
因为(或)
所以,即身高与体重间是高度相关的;
Step 3:代入公式,求出=x+中参数,的值
因为,
所以,
Step 4:写出经验回归方程并对实际问题作出估计.
所以体重关于身高的回归方程为, 所以当时,.
即某同学身高为时,体重大概为
题型三 独立性检验
【例4】(2025·全国一卷T15)调查1000人是否患某疾病与超声波检测结果的到联表如下:
是否患病 是否患病 检测结果 正常 不正常 合计
患病 20 180 200
不患病 780 20 800
合计 800 200 1000
(1)若检测结果不正常者患病的概率为,求的估计值;
(2)能否根据小概率的独立性检验认为样本数据中超声波检测结果是否患该疾病有关?
了解试题背景,生产线智能化升级改造②对图表中甲、乙车间数据整合
联想独立性检验的相关原理和步骤,进行相关数据的计算和判断
了解力的含义
明确判断该工厂产品的优级品率是否提高的方法
【思维探究】
看到什么 想到什么
检测结果不正常者患病的概率为 频率估计概率,古典概型的概率公式
小概率的独立性检验 联想独立性检验的相关原理和步骤,进行相关数据的计算χ2
检测结果是否患该疾病有关 与临界值xα比较,根据检验规则得出推断结论
【解】(1)超声波检查结果不正常患者有200人,患病有180人,
所以
(2)零假设为H0:样本数据中超声波检测结果是否患该疾病无关
【技巧】比较χ2与临界值的大小关系,作统计推断
所以说认为样本数据中超声波检测结果是患该疾病有关
【通关训练】
1.(2025·全国二卷T1)样本数据2,8,14,16,20的平均数为( )
A.8 B.9 C.12 D.18
【答案】C
【解析】样本数据的平均数为,故选:C.
2.(2024·天津卷T3)下列图中,线性相关性系数最大的是( )
A.B.C. D.
【答案】A
【解析】观察4幅图可知,A图散点分布比较集中,且大体接近某一条直线,线性回归模型拟合效果比较好,呈现明显的正相关,值相比于其他3图更接近1,故选A
3.(2022·天津卷T4)将1916到2015年的全球年平均气温(单位:),共100个数据,分成6组:,并整理得到如下的频率分布直方图,则全球年平均气温在区间内的有( )
A.22年 B.23年 C.25年 D.35年
【答案】B
【解析】全球年平均气温在区间内的频率为,
则全球年平均气温在区间内的有年,故选B.
4.(2025·江西宜春·二模)已知一组数据,,,,的分位数是,则的取值范围为( )
A. B. C. D.
【答案】C
【解析】因为,
所以数据,,,,的分位数为五个数中第二大的数,
由已知数据,,,,中第二大的数是,所以,故选C.
5.(2022·全国甲卷T2)某社区通过公益讲座以普及社区居民的垃圾分类知识.为了解讲座效果,随机抽取10位社区居民,让他们在讲座前和讲座后各回答一份垃圾分类知识问卷,这10位社区居民在讲座前和讲座后问卷答题的正确率如下图:
则( )
A.讲座前问卷答题的正确率的中位数小于
B.讲座后问卷答题的正确率的平均数大于
C.讲座前问卷答题的正确率的标准差小于讲座后正确率的标准差
D.讲座后问卷答题的正确率的极差大于讲座前正确率的极差
【答案】B
【解析】讲座前中位数为,所以错;
讲座后问卷答题的正确率只有一个是个,剩下全部大于等于,所以讲座后问卷答题的正确率的平均数大于,所以B对;
讲座前问卷答题的正确率更加分散,所以讲座前问卷答题的正确率的标准差大于讲座后正确率的标准差,所以C错;
讲座后问卷答题的正确率的极差为,
讲座前问卷答题的正确率的极差为,所以错.
故选:B.
6.(2025·江西萍乡·一模)某中学有初中生600名,高中生200名,为保障学生的身心健康,学校举办“校园安全知识”了竞赛.现按比例分配的分层随机抽样的方法,分别抽取初中生名,高中生名,经统计:名学生的平均成绩为74分,其中名初中生的平均成绩为72分,名高中生的平均成绩为分,则( )
A.74 B.76 C.78 D.80
【答案】D
【解析】由题意,得可得,解得.故选:D.
7.已知变量的关系可以用模型拟合,设,其变换后得到一组数据如下.由上表可得线性回归方程,则( )
x 1 2 3 4 5
z 2 4 5 10 14
A. B. C. D.
【答案】B
【解析】由表格数据知,.即样本中心点为,
由,得,即,
所以,即,可得,故选B.
8.(2025·山东临沂·三模)某班成立了A、B两个数学兴趣小组,A组10人,B组30人,经过一周的补习后进行了一次测试,在该测试中,A组平均成绩为130分,方差115,B组平均成绩为110分,方差为215,则在这次测试中,全班学生的平均成绩和方差为( )
A.115分,105 B.115分,265
C.120分,105 D.120分,265
【答案】B
【解析】依题意,,
所以全班学生的平均成绩(分);
全班学生成绩的方差为
.故选B
9.(多选)(2025·四川攀枝花·三模)小张同学对具有线性相关的两个变量x和y进行了统计分析,得到了右表,其中一些数据丢失,只记得这组数据拟合出的y关于x的经验回归方程为,若成等差数列,则( )
x 4 6 8 10 12
y a 2 b c 6
A.变量x与y的样本相关系数 B.
C.当时,残差为 D.当时,y的预测值为
【答案】BCD
【解析】由表格中的数据可计算平均数:,

又因为成等差数列,所以,则,
根据经验回归方程为必过点,
则,解得,故B正确;
由于经验回归方程为是递增的一次函数,所以两个变量是正相关,
则样本相关系数,故A错误;
当时,,所以残差为,故C正确;
当时,,所以y的预测值为,故D正确;
故选:BCD.
10.(多选)(2023·新课标Ⅰ卷T9)有一组样本数据,其中是最小值,是最大值,则( )
A.的平均数等于的平均数
B.的中位数等于的中位数
C.的标准差不小于的标准差
D.的极差不大于的极差
【答案】BD
【解析】对于选项A:设的平均数为,的平均数为,
则,
因为没有确定的大小关系,所以无法判断的大小,
例如:,可得;
例如,可得;
例如,可得;故A错误;
对于选项B:不妨设,
可知的中位数等于的中位数均为,故B正确;
对于选项C:举反例说明,例如:,则平均数,
标准差,
,则平均数,
标准差,显然,即,
所以的标准差不小于的标准差,这一论断不成立,故C错误;
对于选项D:不妨设,
则,当且仅当时,等号成立,故D正确;
故选:BD.
11.某社区为了解本社区中老年人锻炼身体的方式,在全社区范围内随机抽查部分中老年人,了解到锻炼方式有:-走路 -骑行 -打球 -其他方式,且统计得知走路锻炼占45%,并将收集的数据整理绘制得到如图所示不完整的统计图,则打球锻炼的人数为 .
【答案】120
【解析】由条形统计图可知走路锻炼的有360人,且占总体的45%,
所以抽查360的总人数为(人),
所以打球锻炼的人数为(人).
12.(2025·江西·三模)某产品的标准质量是100克/袋,抽取该产品8袋,称出各袋的质量(单位:克)如下:
这8袋产品中,质量在以平均数为中心,1倍标准差范围内的有 袋
【答案】6
【解析】根据题意,这8袋产品的平均质量为克,
方差为,
则标准差为.那么质量在以平均数为中心,1倍标准差范围内,
即在内的有6袋.
13.“数学好玩”是国际著名数学家陈省身赠送给少年数学爱好者们的一句话.某校为了更好地培养学生创新精神和实践能力,特举办数学竞赛活动,在活动中,共有19道题.从所有答卷中随机抽取100份作为样本,将样本的成绩(满分100分,成绩均为不低于40分的整数)分成六段:,,…,,得到如图所示的频率分布直方图.
(1)求频率分布直方图中的值及样本成绩的上四分位数;
(2)已知落在的平均成绩是54,方差是7,落在的平均成绩为66,方差是4,求两组成绩合并后的平均数和方差.
【解】(1)因为频率之和为1,所以,
解得.
成绩落在内的频率为,
落在内的频率为,
设第分位数为,则,
由,得,
所以样本成绩的第分位数为84.
综上,;上四分位数为84.
(2)由图可知,成绩在的人数为,
成绩在的人数为,
故这两组成绩的总平均数,
总方差.
综上,总平均数;总方差.
14.(2024·全国甲卷T18)某工厂进行生产线智能化升级改造,升级改造后,从该工厂甲、乙两个车间的产品中随机抽取150件进行检验,数据如下:
优级品 合格品 不合格品 总计
甲车间 26 24 0 50
乙车间 70 28 2 100
总计 96 52 2 150
(1)填写如下列联表:
优级品 非优级品
甲车间
乙车间
能否有的把握认为甲、乙两车间产品的优级品率存在差异?能否有的把握认为甲,乙两车间产品的优级品率存在差异?
(2)已知升级改造前该工厂产品的优级品率,设为升级改造后抽取的n件产品的优级品率.如果,则认为该工厂产品的优级品率提高了,根据抽取的150件产品的数据,能否认为生产线智能化升级改造后,该工厂产品的优级品率提高了?()
附:
0.050 0.010 0.001
k 3.841 6.635 10.828
【解】(1)根据题意可得列联表:
优级品 非优级品
甲车间 26 24
乙车间 70 30
可得,
因为,
所以有的把握认为甲、乙两车间产品的优级品率存在差异,没有的把握认为甲,乙两车间产品的优级品率存在差异.
(2)由题意可知:生产线智能化升级改造后,该工厂产品的优级品的频率为,
用频率估计概率可得,
又因为升级改造前该工厂产品的优级品率,
则,
可知,
所以可以认为生产线智能化升级改造后,该工厂产品的优级品率提高了.
21世纪教育网 www.21cnjy.com 精品试卷·第 2 页 (共 2 页)
21世纪教育网(www.21cnjy.com)

展开更多......

收起↑

资源预览