第01讲 随机抽样、统计图表、用样本估计总体(专项训练) (含答案)2026年高考数学一轮复习讲练测(全国通用)

资源下载
  1. 二一教育资源

第01讲 随机抽样、统计图表、用样本估计总体(专项训练) (含答案)2026年高考数学一轮复习讲练测(全国通用)

资源简介

中小学教育资源及组卷应用平台
第01讲 随机抽样、统计图表、用样本估计总体
目录
01 常考题型过关练
题型01 随机抽样、分层抽样
题型02 统计图表
题型03 频率分布直方图
题型04百分位数
题型05 样本的数字特征
题型06 总体集中趋势估计
题型07 总体离散程度估计
题型08 分层方差问题
02 核心突破提升练
03 真题溯源通关练
01 随机抽样、分层抽样
1.某校从500名同学中用随机数法抽取30人参加这一项调查.将这500名同学编号为001,002,…500,假设从第1行第4列的数字开始,则第5个被抽到的同学的编号为( )
3484 4217 5572 1754 5560 8331
0474 4767 2176 3350 2583 9212
0676 6301 6378 5916 9555 6719
A.331 B.047 C.447 D.672
2.某校高一年级有720名学生,现用比例分配的分层随机抽样方法抽取一个容量为48的样本,其中身高在175cm以下的学生人数为32,则该校高一年级身高在175cm以下的学生人数为( )
A.320 B.360 C.420 D.480
3.设总体由编号为的60个个体组成,利用下面的随机数表选取6个个体,选取方法是从该随机数表第1行的第6个数字开始由左到右依次选取两个数字,则选出来的第4个个体的编号为 .
5044664421 6606580562 6155643502 4235489632 1452415248
2266221586 2663754199 5842367224 5837521851 0337183911
4.某公司青年、中年、老年员工的人数之比为,从中抽取100名作为样本,若每人被抽中的概率是,则该公司青年员工的人数为 .
5.某市为了调查教师对统计软件的了解程度,拟采用比例分配的分层随机抽样的方法从A,B,C三所学校抽取60名教师进行调查,已知A,B,C三所学校分别有180,270,90名教师,则从A学校中应抽取的人数为 .
02 统计图表
6.(多选)新高一学生会对物理、历史2门课程进行选科,每位同学从中选择1门课程学习.现对该校2000名学生的选科情况进行了统计,如图①,并用比例分配的分层随机抽样的方法从中抽取的学生对所选课程进行了满意率调查,如图②.
则下列说法正确的是( )
A.满意率调查中抽取的样本容量为2000
B.该校学生中对物理课程满意的人数约为720
C.若抽取的学生中对历史课程满意的人数为32,则=80
D.抽取的学生中对物理课程满意的人数多于对历史课程满意的人数
7.(多选)2025年4月23日,在第四届全民阅读大会上正式发布了2024年度中国数字阅读报告.统计了我国近五年数字阅读用户规模和网民规模数据,如图所示,则( )
A.2024年,我国数字阅读用户规模占网民规模的五成以上
B.近五年,我国数字阅读用户规模的增长量比网民规模的增长量大
C.从2020年至2024年,我国数字阅读用户规模逐年递增
D.从2020年至2024年,我国网民规模的增长率逐年递增
8.(多选)的监测值是用来评价环境空气质量的指标之一.划分等级为日均值在以下,空气质量为一级;在,空气质量为二级;超过为超标.如图是某地12月1日至10日的日均值(单位:),则下列说法正确的是()
A.这10天的日均值逐日增大
B.这10天中日均值的平均值是48.8
C.从日均值看,前5天的日均值的标准差小于后5天的日均值的标准差
D.这10天日均值超标的有3天
9.(多选)佛山50公里徒步自2016年首次推出5条路线实现“五龙汇聚”,参与人数逐年增加,到2025年,现场参与人数为45万人,这不仅是一场全民健身的狂欢,更是佛山城市品牌的一次璀璨展示.下面分别为2016年佛山50公里徒步参与人数的扇形统计图(图1)、2025年佛山50公里徒步参与人数的条形统计图(图2,单位:万人),已知2025年高明线的参与人数是2016年的2倍,则( )
A.2016年佛山50公里徒步总的参与人数是20万
B.2025年顺德线的参与人数超过了2016年南海线与顺德线的参与人数总和
C.五条线的参与人数2025年与2016年相比增加人数最少的是三水线
D.五条线的参与人数2025年与2016年相比增长率最高的是南海线
10.为响应国家“体重管理年”三年行动的号召,某单位开展健步走活动,现统计该单位400名员工5月4日至5月10日的步数信息.其中甲、乙两位员工这7天的步数折线图如图1所示:
(1)求从这7天中随机选取一天,该天甲比乙的步数多的概率;
(2)整理这400名员工7天的健步走数据,得到频率分布直方图如图2所示.现将该单位员工每天的步数从多到少进行排名,已知某天甲与乙的步数排名分别为第283名和第130名,试判断这是哪一天的数据,并说明理由.
03 频率分布直方图
11.为了让学生了解环保知识,增强环保意识,某中学举办了一次环保知识竞赛,共有900名学生参加了这次竞赛.为了了解本次竞赛的成绩情况,从中抽取了部分学生的成绩(得分均为整数,满分为100分)进行统计.请你根据尚未完成并有局部污损的频数分布表和频数分布直方图,解答下列问题:
分组 频数 频率
50.5~60.5 4 0.08
60.5~70.5 0.16
70.5~80.5 10
80.5~90.5 16 0.32
90.5~100.5
合计 50
(1)填充频数分布表的空格(将答案直接填在表格内);
(2)补全频数分布直方图;
(3)若成绩在75.5~85.5的学生为二等奖,问获得二等奖的学生约为多少人?
12.天安门广场国旗的升降时间是根据北京的日出日落时间确定的,具体时间是由北京天文台的天文学家专门计算的.早晨,当太阳的上部边缘与天安门广场所见地平线相平时,为升旗时间.国旗的降旗时间分为逐渐推迟和逐渐提前两个时段.遇到阴天、雨天或雪天,升旗和降旗的时间与前一天相同,每个月第一天,天安门广场升旗时由军乐队奏国歌,整个升旗持续时间为2分零7秒.下表是某年部分日期的天安门广场升旗时刻表.
日期 升旗时刻 日期 升旗时刻
1月1日 7:36 5月15日 5:00
1月23日 7:30 6月9日 4:45
2月5日 7:15 6月16日 4:45
2月21日 7:00 6月21日 4:45
3月3日 6:45 8月20日 5:30
3月13日 6:30 9月5日 6:45
3月22日 6:15 10月6日 6:15
4月10日 5:45 10月21日 6:30
4月20日 5:30 11月3日 6:45
5月1日 5:15 12月18E 7:30
将表中的升旗时刻化为分数后作为样本数据(如:7:36可化)
(1)请完成下面的频率分布表及频率分布直方图.
分组 分组 分组
4:00~4:59 3
5:00~5:59 0.25
6:00~6:59
7:00~7:59 5
合计 20
(2)若甲学校从上表日期中随机选择一天观看升旗.试估计甲学校观看升旗的时刻早于6:00的概率.
(3)若甲、乙两个学校各自从天安门广场升旗时刻表中五月、六月的日期中随机选择一天观看升旗,求两校观看升旗的时刻均不早于5:00的概率.
13.某中学举行了一次“环保知识竞赛”,全校学生参加了这次竞赛. 为了了解本次竞赛成绩情况,从中抽取了部分学生的成绩(得分取正整数,满分为100分)作为样本进行统计. 请根据下面尚未完成并有局部污损的频率分布表(如图所示)和频率分布直方图(如图所示)解决下列问题:频率分布表:
组别 分组 频数 频率
第1组 8 0.16
第2组
第3组 20 0.40
第4组 0.08
第5组 2
合计
频率分布直方图:
(1)写出 的值;
(2)若根据这次成绩,学校准备淘汰 同学,仅留 的同学进入下一轮竞赛,请问晋级分数线划为多少合理?
(3)某老师在此次考试成绩中抽取10名学生的分数:,已知这10个分数的平均数,标准差 ,若剔除其中的100和80这两个分数,求剩余8个分数的平均数与标准差.
14.2024年入冬以来,为了减少甲流对师生身体健康的影响,某学校规定师生进出学校需佩戴口罩,现将该学校1000位师生一周的口罩使用数量统计如下表所示,其中每周的口罩使用数量在6只以上(包含6只)的有700人.
口罩使用数量
频率
(1)求的值,根据表中数据,完善上面的频率分布直方图(不要求写出过程,画图即可);
(2)根据频率分布直方图估计该学校师生一周口罩使用数量的分位数和平均数(每组数据用每组中间值代替);
(3)按分层抽样的方法在前三组中抽取一个容量为6的样本,记第一组抽取的2人为.第二组抽取的1人为,第三组抽取的3人为,从这6人中随机抽取两人检查其健康状况记为事件,请列出事件的样本空间,并求这两人恰好来自同一组的概率.
15.某校倡议七年级学生利用双休日在各自社区参加义务劳动,为了解学生们的劳动情况,学校随机抽查了部分学生的劳动时间,并用得到的数据绘制成不完整的统计图表,如图所示:
劳动时间(时) 频数(人数) 频率
12 0.12
30 0.3
0.4
18
合计 1

(1)统计表中的______,______,补全频率分布直方图;
(2)估计所有被调查学生劳动时间的平均数;
(3)针对被调查的学生,用分层抽样的方法从劳动时间在和的两组中抽取5人,再从这5人中随机抽取2人,求这2人全部来自劳动时间在的概率.
04 百分位数
16.从高三抽出50名学生参加数学竞赛,由成绩得到如图的频率分布直方图,则估计这50名学生成绩的分位数为 分.
17.从某中学抽取6名同学,他们的数学成绩如下:87,85,83,90,92,93(单位:分),则这6名同学数学成绩的第75百分位数为 (单位:分).
18.在一次高一学生的答题测试中,10位参加测试的同学答对题目的数量分别为7,7,4,6,8,8,2,5,10,7,则该组数据的平均数为 ;该组数据的第70百分位数为 .
19.已知一组数据如下:,则这组数据的第80百分位数是 .
20.某人工智能公司为优化新开发的机器人模型,在其模型试用人群中开展满意度问卷调查,满意度采用计分制(满分100分),统计满意度并绘制成如下频率分布直方图,则图中 ,根据直方图可知满意度计分的第三四分位数约为 .
05 样本的数字特征
21.已知某班级部分同学一次测验的成绩统计如图,则其中位数和众数分别为( )
A.95,94 B.92,86 C.99,86 D.95,91
22.已知是这九个数据的中位数,且这五个数据的平均数为3,则的取值范围为( )
A. B. C. D.
23.一个公司有8名员工,其中6位员工的月工资分别为6200、6300、6500、7100、7500、7600,另两位员工的月工资数据不清楚,那么8位员工月工资的中位数不可能是( )
A.6800 B.7000 C.7200 D.7400
24.高一年级有男生490人,女生510人,按男生、女生进行分层,抽取总样本量为100.通过分层随机抽样的方法得到男生、女生的平均身高为170.2cm和160.8cm.则估计高一年级全体学生的平均身高为 cm.(结果保留一位小数)
25.某厂有甲、乙、丙三个车间生产同一种零件,经统计,甲车间生产的100个零件中的次品率为0.03,乙车间生产的200个零件中的次品率为0.02,丙车间生产的200个零件中的次品率为0.03,则该厂零件的次品率的估计值为 .
6.某百货公司连续40天的销售额数据(单位:万元)如下:
41 25 29 47 38 34 30 38 43 40
46 36 45 37 37 36 45 43 33 44
35 28 46 34 30 37 44 26 38 44
42 36 37 37 49 39 42 32 36 35
(1)根据上面的数据进行适当的分组,编制频数分布表,并绘制频率分布直方图;
(2)在绘制的频率分布直方图上指出数据组的中位数、众数、平均数所在区域,并比较它们之间的大小;
(3)试估计该百货公司一年(按365天计算)的销售额.
26.在 “好声音”校园歌手决赛中,由9名专业人士和9名观众代表各组成一个评委小组,给参赛选手打分,下面是两组评委对同一名选手的打分:
小组A:85 86 92 87 89 95 82 91 85
小组B:95 93 51 88 90 89 91 92 94
分别求两组评委打分的平均分.
06 总体集中趋势的估计
27.五一期间昆明蓝花楹盛开,吸引了很多游客,现随机采访了100名来欣赏蓝花楹的游客,并将这100人按年龄分组:第1组,第2组,第3组,第4组,第5组,得到的频率分布直方图如图所示:
(1)求样本数据的第50百分位数;
(2)估计这100名游客的平均年龄(同一组中的数据用该组中的中点值代表).
28.某市为了研究高三学生在全市质检中的语文成绩的情况,从全市16000名学生中随机抽取了1600名学生的成绩作为样本(成绩均在内),将所得的成绩分成七组:,,,,,,,得到频率分布直方图如图所示.
(1)求的值,并估计该市语文成绩落在区间内的学生人数;
(2)估计本次考试全市语文成绩的中位数(精确到0.01)和平均数(同一组中的数据用该区间的中点值作代表).
29.为了调查学生完成课后作业所用时间的基本情况,从600名初中学生中抽取100名学生进行调查统计,学生完成作业所需时间的频率分布直方图如图:
(1)估计该年级学生完成课后作业所需时间的平均值;
(2)估计该年级学生完成课后作业所需时间的25%分位数;
(3)估计全年级学生完成课后作业所需时间超过了2.5小时的人数.
30.张先生在一家科技公司工作,每天早上自驾去公司上班.他统计了最近100次开车从家到公司的红灯等待时间并形成统计表,将数据分成了,,,,(单位:秒)这5组,并整理得到频率分布直方图,如图所示.
(1)求图中a的值,估计张先生最近100次红灯等候时间的平均数;
(2)估计张先生红灯等待时间的上四分位数;
(3)根据以上数据,估计张先生在接下来的20次早上从家到公司的出行中,红灯等待时间不低于85秒的次数.
31.为了解新能源汽车充电情况,某数学兴趣小组在社区内随机抽测了一定数量的新能源汽车的充电时长(单位:分钟),所得数据均在区间上,其频率分布直方图如图所示.
(1)求频率分布直方图中a的值;
(2)试估计该社区内新能源汽车充电时长的平均值;
(3)现用比例分配的分层随机抽样方法从充电时长在上的样本中抽取n个样本数据,若在上抽取了6个样本数据,求n的值.
32.从某企业生产的某种产品中抽取100件,测量这些产品的一项质量指标值,由测量表得如下频数分布表:
质量指标值分组
频数 4 22 38 28 8
(1)在答题卡上按照示例补全这些数据的频率分布直方图;
(2)估计这种产品质量指标值的平均数(同一组中的数据用该组区间的中点值作代表);
(3)根据以上抽样调查数据,能否认为该企业生产的这种产品符合“质量指标值不低于90的产品至少要占全部产品的80%”的规定?
07 总体离散程度的估计
33.某果园试种了 两个品种的桃树各10棵,并在桃树成熟挂果后统计了这20棵桃树的产量如下表,记两个品种各10棵产量的平均数分别为和,方差分别为和.
(单位/kg) 60 50 40 60 70 80 70 30 50 90
(单位/kg) 40 60 50 80 80 50 60 20 80 70
(1)分别求这两个品种产量的极差和中位数;
(2)求,,,;
(3)果园要大面积种植这两种桃树中的一种,依据以上计算结果分析选种哪个品种更合适,并说明理由.
34.在重庆复旦中学“复旦好声音”校园歌手决赛中,由9名专业人士和9名观众代表各组成一个评委小组,给参赛选手打分,下面是两组评委对同一名选手的打分:
小组A:85 86 92 87 89 95 82 91 85
小组B:95 93 51 88 90 89 91 92 94
(1)分别求两组评委打分的平均分.
(2)判断小组A和小组B中哪一个更像是由专业人士组成,根据所学的统计知识,说明理由.
35.某省农科院在某地区选择了自然条件相同的两个试验区,用相同的管理技术试种甲、乙两种水稻各100亩.待水稻成熟,分别从甲、乙的100亩水稻中随机抽取10亩水稻,它们的亩产量如下表所示.就产量这一指标来讲,试确定哪个品种的水稻在该地区更适合推广.
种类 水稻的亩产量/kg
甲 865 885 886 876 893 885 870 905 890 895
乙 870 875 884 885 886 888 882 890 895 896
36.“一带一路”是“丝绸之路经济带”和“21世纪海上丝绸之路”的简称.某市为了了解人们对“一带一路”的认知程度,对不同年龄和不同职业的人举办了一次“一带一路”知识竞赛,满分100分(90分及以上为认知程度高).现从参赛者中抽取了x人,按年龄分成5组,第一组:[20,25),第二组:[25,30),第三组:[30,35),第四组:[35,40)第五组:[40,45],得到如图所示的频率分布直方图,已知第一组有6人.
(1)求x;
(2)求抽取的x人的年龄的中位数(结果保留整数);
(3)从该市大学生、军人、医务人员、工人、个体户五种人中用分层随机抽样的方法依次抽取6人,42人,36人,24人,12人,分别记为1~5组,从这5个按年龄分的组和这5个按职业分的组中每组各选派1人参加知识竞赛,分别代表相应组的成绩,年龄组中1~5组的成绩分别为,职业组中1~5组的成绩分别为.
①分别求5个年龄组和5个职业组成绩的平均数和方差;
②以上述数据为依据,评价5个年龄组和5个职业组对“一带一路”的认知程度.
37.某果园试种了,两个品种的桃树各10棵,并在桃树成熟挂果后统计了这20棵桃树的产量如下表,记,两个品种各10棵的产量的平均数分别为和,方差分别为和.
(单位:kg) 60 50 40 60 70 80 80 80 90 90
(单位:kg) 40 60 60 80 80 50 80 80 70 100
(1)求品种的10棵桃树产量的第80百分位数;
(2)求,,,;
(3)果园要大面积种植这两种桃树中的一种,依据以上计算结果分析选种哪个品种更合适,并说明理由.
38.2025年NBA选秀大会,我国选手杨瀚森将参加选秀,为备战选秀,运动员参加了联合试训,其中甲、乙两位运动员开展了队内三分投篮对抗赛.在对抗赛中两人每轮投篮10次,共进行10轮,每轮命中的成绩(个数)如下:
甲 4 7 6 5 4 9 10 7 8 10
乙 7 5 8 6 7 9 7 6 7 8
(1)求甲运动员的样本数据第75百分位数;
(2)分别计算这两位运动员10轮投篮成绩的平均数和方差;
(3)根据第二问结果回答下列问题:甲、乙两位运动员谁的发挥更稳定,为什么?
08 分层方差问题
39.2025年海口市某中学举办校园诗词大赛,评委对参赛选手的表现进行打分.现随机抽取了40名选手的成绩,并分成五组:第一组,第二组,第三组,第四组,第五组,绘制成如图所示频率分布直方图.
(1)求的值;
(2)估计这40名选手成绩的平均数和第95百分位数(同组中数据用该组区间中点值作代表);
(3)现从以上各组中用分层随机抽样的方法选取20人.若第二组选手成绩的平均数和方差分别为65和30,第五组选手成绩的平均数和方差分别为95和40,请据此估计第二组和第五组所有选手成绩的方差.
(附:设两组数据的样本量、样本平均数和样本方差分别为:,,;,,,记两组数据总体样本平均数为,总体样本方差为,则总体样本平均数,总体样本方差.)
40.汽车智能化——无人驾驶汽车成为汽车行业发展趋势.某汽车研发部门为了解客户对无人驾驶汽车的性能满意情况,随机抽取200名客户对无人驾驶汽车的性能进行打分,发现打分均在[40,100]内,将这些数据分成6组:,,,,,,并绘制出样本的频率分布直方图,因不慎,使得图形残缺,如图所示.
(1)求样本中打分在内的客户人数并估计样本的中位数;
(2)已知打分在内的样本数据的平均值为63,方差为5,打分在内的样本数据的平均值为78,方差为2,求打分在内的样本数据的平均值与方差.
41.为推动防范电信网络诈骗工作,预防和减少电信网络诈骗案件的发生,某市开展防骗知识宣传活动,举办“网络防骗”知识竞赛.现从所有答卷中随机抽取100份作为样本,将样本的成绩(满分100分,成绩均为不低于40分的整数)分成六段:,,…,得到如图所示的频率分布直方图.
(1)求图中a的值;
(2)根据频率分布直方图计算样本成绩的80%分位数;
(3)若总体划分为2层,采用样本量比例分配的分层随机抽样,各层抽取的样本量、样本平均数样本方差分别为:m,,;n,,.记总的样本平均数为,样本方差为,则.已知在的平均数是65,方差是6,在的平均数是75,方差是3,求这两组样本的总平均数和总方差.
42.2025年5月25日,平潭综合实验区成功举办半程马拉松赛.志愿服务是赛事成功举办的重要保障.在该赛事志愿者选拔工作中,工作人员随机抽取100名候选者,将其面试成绩按要求分成六组:,并根据数据绘制了频率分布直方图(如图所示).
(1)估计这100名候选者面试成绩的平均数;(同一组中的数据用该组区间的中点值作代表)
(2)已知落在区间内的面试成绩平均数为55,方差为16,落在区间的面试成绩平均数为67,方差为20,试估算在区间内所有面试成绩的平均数和方差.
43.为进一步推动防范电信网络诈骗工作,预防和减少电信网络诈骗案件的发生,某市开展防骗知识大宣传活动.举办了“网络防骗”知识竞赛,从所有答卷中随机抽取100份作为样本,将样本的成绩(满分100分,成绩均为不低于40分的整数)分成六段:,,…,,得到如图所示的频率分布直方图.
(1)求图中的值;
(2)根据频率分布直方图,估计样本成绩的平均数和下四分位数;
(3)若总体划分为2层,通过分层随机抽样抽取样本构成总样本.已知各层抽取的样本量、样本平均数和样本方差分别为,,;,,,求总样本平均数,样本方差.
44.某电视台有一档益智答题类综艺节目,每期节目从现场编号为01~80的80名观众中随机抽取10人答题.答题选手要从“科技”和“文艺”两类题目中选一类作答,一共回答10个问题,答对1题得1分.
(1)若采用随机数表法抽取答题选手,按照以下随机数表,从下方带点的数字2开始向右读,每次读取两位数,一行用完接下一行左端,求抽取的第6个观众的编号.
1622779439 4954435482 1737932378 8735209643 8426349164
8442175331 5724550688 7704744767 2176335025 83921206761
某学校统计教师职称及年龄,中级职称教师的人数为50人,其平均年龄为38岁,方差为2,高级职称的教师3人58岁,5人40岁,2人38岁,求该学校教师年龄的平均数和方差.
1.(2025·湖北武汉·模拟预测)某地统计了辖区内从2017年至2024年这8年的新能源汽车和纯电动汽车的销量(单位:百辆),得到如下折线图:
现对2021年至2024年这4年的数据进行分析,设新能源汽车的销量数据和纯电动汽车的销量数据的方差分别为和,新能源汽车的销量数据和纯电动汽车的销量数据的年平均增长率分别为和,则( )
A. B. C. D.
2.(2025·安徽合肥·模拟预测)已知这10个数据的平均数为,方差为1.98,则这11个数据的方差为( )
A.1.8 B.0.8 C.1.98 D.0.98
3.(2025·甘肃定西·模拟预测)某品牌电动汽车公司为了解车主使用电动车辅助驾驶功能的情况,进行了问卷调查,从中抽取了100位车主进行抽样分析,得出这100位车主每人在100次驾驶途中使用辅助驾驶功能的次数的频率分布直方图,则样本中车主使用辅助驾驶功能次数的分位数为( )
A.62 B.64 C.66 D.68
4.(多选)(2025·海南三亚·一模)某学校为培养学生创新精神和实践能力,组织了一次“科技小发明”竞赛活动,并对200位参赛学生的综合表现进行评分,评分的频率分布直方图如图,根据图中数据,下列说法正确的是( )
A.
B.评分在的人数约为20
C.估计评分的下四分位数为65
D.估计评分的平均数为76.5
5.(2025·天津红桥·模拟预测)采用分层抽样的方法抽取一个容量为80的样本,高一年级被抽取20人,高二年级被抽取30人,高三年级共有600人,则这个学校共有高中学生 人.
6.(2025·甘肃白银·模拟预测)为了更好地应对新高考改革以及调整日常教学,某地区教育局对该地区的三所高中的二年级学生进行了抽样调查,采用分层抽样的方式抽取了1000名学生参加物理学科的抽样质量测试,其中A校、B校、C校的学生人数分别为300人、500人、200人,考试结束后对这1000名同学的物理成绩进行统计,得知A,B,C三所学校的高二年级的物理平均分依次为60分、75分、58分,则这1000名同学物理成绩的总平均分为 分.
7.(2025·新疆·模拟预测)某学校为了解学生的体质健康状况,对高一、高二两个年级的学生进行体质健康测试.现从两个年级学生中各随机抽取20人,他们的测试数据如下:
高一:50,53,58,64,66,67,67,69,71,72,75,78,79,82,83,86,89,93,94,96
高二:40,42,50,52,56,64,65,67,68,72,73,73,79,81,84,85,88,90,96,98
国家学生体质健康标准的等级标准如下表,规定:测试数据,体质健康为合格.
等级 优秀 良好 及格 不及格
测试数据
(1)从该校高二年级学生中随机抽取一名学生,试估计这名学生体质健康不合格的概率;
(2)从两个年级等级为优秀的样本中各随机抽取一名学生,求抽取的两名学生的测试数据平均数不大于95的概率;
(3)设该校高一学生测试数据的平均数和方差分别为,,高二学生测试数据的平均数和方差分别为,,试比较与、与的大小.(只需写出结论)
8.(2024·陕西西安·一模)近年来“天宫课堂”受到广大中小学生欢迎,激发了同学们对科学知识的探索欲望和对我国航天事业成就的自豪.为领悟航天精神,感受中国梦想,某校组织了一次“寻梦天宫”航天知识竞赛(满分分),各年级学生踊跃参加.校团委为了比较高一、高二学生这次竞赛的成绩,从两个年级的答卷中各随机选取了份,将成绩进行统计得到以下频数分布表:
成绩
高一学生人数
高二学生人数
试利用样本估计总体的思想,解决下列问题:
(1)从平均数与方差的角度分析哪个年级学生这次竞赛成绩更好(同一组中的数据用该组区间的中点值为代表)?
(2)校后勤部决定对参与这次竞赛的学生给予一定的奖励,奖励方案有以下两种:
方案一:记学生得分为,当时,奖励该学生元食堂代金券;当时,奖励该学生元食堂代金券;当时,奖励该学生元食堂代金券;
方案二:得分低于样本中位数的每位学生奖励元食堂代金券;得分不低于中位数的每位学生奖励元食堂代金券.
若高一年级组长希望本年级学生获得更多的奖励,则他应该选择哪种方案?
1.(2023·新课标Ⅱ卷·高考真题)某学校为了解学生参加体育运动的情况,用比例分配的分层随机抽样方法作抽样调查,拟从初中部和高中部两层共抽取60名学生,已知该校初中部和高中部分别有400名和200名学生,则不同的抽样结果共有( ).
A.种 B.种
C.种 D.种
2.(多选)(2023·新课标Ⅰ卷·高考真题)有一组样本数据,其中是最小值,是最大值,则( )
A.的平均数等于的平均数
B.的中位数等于的中位数
C.的标准差不小于的标准差
D.的极差不大于的极差
3.(2024·上海·高考真题)为了解某地初中学生体育锻炼时长与学业成绩的关系,从该地区29000名学生中抽取580人,得到日均体育锻炼时长与学业成绩的数据如下表所示:
时间范围学业成绩
优秀 5 44 42 3 1
不优秀 134 147 137 40 27
(1)该地区29000名学生中体育锻炼时长不少于1小时人数约为多少?
(2)估计该地区初中学生日均体育锻炼的时长(精确到0.1)
4.(2023·全国甲卷·高考真题)一项试验旨在研究臭氧效应,试验方案如下:选40只小白鼠,随机地将其中20只分配到试验组,另外20只分配到对照组,试验组的小白鼠饲养在高浓度臭氧环境,对照组的小白鼠饲养在正常环境,一段时间后统计每只小白鼠体重的增加量(单位:g).试验结果如下:
对照组的小白鼠体重的增加量从小到大排序为
15.2 18.8 20.2 21.3 22.5 23.2 25.8 26.5 27.5 30.1
32.6 34.3 34.8 35.6 35.6 35.8 36.2 37.3 40.5 43.2
试验组的小白鼠体重的增加量从小到大排序为
7.8 9.2 11.4 12.4 13.2 15.5 16.5 18.0 18.8 19.2
19.8 20.2 21.6 22.8 23.6 23.9 25.1 28.2 32.3 36.5
(1)计算试验组的样本平均数;中小学教育资源及组卷应用平台
第01讲 随机抽样、统计图表、用样本估计总体
目录
01 常考题型过关练
题型01 随机抽样、分层抽样
题型02 统计图表
题型03 频率分布直方图
题型04百分位数
题型05 样本的数字特征
题型06 总体集中趋势估计
题型07 总体离散程度估计
题型08 分层方差问题
02 核心突破提升练
03 真题溯源通关练
01 随机抽样、分层抽样
1.某校从500名同学中用随机数法抽取30人参加这一项调查.将这500名同学编号为001,002,…500,假设从第1行第4列的数字开始,则第5个被抽到的同学的编号为( )
3484 4217 5572 1754 5560 8331
0474 4767 2176 3350 2583 9212
0676 6301 6378 5916 9555 6719
A.331 B.047 C.447 D.672
【答案】B
【详解】由题知,选取的同学编号分别是442,175,572,175,455,608,331,047,
剔除重复数据,超过500的数据,符合条件的是442,175,455,331,047,第五个是047.
故选:B.
2.某校高一年级有720名学生,现用比例分配的分层随机抽样方法抽取一个容量为48的样本,其中身高在175cm以下的学生人数为32,则该校高一年级身高在175cm以下的学生人数为( )
A.320 B.360 C.420 D.480
【答案】D
【详解】由比例分配的分层抽样方法可得高一年级身高在175cm以下的学生人数为.
故选:D.
3.设总体由编号为的60个个体组成,利用下面的随机数表选取6个个体,选取方法是从该随机数表第1行的第6个数字开始由左到右依次选取两个数字,则选出来的第4个个体的编号为 .
5044664421 6606580562 6155643502 4235489632 1452415248
2266221586 2663754199 5842367224 5837521851 0337183911
【答案】26
【详解】从第1行的第6个数字开始由左到右依次选取两个数字可得64(舍),42,16,60(舍),65(舍),80(舍),56,26,15,
符合要求的数为42,16,56,26,所以第四个数为26.
故答案为:26.
4.某公司青年、中年、老年员工的人数之比为,从中抽取100名作为样本,若每人被抽中的概率是,则该公司青年员工的人数为 .
【答案】
【详解】设公司的人数为,因为抽取100名作为样本,若每人被抽中的概率是,
可得,解得人,
有业务公司青年、中年、老年员工的人数之比为,
所以该公司青年员工的人数为人.
故答案为:.
5.某市为了调查教师对统计软件的了解程度,拟采用比例分配的分层随机抽样的方法从A,B,C三所学校抽取60名教师进行调查,已知A,B,C三所学校分别有180,270,90名教师,则从A学校中应抽取的人数为 .
【答案】20
【详解】由题意知,A,B,C三所学校分别有180,270,90名教师,
可得A,B,C三所学校教师的人数比为,
所以三所学校抽取60名教师,其中A学校中应抽取的人数为人.
故答案为:.
02 统计图表
6.(多选)新高一学生会对物理、历史2门课程进行选科,每位同学从中选择1门课程学习.现对该校2000名学生的选科情况进行了统计,如图①,并用比例分配的分层随机抽样的方法从中抽取的学生对所选课程进行了满意率调查,如图②.
则下列说法正确的是( )
A.满意率调查中抽取的样本容量为2000
B.该校学生中对物理课程满意的人数约为720
C.若抽取的学生中对历史课程满意的人数为32,则=80
D.抽取的学生中对物理课程满意的人数多于对历史课程满意的人数
【答案】BC
【详解】根据题意及图①可知:该调查的总体容量为,其中学习物理有人,学习历史有人;
对于选项A::满意率调查中抽取的样本容量为,故选项A错误;
对于选项B:该校学生中对物理课程满意的人数约为,故选项B正确;
对于选项C:按比例分配进行分层随机抽样时,
学习物理有人,学习历史的有人,
若抽取的学生中对历史课程满意的人数为32,则,故选项C正确;
对于选项D:因为,
所以抽取的学生中对历史课程满意的人数为,
又因为抽取的学生中对物理课程满意的人数为,
所以抽取的学生中对物理课程满意的人数、对历史课程满意的人数无法比较,
故选项D错误.
故选:BC.
7.(多选)2025年4月23日,在第四届全民阅读大会上正式发布了2024年度中国数字阅读报告.统计了我国近五年数字阅读用户规模和网民规模数据,如图所示,则( )
A.2024年,我国数字阅读用户规模占网民规模的五成以上
B.近五年,我国数字阅读用户规模的增长量比网民规模的增长量大
C.从2020年至2024年,我国数字阅读用户规模逐年递增
D.从2020年至2024年,我国网民规模的增长率逐年递增
【答案】ABC
【详解】对于A,根据条形图,2024年,我国数字阅读用户规模为6.7亿,网民规模为11.1亿,数字阅读用户规模约占网民规模的,故A正确;
对于B,近五年,我国数字阅读用户规模的增长量为亿,网民规模的增长量为亿,
数字阅读用户规模的增长量大于网民规模的增长量,故B正确;
对于C,根据条形图,可以看出,从2020年至2024年,我国数字阅读用户规模在逐年递增,故C正确;
对于D,根据条形图,从2020年至2021年,我国网民规模的增长率为,
从2023年至2024年,我国网民规模的增长率为,增长率减小了,故D错误.
故选:ABC.
8.(多选)的监测值是用来评价环境空气质量的指标之一.划分等级为日均值在以下,空气质量为一级;在,空气质量为二级;超过为超标.如图是某地12月1日至10日的日均值(单位:),则下列说法正确的是()
A.这10天的日均值逐日增大
B.这10天中日均值的平均值是48.8
C.从日均值看,前5天的日均值的标准差小于后5天的日均值的标准差
D.这10天日均值超标的有3天
【答案】BC
【详解】对于A,由图可知这10天的日均值有增有减,故A错误;
对于B,这10天中日均值的平均值,故B正确;
对于C,前5天平均值为,后5天平均值为,
所以前5天的日均值的方差,
后5天日均值的方差
因为,所以前5天的日均值的方差小于后5天的日均值的方差,
故前5天的日均值的标准差小于后5天的日均值的标准差,故C正确;
对于D,由图可知12月6、7这两天的大于,故D错误.
故选:BC.
9.(多选)佛山50公里徒步自2016年首次推出5条路线实现“五龙汇聚”,参与人数逐年增加,到2025年,现场参与人数为45万人,这不仅是一场全民健身的狂欢,更是佛山城市品牌的一次璀璨展示.下面分别为2016年佛山50公里徒步参与人数的扇形统计图(图1)、2025年佛山50公里徒步参与人数的条形统计图(图2,单位:万人),已知2025年高明线的参与人数是2016年的2倍,则( )
A.2016年佛山50公里徒步总的参与人数是20万
B.2025年顺德线的参与人数超过了2016年南海线与顺德线的参与人数总和
C.五条线的参与人数2025年与2016年相比增加人数最少的是三水线
D.五条线的参与人数2025年与2016年相比增长率最高的是南海线
【答案】ABD
【详解】因为2025年高明线的参与人数是2016年的2倍,则2016年的高明线的参与人数是万人,
对于A:根据扇形图得出万,所以2016年佛山50公里徒步总的参与人数是20万,A选项正确;
2016年佛山50公里徒步高明线,三水线,禅城线,顺德线,南海线参与人数分别为:万,万,万,万,万,
2025年佛山50公里徒步高明线,三水线,禅城线,顺德线,南海线参与人数分别为:万,万,万,万,万,
对于B:因为,2025年顺德线的参与人数超过了2016年南海线与顺德线的参与人数总和,B选项正确;
对于C:五条线的参与人数2025年与2016年相比增加人数最少的是高明线,C选项错误;
对于D:南海线的参与人数2025年与2016年相比增长率,顺德线的参与人数2025年与2016年相比增长率,
禅城线的参与人数2025年与2016年相比增长率,三水线的参与人数2025年与2016年相比增长率,
高明线的参与人数2025年与2016年相比增长率,所以五条线的参与人数2025年与2016年相比增长率最高的是南海线,D选项正确;
故选:ABD.
10.为响应国家“体重管理年”三年行动的号召,某单位开展健步走活动,现统计该单位400名员工5月4日至5月10日的步数信息.其中甲、乙两位员工这7天的步数折线图如图1所示:
(1)求从这7天中随机选取一天,该天甲比乙的步数多的概率;
(2)整理这400名员工7天的健步走数据,得到频率分布直方图如图2所示.现将该单位员工每天的步数从多到少进行排名,已知某天甲与乙的步数排名分别为第283名和第130名,试判断这是哪一天的数据,并说明理由.
【答案】(1)
(2)这一天是5月6日的数据
【详解】(1)由折线图可知,只有第5日和第9日,甲比乙的步数多,
所以从这7天中随机选取一天,该天甲比乙的步数多的概率为;
(2)由频率分布直方图可知,
步数在的有人,
步数在的有人,
步数在的有人,
步数在的有人,
步数在的有人,
步数在的有人,
因为这一天甲的步数的排名是283名,乙的步数排名是130名,
所以甲的步数在区间,乙的步数在区间,
根据折线图可知, 5月6日的数据符合,所以这一天是5月6日.
03 频率分布直方图
11.为了让学生了解环保知识,增强环保意识,某中学举办了一次环保知识竞赛,共有900名学生参加了这次竞赛.为了了解本次竞赛的成绩情况,从中抽取了部分学生的成绩(得分均为整数,满分为100分)进行统计.请你根据尚未完成并有局部污损的频数分布表和频数分布直方图,解答下列问题:
分组 频数 频率
50.5~60.5 4 0.08
60.5~70.5 0.16
70.5~80.5 10
80.5~90.5 16 0.32
90.5~100.5
合计 50
(1)填充频数分布表的空格(将答案直接填在表格内);
(2)补全频数分布直方图;
(3)若成绩在75.5~85.5的学生为二等奖,问获得二等奖的学生约为多少人?
【答案】(1)表格见解析
(2)直方图见解析
(3)人
【详解】(1)易知样本容量为50,
故第二组的频数为,第三组的频率为,
第四组的频数为,频率为,
故频数分布表为
分组 频数 频率
50.5~60.5 4 0.08
60.5~70.5 8 0.16
70.5~80.5 10 0.20
80.5~90.5 16 0.32
90.5~100.5 12 0.24
合计 50 1.00
(2)由(1)知,60.5~70.5这一组的频数为8,补全频数分布直方图,如图:
(3)成绩在75.5~80.5的学生占70.5~80.5的学生的,
因为成绩在70.5~80.5的学生频率为0.20,所以成绩在75.5~80.5的学生频率为0.10.
成绩在80.5~85.5的学生占80.5~90.5的学生的,
因为成绩在80.5~90.5的学生频率为0.32,所以成绩在80.5~85.5的学生频率为0.16,
所以成绩在75.5~85.5的学生频率为.
由于有900名学生参加了这次竞赛,
所以该校获得二等奖的学生约为(人).
12.天安门广场国旗的升降时间是根据北京的日出日落时间确定的,具体时间是由北京天文台的天文学家专门计算的.早晨,当太阳的上部边缘与天安门广场所见地平线相平时,为升旗时间.国旗的降旗时间分为逐渐推迟和逐渐提前两个时段.遇到阴天、雨天或雪天,升旗和降旗的时间与前一天相同,每个月第一天,天安门广场升旗时由军乐队奏国歌,整个升旗持续时间为2分零7秒.下表是某年部分日期的天安门广场升旗时刻表.
日期 升旗时刻 日期 升旗时刻
1月1日 7:36 5月15日 5:00
1月23日 7:30 6月9日 4:45
2月5日 7:15 6月16日 4:45
2月21日 7:00 6月21日 4:45
3月3日 6:45 8月20日 5:30
3月13日 6:30 9月5日 6:45
3月22日 6:15 10月6日 6:15
4月10日 5:45 10月21日 6:30
4月20日 5:30 11月3日 6:45
5月1日 5:15 12月18E 7:30
将表中的升旗时刻化为分数后作为样本数据(如:7:36可化)
(1)请完成下面的频率分布表及频率分布直方图.
分组 分组 分组
4:00~4:59 3
5:00~5:59 0.25
6:00~6:59
7:00~7:59 5
合计 20
(2)若甲学校从上表日期中随机选择一天观看升旗.试估计甲学校观看升旗的时刻早于6:00的概率.
(3)若甲、乙两个学校各自从天安门广场升旗时刻表中五月、六月的日期中随机选择一天观看升旗,求两校观看升旗的时刻均不早于5:00的概率.
【答案】(1)答案见解析
(2)0.4
(3)
【详解】(1)频率分布表及频率分布直方图如下:
分组 分组 分组
4:00~4:59 3 0.15
5:00~5:59 5 0.25
6:00~6:59 7 0.35
7:00~7:59 5 0.25
合计 20 1
(2)由1中的表知,甲学校从20次升旗日期中随机选择一天观看升旗,
观看升旗的时刻早于6:00的为8次,
所以甲学校观看升旗的时刻早于6:00的概率约为.
(3)由题中表1知,五月,六月的升旗日期中不早于5:00的时间有2次,两个月一共升旗5次.
设按表1中五月,六月的日期先后顺序,甲选择一天观看升旗分别为,,,,,
乙选择一天观看升旗分别为,,,,,
则甲,乙两个学校观看升旗的时刻的样本空间:


,共有25个样本点.
设两校观看升旗的时刻均不早于5:00为事件A,
则A包含4个样本点,即,,,,
所以,即两校观看升旗的时刻均不早于5:00的概率为.
13.某中学举行了一次“环保知识竞赛”,全校学生参加了这次竞赛. 为了了解本次竞赛成绩情况,从中抽取了部分学生的成绩(得分取正整数,满分为100分)作为样本进行统计. 请根据下面尚未完成并有局部污损的频率分布表(如图所示)和频率分布直方图(如图所示)解决下列问题:频率分布表:
组别 分组 频数 频率
第1组 8 0.16
第2组
第3组 20 0.40
第4组 0.08
第5组 2
合计
频率分布直方图:
(1)写出 的值;
(2)若根据这次成绩,学校准备淘汰 同学,仅留 的同学进入下一轮竞赛,请问晋级分数线划为多少合理?
(3)某老师在此次考试成绩中抽取10名学生的分数:,已知这10个分数的平均数,标准差 ,若剔除其中的100和80这两个分数,求剩余8个分数的平均数与标准差.
【答案】(1)
(2)
(3),
【详解】(1)由题意可知抽取的学生人数为:,
则第四组人数为:,
所以,
,,.
(2)成绩落在内的频率为:,
落在内的频率为:,
设第90百分位数为,
则,解得,
故晋级分数线划为82.5合理.
(3)因为,所以.
标准差,所以,
则,
剔除其中的100和80两个分数,设剩余8个数为,
设平均数与标准差分别为,
则剩余8个分数的平均数为,
方差为,
故标准差为.
14.2024年入冬以来,为了减少甲流对师生身体健康的影响,某学校规定师生进出学校需佩戴口罩,现将该学校1000位师生一周的口罩使用数量统计如下表所示,其中每周的口罩使用数量在6只以上(包含6只)的有700人.
口罩使用数量
频率
(1)求的值,根据表中数据,完善上面的频率分布直方图(不要求写出过程,画图即可);
(2)根据频率分布直方图估计该学校师生一周口罩使用数量的分位数和平均数(每组数据用每组中间值代替);
(3)按分层抽样的方法在前三组中抽取一个容量为6的样本,记第一组抽取的2人为.第二组抽取的1人为,第三组抽取的3人为,从这6人中随机抽取两人检查其健康状况记为事件,请列出事件的样本空间,并求这两人恰好来自同一组的概率.
【答案】(1);直方图见解析
(2)个,个
(3)答案见解析,
【详解】(1)由每周的口罩使用个数在6以上(含6)的有700人得:

故所求,
频率分布直方图如下:
(2)由(1)知,又因为口罩使用数量在的频率是0.3,

所以假设分位数为,
则,
由频率分布直方图得一周内使用口罩的平均数为:
(个),
故估计所求分位数为9个,平均数估计为7个.
(3)可知样本空间:

共含有15个样本点,可以认为这个样本点出现的可能性是相等的.
记“这两个人来自同一组”为事件,则,
样本点有4个,故.
15.某校倡议七年级学生利用双休日在各自社区参加义务劳动,为了解学生们的劳动情况,学校随机抽查了部分学生的劳动时间,并用得到的数据绘制成不完整的统计图表,如图所示:
劳动时间(时) 频数(人数) 频率
12 0.12
30 0.3
0.4
18
合计 1

(1)统计表中的______,______,补全频率分布直方图;
(2)估计所有被调查学生劳动时间的平均数;
(3)针对被调查的学生,用分层抽样的方法从劳动时间在和的两组中抽取5人,再从这5人中随机抽取2人,求这2人全部来自劳动时间在的概率.
【答案】(1)40,0.18,图见解析
(2)2.14(时)
(3)
【详解】(1)由题意,
故,,
频率分布直方图如图所示:

(2)平均劳动时间(时);
(3)劳动时间在应抽取的人数为(人),分别记为,;
劳动时间在应抽取的人数为(人),分别记为,,,
则该试验的样本空间,

设事件“抽取的2人均来自”,
则,,
所以,故所求概率为.
04 百分位数
16.从高三抽出50名学生参加数学竞赛,由成绩得到如图的频率分布直方图,则估计这50名学生成绩的分位数为 分.
【答案】86.25
【详解】依题意,前四个小矩形的面积之和为,
前五个小矩形的面积之和为,
因此分位数位于内,,
所以估计这50名学生成绩的分位数为86.25分.
故答案为:86.25
17.从某中学抽取6名同学,他们的数学成绩如下:87,85,83,90,92,93(单位:分),则这6名同学数学成绩的第75百分位数为 (单位:分).
【答案】92
【详解】6名同学的成绩按从小到大顺序排列为:83,85,87,90,92,93,

所以第75百分位数为第5个数:92.
故答案为:92.
18.在一次高一学生的答题测试中,10位参加测试的同学答对题目的数量分别为7,7,4,6,8,8,2,5,10,7,则该组数据的平均数为 ;该组数据的第70百分位数为 .
【答案】 6.4 7.5
【详解】将数据从小到大排列得到:2,4,5,6,7,7,7,8,8,10,
平均数为.
,故第70百分位数为.
故答案为:;
19.已知一组数据如下:,则这组数据的第80百分位数是 .
【答案】8.5/
【详解】由题意,数据,可得,
故第80百分位数是第8个数和第9个数的平均数,即为.
故答案为:8.5.
20.某人工智能公司为优化新开发的机器人模型,在其模型试用人群中开展满意度问卷调查,满意度采用计分制(满分100分),统计满意度并绘制成如下频率分布直方图,则图中 ,根据直方图可知满意度计分的第三四分位数约为 .
【答案】 0.03 85
【详解】由频率分布直方图可得,可得;
前三组的频率之和为,
前四组的频率之和为,所以满意度计分的第三四分位数,
所以,即满意度计分的第三四分位数约为85.
故答案为:0.03;85.
05 样本的数字特征
21.已知某班级部分同学一次测验的成绩统计如图,则其中位数和众数分别为( )
A.95,94 B.92,86 C.99,86 D.95,91
【答案】B
【详解】从茎叶图进行数据分析可得:
把数据从小到大排列得到:76,79,81,83,86,86,87,91,92,94,95,96,98,99,101,103,114
所以中位数是92,众数为86.
故选:B
22.已知是这九个数据的中位数,且这五个数据的平均数为3,则的取值范围为( )
A. B. C. D.
【答案】C
【详解】解:因为是这九个数据的中位数,所以,
因为这五个数据的平均数为3,
所以,即,
所以,,,
因为函数在上均为减函数,
所以,,为单调递减函数,
因为
所以的取值范围为.
故选:C
23.一个公司有8名员工,其中6位员工的月工资分别为6200、6300、6500、7100、7500、7600,另两位员工的月工资数据不清楚,那么8位员工月工资的中位数不可能是( )
A.6800 B.7000 C.7200 D.7400
【答案】D
【详解】∵一个公司有8名员工,其中6名员工的月工资分别为6200,6300,6500,7100,7500,7600,
∴当另外两名员工的工资都小于6300时,中位数为(6300+6500)÷2=6400,
当另外两名员工的工资都大于7500时,中位数为(7100+7500)÷2=7300,
∴8位员工月工资的中位数的取值区间为[6400,7300],
∴8位员工月工资的中位数不可能是7400.
故选:D.
24.高一年级有男生490人,女生510人,按男生、女生进行分层,抽取总样本量为100.通过分层随机抽样的方法得到男生、女生的平均身高为170.2cm和160.8cm.则估计高一年级全体学生的平均身高为 cm.(结果保留一位小数)
【答案】165.4
【详解】设在男生、女生中分别抽取m名和n名,
则,解得,.
据此可以估计高二年级全体学生的平均身高为
.
故答案为:165.4.
25.某厂有甲、乙、丙三个车间生产同一种零件,经统计,甲车间生产的100个零件中的次品率为0.03,乙车间生产的200个零件中的次品率为0.02,丙车间生产的200个零件中的次品率为0.03,则该厂零件的次品率的估计值为 .
【答案】0.026/
【详解】该厂零件的次品率的估计值为.
故答案为:
6.某百货公司连续40天的销售额数据(单位:万元)如下:
41 25 29 47 38 34 30 38 43 40
46 36 45 37 37 36 45 43 33 44
35 28 46 34 30 37 44 26 38 44
42 36 37 37 49 39 42 32 36 35
(1)根据上面的数据进行适当的分组,编制频数分布表,并绘制频率分布直方图;
(2)在绘制的频率分布直方图上指出数据组的中位数、众数、平均数所在区域,并比较它们之间的大小;
(3)试估计该百货公司一年(按365天计算)的销售额.
【答案】(1)见解析
(2)中位数为37,众数为37,平均数为,平均数最大,中位数和众数相等,
(3)万元
【详解】(1)这组数的最小值为25,最大值为49,其差为,取组距为5,将其分成5组,则分的组为,
销售额的频率分布表如下:
组段 频数 频率
4
6
15
9
6
销售额的频率分布直方图如下:
(2)将40个数据从小到大排列依次为
25,26,28,29,30,30,32,33,34,34,35,35,36,36,36,36,37,37,37,37,
37,38,38,38,39,40,41,42,42,43,43,44,44,44,45,45,46,46,47,49,
所以中位数为37,众数为37,
平均数为,
中位数、众数、平均数都在,其平均数最大,中位数和众数相等
(3)由(2)可知平均每天的销售额为万元,
所以该百货公司一年的销售额约为
万元
26.在 “好声音”校园歌手决赛中,由9名专业人士和9名观众代表各组成一个评委小组,给参赛选手打分,下面是两组评委对同一名选手的打分:
小组A:85 86 92 87 89 95 82 91 85
小组B:95 93 51 88 90 89 91 92 94
分别求两组评委打分的平均分.
【答案】88;87
【详解】记小组A的数据依次为,小组B的数据依次为,,
由题意可得:每组的平均数分别为:,.
06 总体集中趋势的估计
27.五一期间昆明蓝花楹盛开,吸引了很多游客,现随机采访了100名来欣赏蓝花楹的游客,并将这100人按年龄分组:第1组,第2组,第3组,第4组,第5组,得到的频率分布直方图如图所示:
(1)求样本数据的第50百分位数;
(2)估计这100名游客的平均年龄(同一组中的数据用该组中的中点值代表).
【答案】(1)
(2)50岁
【详解】(1)由频率分布直方图可知,
样本中数据落在的频率为,
设第50百分位数为,易得位于50和60之间,
则有:,解得.
(2)设100名游客的平均年龄为,由图可知,

故这100名游客的平均年龄约为50岁.
28.某市为了研究高三学生在全市质检中的语文成绩的情况,从全市16000名学生中随机抽取了1600名学生的成绩作为样本(成绩均在内),将所得的成绩分成七组:,,,,,,,得到频率分布直方图如图所示.
(1)求的值,并估计该市语文成绩落在区间内的学生人数;
(2)估计本次考试全市语文成绩的中位数(精确到0.01)和平均数(同一组中的数据用该区间的中点值作代表).
【答案】(1),8000人
(2)中位数为97.14,平均数为98.2
【详解】(1)由题意知,解得,
所以该市语文成绩落在区间的频率为,
估计该市语文成绩落在区间内的学生人数是;
(2)由频率分布直方图得,分数在区间的频率为,
的频率分别为,
因此该校语文成绩的中位数在之间,
所以,解得,
语文成绩的平均数为.
29.为了调查学生完成课后作业所用时间的基本情况,从600名初中学生中抽取100名学生进行调查统计,学生完成作业所需时间的频率分布直方图如图:
(1)估计该年级学生完成课后作业所需时间的平均值;
(2)估计该年级学生完成课后作业所需时间的25%分位数;
(3)估计全年级学生完成课后作业所需时间超过了2.5小时的人数.
【答案】(1);
(2);
(3).
【详解】(1)由直方图可知,;
(2)因为前两组的频率之和为,
前三组的频率之和为,
所以该年级学生完成课后作业所需时间的25%分位数在区间,设为,
则,解得;
(3)小时分钟,
所需时间超过分钟的频率为,
所以全年级学生完成课后作业所需时间超过了2.5小时的人数大约为人.
30.张先生在一家科技公司工作,每天早上自驾去公司上班.他统计了最近100次开车从家到公司的红灯等待时间并形成统计表,将数据分成了,,,,(单位:秒)这5组,并整理得到频率分布直方图,如图所示.
(1)求图中a的值,估计张先生最近100次红灯等候时间的平均数;
(2)估计张先生红灯等待时间的上四分位数;
(3)根据以上数据,估计张先生在接下来的20次早上从家到公司的出行中,红灯等待时间不低于85秒的次数.
【答案】(1),79.5
(2)87.5
(3)6次
【详解】(1)因为各组频率之和为1,组距为10,
所以,
解得.
平均数为.
(2)因为前3组的频率为,
前4组的频率为,
所以上四分位数在第4组,
则上四分位数为.
所以红灯等待时间的上四分位数的估计值为87.5.
(3)由题红灯等待时间不低于85秒的频率为,
故估计张先生在接下来的20次中红灯等待时间不低于85秒的次数为次.
31.为了解新能源汽车充电情况,某数学兴趣小组在社区内随机抽测了一定数量的新能源汽车的充电时长(单位:分钟),所得数据均在区间上,其频率分布直方图如图所示.
(1)求频率分布直方图中a的值;
(2)试估计该社区内新能源汽车充电时长的平均值;
(3)现用比例分配的分层随机抽样方法从充电时长在上的样本中抽取n个样本数据,若在上抽取了6个样本数据,求n的值.
【答案】(1)
(2)65
(3)34
【详解】(1)由题意知,,
解得.
(2),
所以该社区内新能源汽车充电时长的平均值为65.
(3)充电时长在,,上的样本数据的比例为

因为在上抽取了6个样本数据,
故在,上应分别抽取12,16个样本数据,
所以.
32.从某企业生产的某种产品中抽取100件,测量这些产品的一项质量指标值,由测量表得如下频数分布表:
质量指标值分组
频数 4 22 38 28 8
(1)在答题卡上按照示例补全这些数据的频率分布直方图;
(2)估计这种产品质量指标值的平均数(同一组中的数据用该组区间的中点值作代表);
(3)根据以上抽样调查数据,能否认为该企业生产的这种产品符合“质量指标值不低于90的产品至少要占全部产品的80%”的规定?
【答案】(1)答案见详解
(2)
(3)能认为该企业生产的这种产品符合“质量指标值不低于90的产品至少要占全部产品的80%”的规定.
【详解】(1)由频数分布表中对应频数,可得频率分布直方图中各个小长方形的高,直方图如图.
(2)这种产品质量指标值的平均数为
.
(3)质量指标值不低于90的产品所占比例的估计值为,
所以能认为该企业生产的这种产品符合“质量指标值不低于90的产品至少要占全部产品的80%”的规定.
07 总体离散程度的估计
33.某果园试种了 两个品种的桃树各10棵,并在桃树成熟挂果后统计了这20棵桃树的产量如下表,记两个品种各10棵产量的平均数分别为和,方差分别为和.
(单位/kg) 60 50 40 60 70 80 70 30 50 90
(单位/kg) 40 60 50 80 80 50 60 20 80 70
(1)分别求这两个品种产量的极差和中位数;
(2)求,,,;
(3)果园要大面积种植这两种桃树中的一种,依据以上计算结果分析选种哪个品种更合适,并说明理由.
【答案】(1)A品种极差为,中位数为60;B品种极差为,中位数为60
(2),,,
(3)应该选种A品种桃树,理由见解析
【详解】(1)这10棵A品种桃树的产量从小到大分别为,
这10棵A品种桃树产量的极差为,中位数为,
这10棵B品种桃树产量从小到大分别为,
这10棵B品种桃树产量的极差为,中位数为.
(2),


.
(3)由第一问可知这两个品种极差和中位数都相等, 由第二问可知,,
所以品种桃树平均产量高,稳定性好,应该选种品种桃树.
34.在重庆复旦中学“复旦好声音”校园歌手决赛中,由9名专业人士和9名观众代表各组成一个评委小组,给参赛选手打分,下面是两组评委对同一名选手的打分:
小组A:85 86 92 87 89 95 82 91 85
小组B:95 93 51 88 90 89 91 92 94
(1)分别求两组评委打分的平均分.
(2)判断小组A和小组B中哪一个更像是由专业人士组成,根据所学的统计知识,说明理由.
【答案】(1)88,87
(2)A组更像,理由见解析
【详解】(1)记小组A的数据依次为,小组B的数据依次为,,
由题意可得:每组的平均数分别为:,.
(2)A组更像是由专业人士组成,
两组的方差分别为:,.
由于专业人士给分更符合专业规则,相似程度更高,,,
因而,
根据方差越大数据波动越大,因此A组更像是由专业人士组成的.
35.某省农科院在某地区选择了自然条件相同的两个试验区,用相同的管理技术试种甲、乙两种水稻各100亩.待水稻成熟,分别从甲、乙的100亩水稻中随机抽取10亩水稻,它们的亩产量如下表所示.就产量这一指标来讲,试确定哪个品种的水稻在该地区更适合推广.
种类 水稻的亩产量/kg
甲 865 885 886 876 893 885 870 905 890 895
乙 870 875 884 885 886 888 882 890 895 896
【答案】在该地区,乙种水稻更有推广价值
【详解】使用计算器可算出甲、乙品种各10亩抽样水稻的平均亩产量为
,.
由于这10亩水稻是随机抽取的,而这两种水稻的样本均值相差很小,从而我们可以估计大面积种植这两种水稻后的平均亩产量也应相差很小.
借助计算器计算方差可得


由于,因此我们可以估计乙种水稻的亩产量要比甲种水稻稳定.
综合以上两种因素,我们可以得出:在该地区,乙种水稻更有推广价值.
36.“一带一路”是“丝绸之路经济带”和“21世纪海上丝绸之路”的简称.某市为了了解人们对“一带一路”的认知程度,对不同年龄和不同职业的人举办了一次“一带一路”知识竞赛,满分100分(90分及以上为认知程度高).现从参赛者中抽取了x人,按年龄分成5组,第一组:[20,25),第二组:[25,30),第三组:[30,35),第四组:[35,40)第五组:[40,45],得到如图所示的频率分布直方图,已知第一组有6人.
(1)求x;
(2)求抽取的x人的年龄的中位数(结果保留整数);
(3)从该市大学生、军人、医务人员、工人、个体户五种人中用分层随机抽样的方法依次抽取6人,42人,36人,24人,12人,分别记为1~5组,从这5个按年龄分的组和这5个按职业分的组中每组各选派1人参加知识竞赛,分别代表相应组的成绩,年龄组中1~5组的成绩分别为,职业组中1~5组的成绩分别为.
①分别求5个年龄组和5个职业组成绩的平均数和方差;
②以上述数据为依据,评价5个年龄组和5个职业组对“一带一路”的认知程度.
【答案】(1)120
(2)32
(3)①平均数94;方差6.8;②从平均数来看两组的认知程度相同,从方差来看年龄组的认知程度更好.
【详解】(1)根据题中频率分布直方图得第一组的频率为,
所以,
所以;
(2)设中位数为,
则,
所以,
∴抽取的人的年龄的中位数为.
(3)①5个年龄组的平均数为,
方差为,
5个职业组的平均数为,
方差为.
②评价:从平均数来看两组的认知程度相同,从方差来看年龄组的认知程度更好.
37.某果园试种了,两个品种的桃树各10棵,并在桃树成熟挂果后统计了这20棵桃树的产量如下表,记,两个品种各10棵的产量的平均数分别为和,方差分别为和.
(单位:kg) 60 50 40 60 70 80 80 80 90 90
(单位:kg) 40 60 60 80 80 50 80 80 70 100
(1)求品种的10棵桃树产量的第80百分位数;
(2)求,,,;
(3)果园要大面积种植这两种桃树中的一种,依据以上计算结果分析选种哪个品种更合适,并说明理由.
【答案】(1)
(2);;;
(3)选种品种,理由见解析.
【详解】(1)由题意将品种的棵桃树产量从小到大排列为:,,,,,,,,,;
且,则第百分位数为第位和第位数的平均数:.
故品种的棵桃树产量的第百分位数为.
(2)由题意可得,



.
(3)种植品种,因为,但是,所以品种产量较稳定.
38.2025年NBA选秀大会,我国选手杨瀚森将参加选秀,为备战选秀,运动员参加了联合试训,其中甲、乙两位运动员开展了队内三分投篮对抗赛.在对抗赛中两人每轮投篮10次,共进行10轮,每轮命中的成绩(个数)如下:
甲 4 7 6 5 4 9 10 7 8 10
乙 7 5 8 6 7 9 7 6 7 8
(1)求甲运动员的样本数据第75百分位数;
(2)分别计算这两位运动员10轮投篮成绩的平均数和方差;
(3)根据第二问结果回答下列问题:甲、乙两位运动员谁的发挥更稳定,为什么?
【答案】(1)9
(2)甲的平均数为7,方差为4.6,乙的平均数为7,方差为1.2
(3)乙发挥的更加稳定,理由见解析
【详解】(1)甲运动员的成绩从小到大排列为,
,故甲运动员的样本数据第75百分位数为9,
(2)甲的平均数为,
方差为
乙的平均数为
方差为
(3)由(2)知:,
故乙发挥的更加稳定.
08 分层方差问题
39.2025年海口市某中学举办校园诗词大赛,评委对参赛选手的表现进行打分.现随机抽取了40名选手的成绩,并分成五组:第一组,第二组,第三组,第四组,第五组,绘制成如图所示频率分布直方图.
(1)求的值;
(2)估计这40名选手成绩的平均数和第95百分位数(同组中数据用该组区间中点值作代表);
(3)现从以上各组中用分层随机抽样的方法选取20人.若第二组选手成绩的平均数和方差分别为65和30,第五组选手成绩的平均数和方差分别为95和40,请据此估计第二组和第五组所有选手成绩的方差.
(附:设两组数据的样本量、样本平均数和样本方差分别为:,,;,,,记两组数据总体样本平均数为,总体样本方差为,则总体样本平均数,总体样本方差.)
【答案】(1)
(2)平均数为77,第95百分位数为95分
(3)
【详解】(1)因为,所以;
(2)40名选手成绩的平均数为,
因为前4组的频率和为,
前5组的频率和为,
所以第95百分位数位于内,设其为,
则,解得,
即第95百分位数为95分.
(3)设第二组、第五组选手成绩的平均数、方差分别为,,,,
且从第二组选取的人数为,从第五组选取的人数为,
则第二组和第五组所有选手的成绩平均数为,
第二组和第五组所有选手成绩的方差为

所以第二组和第五组所有选手成绩的方差为.
40.汽车智能化——无人驾驶汽车成为汽车行业发展趋势.某汽车研发部门为了解客户对无人驾驶汽车的性能满意情况,随机抽取200名客户对无人驾驶汽车的性能进行打分,发现打分均在[40,100]内,将这些数据分成6组:,,,,,,并绘制出样本的频率分布直方图,因不慎,使得图形残缺,如图所示.
(1)求样本中打分在内的客户人数并估计样本的中位数;
(2)已知打分在内的样本数据的平均值为63,方差为5,打分在内的样本数据的平均值为78,方差为2,求打分在内的样本数据的平均值与方差.
【答案】(1)客户人数为60人,中位数为75
(2)平均值为73,方差为53
【详解】(1)由题可知,打分在内的频率为

所以样本中打分在内的客户人数为人.
由图可知,打分在内的频率为0.35,在内的频率为0.30,
设样本的中位数为,则,
则,解得,
故样本的中位数为75.
(2)根据频率分布直方图可知,打分在,内的样本数据的频数分别为30,60,
所以打分在内的样本数据的平均值为.
打分在内的样本数据的方差为

41.为推动防范电信网络诈骗工作,预防和减少电信网络诈骗案件的发生,某市开展防骗知识宣传活动,举办“网络防骗”知识竞赛.现从所有答卷中随机抽取100份作为样本,将样本的成绩(满分100分,成绩均为不低于40分的整数)分成六段:,,…,得到如图所示的频率分布直方图.
(1)求图中a的值;
(2)根据频率分布直方图计算样本成绩的80%分位数;
(3)若总体划分为2层,采用样本量比例分配的分层随机抽样,各层抽取的样本量、样本平均数样本方差分别为:m,,;n,,.记总的样本平均数为,样本方差为,则.已知在的平均数是65,方差是6,在的平均数是75,方差是3,求这两组样本的总平均数和总方差.
【答案】(1)
(2)86
(3),
【详解】(1)由,解得.
(2)由题,成绩在的频率为,
在的频率为,
所以样本成绩的80%分位数在内,设样本成绩的80%分位数为,
则,解得,
所以样本成绩的80%分位数为86.
(3)频率为,样本量,的频率为,样本量,
所以两组样本的总体平均数,
两组样本的总方差.
42.2025年5月25日,平潭综合实验区成功举办半程马拉松赛.志愿服务是赛事成功举办的重要保障.在该赛事志愿者选拔工作中,工作人员随机抽取100名候选者,将其面试成绩按要求分成六组:,并根据数据绘制了频率分布直方图(如图所示).
(1)估计这100名候选者面试成绩的平均数;(同一组中的数据用该组区间的中点值作代表)
(2)已知落在区间内的面试成绩平均数为55,方差为16,落在区间的面试成绩平均数为67,方差为20,试估算在区间内所有面试成绩的平均数和方差.
【答案】(1)74
(2)63,
【详解】(1)由每组小矩形的面积之和为1,得,
解得,
由,
得样本成绩的平均数为74;
(2)由频率分布直方图知,成绩在的人数为,
成绩在的人数为,
所以落在所有候选者的面试成绩的平均数 ,
方差 . ,
估计落在所有候选者的面试成绩的方差为 .
43.为进一步推动防范电信网络诈骗工作,预防和减少电信网络诈骗案件的发生,某市开展防骗知识大宣传活动.举办了“网络防骗”知识竞赛,从所有答卷中随机抽取100份作为样本,将样本的成绩(满分100分,成绩均为不低于40分的整数)分成六段:,,…,,得到如图所示的频率分布直方图.
(1)求图中的值;
(2)根据频率分布直方图,估计样本成绩的平均数和下四分位数;
(3)若总体划分为2层,通过分层随机抽样抽取样本构成总样本.已知各层抽取的样本量、样本平均数和样本方差分别为,,;,,,求总样本平均数,样本方差.
【答案】(1);
(2)74,65
(3),.
【详解】(1)由频率分布直方图知,,
所以.
(2)平均数为,
前2组的频率和为,前3组的频率和为,
因此下四分位数在第3组,设为,,解得,
所以下四分位数为.
(3)总样本平均数,
,,
总样本方差,
又,

同理,
所以.
44.某电视台有一档益智答题类综艺节目,每期节目从现场编号为01~80的80名观众中随机抽取10人答题.答题选手要从“科技”和“文艺”两类题目中选一类作答,一共回答10个问题,答对1题得1分.
(1)若采用随机数表法抽取答题选手,按照以下随机数表,从下方带点的数字2开始向右读,每次读取两位数,一行用完接下一行左端,求抽取的第6个观众的编号.
1622779439 4954435482 1737932378 8735209643 8426349164
8442175331 5724550688 7704744767 2176335025 83921206761
(2)某学校统计教师职称及年龄,中级职称教师的人数为50人,其平均年龄为38岁,方差为2,高级职称的教师3人58岁,5人40岁,2人38岁,求该学校教师年龄的平均数和方差.
【答案】(1)
(2)平均数为,方差为
【详解】(1)解:根据题意,结合随机数表中数字的读取方法,
可得读取的数字编号依次为:,
所以抽取的第6个观众的编号为.
(2)解:设中级职称教师的人数年龄的平均数为,方差为,可得,,
设中级职称教师的人数年龄的平均数为,方差为,
因为高级职称的教师3人58岁,5人40岁,2人38岁,
可得,

则该学校教师年龄的平均数(岁),
方差为.
1.(2025·湖北武汉·模拟预测)某地统计了辖区内从2017年至2024年这8年的新能源汽车和纯电动汽车的销量(单位:百辆),得到如下折线图:
现对2021年至2024年这4年的数据进行分析,设新能源汽车的销量数据和纯电动汽车的销量数据的方差分别为和,新能源汽车的销量数据和纯电动汽车的销量数据的年平均增长率分别为和,则( )
A. B. C. D.
【答案】B
【详解】因为2021年至2024年这4年新能源汽车的销量数据为,
平均数为,
所以

2021年的年增长率为,2022年的年增长率为,
2023年的年增长率为,2024年的年增长率为,
这四年的新能源汽车的销量数据和年平均增长率分别为;
因为2021年至2024年这4年纯电动汽车的销量数据为,
平均数为,
所以

2021年的年增长率为,2022年的年增长率为,
2023年的年增长率为,2024年的年增长率为,
这四年的新能源汽车的销量数据和年平均增长率分别为;
所以.
故选:B
2.(2025·安徽合肥·模拟预测)已知这10个数据的平均数为,方差为1.98,则这11个数据的方差为( )
A.1.8 B.0.8 C.1.98 D.0.98
【答案】A
【详解】这10个数据的方差为,则,
这11个数据的平均数为,
方差为.
故选:A
3.(2025·甘肃定西·模拟预测)某品牌电动汽车公司为了解车主使用电动车辅助驾驶功能的情况,进行了问卷调查,从中抽取了100位车主进行抽样分析,得出这100位车主每人在100次驾驶途中使用辅助驾驶功能的次数的频率分布直方图,则样本中车主使用辅助驾驶功能次数的分位数为( )
A.62 B.64 C.66 D.68
【答案】C
【详解】因为,

所以样本中车主使用辅助驾驶功能次数的40%分位数位于内,
设样本中车主使用辅助驾驶功能次数的分位数为,
则,
解得.
故选:C.
4.(多选)(2025·海南三亚·一模)某学校为培养学生创新精神和实践能力,组织了一次“科技小发明”竞赛活动,并对200位参赛学生的综合表现进行评分,评分的频率分布直方图如图,根据图中数据,下列说法正确的是( )
A.
B.评分在的人数约为20
C.估计评分的下四分位数为65
D.估计评分的平均数为76.5
【答案】ABD
【详解】对A,由频率之和为1得,解得,故A正确;
对B,评分在的频率为,故人数约为20,故B正确;
对C,下四分位数频率为0.25,故下四分位数为 ,故C错误;
对D,平均数为,故D正确.
故选:ACD
5.(2025·天津红桥·模拟预测)采用分层抽样的方法抽取一个容量为80的样本,高一年级被抽取20人,高二年级被抽取30人,高三年级共有600人,则这个学校共有高中学生 人.
【答案】
【详解】依题意高三年级共抽取人.
又高三年级共有600人,所以抽样比为,所以学校共有高中生人.
故答案为:.
6.(2025·甘肃白银·模拟预测)为了更好地应对新高考改革以及调整日常教学,某地区教育局对该地区的三所高中的二年级学生进行了抽样调查,采用分层抽样的方式抽取了1000名学生参加物理学科的抽样质量测试,其中A校、B校、C校的学生人数分别为300人、500人、200人,考试结束后对这1000名同学的物理成绩进行统计,得知A,B,C三所学校的高二年级的物理平均分依次为60分、75分、58分,则这1000名同学物理成绩的总平均分为 分.
【答案】67.1
【详解】由分层抽样的平均数计算可得总样本1000名同学物理成绩的总平均分为分.
故答案为:67.1
7.(2025·新疆·模拟预测)某学校为了解学生的体质健康状况,对高一、高二两个年级的学生进行体质健康测试.现从两个年级学生中各随机抽取20人,他们的测试数据如下:
高一:50,53,58,64,66,67,67,69,71,72,75,78,79,82,83,86,89,93,94,96
高二:40,42,50,52,56,64,65,67,68,72,73,73,79,81,84,85,88,90,96,98
国家学生体质健康标准的等级标准如下表,规定:测试数据,体质健康为合格.
等级 优秀 良好 及格 不及格
测试数据
(1)从该校高二年级学生中随机抽取一名学生,试估计这名学生体质健康不合格的概率;
(2)从两个年级等级为优秀的样本中各随机抽取一名学生,求抽取的两名学生的测试数据平均数不大于95的概率;
(3)设该校高一学生测试数据的平均数和方差分别为,,高二学生测试数据的平均数和方差分别为,,试比较与、与的大小.(只需写出结论)
【答案】(1)
(2).
(3),.
【详解】(1)由样本中测试数据可知高二学生样本中体质健康不合格的人数为5,
故样本中学生体质健康不合格的频率为,
故从该校高二年级学生中随机抽取一名学生,估计这名学生体质健康不合格的概率为.
(2)设高一年级样本中测试数据为93,94,96的三名学生分别为,,,
高二年级样本中测试数据为90,96,98的三名学生分别为,,,
选取的2名学生构成的基本事件为:,,,
,,,,,,共9个,
其中两名学生的测试数据平均数大于95的有,,,,共4个,
所以选取的两名学生的测试数据平均数大于95的概率为,
故选取的两名学生的测试数据平均数不大于95的概率为.
(3)
故,.
8.(2024·陕西西安·一模)近年来“天宫课堂”受到广大中小学生欢迎,激发了同学们对科学知识的探索欲望和对我国航天事业成就的自豪.为领悟航天精神,感受中国梦想,某校组织了一次“寻梦天宫”航天知识竞赛(满分分),各年级学生踊跃参加.校团委为了比较高一、高二学生这次竞赛的成绩,从两个年级的答卷中各随机选取了份,将成绩进行统计得到以下频数分布表:
成绩
高一学生人数
高二学生人数
试利用样本估计总体的思想,解决下列问题:
(1)从平均数与方差的角度分析哪个年级学生这次竞赛成绩更好(同一组中的数据用该组区间的中点值为代表)?
(2)校后勤部决定对参与这次竞赛的学生给予一定的奖励,奖励方案有以下两种:
方案一:记学生得分为,当时,奖励该学生元食堂代金券;当时,奖励该学生元食堂代金券;当时,奖励该学生元食堂代金券;
方案二:得分低于样本中位数的每位学生奖励元食堂代金券;得分不低于中位数的每位学生奖励元食堂代金券.
若高一年级组长希望本年级学生获得更多的奖励,则他应该选择哪种方案?
【答案】(1)高二学生这次竞赛成绩更好
(2)选择方案一
【详解】(1)样本中,高一学生竞赛平均成绩为:,
方差;
样本中,高二学生竞赛平均成绩为:,
方差.
,,
样本中平均成绩一样,但高二学生的成绩更稳定.
利用样本估计总体的思想可以认为,高二学生这次竞赛成绩更好.
(2)设选择方案一时一位学生获得的奖金为元,
则的可能取值为,其对应的频率分别为,
获得奖励的平均数:(元);
设选择方案二时一位学生获得的奖励为元,则获得奖金的平均数:
(元).
,从统计角度看,高一年级组长应该选择方案一.
1.(2023·新课标Ⅱ卷·高考真题)某学校为了解学生参加体育运动的情况,用比例分配的分层随机抽样方法作抽样调查,拟从初中部和高中部两层共抽取60名学生,已知该校初中部和高中部分别有400名和200名学生,则不同的抽样结果共有( ).
A.种 B.种
C.种 D.种
【答案】D
【详解】根据分层抽样的定义知初中部共抽取人,高中部共抽取,
根据组合公式和分步计数原理则不同的抽样结果共有种.
故选:D.
2.(多选)(2023·新课标Ⅰ卷·高考真题)有一组样本数据,其中是最小值,是最大值,则( )
A.的平均数等于的平均数
B.的中位数等于的中位数
C.的标准差不小于的标准差
D.的极差不大于的极差
【答案】BD
【详解】对于选项A:设的平均数为,的平均数为,
则,
因为没有确定的大小关系,所以无法判断的大小,
例如:,可得;
例如,可得;
例如,可得;故A错误;
对于选项B:不妨设,
可知的中位数等于的中位数均为,故B正确;
对于选项C:举反例说明,例如:,则平均数,
标准差,
,则平均数,
标准差,显然,即,
所以的标准差不小于的标准差,这一论断不成立,故C错误;
对于选项D:不妨设,
则,当且仅当时,等号成立,故D正确;
故选:BD.
3.(2024·上海·高考真题)为了解某地初中学生体育锻炼时长与学业成绩的关系,从该地区29000名学生中抽取580人,得到日均体育锻炼时长与学业成绩的数据如下表所示:
时间范围学业成绩
优秀 5 44 42 3 1
不优秀 134 147 137 40 27
(1)该地区29000名学生中体育锻炼时长不少于1小时人数约为多少?
(2)估计该地区初中学生日均体育锻炼的时长(精确到0.1)
【答案】(1)
(2)
【详解】(1)由表可知锻炼时长不少于1小时的人数为占比,
则估计该地区29000名学生中体育锻炼时长不少于1小时的人数为.
(2)估计该地区初中生的日均体育锻炼时长约为

则估计该地区初中学生日均体育锻炼的时长为0.9小时.
4.(2023·全国甲卷·高考真题)一项试验旨在研究臭氧效应,试验方案如下:选40只小白鼠,随机地将其中20只分配到试验组,另外20只分配到对照组,试验组的小白鼠饲养在高浓度臭氧环境,对照组的小白鼠饲养在正常环境,一段时间后统计每只小白鼠体重的增加量(单位:g).试验结果如下:
对照组的小白鼠体重的增加量从小到大排序为
15.2 18.8 20.2 21.3 22.5 23.2 25.8 26.5 27.5 30.1
32.6 34.3 34.8 35.6 35.6 35.8 36.2 37.3 40.5 43.2
试验组的小白鼠体重的增加量从小到大排序为
7.8 9.2 11.4 12.4 13.2 15.5 16.5 18.0 18.8 19.2
19.8 20.2 21.6 22.8 23.6 23.9 25.1 28.2 32.3 36.5
(1)计算试验组的样本平均数;
【答案】(1)
【详解】(1)试验组样本平均数为:

展开更多......

收起↑

资源列表