第01讲 随机抽样、统计图表、用样本估计总体(复习讲义)(含答案)2026年高考数学一轮复习讲练测(全国通用)

资源下载
  1. 二一教育资源

第01讲 随机抽样、统计图表、用样本估计总体(复习讲义)(含答案)2026年高考数学一轮复习讲练测(全国通用)

资源简介

中小学教育资源及组卷应用平台
第01讲 随机抽样、统计图表、用样本估计总体
目录
01
02体系构建·思维可视 4
03核心突破·靶向攻坚 5
知能解码 5
知识点1 简单随机抽样 5
知识点2 分层抽样 5
知识点3 用样本估计总体 6
知识点4 样本的数字特征 7
知识点5 平均数、方差的线性关系 8
题型破译 9
题型1 随机抽样、分层抽样 9
题型2 统计图表 10
题型3 频率分布直方图 14
题型4 百分位数 19
【方法技巧】计算一组个数据的第百分位数的步骤
题型5 样本的数字特征 21
题型6 总体集中趋势的估计 23
题型7 总体离散程度的估计 27
题型8 分层抽样的方差问题 29
【方法技巧】分层抽样的样本均值和样本方差
04真题溯源·考向感知 34
05课本典例·高考素材 36
考点要求 考察形式 2025年 2024年 2023年
(1)抽样方法 (2)统计图表 (3)频率分布直方图 (4)样本的数字特征的估计,总体集中趋势的估计,总体离散程度的估计 单选题 多选题 填空题 解答题 2025年上海卷第17题(3),4分 2025年全国二卷第1题,5分 2024年II卷第4题,5分 2024年上海卷第19题(1),(2)8分 2023年上海卷第9题,5分 2023年I卷第9题,5分 2023年甲卷(文)第19题(1),4分 2023年乙卷(理)第17题,12分
考情分析: 统计学是“大数据”技术的关键,在互联网时代具有强大的社会价值和经济价值,在高考中受重视程度越来越大,未来在考试中的出题角度会更加与实际生活紧密联系,背景新颢、形式多样
复习目标: (1)会用简单随机抽样的方法从总体中抽取样本,了解分层随机抽样. (2)理解统计图表的含义. (3)会用统计图表对总体进行估计,会求个数据的第百分位数. (4)能用数字特征估计总体集中趋势和总体离散程度.
知识点1 简单随机抽样
(1)简单随机抽样
分为放回简单随机抽样和不放回简单随机抽样.除非特殊声明,本章简单随机抽样指不放回简单随机抽样.
(2)简单随机样本
通过简单随机抽样获得的样本称为简单随机样本.
(3)简单随机抽样的常用方法
实现简单随机抽样的方法很多,抽签法和随机数法是比较常用的两种方法.
自主检测用抽签法从学号为1到50的50名学生(其中含学生李华)中不放回抽取5名学生进行问卷调查,每次抽取一个号码,共抽取5次,设李华第一次被抽到的概率为,第五次被抽到的概率为,则( )
A.a = ,B.a = ,C.a = , D.a = ,
【答案】B
【详解】由简单随机抽样的定义知,每个个体在每次抽取中都有相同的可能性被抽到,
因为每次抽取一个号码,所以李华第一次被抽到的可能性为,
第五次被抽到的可能性为.
即李华同学在每次抽样中被抽到的可能性都是,所以,.
故选:B.
知识点2 分层抽样
(1)分层随机抽样的概念
一般地,按一个或多个变量把总体划分成若干个子总体,每个个体属于且仅属于一个子总体,在每个子总体中独立地进行简单随机抽样,再把所有子总体中抽取的样本合在一起作为总样本,这样的抽样方法称为分层随机抽样,每一个子总体称为层.
(2)分层随机抽样的平均数计算
在分层随机抽样中,以层数是2为例,如果第1层和第2层包含的个体数分别为和,抽取的样本量分别为和,第1层和第2层的样本平均数分别为,,样本平均数位,则.我们可以采用样本平均数估计总体平均数
自主检测某校高一、高二、高三年级的学生人数之比为,现用分层随机抽样的方法从该校三个年级的学生中抽取容量为300的样本,则从高二年级抽取的学生人数为( )
A.60 B.90 C.120 D.150
【答案】B
【详解】由题意:从高二年级抽取的学生人数为:.
故选:B
知识点3 用样本估计总体
1、频率分布直方图
(1)频率、频数、样本容量的计算方法
①×组距=频率.
②=频率,=样本容量,样本容量×频率=频数.
③频率分布直方图中各个小方形的面积总和等于.
2、频率分布直方图中数字特征的计算
(1)最高的小长方形底边中点的横坐标即是众数.
(2)中位数左边和右边的小长方形的面积和是相等的.设中位数为,利用左(右)侧矩形面积之和等于,即可求出.
(3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和,即有,其中为每个小长方形底边的中点,为每个小长方形的面积.
3.总体百分位数的估计
(1)第百分位数的定义
一般地,一组数据的第p百分位数是这样一个值,它使得这组数据中至少有的数据小于或等于这个值,且至少有的数据大于或等于这个值.
(2)计算一组个数据的第百分位数的步骤:
第1步,按从小到大排列原始数据.
第2步,计算.
第3步,若不是整数,而大于的比邻整数为,则第百分位数为第项数据;若是整数,则第百分位数为第项与第项数据的平均数.
自主检测一组数据按从大到小的顺序排列为8,7,x,4,4,1,若该组数据的中位数是众数的倍,则该组数据的第60百分位数是 .
【答案】6
【详解】因为数据1,4,4,,7,8(其中)的中位数为,众数为4,
所以,得,
因为,
所以这组数据的第60百分位数是6;
故答案为:6
知识点4 样本的数字特征
(1)众数
一组数据中出现次数最多的数据(即频率分布最大值所对应的样本数据)称为这组数据的众数.
(2)中位数
一组数据按从小到大(或从大到小)的顺序排成一列,处于最中间的一个数据(当数据个数是奇数时)或最中间两个数据的平均数(当数据个数是偶数时)称为这组数据的中位数.
(3)平均数
一组数据的和与这组数据的个数的商称为这组数据的平均数.数据,,,的平均数为
(4)标准差与方差
如果有个数据,,,那么平均数,标准差为:,方差:
知识点三:在频率分布直方图中,众数,中位数,平均数的估计值
(1)最高的小矩形底边中点的横坐标即是众数;
(2)中位数左边和右边的所有小矩形的面积和是相等的;
(3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小矩形的面积乘小矩形底边中点的横坐标之和.
自主检测为弘扬传统文化,某校举办了传统文化知识竞赛.现将竞赛得分在分(满分:分)的学生成绩进行统计与分组,得到如下图所示的频率分布直方图.
(1)求的值,并估计统计数据的上四分位数;
(2)据统计,本次竞赛在内得分的平均数为,方差为;在内得分的平均数为,方差为,求在内得分的平均数与方差.
【答案】(1);
(2);
【详解】(1)由频率分布直方图的性质,知所有矩形的面积和为1,
所以即,解得:
因为,
故四分位数区间一定在内
设四分位数为,则,解得:
(2)的频率:
的频率:
因此,与的数量比为
设有个数据,有个数据,
已知内得分的平均数为,内得分的平均数为
则的平均数为
根据方差的性质得:
知识点5 平均数、方差的线性关系
如果数据的平均数为,方差为,那么
①一组新数据的平均数为,方差是.
②一组新数据的平均数为,方差是.
③一组新数据的平均数为,方差是.
自主检测已知数据,,,,的方差是4,则,,,,的方差为 .
【答案】16
【详解】由题意可得,,
则,.
故答案为:.
题型1 随机抽样、分层抽样
例1-1某高校对中文系新生进行体测,利用随机数表对400名学生进行抽样,先将400名学生进行编号,001,002,……,399,400.从中抽取40个样本,如图提供随机数表的第4行到第6行,若从表中第5行第6列开始向右读取数据,则得到的第4个样本编号是( )
32 21 18 34 29 78 64 54 07 32 52 42 06 44 38 12 23 43 56 77 35 78
84 42 12 53 31 34 57 86 07 36 25 30 07 32 86 23 45 78 89 07 23 68
32 56 78 08 43 67 89 53 55 77 34 89 94 83 75 22 53 55 78 32 45 77
A.328 B.253 C.007 D.860
【答案】A
【详解】从表中第5行第6列开始向右读取数据为:253,313,457(舍),860(舍),736(舍),253(舍),007,328,所以第四个数为328.
故选:A.
例1-2某校高一年级有男生160人,女生120人,现需抽调人参与学校“5.4”文艺汇演志愿者工作.若按性别分层,采用比例分配的分层随机抽样.已知男生抽取16人,则( )
A.27 B.28 C.29 D.30
【答案】B
【详解】由抽取男生人数16人,所以抽取比例为,所以抽取人数为,
故选:B.
【变式训练1-1】某班级有名学生,班主任用不放回的简单随机抽样的方法从这名学生中抽取人进行家访,则同学被抽到的可能性为( )
A. B. C. D.
【答案】D
【详解】总体有个个体,每个个体被抽到的概率相同,均为,
故选:D.
【变式训练1-2】某县有高中生2000人,初中生3000人,小学生4000人,幼儿园学生1500人,为了解该县学生的健康情况,采用比例分配的分层随机抽样方法从中抽取样本,若抽出的初中生为30人,则抽出的幼儿园学生人数为( )
A.15 B.20 C.30 D.40
【答案】A
【详解】分层抽样的抽取比例为,
所以幼儿园应抽取的学生人数为:人,
故选:A.
【变式训练1-3】某林区有针叶林、阔叶林、混交林三类树种区域,面积占比为,每个区域树种种植密度均相同.现采用分层随机抽样调查各类树种生长情况,若从针叶林区域抽取了120株样树,则在该林区总共抽取的树种数量为 .
【答案】
【详解】由题意,设该林区总共抽取的树种数量为,
因为针叶林、阔叶林、混交林三类树种区域的面积占比为,
所以针叶林区域占比为,
又因为从针叶林区域抽取了株样树,
所以,解得,
故该林区总共抽取的树种数量为.
故答案为:.
题型2 统计图表
例2-1年度全省地区生产总值为本年度第一、二、三产业增加值之和.观察下列两个图表,则下列说法错误的是( )
A.2020至2024年第一产业增加值逐年下降
B.2020至2024年第二产业增加值逐年升高
C.2020至2024年第三产业增加值占地区生产总值比重逐年升高
D.2020至2024年全省地区生产总值逐年增长
【答案】A
【详解】结合图1和图2,计算可得2020至2024年第一产业增加值依次为
3167.578,3362.034,3505.425,3520.571,3543.75,成递增趋势,故A错误;
结合图1和图2,计算可得2020至2024年第二产业增加值依次为
15297.084,16939.479,17709.225,18712.076,19591.875,成递增趋势,故B正确;
由图2可知,2020至2024年第三产业增加值占地区生产总值比重逐年升高,故C正确;
由图1可知,2020至2024年全省地区生产总值逐年增长,故D正确.
故选:A.
例2-2(多选)某校秋季运动会中A,B两班的各个单项得分(满分5分)的雷达图如图所示,则下列说法正确的是( )
A.在200米项目中,A班的得分比B班的得分高
B.对于这六个项目成绩,A班的第80百分位数比B班的第80百分位数高
C.对于这六个项目成绩,A班与B班的众数相同
D.B班的总分比A班的总分高
【答案】AD
【详解】由雷达图可知,100米,200米,铅球,1000米,跳远,跳高这六个项目,
A班的得分分别为4,4,3,5,4,3;B班的得分分别为5,3,4,5,3,4;
对于A,在200米项目中,A班的得分比B班的得分高,正确;
对于B,,A班的得分从小到大排序为3,3,4,4,4,5;
B班的得分分别为3,3,4,4,5,5;所以A班的第80百分位数为4,B班的第80百分位数为5,
故A班的第80百分位数比B班的第80百分位数高,错误;
对于C,A班的众数为4,B班的数据中3,4,5出现的次数一样,众数为3,4,5,错误;
对于D,A班的总分为,B班的总分为,
所以B班的总分比A班的总分高,正确.
故选:AD
【变式训练2-1】(多选)某快递公司2020-2024年快递业务量及其增长率如图所示,则( )
A.该公司2020-2024年快逆业务量逐年上升
B.该公司2020-2024年快递业务量的极差为68.5
C.该公司2020-2024年快递业务量的增长率的平均数为
D.该公司2020-2024年快递业务量的增长率的中位数为
【答案】ABC
【详解】对A:由图可知:2020—2024年快递业务量逐年上升,故A正确;
对B:2020—2024年快递业务量的极差为:(亿件),故B正确;
对C:由,故C正确;
对D:将增长率从小到大排序,即,则中位数为,故D错误;
故选:ABC.
【变式训练2-2】(多选)某学校对高一学生预选科进行调查统计,发现学生选科仅有物化生 政史地 物化地 物化政 生史地五种组合,其中选择物化地和物化政组合的人数相等,并绘制得到如下的扇形图和条形图,则( )
A.该校高一学生总人数为800
B.该校高一学生中选择物化政组合的人数为90
C.该校高一学生中选择物理的人数比选择历史的人数多
D.按选科组合用分层随机抽样的方法从该校高一学生抽取40人,则生史地组合应抽取8人
【答案】ACD
【详解】选项A:由扇形图可知选科是政史地这种组合的学生所占比例为,
由条形图可知选科是政史地这种组合的学生人数为200,
故该校高一学生总人数为,选项A正确;
选项B:由条形图可知选科是生史地这种组合的学生人数为160,
则选科是生史地这种组合的学生所占比例为,
依题意,选择物化地和物化政组合的人数相等,
因此选科是物化政这种组合的学生所占比例为,
故选科是物化政这种组合的学生人数为,选项B错误;
选项C:该校高一学生中选择物理的学生所占比例为:,
该校高一学生中选择历史的学生所占比例为:,,
故该校高一学生中选择物理的人数比选择历史的人数多,故选项C正确;
选项D:选科是生史地这种组合的学生所占比例为,
故生史地组合应抽取人,选择D正确.
故选:ACD.
【变式训练2-3】(多选)为了解某企业员工的学习情况,对该企业员工进行问卷调查,已知他们的得分都处在A,B,C,D四个区间内,根据调查结果得到下面的统计图.已知该企业男员工占则下列结论正确的是( )
A.男、女员工得分在A区间的占比相同
B.在各得分区间男员工的人数都多于女员工的人数
C.得分在C区间的员工最多
D.得分在D区间的员工占总人数的19%
【答案】AD
【详解】根据题意,设员工总人数为,因为女员工人数为(人),
所以,解得,
所以男员工人数为(人),
对于A,女员工得分在区间的占比为,
男员工得分在区间的占比为,
即男、女员工得分在A区间的占比相同,故A正确;
对于B,由题图1可知,女员工在区间有20人,区间有60人,区间有70人,区间有50人,
男员工在区间有(人),区间有(人),
区间有(人),区间有(人),
所以区间男员工少于女员工,故B错误;
对于C,区间有(人),区间有(人),
所以区间人数比C区间多,故C错误;
对于D,区间有(人),
所以得分在区间的员工占总人数的,故D正确.
故选:AD
题型3 频率分布直方图
例3-1某高校举行了一次环保知识竞赛,共有900名学生参加,为了解本次竞赛成绩的情况,从中抽取了部分学生的成绩(得分均为整数,满分为100分)进行统计.请你根据尚未完成的频率分布表和频率分布直方图,解答下列问题:
分组 频数 频率
[50,60) 4 0.08
[60,70) 0.16
[70,80) 10
[80,90) 16 0.32
[90,100]
合计 50
AI
(1)填充频率分布表的空格(将答案直接填在表格内);
(2)补全频率分布直方图;
(3)若成绩在[80,100]内的学生获得环保纪念勋章,请估计该校获得环保纪念勋章的学生有多少人.
【答案】(1)表格见解析
(2)作图见解析
(3)504
【详解】(1)由频率分布表,可知样本容量为50,
故成绩在[60,70)的频数为,
成绩在[70,80)的频率为,
成绩在[90,100]的频数为,
频率为,
故频率分布表为:
分组 频数 频率
[50,60) 4 0.08
[60,70) 8 0.16
[70,80) 10 0.20
[80,90) 16 0.32
[90,100] 12 0.24
合计 50 1
(2)频率分布直方图如图所示:

(3)样本中成绩在[80,100]的频率为0.32 + 0.24 = 0.56,
所以估计该校获得环保纪念勋章的学生人数为900×0.56 = 504.
例3-2某所学校为了解高三年级学生数学第二次模拟考试情况,随机抽取了50名学生的成绩,(满分150分),将所有数据整理后绘制成如下频率分布直方图:
(1)求的值;
(2)求这50名学生的数学成绩的第80百分位数;
(3)根据频率分布直方图,估计这所学校高三学生第二次模拟考试的数学成绩的平均分.
【答案】(1)
(2)
(3)
【详解】(1)分数在的学生频率:,
分数在的学生频率:,
分数在的学生频率:,
分数在的学生频率:,
分数在的学生频率:,
频率之和为1,故,即,解得,
故.
(2)因为,,
所以这50名学生的数学成绩的第80百分位数在内,设为,
则,,,
解得,
故这50名学生的数学成绩的第80百分位数为.
(3)这所学校高三学生第二次模拟考试的数学成绩的平均分为:
.
【变式训练3-1】某机构对年某地销售的新能源汽车的销售价格与销售数量进行统计,销售价格都不小于5万元,且小于30万元,销售价格分为五组:,,,,(单位:万元).统计后制成如图所示的频率分布直方图,则销售价格的80%分位数为( )

A.26 B.23 C.21 D.19
【答案】C
【详解】由频率分布直方图知,
,所以.
设销售价格的分位数为,
因为,1,
所以销售价格的分位数在内.
由,得.
故选:C.
【变式训练3-2】某市举行青年歌手大赛,为了解本次比赛成绩的情况,从中随机抽取了部分人的成绩(满分为100分)作为样本进行统计.请根据下面尚未完成的频率分布表和频率分布直方图解答问题:
组号 分组 频数 频率
1 4 0.08
2 8 0.16
3 16 0.32
4 14 0.28
5
合计

(1)求的值;
(2)补全频率分布直方图;
(3)估计这次比赛的平均成绩.(同一组中的数据用该组区间的中点值作代表)
【答案】(1)
(2)频率分布直方图见解析
(3)
【详解】(1)频率和,则,可得,
因为在内的人数为4,频率为0.08,则总人数为,
则.
(2)因为在内的频率为0.16,则对应小长方形的高为;
因为在内的频率为0.16,则对应小长方形的高为,
所以频率分布直方图如图所示,

(3)估计这次比赛的平均成绩为
.
【变式训练3-3】某部门针对某社区建设满意度进行评分,第一轮由8名评委进行评分,评分如下:71,73,76,79,81,83,86,91;第二轮由100名社区居民进行评分,将居民的评分分成,,,,五组,并画出其频率分布直方图(如图).
(1)求的值并估计这100名居民评分的中位数;
(2)若第一轮评分的平均分为,第二轮评分的平均分为(同一组中的数据用该组区间的中点值作代表).记,根据的取值将社区建设满意度分为三个等级:
的取值
满意度等级 不满意 满意 非常满意
试估计该社区建设满意度等级.
【答案】(1)的值为0.020,中位数为78;
(2)满意.理由见解析
【详解】(1)由题意得,
解得,
因为,,
所以100名居民评分的中位数位于区间,
设100名居民评分的中位数为,
则,解得
所以的值为0.020,中位数为78;
(2),

所以,
所以该社区建设满意度等级为满意.
题型4 百分位数
例4-12024年巴黎奥运会奖牌榜前8名的金牌数依次为40,40,20,18,16,15,14,13,则这组数据的上四分位数为( )
A.40 B.30 C.15 D.14.5
【答案】B
【详解】由题设,数据从小到大为,且,
所以数据的上四分位数为.
故选:B
例4-2已知一组数据39,41,44,46,49,50,x,55的第65百分位数是50,那么实数的取值范围是( )
A. B. C. D.
【答案】A
【详解】∵,∴这组数据按从小到大顺序排列后,第65百分位数是第6个数,因此 不小于50,即,
故选:A.
方法技巧 计算一组个数据的第百分位数的步骤
第1步,按从小到大排列原始数据.
第2步,计算.
第3步,若不是整数,而大于的比邻整数为,则第百分位数为第项数据;若是整数,则第百分位数为第项与第项数据的平均数.
【变式训练4-1】某同学记录了以下数据,分别为12,10,13,11,6,8,16,14,则该组数据的第80百分位数为( )
A.10 B.13 C.13.5 D.14
【答案】D
【详解】根据定义,这些数据由小到大的排序为6,8,10,11,12,13,14,16,
因为,所以第80百分位数为第7个数14.
故选:D
【变式训练4-2】已知一组数据,则这组数据的分位数是 .
【答案】13
【详解】由题意得数据共个数,
由百分位数位置公式得,而不是整数,向上取整为,
而的第个数是13,则这组数据的分位数是13.
故答案为:13
【变式训练4-3】已知一组数据:3,5,7,1,4,6,9,2,则这组数据的第75百分位数是 .
【答案】6.5/
【详解】对原始数据从小到大排序为:
因为,
所以第75百分位数为第6个和第7个的平均数,即,
所以这组数据的第75百分位数是,
故答案:.
题型5 样本的数字特征
例5-1甲、乙、丙、丁对某组数据(该组数据由5个整数组成)进行分析,得到以下数字特征,则不能判断这组数据一定都小于12的是( )
A.甲:中位数为9,众数为11 B.乙:中位数为9,极差为3
C.丙:平均数为8,极差为4 D.丁:平均数为8,方差为3
【答案】B
【详解】对于A,中位数为9,众数为11,说明11至少有两个数,不妨取两个11,
则由中位数可知另外两个数肯定不超过9,故A能判断这组数据都小于12,所以不能选A;
对于B,中位数为9,极差为3,由于极差是5个数中最大与最小的差,
由于该组数据由5个整数组成,所以不妨取4个9,1个12,这样不能判断该组数据一定小于12,故选B;
对于C,平均数为,极差为,由于个数都是整数,根据条件可知,这个数中肯定最大数与最小数的差为,则可知最大数肯定大于,最小数肯定小于,故最小数加得最大数肯定小于,从而能判断这组数据一定都小于12,故不能选C;
对于D,平均数为8,方差为3,由方差公式可得,
若存在数12,则
,这与方差为3相矛盾,所以最大数也一定小于12,故不能选D;
故选:B.
例5-2(多选)根据气象学上的标准,从冬季进入春季的标志为连续天的日平均温度均超过.现将连续天的日平均气温的记录数据(记录数据都是自然数)作为一组样本,则下列样本中一定符合入春指标的有( )
A.平均数为,极差为 B.中位数为,众数为
C.众数为,极差为 D.平均数为,方差为
【答案】ABD
【详解】“连续天的日平均温度均超过”,将天数据从小到大排序为:、、、、,
A选项,因为这五个数据的平均数为,
则,
又因为这五个数据的极差为,则,可得,
若,则,则,所以A选项正确;
B选项,因为这五个数据的中位数是,众数是,
所以将数据从小到大排序后,第个数是,第、个数为,
所以个数据都超过,所以B选项正确.
C选项,因为这五个数据的众数是,极差为,
如、、、、,第天低于,不符合,所以C选项错误.
D选项,因为这五个数据的平均数为,

方差为,
所以,,
若,则,矛盾,所以D选项正确.
故选:ABD.
【变式训练5-1】一组样本数据为3,6,5,7,2,4,8,则( )
A.极差为5 B.中位数是7
C.平均数是5 D.众数是8
【答案】C
【详解】样本数据从小到大排列为,
则极差为,A选项错误;
中位数是,B选项错误;
平均数是,C选项正确;
众数不是8,D选项错误;
故选:C.
【变式训练5-2】(多选)2025年上半年,电影《哪吒2》在全国各地的影院热映,某影院连续8天的观影人数(单位:百人)按升序排列依次为90,120,120,130,160,160,160,180,则这组数据的( )
A.众数为160 B.中位数为145 C.平均数为145 D.第30百分位数为120
【答案】ABD
【详解】影院观影人数按升序排列依次为90,120,120,130,160,160,160,180,
则这组数据的众数为160,A选项正确;
中位数为,B选项正确;
平均数为,C选项错误;
因为,所以第30百分位数为120,D选项正确;
故选:ABD.
【变式训练5-3】甲、乙、丙、丁四人各掷骰子5次(骰子每次出现的点数可能为1,2,3,4,5,6),并分别记录每次出现的点数,四人根据统计结果对各自的试验数据分别做了如下描述:①中位数为3,众数为5;②中位数为3,极差为3;③中位数为1,平均数为2;④平均数为3,方差为2;可以判断一定没有出现6点的描述共有 人.
【答案】2
【详解】①5出现两次,又中位数为3,则数据从小到大为,一定没有6;
②中位数为3,极差为3,则数据从小到大为符合题意,故可能出现6;
③中位数为1,平均数为2,则设数据从小到大为符合题意,故可能出现6;
④平均数为3,方差为2,则满足要求且含6的数据从小到大为,
故且,
因为,满足题意的至少有3个3,一个2或4,
不符合,所以不能同时满足,故一定没有6.
综上,①④一定没有6.
故答案为:2
题型6 总体集中趋势的估计
例6-1某家水果店的店长为了解本店苹果的日销售情况,记录了近期连续120天苹果的日销售量(单位:),并绘制频率分布直方图如下:
(1)请根据频率分布直方图估计该水果店苹果日销售量的众数,平均数,中位数;(同一组中的数据以这组数据所在区间中点的值作代表)
(2)一次进货太多,水果会变得不新鲜;进货太少,又不能满足顾客的需求.店长希望每天的苹果尽量新鲜,又能80%地满足顾客的需求(在10天中,大约有8天可以满足顾客的需求).请问每天应该进多少千克苹果?(精确到整数位)
【答案】(1)众数,平均数,中位数
(2)
【详解】(1)解:根据频率分布直方图知,区间的频数最大,所以估计众数为,
平均数为,
设中位数为,因为日销售量之间的频率为,
日销售量之间的频率为,
所以.
(2)解:由频率分别直方图知,
日销售量之间的频率为,
日销售量之间的频率为,
所以所求的量位于区间之间,
设每天的该进量为千克,则,
所以每天应该进量为千克.
例6-2某校高一年级学生期中考试共有450名学生参加.数学考试成绩的频率分布直方图如图所示.
(1)求a的值;
(2)估计这次数学考试成绩的众数、中位数和平均数(结果保留两位小数);
(3)估计该校高一学生这次期中考试数学成绩的第70百分位数(结果保留两位小数).
【答案】(1);
(2)众数为65,中位数为67.69,平均成绩为67.60;
(3)第70的分位数为75.83.
【详解】(1)由频率分布直方图,得,
所以.
(2)由频率分布直方图知:数据落在内最多,因此众数为65;
由,,得中位数,
则,解得,所以中位数为67.69;
平均数为.
(3)成绩小于70分的频率为,
成绩小于80分的频率为,则第70百分位数在内,
所以第70百分位数为.
【变式训练6-1】第十九届亚运会将于2023年9月23日至10月8在中国杭州举办,为了了解我市居民对杭州亚运会相关信息和知识的掌握情况,某学校组织学生开展社会实践活动,采用问卷的形式随机对我市100名居民进行了调查.为了方便统计分析,调查问卷满分20分,得分情况制成如下频率分布直方图.

(1)求的值;
(2)根据频率分布直方图,估计这100名居民调查问卷中得分的
(i)第70百分位数(结果用分数表示);
(ii)平均值(各组区间的数据以该组区间的中间值作代表).
【答案】(1)
(2)(i) (ii)10.64
【详解】(1),
所以;
(2)(i)因为,

所以第70百分位数在12和16之间,
设第70百分位数是,
(ii)
【变式训练6-2】2025年“五一”假期,全国国内出游3.14亿人次,同比增长6.4%,这一数据反映了民众出行意愿高涨,折射出我国内需市场的活力.某景点为提升服务水平,对部分游客发起满意度调查,满意度采用百分制,统计结果绘制成如下频率分布直方图.
(1)求图中的值,并估计满意度得分在75分及以上所占的百分比;
(2)估计满意度得分的中位数和平均数(同一组中数据用该组区间的中点值作代表).
【答案】(1),
(2)中位数为82.5,平均数为82
【详解】(1)由频率分布直方图可知,解得,
满意度得分在75分以上所占百分比为.
(2)解法一:
因为满意度在内的频率为,
满意度在内的频率为,所以中位数在内,
设中位数为,则有,
解得,所以满意度得分的中位数为,
满意度得分的平均数为:.
解法二:
因为满意度在内的频率为,
满意度在内的频率为,所以中位数在内,
由可得中位数为82.5.
满意度得分的平均数为:.
【变式训练6-3】树人中学为了学生的身心健康,加强食堂用餐质量(简称“美食”)的过程中,后勤部门需了解学生对“美食”工作的认可程度,若学生认可系数(认可系数)不低于0.90,则“美食”工作按原方案继续实施,否则需进一步整改.为此后勤部门随机调查了该校600名学生,根据这600名学生对“美食”工作认可程度给出的评分,分成]五组,得到如图所示的频率分布直方图.

(1)求频率分布直方图中t的值和第70百分位数(结果保留两位小数);
(2)为了解部分学生给“美食”工作评分较低的原因,后勤部门从评分低于80分的学生中,按照调查评分的分组,分为3层,通过按比例分配分层随机抽样抽取45人进行座谈,求应选取评分在的学生人数;
(3)根据你所学的统计知识,结合认可系数,判断“美食”工作是否需要进一步整改,并说明理由.
【答案】(1),88.33
(2)20
(3)需要进一步整改,理由见解析
【详解】(1)由图可知:,所以,
评分在内的频率为,
内的频率为,
则第70百分位数位,且,
所以第70百分位数为88.33.
(2)低于80分的学生中三组学生的人数比例为,
则应选取评分在的学生人数为:(人);
(3)由图可知,认可程度平均分为:,
显然认可系数低于0.90,所以“美食”工作需要进一步整改.
题型7 总体离散程度的估计
例7-1某学校为了获得该校全体高中学生的体育锻炼情况, 按男、女学生的比例分别抽样调查了 48 名男生和 27 名女生的每周锻炼时间. 通过计算得到男生每周锻炼时间的平均数为 7.6 小时, 方差为 7.3, 女生每周锻炼时间的平均数为 6.4 小时, 方差为 8, 则所有样本数据的方差是 .
【答案】
【详解】设所有样本数据的平均数为,
所以所有样本数据的方差为,
故答案为:
例7-2已知样本的各个体的值由小到大依次为、、、、、、、、、,且样本的中位数为若要使该样本的方差最小,求、的值.
【答案】
【详解】解:由中位数的定义可得,可得,且有,
样本数据的平均数为,
这组数据的方差为

故当时,取最小值,此时,.
因此,当时,样本数据的方差取最小值.
【变式训练7-1】已知一组正数,,,的方差为,则数据,,,的平均数为( )
A.3 B.4 C.5 D.6
【答案】D
【详解】设正数的平均数为,
则方差为

所以,解得,
所以数据,,,的平均数为.
故选:D.
【变式训练7-2】已知1,这5个数的平均数为3,方差为2,则这4个数的方差为( )
A.1 B. C. D.2
【答案】B
【详解】∵1,这5个数的平均数为3,方差为2,
∴,即,
∴这4个数的平均数为,
∴,即,
∴这4个数的方差为.
故选:B.
【变式训练7-3】某班级有30名男生和20名女生,现调查学生周末在家学习时长(单位:小时),得到男生样本数据的平均值为8,方差为2,女生样本数据的平均值为10.5,方差为0.75,则该班级全体学生周末在家学习时长的方差的值是 .
【答案】3
【详解】由题知,全体学生周末在家学习时长的平均数为,
所以.
故答案为:3.
题型8 分层抽样的方差问题
例8-1某高校体检随机抽取100名学生,测得他们的身高(单位:cm),按照区间[160,165],[165,170),[170,175),[175,180),[180,185]分组,得到样本身高的频率分布直方图如图所示.
(1)求和频率分布直方图中身高在175cm及以下的学生人数;
(2)估计该校100名学生身高的下四分位数(结果保留到个位数).
(3)已知落在区间[170,175)的样本平均数是173,方差是8,落在区间[175,180)的样本平均数是178,方差是6,求两组样本成绩合并后的平均数和方差.
参考公式:若总体划分为2层,通过分层随机抽样,各层抽取的样本量、样本平均数和样本方差分别为:记总的样本平均数为,样本方差为,则.
【答案】(1);人
(2)
(3);
【详解】(1)由频率分布直方图可知,解得,
身高在175cm及以下的学生人数(人).
(2)的人数占比为,的人数占比为,
所以该校100名学生身高的下四分位数即分位数落在,
设该校100名学生身高的分位数为,
则,解得,
故该校100名生学身高的下四分位数约为168.
(3)由频率分布直方图知,
这100名学生的身高在的有,
身高在的有人,
所以,

所以两组样本成绩合并后的平均数为,方差为.
例8-2某企业拟招聘部分技术人员,有200人参与竞聘,其中研究生50人,本科生150人,现采用分层抽样的方式,对他们的竞聘成绩(满分10分)进行调查,其中研究生竞聘成绩的抽样数据如下:7,7,8,9,9.
(1)请根据上述数据计算研究生竞聘成绩样本的平均数和方差;
(2)若本科生竞聘成绩样本的平均数为6,方差为1,求整体样本数据的平均数和方差.
参考公式:若总体划分为2层,通过分层随机抽样,各层抽取的样本量、样本平均数和样本方差分别为:m,,;n,,.记总的样本平均数为,样本方差为,则,.
【答案】(1)8,0.8
(2)平均数为6.5,方差为1.7.
【详解】(1)平均数为,方差为:.
(2)因为研究生有50人,本科生150人,且研究生抽取5人,
由于采用分层抽样的方式,所以本科生抽取15人,
故整体样本数据的平均数,
整体样本数据的方差,
所以整体样本数据的平均数为6.5,方差为1.7.
方法技巧 分层抽样的样本均值和样本方差
1.分层随机抽样的平均数
(1)定义:一般地,将样本和样本合并成一个新样本,则这个新样本的平均数.若已知上述两层的新样本中每层的平均数分别为和,则这个新样本的平均数为.
记w1,w2,则这个新样本的平均数为,其中w1,w2称为权重.
(2)一般地,设样本中不同层的平均数和相应权重分别为和w1,w2,…,wn,则这个样本的平均数为记作.
2.分层随机抽样的方差
设样本中不同层的平均数分别为方差分别为,,…,,相应的权重分别为w1,w2,…,wn,则这个样本的方差为s2=,其中为这个样本的平均数.
【变式训练8-1】2025年春节期间,国产电影《哪吒之魔童闹海》凭借其震撼的特效、生动的情节与深刻的思想使票房一路攀升,于2025年2月6日登顶中国影史票房榜,根据网络平台数据,截至2025年5月5日,总票房(含港澳台和海外票房)已超158.24亿元,排名全球影史票房第五,是登顶全球动画电影票房榜的亚洲电影.某影院为了解观看该影片的观众的年龄结构,随机抽取了100名观众作为样本,得到如图所示的频率分布直方图.
(1)求频率分布直方图中a的值与样本中年龄的第85百分位数.
(2)从样本中年龄为,,的三组观众中,按比例用分层随机抽样的方法抽取10人,则年龄在中的观众应抽取多少人?
(3)若样本中年龄在的观众年龄的平均数是6,方差是2,年龄在的观众年龄的平均数是57,方差是5,求这两组样本总的平均数和方差.
【答案】(1);
(2)4
(3)23;581
【详解】(1)由题意可得,解得,
由频率分布直方图可知的频率为,而的频率为,
所以第85百分位数在区间内,设第85百分位数为,
则,解得,
所以第85百分位数为;
(2)由频率分布直方图可知年龄为,,的三组观众频率之比为:,
所以按比例用分层随机抽样的方法抽取10人,则年龄在中的观众应抽取4人;
(3)由频率分布直方图可知的频率为,的频率为,
所以,
.
【变式训练8-2】某校从高一年级学生中随机抽取200人参加人工智能科技知识测试,得分在之间,分为五组,得到如图所示的频率分布直方图.
(1)求图中的值;
(2)估计这200名学生得分的上四分位数和平均值(同组中数据用该组区间中点值作代表);
(3)现从以上各组中用分层随机抽样的方法选取40人.若第四组选手成绩的平均数和方差分别为80和14,第五组选手成绩的平均数和方差分别为90和9,请据此估计第四组和第五组所有选手成绩的平均值和方差.
(附:设两组数据的样本量、样本平均数和样本方差分别为:记两组数据总体的样本平均数为,总体样本方差为,则总体样本平均数总体样本方差)
【答案】(1)
(2)上四分位数为,平均值为.
(3)第四组和第五组所有选手成绩的平均值为,方差为.
【详解】(1)由图可得,
解得.
(2)上四分位数即第百分位数,
因为第一组、第二组及第三组的频率之和为,
所以第百分位数为,故上四分位数为.
平均值.
(3)设第四组、第五组所有选手成绩的平均数、方差分别为,
所以第四组抽取人,第五组抽取人,
则第四组、第五组所有选手成绩的平均值为,

第四组、第五组所有选手成绩的方差为
.
【变式训练8-3】某校为了解学生的身高情况,从高一、高二、高三三个年级中采用分层抽样的方法抽取了100名学生进行调查,其中高一、高二、高三的学生人数之比为4:3:3.
(1)求从高一、高二、高三各年级抽取的学生人数;
(2)从抽取的100名学生中随机选取2人协助工作人员调查,求这2人来自不同年级的概率(用最简分数表示);
(3)经过调查,抽取的高二学生身高的平均数为,方差为60,其中被抽中的小李身高是.试求除去小李后其余被抽中的高二学生身高的平均数与方差(结果精确到0.1)
【答案】(1)高一抽取的学生人数为40人,高二抽取的学生人数为30人,高三抽取的学生人数为30人
(2)
(3);
【详解】(1)高一抽取的学生人数为人,
高二抽取的学生人数为人,
高三抽取的学生人数为人.
(2).
(3)设从高二学生中抽出的30人的身高分别为,
则由条件,这30人身高的平均数为,
身高的方差为.
设小李的身高为,则除去小李后其余被抽中的29位高二学生的身高平均
数、方差分别为,
1.(2025·全国二卷·高考真题)样本数据2,8,14,16,20的平均数为( )
A.8 B.9 C.12 D.18
【答案】C
【详解】样本数据的平均数为.
故选:C.
2.(2024·新课标Ⅱ卷·高考真题)某农业研究部门在面积相等的100块稻田上种植一种新型水稻,得到各块稻田的亩产量(单位:kg)并整理如下表
亩产量 [900,950) [950,1000) [1000,1050) [1050,1100) [1100,1150) [1150,1200)
频数 6 12 18 30 24 10
根据表中数据,下列结论中正确的是( )
A.100块稻田亩产量的中位数小于1050kg
B.100块稻田中亩产量低于1100kg的稻田所占比例超过80%
C.100块稻田亩产量的极差介于200kg至300kg之间
D.100块稻田亩产量的平均值介于900kg至1000kg之间
【答案】C
【详解】对于 A, 根据频数分布表可知, ,
所以亩产量的中位数不小于 , 故 A 错误;
对于B,亩产量不低于的频数为,
所以低于的稻田占比为,故B错误;
对于C,稻田亩产量的极差最大为,最小为,故C正确;
对于D,由频数分布表可得,平均值为,故D错误.
故选;C.
3.(2023·上海·高考真题)国内生产总值(GDP)是衡量地区经济状况的最佳指标,根据统计数据显示,某市在2020年间经济高质量增长,GDP稳步增长,第一季度和第四季度的GDP分别为231和242,且四个季度GDP的中位数与平均数相等,则2020年GDP总额为 ;
【答案】946
【详解】GDP稳步增长说明四个季度已经从小到大排列,设第二季度、第三季度分别为,所以中位数即为.
因为中位数与平均数相等,所以,
所以2020年GDP总额:.
故答案为:946.
4.(2023·全国乙卷·高考真题)某厂为比较甲乙两种工艺对橡胶产品伸缩率的处理效应,进行10次配对试验,每次配对试验选用材质相同的两个橡胶产品,随机地选其中一个用甲工艺处理,另一个用乙工艺处理,测量处理后的橡胶产品的伸缩率.甲、乙两种工艺处理后的橡胶产品的伸缩率分别记为,.试验结果如下:
试验序号 1 2 3 4 5 6 7 8 9 10
伸缩率 545 533 551 522 575 544 541 568 596 548
伸缩率 536 527 543 530 560 533 522 550 576 536
记,记的样本平均数为,样本方差为.
(1)求,;
(2)判断甲工艺处理后的橡胶产品的伸缩率较乙工艺处理后的橡胶产品的伸缩率是否有显著提高(如果,则认为甲工艺处理后的橡胶产品的伸缩率较乙工艺处理后的橡胶产品的伸缩率有显著提高,否则不认为有显著提高)
【答案】(1),;
(2)认为甲工艺处理后的橡胶产品的伸缩率较乙工艺处理后的橡胶产品的伸缩率有显著提高.
【详解】(1),


的值分别为: ,

(2)由(1)知:,,故有,
所以认为甲工艺处理后的橡胶产品的伸缩率较乙工艺处理后的橡胶产品的伸缩率有显著提高.
1.高二年级有男生490人,女生510人,张华按男生、女生进行分层,通过分层随机抽样的方法,得到男生、女生的平均身高分别为170.2cm和160.8cm.
(1)如果张华在各层中按比例分配样本,总样本量为100,那么在男生、女生中分别抽取了多少名?在这种情况下,请估计高二年级全体学生的平均身高.
(2)如果张华从男生、女生中抽取的样本量分别为30和70,那么在这种情况下,如何估计高二年级全体学生的平均身高更合理?
【答案】(1)男生49人,女生51人,平均身高165.4cm(2)见解析
【详解】(1)抽取男生人数为,抽取女生人数为.
高二年级全体学生的平均身高估计为(cm).
(2)仍按(1)方式进行估计,即(cm).
【点睛】本题考查了分层抽样的相关计算,意在考查学生的计算能力.
2.下列情况中哪些适合用全面调查,哪些适合用抽样调查?说明理由
(1)了解某城市居民的食品消费结构;
(2)调查一个县各村的粮食播种面积;
(3)了解某地区小学生中患沙眼的人数;
(4)了解一批玉米种子的发芽率;
(5)调查一条河流的水质;
(6)某企业想了解其产品在市场的占有率.
【答案】见解析
【详解】(1)适合抽样调查,因为调查对象较多;
(2)适合全面调查,因为调查对象较少;
(3)适合抽样调查,因为调查对象较多;
(4)适合抽样调查,因为调查具有破坏性;
(5)适合抽样调查,因为调查对象较多;
(6)适合抽样调查,因为调查对象多而且不易操作.
【点睛】本题考查了抽样调查和全面调查,属于简单题.
3.一支田径队有男运动员56人,女运动员42人,按性别进行分层,用分层随机抽样的方法从全体运动员中抽出一个容量为28的样本.如果样本按比例分配,那么男、女运动员应各抽取多少名?
【答案】男生16人,女生12人
【详解】田径队运动员的总人数是,要得到28人的样本,占总体的比例为,
于是应该在男运动员中随机抽取(人),
在女运动员中随机抽取(人).
【点睛】本题考查了分层抽样,属于简单题.
4.甲、乙两台机床同时生产一种零件,在10天中,两台机床每天生产的次品数分别为:
甲:0 1 0 2 2 0 3 1 2 4
乙:2 3 1 1 0 2 1 1 0 1
分别计算这两组数据的平均数和标准差,并说明哪台机床的性能更好?
【答案】答案见解析
【详解】甲的平均数为,
方差为,
故标准差为,
乙的平均数为,
方差为,
故标准差为,
因为,乙机器平均每天生产的次品数比甲的少,且机床性能更稳定,
故乙机床性能更好.
5.有20种不同的零食,每100g可食部分包含的能量(单位:kJ)如下:
110 120 123 165 432 190 174 235 428 318
249 280 162 146 210 120 123 120 150 140
(1)以上述20个数据组成总体,求总体平均数与总体标准差
(2)设计恰当的随机抽样方法,从总体中抽取一个容量为7的样本.
(3)利用上面的抽样方法,再抽取容量为7的样本,这个样本的平均数和标准差与(2)中的结果一样吗?为什么?
(4)利用(2)中的随机抽样方法,分别从总体中抽取一个容量为10,13,16,19的样本,分析样本容量与样本的平均数和标准差对总体的估计效果之间有什么关系.
【答案】(1)平均数为199.75,总体标准差为95.26;(2)抓阄法;(3)(2)和(3)的计算结果不相同的概率相当大,而相同的概率很小;(4)由于样本的随机性,也有极个别(小概率)的例外情况.
【详解】(1)总体平均数为199.75.
总体标准差为95.26.
(2)可以使用抓阄法进行抽样.
(3)由样本的随机性,知(2)和(3)的计算结果不相同的概率相当大,而相同的概率很小.
(4)随着样本容量的增加,分别用样本平均数和样本标准差估计总体平均数和总体标准差的效果会越来越好(即精度会越来越高).但是由于样本的随机性,也有极个别(小概率)的例外情况.
【点睛】本题考查用样本估计总体,样本容量越大时,估计效果可能会更好些.
6.棉花的纤维长度是棉花质量的重要指标,在一批棉花中随机抽测了60根棉花的纤维长度(单位:mm),按从小到大排序结果如下:
25 28 33 50 52 58 59 60 61 62
82 86 113 115 140 143 146 170 175 195
202 206 233 236 238 255 260 263 264 265
293 293 294 296 301 302 303 305 305 306
321 323 325 326 328 340 343 346 348 350
352 355 357 357 358 360 370 380 383 385
(1)请你选择合适的组距,作出这个样本的频率分布直方图,分析这批棉花纤维长度分布的特征;
(2)请你估计这批棉花的第5,95百分位数.
【答案】(1)直方图见解析,有一部分棉花的纤维长度比较短,这批棉花中混进了一些次品;(2)41.5,375.
【详解】(1)频率分布直方图如图,由图分析发现这批棉花的纤维长度不是特别均匀,有一部分棉花的纤维长度比较短,所以,这批棉花中混进了一些次品;
(2)由,可知样本数据的第5,95百分位数为第3项与第4项,第57项与第58项数据的平均数,分别为41.5,375.据此可估计这批棉花的第5,95百分位数分别约为41.5,375.
7.在去年的足球联赛上,一队每场比赛平均失球数是1.5.全年比赛失球个数的标准差为1.1;二队每场比赛平均失球数是2.1.全年失球个数的标准差是0.4.你认为下列说法中哪一种是正确的,为什么?
(1)平均说来一队比二队防守技术好;
(2)二队比一队技术水平更稳定;
(3)一队有时表现很差,有时表现又非常好;
(4)二队很少不失球.
【答案】(1)对,理由见解析;(2)对,理由见解析;(3)对,理由见解析;(4)对,理由见解析.
【详解】(1)对,从平均数的角度考虑;
(2)对,从标准差的角度考虑.
(3)对,从平均数和标准差的角度考虑.
(4)对,从平均数和标准差的角度考虑.中小学教育资源及组卷应用平台
第01讲 随机抽样、统计图表、用样本估计总体
目录
012
02体系构建·思维可视 3
03核心突破·靶向攻坚 4
知能解码 4
知识点1 简单随机抽样 4
知识点2 分层抽样 4
知识点3 用样本估计总体 4
知识点4 样本的数字特征 5
知识点5 平均数、方差的线性关系 7
题型破译 7
题型1 随机抽样、分层抽样 7
题型2 统计图表 8
题型3 频率分布直方图 10
题型4 百分位数 14
【方法技巧】计算一组个数据的第百分位数的步骤
题型5 样本的数字特征 14
题型6 总体集中趋势的估计 15
题型7 总体离散程度的估计 18
题型8 分层抽样的方差问题 18
【方法技巧】分层抽样的样本均值和样本方差
04真题溯源·考向感知 22
05课本典例·高考素材 23
考点要求 考察形式 2025年 2024年 2023年
(1)抽样方法 (2)统计图表 (3)频率分布直方图 (4)样本的数字特征的估计,总体集中趋势的估计,总体离散程度的估计 单选题 多选题 填空题 解答题 2025年上海卷第17题(3),4分 2025年全国二卷第1题,5分 2024年II卷第4题,5分 2024年上海卷第19题(1),(2)8分 2023年上海卷第9题,5分 2023年I卷第9题,5分 2023年甲卷(文)第19题(1),4分 2023年乙卷(理)第17题,12分
考情分析: 统计学是“大数据”技术的关键,在互联网时代具有强大的社会价值和经济价值,在高考中受重视程度越来越大,未来在考试中的出题角度会更加与实际生活紧密联系,背景新颢、形式多样
复习目标: (1)会用简单随机抽样的方法从总体中抽取样本,了解分层随机抽样. (2)理解统计图表的含义. (3)会用统计图表对总体进行估计,会求个数据的第百分位数. (4)能用数字特征估计总体集中趋势和总体离散程度.
知识点1 简单随机抽样
(1)简单随机抽样
分为放回简单随机抽样和不放回简单随机抽样.除非特殊声明,本章简单随机抽样指不放回简单随机抽样.
(2)简单随机样本
通过简单随机抽样获得的样本称为简单随机样本.
(3)简单随机抽样的常用方法
实现简单随机抽样的方法很多,抽签法和随机数法是比较常用的两种方法.
自主检测用抽签法从学号为1到50的50名学生(其中含学生李华)中不放回抽取5名学生进行问卷调查,每次抽取一个号码,共抽取5次,设李华第一次被抽到的概率为,第五次被抽到的概率为,则( )
A.a = ,B.a = ,C.a = , D.a = ,
知识点2 分层抽样
(1)分层随机抽样的概念
一般地,按一个或多个变量把总体划分成若干个子总体,每个个体属于且仅属于一个子总体,在每个子总体中独立地进行简单随机抽样,再把所有子总体中抽取的样本合在一起作为总样本,这样的抽样方法称为分层随机抽样,每一个子总体称为层.
(2)分层随机抽样的平均数计算
在分层随机抽样中,以层数是2为例,如果第1层和第2层包含的个体数分别为和,抽取的样本量分别为和,第1层和第2层的样本平均数分别为,,样本平均数位,则.我们可以采用样本平均数估计总体平均数
自主检测某校高一、高二、高三年级的学生人数之比为,现用分层随机抽样的方法从该校三个年级的学生中抽取容量为300的样本,则从高二年级抽取的学生人数为( )
A.60 B.90 C.120 D.150
知识点3 用样本估计总体
1、频率分布直方图
(1)频率、频数、样本容量的计算方法
①×组距=频率.
②=频率,=样本容量,样本容量×频率=频数.
③频率分布直方图中各个小方形的面积总和等于.
2、频率分布直方图中数字特征的计算
(1)最高的小长方形底边中点的横坐标即是众数.
(2)中位数左边和右边的小长方形的面积和是相等的.设中位数为,利用左(右)侧矩形面积之和等于,即可求出.
(3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和,即有,其中为每个小长方形底边的中点,为每个小长方形的面积.
3.总体百分位数的估计
(1)第百分位数的定义
一般地,一组数据的第p百分位数是这样一个值,它使得这组数据中至少有的数据小于或等于这个值,且至少有的数据大于或等于这个值.
(2)计算一组个数据的第百分位数的步骤:
第1步,按从小到大排列原始数据.
第2步,计算.
第3步,若不是整数,而大于的比邻整数为,则第百分位数为第项数据;若是整数,则第百分位数为第项与第项数据的平均数.
自主检测一组数据按从大到小的顺序排列为8,7,x,4,4,1,若该组数据的中位数是众数的倍,则该组数据的第60百分位数是 .
知识点4 样本的数字特征
(1)众数
一组数据中出现次数最多的数据(即频率分布最大值所对应的样本数据)称为这组数据的众数.
(2)中位数
一组数据按从小到大(或从大到小)的顺序排成一列,处于最中间的一个数据(当数据个数是奇数时)或最中间两个数据的平均数(当数据个数是偶数时)称为这组数据的中位数.
(3)平均数
一组数据的和与这组数据的个数的商称为这组数据的平均数.数据,,,的平均数为
(4)标准差与方差
如果有个数据,,,那么平均数,标准差为:,方差:
知识点三:在频率分布直方图中,众数,中位数,平均数的估计值
(1)最高的小矩形底边中点的横坐标即是众数;
(2)中位数左边和右边的所有小矩形的面积和是相等的;
(3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小矩形的面积乘小矩形底边中点的横坐标之和.
自主检测为弘扬传统文化,某校举办了传统文化知识竞赛.现将竞赛得分在分(满分:分)的学生成绩进行统计与分组,得到如下图所示的频率分布直方图.
(1)求的值,并估计统计数据的上四分位数;
(2)据统计,本次竞赛在内得分的平均数为,方差为;在内得分的平均数为,方差为,求在内得分的平均数与方差.
知识点5 平均数、方差的线性关系
如果数据的平均数为,方差为,那么
①一组新数据的平均数为,方差是.
②一组新数据的平均数为,方差是.
③一组新数据的平均数为,方差是.
自主检测已知数据,,,,的方差是4,则,,,,的方差为 .
题型1 随机抽样、分层抽样
例1-1某高校对中文系新生进行体测,利用随机数表对400名学生进行抽样,先将400名学生进行编号,001,002,……,399,400.从中抽取40个样本,如图提供随机数表的第4行到第6行,若从表中第5行第6列开始向右读取数据,则得到的第4个样本编号是( )
32 21 18 34 29 78 64 54 07 32 52 42 06 44 38 12 23 43 56 77 35 78
84 42 12 53 31 34 57 86 07 36 25 30 07 32 86 23 45 78 89 07 23 68
32 56 78 08 43 67 89 53 55 77 34 89 94 83 75 22 53 55 78 32 45 77
A.328 B.253 C.007 D.860
例1-2某校高一年级有男生160人,女生120人,现需抽调人参与学校“5.4”文艺汇演志愿者工作.若按性别分层,采用比例分配的分层随机抽样.已知男生抽取16人,则( )
A.27 B.28 C.29 D.30
【变式训练1-1】某班级有名学生,班主任用不放回的简单随机抽样的方法从这名学生中抽取人进行家访,则同学被抽到的可能性为( )
A. B. C. D.
【变式训练1-2】某县有高中生2000人,初中生3000人,小学生4000人,幼儿园学生1500人,为了解该县学生的健康情况,采用比例分配的分层随机抽样方法从中抽取样本,若抽出的初中生为30人,则抽出的幼儿园学生人数为( )
A.15 B.20 C.30 D.40
【变式训练1-3】某林区有针叶林、阔叶林、混交林三类树种区域,面积占比为,每个区域树种种植密度均相同.现采用分层随机抽样调查各类树种生长情况,若从针叶林区域抽取了120株样树,则在该林区总共抽取的树种数量为 .
题型2 统计图表
例2-1年度全省地区生产总值为本年度第一、二、三产业增加值之和.观察下列两个图表,则下列说法错误的是( )
A.2020至2024年第一产业增加值逐年下降
B.2020至2024年第二产业增加值逐年升高
C.2020至2024年第三产业增加值占地区生产总值比重逐年升高
D.2020至2024年全省地区生产总值逐年增长
例2-2(多选)某校秋季运动会中A,B两班的各个单项得分(满分5分)的雷达图如图所示,则下列说法正确的是( )
A.在200米项目中,A班的得分比B班的得分高
B.对于这六个项目成绩,A班的第80百分位数比B班的第80百分位数高
C.对于这六个项目成绩,A班与B班的众数相同
D.B班的总分比A班的总分高
【变式训练2-1】(多选)某快递公司2020-2024年快递业务量及其增长率如图所示,则( )
A.该公司2020-2024年快逆业务量逐年上升
B.该公司2020-2024年快递业务量的极差为68.5
C.该公司2020-2024年快递业务量的增长率的平均数为
D.该公司2020-2024年快递业务量的增长率的中位数为
【变式训练2-2】(多选)某学校对高一学生预选科进行调查统计,发现学生选科仅有物化生 政史地 物化地 物化政 生史地五种组合,其中选择物化地和物化政组合的人数相等,并绘制得到如下的扇形图和条形图,则( )
A.该校高一学生总人数为800
B.该校高一学生中选择物化政组合的人数为90
C.该校高一学生中选择物理的人数比选择历史的人数多
D.按选科组合用分层随机抽样的方法从该校高一学生抽取40人,则生史地组合应抽取8人
【变式训练2-3】(多选)为了解某企业员工的学习情况,对该企业员工进行问卷调查,已知他们的得分都处在A,B,C,D四个区间内,根据调查结果得到下面的统计图.已知该企业男员工占则下列结论正确的是( )
A.男、女员工得分在A区间的占比相同
B.在各得分区间男员工的人数都多于女员工的人数
C.得分在C区间的员工最多
D.得分在D区间的员工占总人数的19%
题型3 频率分布直方图
例3-1某高校举行了一次环保知识竞赛,共有900名学生参加,为了解本次竞赛成绩的情况,从中抽取了部分学生的成绩(得分均为整数,满分为100分)进行统计.请你根据尚未完成的频率分布表和频率分布直方图,解答下列问题:
分组 频数 频率
[50,60) 4 0.08
[60,70) 0.16
[70,80) 10
[80,90) 16 0.32
[90,100]
合计 50
AI
(1)填充频率分布表的空格(将答案直接填在表格内);
(2)补全频率分布直方图;
(3)若成绩在[80,100]内的学生获得环保纪念勋章,请估计该校获得环保纪念勋章的学生有多少人.
例3-2某所学校为了解高三年级学生数学第二次模拟考试情况,随机抽取了50名学生的成绩,(满分150分),将所有数据整理后绘制成如下频率分布直方图:
(1)求的值;
(2)求这50名学生的数学成绩的第80百分位数;
(3)根据频率分布直方图,估计这所学校高三学生第二次模拟考试的数学成绩的平均分.
【变式训练3-1】某机构对年某地销售的新能源汽车的销售价格与销售数量进行统计,销售价格都不小于5万元,且小于30万元,销售价格分为五组:,,,,(单位:万元).统计后制成如图所示的频率分布直方图,则销售价格的80%分位数为( )

A.26 B.23 C.21 D.19
【变式训练3-2】某市举行青年歌手大赛,为了解本次比赛成绩的情况,从中随机抽取了部分人的成绩(满分为100分)作为样本进行统计.请根据下面尚未完成的频率分布表和频率分布直方图解答问题:
组号 分组 频数 频率
1 4 0.08
2 8 0.16
3 16 0.32
4 14 0.28
5
合计

(1)求的值;
(2)补全频率分布直方图;
(3)估计这次比赛的平均成绩.(同一组中的数据用该组区间的中点值作代表)
【变式训练3-3】某部门针对某社区建设满意度进行评分,第一轮由8名评委进行评分,评分如下:71,73,76,79,81,83,86,91;第二轮由100名社区居民进行评分,将居民的评分分成,,,,五组,并画出其频率分布直方图(如图).
(1)求的值并估计这100名居民评分的中位数;
(2)若第一轮评分的平均分为,第二轮评分的平均分为(同一组中的数据用该组区间的中点值作代表).记,根据的取值将社区建设满意度分为三个等级:
的取值
满意度等级 不满意 满意 非常满意
试估计该社区建设满意度等级.
题型4 百分位数
例4-12024年巴黎奥运会奖牌榜前8名的金牌数依次为40,40,20,18,16,15,14,13,则这组数据的上四分位数为( )
A.40 B.30 C.15 D.14.5
例4-2已知一组数据39,41,44,46,49,50,x,55的第65百分位数是50,那么实数的取值范围是( )
A. B. C. D.
方法技巧 计算一组个数据的第百分位数的步骤
第1步,按从小到大排列原始数据.
第2步,计算.
第3步,若不是整数,而大于的比邻整数为,则第百分位数为第项数据;若是整数,则第百分位数为第项与第项数据的平均数.
【变式训练4-1】某同学记录了以下数据,分别为12,10,13,11,6,8,16,14,则该组数据的第80百分位数为( )
A.10 B.13 C.13.5 D.14
【变式训练4-2】已知一组数据,则这组数据的分位数是 .
【变式训练4-3】已知一组数据:3,5,7,1,4,6,9,2,则这组数据的第75百分位数是 .
题型5 样本的数字特征
例5-1甲、乙、丙、丁对某组数据(该组数据由5个整数组成)进行分析,得到以下数字特征,则不能判断这组数据一定都小于12的是( )
A.甲:中位数为9,众数为11 B.乙:中位数为9,极差为3
C.丙:平均数为8,极差为4 D.丁:平均数为8,方差为3
例5-2(多选)根据气象学上的标准,从冬季进入春季的标志为连续天的日平均温度均超过.现将连续天的日平均气温的记录数据(记录数据都是自然数)作为一组样本,则下列样本中一定符合入春指标的有( )
A.平均数为,极差为 B.中位数为,众数为
C.众数为,极差为 D.平均数为,方差为
【变式训练5-1】一组样本数据为3,6,5,7,2,4,8,则( )
A.极差为5 B.中位数是7
C.平均数是5 D.众数是8
【变式训练5-2】(多选)2025年上半年,电影《哪吒2》在全国各地的影院热映,某影院连续8天的观影人数(单位:百人)按升序排列依次为90,120,120,130,160,160,160,180,则这组数据的( )
A.众数为160 B.中位数为145 C.平均数为145 D.第30百分位数为120
【变式训练5-3】甲、乙、丙、丁四人各掷骰子5次(骰子每次出现的点数可能为1,2,3,4,5,6),并分别记录每次出现的点数,四人根据统计结果对各自的试验数据分别做了如下描述:①中位数为3,众数为5;②中位数为3,极差为3;③中位数为1,平均数为2;④平均数为3,方差为2;可以判断一定没有出现6点的描述共有 人.
题型6 总体集中趋势的估计
例6-1某家水果店的店长为了解本店苹果的日销售情况,记录了近期连续120天苹果的日销售量(单位:),并绘制频率分布直方图如下:
(1)请根据频率分布直方图估计该水果店苹果日销售量的众数,平均数,中位数;(同一组中的数据以这组数据所在区间中点的值作代表)
(2)一次进货太多,水果会变得不新鲜;进货太少,又不能满足顾客的需求.店长希望每天的苹果尽量新鲜,又能80%地满足顾客的需求(在10天中,大约有8天可以满足顾客的需求).请问每天应该进多少千克苹果?(精确到整数位)
例6-2某校高一年级学生期中考试共有450名学生参加.数学考试成绩的频率分布直方图如图所示.
(1)求a的值;
(2)估计这次数学考试成绩的众数、中位数和平均数(结果保留两位小数);
(3)估计该校高一学生这次期中考试数学成绩的第70百分位数(结果保留两位小数).
【变式训练6-1】第十九届亚运会将于2023年9月23日至10月8在中国杭州举办,为了了解我市居民对杭州亚运会相关信息和知识的掌握情况,某学校组织学生开展社会实践活动,采用问卷的形式随机对我市100名居民进行了调查.为了方便统计分析,调查问卷满分20分,得分情况制成如下频率分布直方图.

(1)求的值;
(2)根据频率分布直方图,估计这100名居民调查问卷中得分的
(i)第70百分位数(结果用分数表示);
(ii)平均值(各组区间的数据以该组区间的中间值作代表).
【变式训练6-2】2025年“五一”假期,全国国内出游3.14亿人次,同比增长6.4%,这一数据反映了民众出行意愿高涨,折射出我国内需市场的活力.某景点为提升服务水平,对部分游客发起满意度调查,满意度采用百分制,统计结果绘制成如下频率分布直方图.
(1)求图中的值,并估计满意度得分在75分及以上所占的百分比;
(2)估计满意度得分的中位数和平均数(同一组中数据用该组区间的中点值作代表).
【变式训练6-3】树人中学为了学生的身心健康,加强食堂用餐质量(简称“美食”)的过程中,后勤部门需了解学生对“美食”工作的认可程度,若学生认可系数(认可系数)不低于0.90,则“美食”工作按原方案继续实施,否则需进一步整改.为此后勤部门随机调查了该校600名学生,根据这600名学生对“美食”工作认可程度给出的评分,分成]五组,得到如图所示的频率分布直方图.

(1)求频率分布直方图中t的值和第70百分位数(结果保留两位小数);
(2)为了解部分学生给“美食”工作评分较低的原因,后勤部门从评分低于80分的学生中,按照调查评分的分组,分为3层,通过按比例分配分层随机抽样抽取45人进行座谈,求应选取评分在的学生人数;
(3)根据你所学的统计知识,结合认可系数,判断“美食”工作是否需要进一步整改,并说明理由.
题型7 总体离散程度的估计
例7-1某学校为了获得该校全体高中学生的体育锻炼情况, 按男、女学生的比例分别抽样调查了 48 名男生和 27 名女生的每周锻炼时间. 通过计算得到男生每周锻炼时间的平均数为 7.6 小时, 方差为 7.3, 女生每周锻炼时间的平均数为 6.4 小时, 方差为 8, 则所有样本数据的方差是 .
例7-2已知样本的各个体的值由小到大依次为、、、、、、、、、,且样本的中位数为若要使该样本的方差最小,求、的值.
【变式训练7-1】已知一组正数,,,的方差为,则数据,,,的平均数为( )
A.3 B.4 C.5 D.6
【变式训练7-2】已知1,这5个数的平均数为3,方差为2,则这4个数的方差为( )
A.1 B. C. D.2
【变式训练7-3】某班级有30名男生和20名女生,现调查学生周末在家学习时长(单位:小时),得到男生样本数据的平均值为8,方差为2,女生样本数据的平均值为10.5,方差为0.75,则该班级全体学生周末在家学习时长的方差的值是 .
题型8 分层抽样的方差问题
例8-1某高校体检随机抽取100名学生,测得他们的身高(单位:cm),按照区间[160,165],[165,170),[170,175),[175,180),[180,185]分组,得到样本身高的频率分布直方图如图所示.
(1)求和频率分布直方图中身高在175cm及以下的学生人数;
(2)估计该校100名学生身高的下四分位数(结果保留到个位数).
(3)已知落在区间[170,175)的样本平均数是173,方差是8,落在区间[175,180)的样本平均数是178,方差是6,求两组样本成绩合并后的平均数和方差.
参考公式:若总体划分为2层,通过分层随机抽样,各层抽取的样本量、样本平均数和样本方差分别为:记总的样本平均数为,样本方差为,则.
例8-2某企业拟招聘部分技术人员,有200人参与竞聘,其中研究生50人,本科生150人,现采用分层抽样的方式,对他们的竞聘成绩(满分10分)进行调查,其中研究生竞聘成绩的抽样数据如下:7,7,8,9,9.
(1)请根据上述数据计算研究生竞聘成绩样本的平均数和方差;
(2)若本科生竞聘成绩样本的平均数为6,方差为1,求整体样本数据的平均数和方差.
参考公式:若总体划分为2层,通过分层随机抽样,各层抽取的样本量、样本平均数和样本方差分别为:m,,;n,,.记总的样本平均数为,样本方差为,则,.
方法技巧 分层抽样的样本均值和样本方差
1.分层随机抽样的平均数
(1)定义:一般地,将样本和样本合并成一个新样本,则这个新样本的平均数.若已知上述两层的新样本中每层的平均数分别为和,则这个新样本的平均数为.
记w1,w2,则这个新样本的平均数为,其中w1,w2称为权重.
(2)一般地,设样本中不同层的平均数和相应权重分别为和w1,w2,…,wn,则这个样本的平均数为记作.
2.分层随机抽样的方差
设样本中不同层的平均数分别为方差分别为,,…,,相应的权重分别为w1,w2,…,wn,则这个样本的方差为s2=,其中为这个样本的平均数.
【变式训练8-1】2025年春节期间,国产电影《哪吒之魔童闹海》凭借其震撼的特效、生动的情节与深刻的思想使票房一路攀升,于2025年2月6日登顶中国影史票房榜,根据网络平台数据,截至2025年5月5日,总票房(含港澳台和海外票房)已超158.24亿元,排名全球影史票房第五,是登顶全球动画电影票房榜的亚洲电影.某影院为了解观看该影片的观众的年龄结构,随机抽取了100名观众作为样本,得到如图所示的频率分布直方图.
(1)求频率分布直方图中a的值与样本中年龄的第85百分位数.
(2)从样本中年龄为,,的三组观众中,按比例用分层随机抽样的方法抽取10人,则年龄在中的观众应抽取多少人?
(3)若样本中年龄在的观众年龄的平均数是6,方差是2,年龄在的观众年龄的平均数是57,方差是5,求这两组样本总的平均数和方差.
【变式训练8-2】某校从高一年级学生中随机抽取200人参加人工智能科技知识测试,得分在之间,分为五组,得到如图所示的频率分布直方图.
(1)求图中的值;
(2)估计这200名学生得分的上四分位数和平均值(同组中数据用该组区间中点值作代表);
(3)现从以上各组中用分层随机抽样的方法选取40人.若第四组选手成绩的平均数和方差分别为80和14,第五组选手成绩的平均数和方差分别为90和9,请据此估计第四组和第五组所有选手成绩的平均值和方差.
(附:设两组数据的样本量、样本平均数和样本方差分别为:记两组数据总体的样本平均数为,总体样本方差为,则总体样本平均数总体样本方差)
【变式训练8-3】某校为了解学生的身高情况,从高一、高二、高三三个年级中采用分层抽样的方法抽取了100名学生进行调查,其中高一、高二、高三的学生人数之比为4:3:3.
(1)求从高一、高二、高三各年级抽取的学生人数;
(2)从抽取的100名学生中随机选取2人协助工作人员调查,求这2人来自不同年级的概率(用最简分数表示);
(3)经过调查,抽取的高二学生身高的平均数为,方差为60,其中被抽中的小李身高是.试求除去小李后其余被抽中的高二学生身高的平均数与方差(结果精确到0.1)
1.(2025·全国二卷·高考真题)样本数据2,8,14,16,20的平均数为( )
A.8 B.9 C.12 D.18
2.(2024·新课标Ⅱ卷·高考真题)某农业研究部门在面积相等的100块稻田上种植一种新型水稻,得到各块稻田的亩产量(单位:kg)并整理如下表
亩产量 [900,950) [950,1000) [1000,1050) [1050,1100) [1100,1150) [1150,1200)
频数 6 12 18 30 24 10
根据表中数据,下列结论中正确的是( )
A.100块稻田亩产量的中位数小于1050kg
B.100块稻田中亩产量低于1100kg的稻田所占比例超过80%
C.100块稻田亩产量的极差介于200kg至300kg之间
D.100块稻田亩产量的平均值介于900kg至1000kg之间
3.(2023·上海·高考真题)国内生产总值(GDP)是衡量地区经济状况的最佳指标,根据统计数据显示,某市在2020年间经济高质量增长,GDP稳步增长,第一季度和第四季度的GDP分别为231和242,且四个季度GDP的中位数与平均数相等,则2020年GDP总额为 ;
4.(2023·全国乙卷·高考真题)某厂为比较甲乙两种工艺对橡胶产品伸缩率的处理效应,进行10次配对试验,每次配对试验选用材质相同的两个橡胶产品,随机地选其中一个用甲工艺处理,另一个用乙工艺处理,测量处理后的橡胶产品的伸缩率.甲、乙两种工艺处理后的橡胶产品的伸缩率分别记为,.试验结果如下:
试验序号 1 2 3 4 5 6 7 8 9 10
伸缩率 545 533 551 522 575 544 541 568 596 548
伸缩率 536 527 543 530 560 533 522 550 576 536
记,记的样本平均数为,样本方差为.
(1)求,;
(2)判断甲工艺处理后的橡胶产品的伸缩率较乙工艺处理后的橡胶产品的伸缩率是否有显著提高(如果,则认为甲工艺处理后的橡胶产品的伸缩率较乙工艺处理后的橡胶产品的伸缩率有显著提高,否则不认为有显著提高)
1.高二年级有男生490人,女生510人,张华按男生、女生进行分层,通过分层随机抽样的方法,得到男生、女生的平均身高分别为170.2cm和160.8cm.
(1)如果张华在各层中按比例分配样本,总样本量为100,那么在男生、女生中分别抽取了多少名?在这种情况下,请估计高二年级全体学生的平均身高.
(2)如果张华从男生、女生中抽取的样本量分别为30和70,那么在这种情况下,如何估计高二年级全体学生的平均身高更合理?
2.下列情况中哪些适合用全面调查,哪些适合用抽样调查?说明理由
(1)了解某城市居民的食品消费结构;
(2)调查一个县各村的粮食播种面积;
(3)了解某地区小学生中患沙眼的人数;
(4)了解一批玉米种子的发芽率;
(5)调查一条河流的水质;
(6)某企业想了解其产品在市场的占有率.
3.一支田径队有男运动员56人,女运动员42人,按性别进行分层,用分层随机抽样的方法从全体运动员中抽出一个容量为28的样本.如果样本按比例分配,那么男、女运动员应各抽取多少名?
4.甲、乙两台机床同时生产一种零件,在10天中,两台机床每天生产的次品数分别为:
甲:0 1 0 2 2 0 3 1 2 4
乙:2 3 1 1 0 2 1 1 0 1
分别计算这两组数据的平均数和标准差,并说明哪台机床的性能更好?
5.有20种不同的零食,每100g可食部分包含的能量(单位:kJ)如下:
110 120 123 165 432 190 174 235 428 318
249 280 162 146 210 120 123 120 150 140
(1)以上述20个数据组成总体,求总体平均数与总体标准差
(2)设计恰当的随机抽样方法,从总体中抽取一个容量为7的样本.
(3)利用上面的抽样方法,再抽取容量为7的样本,这个样本的平均数和标准差与(2)中的结果一样吗?为什么?
(4)利用(2)中的随机抽样方法,分别从总体中抽取一个容量为10,13,16,19的样本,分析样本容量与样本的平均数和标准差对总体的估计效果之间有什么关系.
6.棉花的纤维长度是棉花质量的重要指标,在一批棉花中随机抽测了60根棉花的纤维长度(单位:mm),按从小到大排序结果如下:
25 28 33 50 52 58 59 60 61 62
82 86 113 115 140 143 146 170 175 195
202 206 233 236 238 255 260 263 264 265
293 293 294 296 301 302 303 305 305 306
321 323 325 326 328 340 343 346 348 350
352 355 357 357 358 360 370 380 383 385
(1)请你选择合适的组距,作出这个样本的频率分布直方图,分析这批棉花纤维长度分布的特征;
(2)请你估计这批棉花的第5,95百分位数.
7.在去年的足球联赛上,一队每场比赛平均失球数是1.5.全年比赛失球个数的标准差为1.1;二队每场比赛平均失球数是2.1.全年失球个数的标准差是0.4.你认为下列说法中哪一种是正确的,为什么?
(1)平均说来一队比二队防守技术好;
(2)二队比一队技术水平更稳定;
(3)一队有时表现很差,有时表现又非常好;
(4)二队很少不失球.

展开更多......

收起↑

资源列表