第九章 第2节 用样本估计总体(课件 学案)2026届高中数学大一轮复习

资源下载
  1. 二一教育资源

第九章 第2节 用样本估计总体(课件 学案)2026届高中数学大一轮复习

资源简介

第2节 用样本估计总体
[课程标准要求]
1.能用样本估计总体的集中趋势参数(平均数、中位数、众数、百分位数),理解集中趋势参数的统计含义.
2.能用样本估计总体的离散程度参数(标准差、方差、极差),理解离散程度参数的统计
含义.
1.百分位数
一般地,一组数据的第p百分位数是这样一个值,它使得这组数据中至少有p%的数据小于或等于这个值,且至少有(100-p)%的数据大于或等于这个值.
2.平均数、中位数和众数
(1)平均数:=(x1+x2+…+xn).
(2)中位数:将一组数据按从小到大或从大到小的顺序排列,处在最中间的一个数据(当数据个数是奇数时)或最中间两个数据的平均数(当数据个数是偶数时).
(3)众数:一组数据中出现次数最多的数据(即频数最大值所对应的样本数据).
3.方差和标准差
(1)方差:s2=[(x1-)2+(x2-)2+…+(xn-)2].
(2)标准差:s=.
1.若x1,x2,…,xn的平均数为,那么mx1+a,mx2+a,…,mxn+a的平均数为m+a,其中m,a为
常数.
2.若两组数据x1,x2,…,xn和y1,y2,…,yn的平均数分别是和,则x1+y1,x2+y2,…,xn+yn的平均数是+.
3.若x1,x2,…,xn的方差为s2,那么ax1+b,ax2+b,…,axn+b的方差为a2s2,其中a,b为常数.
1.(人教B版必修第二册P70练习A T2改编)样本数据36,27,25,22,20,16,13,12,11的中位数为(  )
[A] 16 [B] 18
[C] 20 [D] 21
2.有一组数据,按从小到大的顺序排列为1,2,x,8,9,10,这组数据的第40百分位数等于这组数据的平均数,则x为(  )
[A] 3 [B] 4 [C] 5 [D] 6
3.(多选题)(人教A版必修第二册P216习题9.2 T3改编)在去年某校高二年级足球比赛中,甲、乙两班每场比赛平均进球数、失球数及所有场次比赛进球个数、失球个数的标准差如下表:
项目 进球个数 平均数 失球个数 平均数 进球个数 标准差 失球个数 标准差
甲班 2.3 1.5 0.5 1.1
乙班 1.4 2.1 1.2 0.4
下列说法正确的是(  )
[A] 甲班在防守中比乙班稳定
[B] 乙班总体实力优于甲班
[C] 乙班很少失球
[D] 乙班在进攻中有时表现很好,有时表现较差
4.(苏教版必修第二册P257练习T3改编)已知样本数据x1,x2,…,x15的平均数为8,方差为32,由这组数据得到新样本数据y1,y2,…,y15,其中yi=3xi+1(i=1,2,…,15),则得到的新样本数据的平均数和方差分别是      .
5.(2025·江苏南通模拟)某公司为了解用户对其产品的满意度,从使用该产品的用户中随机调查了100名用户,根据用户对产品的满意度评分,得到如图所示的用户满意度评分的频率分布直方图.若用户满意度评分的中位数、众数、平均数的估计值分别为a,b,c,则a,b,c的大小关系为    .(按从小到大的顺序排列)
考点一 总体百分位数的估计
[例1] (1)(2025·天津模拟)某校高三数学备课组老师的年龄(单位:岁)分别为37,30,42,
32,41,46,45,48,35,53,则这组数据的第60百分位数为(  )
[A] 45 [B] 42
[C] 43.5 [D] 45.5
(2)某科研单位对某APP的使用情况进行满意度调查,在一批用户的有效问卷(用户打分在50分到100分之间的问卷)中随机抽取了100份,按分数进行分组(每组为左闭右开的区间),得到如图所示的频率分布直方图,估计这批用户问卷的得分的第75百分位数为(  )
[A] 78.5 [B] 82.5
[C] 85 [D] 87.5
计算一组数据的第p百分位数的步骤
[针对训练] (1)(2025·浙江衢州模拟)将10个数据按照从小到大的顺序排列为11,15,17,a,23,26,27,34,37,38,若该组数据的第40百分位数为22,则a等于(  )
[A] 19 [B] 20 [C] 21 [D] 22
(2)(2025·湖北黄冈模拟)为了解高中学生每天的体育活动时间,某市教育部门随机抽取
1 000名高中学生进行调查,把每天进行体育活动的时间按照时长(单位:min)分成6组:
[30,40),[40,50),[50,60),[60,70),[70,80),[80,90],然后对统计数据整理得到如图所示的频率分布直方图,则可估计这1 000名学生每天体育活动时间的第25百分位数为(  )
[A] 47.5 [B] 45.5
[C] 43.5 [D] 42.5
考点二 总体集中趋势的估计
[例2] 某市为了制定合理的节水方案,对居民用水情况进行了调查,通过抽样,获得了某年100名居民每人的月均用水量(单位:吨),将数据按照[0,0.5),[0.5,1),…,[4,4.5]分成9组,制成了如图所示的频率分布直方图.
(1)求频率分布直方图中a的值;
(2)已知该市有30万居民,估计全市居民中月均用水量不低于3吨的人数;
(3)估计居民月均用水量的众数、中位数(同一组中数据用该组区间中点值作代表).
频率分布直方图中数字特征的计算
(1)最高的小长方形底边中点的横坐标即是众数估计值.
(2)中位数估计值的左边和右边的小长方形的面积和是相等的.
(3)平均数是频率分布直方图的“重心”,其估计值等于频率分布直方图中每个小长方形的面积乘小长方形底边中点的横坐标之和.
[针对训练] (2025·广西南宁模拟)为了普及环保知识,增强环保意识,某大学随机抽取30名学生参加环保知识测试,得分(十分制)如图所示,假设得分值的中位数为me,众数为m0,平均值为 ,则(  )
[A] me=m0= [B] me=m0<
[C] me考点三 总体离散程度的估计
[例3] (2025·陕西安康模拟)某届展览会在各个展区中设置了多项互动体验活动,吸引了很多的中小学生.现从某个有互动体验活动的展区中随机抽取60名中小学生,统计他们的参观时间(从进入该展区到离开该展区的时长,单位:min,时间取整数),将时间分成[40,50),[50,60),…,
[90,100]六组,并绘制成如图所示的频率分布直方图.
(1)由频率分布直方图,估计样本的平均数和方差;(同一组数据以该组区间的中点值为
代表)
(2)为对比展区是否有互动体验活动对中小学生的吸引程度,某工作人员给出了一份该展区中没有互动体验活动的参观时间的随机数据,经计算得到该组数据参观时长平均值为=65 min,方差为=178,试判断有互动体验活动的展区参观时长均值比没有互动体验活动的展区参观时长均值是否有显著提高;(如果≥,则认为有显著提高,否则不认为有显著提高)
(3)利用(2)中的结果,你认为展区是否应该设置互动体验活动 请说明理由.
利用样本的数字特征解决优化决策问题的依据
(1)平均数反映了数据取值的平均水平,标准差、方差描述了一组数据围绕平均数波动的大小.标准差、方差越大,数据的离散程度越大,越不稳定;标准差、方差越小,数据的离散程度越小,越稳定.
(2)用样本估计总体就是利用样本的数字特征来描述总体的数字特征.
[针对训练] (2023·全国乙卷)某厂为比较甲、乙两种工艺对橡胶产品伸缩率的处理效应,进行10次配对试验,每次配对试验选用材质相同的两个橡胶产品,随机地选其中一个用甲工艺处理,另一个用乙工艺处理,测量处理后的橡胶产品的伸缩率,甲、乙两种工艺处理后的橡胶产品的伸缩率分别记为xi,yi(i=1,2,…,10),试验结果如下:
试验 序号i 1 2 3 4 5 6 7 8 9 10
伸缩 率xi 545 533 551 522 575 544 541 568 596 548
伸缩 率yi 536 527 543 530 560 533 522 550 576 536
记zi=xi-yi(i=1,2,…,10),z1,z2,…,z10的样本平均数为,样本方差为s2.
(1)求,s2;
(2)判断甲工艺处理后的橡胶产品的伸缩率较乙工艺处理后的橡胶产品的伸缩率是否有显著提高(如果≥2,则认为甲工艺处理后的橡胶产品的伸缩率较乙工艺处理后的橡胶产品的伸缩率有显著提高,否则不认为有显著提高).
(分值:95分)
选题明细表
知识点、方法 题号
总体百分位数的估计 1,2,3,7
总体集中趋势的估计 4,13
总体离散程度的估计 5,6,10,14
综合应用 8,9,11,12,15
单选每题5分,多选每题6分,填空每题5分.
1.有一组样本数据:2,3,3,3,4,4,5,5,6,6,则关于该组数据的下列数字特征中,数值最大的为(  )
[A] 第75百分位数 [B] 平均数
[C] 极差 [D] 众数
2.(2025·山东济南模拟)一组数据按从小到大的顺序排列为1,4,m,12,14,21,若该组数据的中位数是极差的,则该组数据的第45百分位数是(  )
[A] 4 [B] 6 [C] 8 [D] 12
3.(2025·江西九江模拟)某中学举办了一次知识竞赛,从中随机抽取了部分学生的成绩绘制成如图所示的频率分布直方图,则估计该中学本次竞赛成绩的第70百分位数为(  )
[A] 68 [B] 71 [C] 76 [D] 77
4.(2024·新课标Ⅱ卷)某农业研究部门在面积相等的100块稻田上种植一种新型水稻,得到各块稻田的亩产量(单位:kg)并整理得下表:
亩产量 [900,950) [950, 1 000) [1 000, 1 050)
频数 6 12 18
亩产量 [1 050, 1 100) [1 100, 1 150) [1 150, 1 200)
频数 30 24 10
根据表中数据,下列结论中正确的是(  )
[A] 100块稻田亩产量的中位数小于1 050 kg
[B] 100块稻田中亩产量低于1 100 kg的稻田所占比例超过80%
[C] 100块稻田亩产量的极差介于200 kg至300 kg 之间
[D] 100块稻田亩产量的平均值介于900 kg至 1 000 kg之间
5.(多选题)已知甲组数据为1,1,3,3,5,7,9,乙组数据为1,3,5,7,9,则下列说法正确的是(  )
[A] 这两组数据的第80百分位数相等
[B] 这两组数据的极差相等
[C] 这两组数据分别去掉一个最大值和一个最小值后,仅仅乙组数据的均值不变
[D] 甲组数据比乙组数据分散
6.(多选题)(2025·广东汕头模拟)如图是样本甲与样本乙的频率分布直方图(每组为左闭右开的区间,最后一组为闭区间),下列说法正确的是(  )
[A] 样本乙的极差一定大于样本甲的极差
[B] 样本乙的众数一定大于样本甲的众数
[C] 样本乙的方差一定小于样本甲的方差
[D] 样本甲的中位数一定小于样本乙的中位数
7.(5分)(2025·安徽合肥模拟)已知甲、乙两组按从小到大顺序排列的数据:甲组:24,30,36,m,
40,50,52,54,57,60;乙组:27,32,n,44,48,52.若甲组数据的第30百分位数和乙组数据的第50百分位数相等,则m-n等于    .
8.(11分)文明城市是反映城市整体文明水平的综合性荣誉称号,作为普通市民,既是文明城市的最大受益者,更是文明城市的主要创造者.某市为提高市民对文明城市创建的认识,举办了“创建文明城市”知识竞赛,从所有答卷中随机抽取100份作为样本,将样本的成绩(满分100分,成绩均为不低于40分的整数)分成六段:[40,50),[50,60),…,[90,100],得到如图所示的频率分布直方图.
(1)求频率分布直方图中a的值;
(2)估计样本成绩的第75百分位数;
(3)已知落在[50,60)的平均成绩是56,方差是7,落在[60,70)的平均成绩为65,方差是4,求两组成绩的总平均数和总方差s2.
9.(2025·陕西商洛模拟)某高校为宣扬中华文化,举办了“论语吟唱”的比赛,在比赛中,由A,B两个评委小组(各9人)给参赛选手打分.根据两个评委小组对同一名选手的打分绘制成如图所示折线图,则下列说法正确的是(  )
[A] B组打分的方差小于A组打分的方差
[B] B组打分的中位数为75
[C] A组的意见相对一致
[D] A组打分的众数为50
10.从某小型加工厂生产的产品中抽取100件作为样本,将该样本进行某项质量指标值测量,下图是测量结果x的频率分布直方图.若同一组中的数据用该组区间的中点值作代表,则在下列选项中,关于该样本统计量的叙述不正确的是(  )
[A] 指标值在区间[195,205)的产品有33件
[B] 指标值的极差介于50与70之间
[C] 指标值的第60百分位数大于205
[D] 指标值的方差的估计值是150
11.(多选题)(2023·新课标Ⅰ卷)有一组样本数据x1,x2,…,x6,其中x1是最小值,x6是最大值,则(  )
[A] x2,x3,x4,x5的平均数等于x1,x2,…,x6的平均数
[B] x2,x3,x4,x5的中位数等于x1,x2,…,x6的中位数
[C] x2,x3,x4,x5的标准差不小于x1,x2,…,x6的标准差
[D] x2,x3,x4,x5的极差不大于x1,x2,…,x6的极差
12.某学校开展“国学知识竞赛”,共有“诗经组”“论语组”“春秋组”“礼记组”4个小组参赛,每组10名选手,若该组每名选手的失分不超过6分,该组获得“优秀”称号,则根据每组选手的失分情况(竞赛分数为整数),下列小组一定获得“优秀”称号的是(  )
[A] 中位数为3,众数为2的诗经组
[B] 平均数为3,方差为1的论语组
[C] 平均数为3,众数为2的春秋组
[D] 中位数为3,极差为4的礼记组
13.(5分)已知样本数据x1,x2,…,x2 026的平均数为2,方差为 2 024,则,,…,的平均数为    .
14.(15分)(2025·宁夏银川模拟)滨海盐碱地是我国盐碱地的主要类型之一,如何利用更有效的方法改造这些宝贵的土地资源,成为摆在我们面前的世界级难题.对盐碱地的改良方法,研究人员在长期的实践中获得了两种成本差异不大,且能降低滨海盐碱地30~60 cm土壤层可溶性盐含量的技术,为了对比这两种技术改良盐碱地的效果,科研人员在同一区域采集了12个土壤样本,平均分成A,B两组,测得A组土壤可溶性盐含量数据样本平均数=0.82,方差=0.029 3,B组土壤可溶性盐含量数据样本平均数=0.83,方差=0.169 7.用技术1对A组土壤进行可溶性盐改良试验,用技术2对B组土壤进行可溶性盐改良试验,分别获得改良后土壤可溶性盐含量数据如下:
A组y1 0.66 0.68 0.69 0.71 0.72 0.74
B组y2 0.46 0.48 0.49 0.49 0.51 0.54
改良后A组、B组土壤可溶性盐含量数据样本平均数分别为和,样本方差分别记为和.
(1)求,,,;
(2)应用技术1与技术2土壤可溶性盐改良试验后,土壤可溶性盐含量是否有显著降低 (若>2,i=1,2,则认为应用技术有显著降低土壤可溶性盐含量,否则不认为有显著
降低)
15.(多选题)(2025·湖北荆州模拟)某班语文老师对该班甲、乙、丙、丁4名同学连续7周每周阅读的天数(每周阅读天数可以是1,2,3,4,5,6,7)进行统计,根据统计所得数据对这4名同学这7周每周的阅读天数分别做了如下描述:
甲:中位数为4,极差为3;
乙:中位数为3,众数为5;
丙:中位数为4,平均数为3;
丁:平均数为3,方差为3.
那么可以判断一周阅读天数一定没有出现7天的是(  )
[A] 甲 [B] 乙 [C] 丙 [D] 丁
第2节 用样本估计总体(解析版)
[课程标准要求]
1.能用样本估计总体的集中趋势参数(平均数、中位数、众数、百分位数),理解集中趋势参数的统计含义.
2.能用样本估计总体的离散程度参数(标准差、方差、极差),理解离散程度参数的统计
含义.
1.百分位数
一般地,一组数据的第p百分位数是这样一个值,它使得这组数据中至少有p%的数据小于或等于这个值,且至少有(100-p)%的数据大于或等于这个值.
2.平均数、中位数和众数
(1)平均数:=(x1+x2+…+xn).
(2)中位数:将一组数据按从小到大或从大到小的顺序排列,处在最中间的一个数据(当数据个数是奇数时)或最中间两个数据的平均数(当数据个数是偶数时).
(3)众数:一组数据中出现次数最多的数据(即频数最大值所对应的样本数据).
3.方差和标准差
(1)方差:s2=[(x1-)2+(x2-)2+…+(xn-)2].
(2)标准差:s=.
1.若x1,x2,…,xn的平均数为,那么mx1+a,mx2+a,…,mxn+a的平均数为m+a,其中m,a为
常数.
2.若两组数据x1,x2,…,xn和y1,y2,…,yn的平均数分别是和,则x1+y1,x2+y2,…,xn+yn的平均数是+.
3.若x1,x2,…,xn的方差为s2,那么ax1+b,ax2+b,…,axn+b的方差为a2s2,其中a,b为常数.
1.(人教B版必修第二册P70练习A T2改编)样本数据36,27,25,22,20,16,13,12,11的中位数为(  )
[A] 16 [B] 18
[C] 20 [D] 21
【答案】 C
【解析】 将样本数据从小到大排序得11,12,13,16,20,22,25,27,36,位于中间的是20.
故选C.
2.有一组数据,按从小到大的顺序排列为1,2,x,8,9,10,这组数据的第40百分位数等于这组数据的平均数,则x为(  )
[A] 3 [B] 4 [C] 5 [D] 6
【答案】 D
【解析】 因为该组数据共6个,且6×40%=2.4,所以这组数据的第40百分位数为第三个数,即为x,则x=,解得x=6.故选D.
3.(多选题)(人教A版必修第二册P216习题9.2 T3改编)在去年某校高二年级足球比赛中,甲、乙两班每场比赛平均进球数、失球数及所有场次比赛进球个数、失球个数的标准差如下表:
项目 进球个数 平均数 失球个数 平均数 进球个数 标准差 失球个数 标准差
甲班 2.3 1.5 0.5 1.1
乙班 1.4 2.1 1.2 0.4
下列说法正确的是(  )
[A] 甲班在防守中比乙班稳定
[B] 乙班总体实力优于甲班
[C] 乙班很少失球
[D] 乙班在进攻中有时表现很好,有时表现较差
【答案】 CD
【解析】 由失球个数的标准差可得A错误;由进球个数和失球个数的平均数可得B错误;由失球个数的标准差可知C正确;由进球个数的标准差可知D正确.故选CD.
4.(苏教版必修第二册P257练习T3改编)已知样本数据x1,x2,…,x15的平均数为8,方差为32,由这组数据得到新样本数据y1,y2,…,y15,其中yi=3xi+1(i=1,2,…,15),则得到的新样本数据的平均数和方差分别是      .
【答案】 25,288
【解析】 设样本数据x1,x2,…,x15的方差为,新样本数据的方差为,
因为yi=3xi+1(i=1,2,…,15),所以新样本数据的平均数=3+1=3×8+1=25,
新样本数据的方差为=32=9×32=288.
5.(2025·江苏南通模拟)某公司为了解用户对其产品的满意度,从使用该产品的用户中随机调查了100名用户,根据用户对产品的满意度评分,得到如图所示的用户满意度评分的频率分布直方图.若用户满意度评分的中位数、众数、平均数的估计值分别为a,b,c,则a,b,c的大小关系为    .(按从小到大的顺序排列)
【答案】 b【解析】 由频率分布直方图可知众数估计值为65,即b=65;由题图可知,组距为10,所以平均数估计值为45×0.15+55×0.2+65×0.25+75×0.2+85×0.1+95×0.1=67,故c=67;设中位数为x,则有10×0.015+10×0.02+(x-60)×0.025=0.5,解得 x=66,即中位数估计值为a=66,所以b考点一 总体百分位数的估计
[例1] (1)(2025·天津模拟)某校高三数学备课组老师的年龄(单位:岁)分别为37,30,42,
32,41,46,45,48,35,53,则这组数据的第60百分位数为(  )
[A] 45 [B] 42
[C] 43.5 [D] 45.5
(2)某科研单位对某APP的使用情况进行满意度调查,在一批用户的有效问卷(用户打分在50分到100分之间的问卷)中随机抽取了100份,按分数进行分组(每组为左闭右开的区间),得到如图所示的频率分布直方图,估计这批用户问卷的得分的第75百分位数为(  )
[A] 78.5 [B] 82.5
[C] 85 [D] 87.5
【答案】 (1)C (2)B
【解析】 (1)10名老师的年龄从小到大排列为30,32,35,37,41,42,45,46,48,53,由10×60%=6,所以这组数据的第60百分位数为=43.5.故选C.
(2)因为(0.01+0.025+0.035)×10=0.7<0.75,(0.01+0.025+0.035+0.02)×10=0.9>0.75,所以第75百分位数位于[80,90),设为x,则(0.01+0.025+0.035)×10+0.02(x-80)=0.75,解得x=82.5,即这批用户问卷的得分的第75百分位数估计值为82.5.故选B.
计算一组数据的第p百分位数的步骤
[针对训练] (1)(2025·浙江衢州模拟)将10个数据按照从小到大的顺序排列为11,15,17,a,23,26,27,34,37,38,若该组数据的第40百分位数为22,则a等于(  )
[A] 19 [B] 20 [C] 21 [D] 22
(2)(2025·湖北黄冈模拟)为了解高中学生每天的体育活动时间,某市教育部门随机抽取
1 000名高中学生进行调查,把每天进行体育活动的时间按照时长(单位:min)分成6组:
[30,40),[40,50),[50,60),[60,70),[70,80),[80,90],然后对统计数据整理得到如图所示的频率分布直方图,则可估计这1 000名学生每天体育活动时间的第25百分位数为(  )
[A] 47.5 [B] 45.5
[C] 43.5 [D] 42.5
【答案】 (1)C (2)A
【解析】 (1)40%×10=4,又该组数据的第40百分位数为22,则=22,解得a=21.故选C.
(2)第25百分位数设为x,而0.1<0.25<0.1+0.2,则所求百分位数在第二组,则可列方程 0.1+0.02(x-40)=0.25,解得x=47.5,即这1 000名学生每天体育活动时间的第25百分位数的估计值为47.5.故选A.
考点二 总体集中趋势的估计
[例2] 某市为了制定合理的节水方案,对居民用水情况进行了调查,通过抽样,获得了某年100名居民每人的月均用水量(单位:吨),将数据按照[0,0.5),[0.5,1),…,[4,4.5]分成9组,制成了如图所示的频率分布直方图.
(1)求频率分布直方图中a的值;
(2)已知该市有30万居民,估计全市居民中月均用水量不低于3吨的人数;
(3)估计居民月均用水量的众数、中位数(同一组中数据用该组区间中点值作代表).
【解】 (1)由频率分布直方图知,(0.08+0.16+a+0.42+0.50+a+0.12+0.08+0.04)×0.5=1,解得a=0.30,所以直方图中a的值为0.30.
(2)由题图得居民月均用水量不低于3吨的频率为0.5×(0.12+0.08+0.04)=0.12,
所以估计全市居民中月均用水量不低于3吨的人数为300 000×0.12=36 000.
(3)由题图可知,众数估计值是=2.25,
因为(0.08+0.16+0.30+0.42)×0.5=0.48<0.5,(0.08+0.16+0.30+0.42+0.50)×0.5=0.73>0.5,所以中位数在区间[2,2.5)内,设为x,则0.48+0.50(x-2)=0.5,解得x=2.04,
即中位数估计值为2.04.
频率分布直方图中数字特征的计算
(1)最高的小长方形底边中点的横坐标即是众数估计值.
(2)中位数估计值的左边和右边的小长方形的面积和是相等的.
(3)平均数是频率分布直方图的“重心”,其估计值等于频率分布直方图中每个小长方形的面积乘小长方形底边中点的横坐标之和.
[针对训练] (2025·广西南宁模拟)为了普及环保知识,增强环保意识,某大学随机抽取30名学生参加环保知识测试,得分(十分制)如图所示,假设得分值的中位数为me,众数为m0,平均值为 ,则(  )
[A] me=m0= [B] me=m0<
[C] me【答案】 D
【解析】 由题图可知,30名学生的得分情况依次为2个人得3分,3个人得4分,10个人得5分,6个人得6分,3个人得7分,2个人得8分,2个人得9分,2个人得10分.中位数为第15,16个数(分别为5,6)的平均数,即me=5.5,5出现次数最多,故m0=5,
=≈5.97.
于是m0考点三 总体离散程度的估计
[例3] (2025·陕西安康模拟)某届展览会在各个展区中设置了多项互动体验活动,吸引了很多的中小学生.现从某个有互动体验活动的展区中随机抽取60名中小学生,统计他们的参观时间(从进入该展区到离开该展区的时长,单位:min,时间取整数),将时间分成[40,50),[50,60),…,
[90,100]六组,并绘制成如图所示的频率分布直方图.
(1)由频率分布直方图,估计样本的平均数和方差;(同一组数据以该组区间的中点值为
代表)
(2)为对比展区是否有互动体验活动对中小学生的吸引程度,某工作人员给出了一份该展区中没有互动体验活动的参观时间的随机数据,经计算得到该组数据参观时长平均值为=65 min,方差为=178,试判断有互动体验活动的展区参观时长均值比没有互动体验活动的展区参观时长均值是否有显著提高;(如果≥,则认为有显著提高,否则不认为有显著提高)
(3)利用(2)中的结果,你认为展区是否应该设置互动体验活动 请说明理由.
【解】 (1)由题得,=10×(45×0.010+55×0.015+65×0.015+75×0.030+85×0.025+95×0.005)=71,
所以样本的方差为=10×[(45-71)2×0.010+(55-71)2×0.015+(65-71)2×0.015+
(75-71)2×0.030+(85-71)2×0.025+(95-71)2×0.005]=194.
(2)由题得,=71-65=6,==<6,所以满足≥,
所以有互动体验活动的展区参观时长均值比没有互动体验活动的展区参观时长均值有显著提高.
(3)从(2)中可知,展区应该设置互动体验活动,这样可以吸引更多的中小学生进行观看与体验,使他们能更多地了解产品,并能更大程度地激发中小学生的兴趣爱好.
利用样本的数字特征解决优化决策问题的依据
(1)平均数反映了数据取值的平均水平,标准差、方差描述了一组数据围绕平均数波动的大小.标准差、方差越大,数据的离散程度越大,越不稳定;标准差、方差越小,数据的离散程度越小,越稳定.
(2)用样本估计总体就是利用样本的数字特征来描述总体的数字特征.
[针对训练] (2023·全国乙卷)某厂为比较甲、乙两种工艺对橡胶产品伸缩率的处理效应,进行10次配对试验,每次配对试验选用材质相同的两个橡胶产品,随机地选其中一个用甲工艺处理,另一个用乙工艺处理,测量处理后的橡胶产品的伸缩率,甲、乙两种工艺处理后的橡胶产品的伸缩率分别记为xi,yi(i=1,2,…,10),试验结果如下:
试验 序号i 1 2 3 4 5 6 7 8 9 10
伸缩 率xi 545 533 551 522 575 544 541 568 596 548
伸缩 率yi 536 527 543 530 560 533 522 550 576 536
记zi=xi-yi(i=1,2,…,10),z1,z2,…,z10的样本平均数为,样本方差为s2.
(1)求,s2;
(2)判断甲工艺处理后的橡胶产品的伸缩率较乙工艺处理后的橡胶产品的伸缩率是否有显著提高(如果≥2,则认为甲工艺处理后的橡胶产品的伸缩率较乙工艺处理后的橡胶产品的伸缩率有显著提高,否则不认为有显著提高).
【解】 (1)=×(545+533+551+522+575+544+541+568+596+548)=552.3,
=×(536+527+543+530+560+533+522+550+576+536)=541.3,
==552.3-541.3=11,zi=xi-yi的值分别为9,6,8,-8,15,11,19,18,20,12,
故s2=×[(9-11)2+(6-11)2+(8-11)2+(-8-11)2+(15-11)2+0+(19-11)2+(18-11)2+(20-11)2+(12-11)2]=61.
(2)由(1)知,=11,2=2=,故有>2,
所以认为甲工艺处理后的橡胶产品的伸缩率较乙工艺处理后的橡胶产品的伸缩率有显著
提高.
(分值:95分)
选题明细表
知识点、方法 题号
总体百分位数的估计 1,2,3,7
总体集中趋势的估计 4,13
总体离散程度的估计 5,6,10,14
综合应用 8,9,11,12,15
单选每题5分,多选每题6分,填空每题5分.
1.有一组样本数据:2,3,3,3,4,4,5,5,6,6,则关于该组数据的下列数字特征中,数值最大的为(  )
[A] 第75百分位数 [B] 平均数
[C] 极差 [D] 众数
【答案】 A
【解析】 10×0.75=7.5,则取第8个数据,即该组数据的第75百分位数为5;
平均数为=4.1;
极差为6-2=4;众数为3.
综上,第75百分位数最大.故选A.
2.(2025·山东济南模拟)一组数据按从小到大的顺序排列为1,4,m,12,14,21,若该组数据的中位数是极差的,则该组数据的第45百分位数是(  )
[A] 4 [B] 6 [C] 8 [D] 12
【答案】 D
【解析】 由已知可得,极差是21-1=20,而中位数是极差的,即中位数是12,
根据6个数的中位数是=12,解得m=12.又6×45%=2.7,所以第45百分位数是第3个数据.故选D.
3.(2025·江西九江模拟)某中学举办了一次知识竞赛,从中随机抽取了部分学生的成绩绘制成如图所示的频率分布直方图,则估计该中学本次竞赛成绩的第70百分位数为(  )
[A] 68 [B] 71 [C] 76 [D] 77
【答案】 C
【解析】 设m为抽取的学生成绩的第70百分位数,因为(0.016+0.030)×10=0.46<0.7,
(0.016+0.030+0.040)×10=0.86>0.7,所以 m∈[70,80),所以(m-70)×0.04+0.46=0.7,解得m=76.故估计该中学本次竞赛成绩的第70百分位数为76.故选C.
4.(2024·新课标Ⅱ卷)某农业研究部门在面积相等的100块稻田上种植一种新型水稻,得到各块稻田的亩产量(单位:kg)并整理得下表:
亩产量 [900,950) [950, 1 000) [1 000, 1 050)
频数 6 12 18
亩产量 [1 050, 1 100) [1 100, 1 150) [1 150, 1 200)
频数 30 24 10
根据表中数据,下列结论中正确的是(  )
[A] 100块稻田亩产量的中位数小于1 050 kg
[B] 100块稻田中亩产量低于1 100 kg的稻田所占比例超过80%
[C] 100块稻田亩产量的极差介于200 kg至300 kg 之间
[D] 100块稻田亩产量的平均值介于900 kg至 1 000 kg之间
【答案】 C
【解析】 对于A,根据频数分布表可知,6+12+18=36<50,
所以亩产量的中位数不小于1 050 kg,故A错误;
对于B,亩产量不低于1 100 kg的频数为24+10=34,所以亩产量低于1 100 kg的稻田占比为=66%,故B错误;
对于C,因为1 200-900=300,1 150-950=200,所以100块稻田亩产量的极差介于200 kg至 300 kg 之间,故C正确;
对于D,由频数分布表可得,平均值为×(6×925+12×975+18×1 025+30×1 075+24×1 125+
10×1 175)=1 067,故D错误.故选C.
5.(多选题)已知甲组数据为1,1,3,3,5,7,9,乙组数据为1,3,5,7,9,则下列说法正确的是(  )
[A] 这两组数据的第80百分位数相等
[B] 这两组数据的极差相等
[C] 这两组数据分别去掉一个最大值和一个最小值后,仅仅乙组数据的均值不变
[D] 甲组数据比乙组数据分散
【答案】 BC
【解析】 对于A,由7×80%=5.6,得甲组数据的第80百分位数为7,
由5×80%=4,得乙组数据的第80百分位数为8,A错误;
对于B,甲组数据与乙组数据的极差均为8,B正确;
对于C,甲组数据去掉一个最大值和一个最小值前、后的均值分别为,,乙组数据去掉一个最大值和一个最小值前、后的均值分别为5,5,C正确;
对于D,甲组数据的方差=×[2×()2+2×()2+()2+()2+()2]=,
乙组数据的方差=×(42+22+02+22+42)=8,显然<8,
因此乙组数据较分散,D错误.故选BC.
6.(多选题)(2025·广东汕头模拟)如图是样本甲与样本乙的频率分布直方图(每组为左闭右开的区间,最后一组为闭区间),下列说法正确的是(  )
[A] 样本乙的极差一定大于样本甲的极差
[B] 样本乙的众数一定大于样本甲的众数
[C] 样本乙的方差一定小于样本甲的方差
[D] 样本甲的中位数一定小于样本乙的中位数
【答案】 BCD
【解析】 对于A,甲的数据介于[1.5,7.5]之间,极差小于或等于6,乙的数据分布于[2.5,8.5],极差小于或等于6,从而甲和乙的极差可能相等,A错误;
对于B,根据频率分布直方图可知,甲的众数介于[2.5,5.5)之间,乙的众数介于[5.5,6.5)之间,乙的众数大于甲的众数,B正确;
对于C,甲的数据比较分散,乙的数据比较集中,因此乙的方差小于甲的方差,C正确;
对于D,甲的各组频率依次为0.15,0.20,0.20,0.20,0.15,0.10,其中位数位于[3.5,4.5)之间,
乙的各组频率依次为0.05,0.10,0.15,0.35,0.20,0.15,其中位数位于[5.5,6.5)之间,所以甲的中位数小于乙的中位数,D正确.故选BCD.
7.(5分)(2025·安徽合肥模拟)已知甲、乙两组按从小到大顺序排列的数据:甲组:24,30,36,m,
40,50,52,54,57,60;乙组:27,32,n,44,48,52.若甲组数据的第30百分位数和乙组数据的第50百分位数相等,则m-n等于    .
【答案】 8
【解析】 因为30%×10=3,50%×6=3,
且甲组数据的第30百分位数和乙组数据的第50百分位数相等,
则=,解得m-n=8.
8.(11分)文明城市是反映城市整体文明水平的综合性荣誉称号,作为普通市民,既是文明城市的最大受益者,更是文明城市的主要创造者.某市为提高市民对文明城市创建的认识,举办了“创建文明城市”知识竞赛,从所有答卷中随机抽取100份作为样本,将样本的成绩(满分100分,成绩均为不低于40分的整数)分成六段:[40,50),[50,60),…,[90,100],得到如图所示的频率分布直方图.
(1)求频率分布直方图中a的值;
(2)估计样本成绩的第75百分位数;
(3)已知落在[50,60)的平均成绩是56,方差是7,落在[60,70)的平均成绩为65,方差是4,求两组成绩的总平均数和总方差s2.
【解】 (1)利用每组小矩形的面积之和为1可得,(0.005+0.010+0.020+a+0.025+0.010)×10=1,解得a=0.030.
(2)成绩落在[40,80)内的频率为(0.005+0.010+0.020+0.030)×10=0.65,落在[40,90)内的频率为(0.005+0.010+0.020+0.030+0.025)×10=0.9,设第75百分位数为m,由0.65+(m-80)×
0.025=0.75,得m=84,故第75百分位数的估计值为84.
(3)由题图可知,成绩在[50,60)的市民人数为 100×0.1=10,成绩在[60,70)的市民人数为 100×0.2=20,故==62;由样本方差计算总体方差公式可得总方差为s2=×{10×[7+(56-62)2]+20×[4+(65-62)2]}=23.
9.(2025·陕西商洛模拟)某高校为宣扬中华文化,举办了“论语吟唱”的比赛,在比赛中,由A,B两个评委小组(各9人)给参赛选手打分.根据两个评委小组对同一名选手的打分绘制成如图所示折线图,则下列说法正确的是(  )
[A] B组打分的方差小于A组打分的方差
[B] B组打分的中位数为75
[C] A组的意见相对一致
[D] A组打分的众数为50
【答案】 C
【解析】 对于A,观察题中折线图可知,B组的极差大于A组的极差,且数据波动性较A组更大,所以B组打分的方差大于A组打分的方差,故A错误;
对于B,B组打分的分值按照从小到大排列为36,55,58,62,66,68,68,70,75,所以中间数为66,故中位数为66,故B错误;
对于C,A组打分的分值比较均匀,波动更小,故A组意见相对一致,故C正确;
对于D,A组打分的分值为42,47,45,46,50,47,55,50,47,所以A组打分的分值的众数为47,故D错误.故选C.
10.从某小型加工厂生产的产品中抽取100件作为样本,将该样本进行某项质量指标值测量,下图是测量结果x的频率分布直方图.若同一组中的数据用该组区间的中点值作代表,则在下列选项中,关于该样本统计量的叙述不正确的是(  )
[A] 指标值在区间[195,205)的产品有33件
[B] 指标值的极差介于50与70之间
[C] 指标值的第60百分位数大于205
[D] 指标值的方差的估计值是150
【答案】 C
【解析】 由直方图可得出,从第一组至第七组的频率依次是0.02,0.09,0.22,0.33,
0.24,0.08,0.02,
对于选项A,指标值在区间[195,205)的产品有100×0.33=33(件),A选项正确;
对于选项B,指标值的最大极差为235-165=70,最小极差大于225-175=50,B选项正确;
对于选项C,因为0.02+0.09+0.22=0.33<0.6,0.02+0.09+0.22+0.33=0.66>0.6,所以指标值的第60百分位数在[195,205)内,小于205,C选项不正确;
对于选项D,抽取的产品的质量指标值的样本平均数和样本方差的估计值分别为=170×0.02+180×0.09+190×0.22+200×0.33+210×0.24+220×0.08+230×0.02=200,
s2=(-30)2×0.02+(-20)2×0.09+(-10)2×0.22+0×0.33+102×0.24+202×0.08+302×0.02=150,
D选项正确.故选C.
11.(多选题)(2023·新课标Ⅰ卷)有一组样本数据x1,x2,…,x6,其中x1是最小值,x6是最大值,则(  )
[A] x2,x3,x4,x5的平均数等于x1,x2,…,x6的平均数
[B] x2,x3,x4,x5的中位数等于x1,x2,…,x6的中位数
[C] x2,x3,x4,x5的标准差不小于x1,x2,…,x6的标准差
[D] x2,x3,x4,x5的极差不大于x1,x2,…,x6的极差
【答案】 BD
【解析】 对于选项A,设x2,x3,x4,x5的平均数为m,x1,x2,…,x6的平均数为n,
则n-m=-=,
因为没有确定2(x1+x6),x2+x3+x4+x5的大小关系,所以无法判断m,n的大小关系,故A错误;
对于选项B,不妨设x1≤x2≤x3≤x4≤x5≤x6,
可知x2,x3,x4,x5的中位数等于x1,x2,…,x6的中位数均为,故B正确;
对于选项C,因为x1是最小值,x6是最大值,
则x2,x3,x4,x5的波动性不大于x1,x2,…,x6的波动性,即x2,x3,x4,x5的标准差不大于x1,x2,…,x6的标准差,故C错误;
对于选项D,不妨设x1≤x2≤x3≤x4≤x5≤x6,
则x6-x1≥x5-x2,当且仅当x1=x2,x5=x6时,等号成立,故D正确.故选BD.
12.某学校开展“国学知识竞赛”,共有“诗经组”“论语组”“春秋组”“礼记组”4个小组参赛,每组10名选手,若该组每名选手的失分不超过6分,该组获得“优秀”称号,则根据每组选手的失分情况(竞赛分数为整数),下列小组一定获得“优秀”称号的是(  )
[A] 中位数为3,众数为2的诗经组
[B] 平均数为3,方差为1的论语组
[C] 平均数为3,众数为2的春秋组
[D] 中位数为3,极差为4的礼记组
【答案】 B
【解析】 对于A,数据为1,2,2,2,2,4,6,7,8,9时,满足中位数为3,众数为2,但不满足每名选手的失分不超过6分,故A错误;
对于B,假设有一名选手失7分,则方差s2>=1.6,与方差为1矛盾,假设不成立,故B
正确;
对于C,数据为1,2,2,2,2,2,2,3,5,9时,满足平均数为3,众数为2,但是不满足每名选手失分不超过6分,故C错误;
对于D,数据为3,3,3,3,3,3,3,3,7,7,满足中位数为3,极差为4,但最大值超过6,故D错误.
故选B.
13.(5分)已知样本数据x1,x2,…,x2 026的平均数为2,方差为 2 024,则,,…,的平均数为    .
【答案】 2 028
【解析】 由题意,可得=2,所以x1+x2+…+x2 026=4 052,
又由=2 024,
即++…+-4(x1+x2+…+x2 026)+22×2 026=2 024×2 026,
所以=2 028.
14.(15分)(2025·宁夏银川模拟)滨海盐碱地是我国盐碱地的主要类型之一,如何利用更有效的方法改造这些宝贵的土地资源,成为摆在我们面前的世界级难题.对盐碱地的改良方法,研究人员在长期的实践中获得了两种成本差异不大,且能降低滨海盐碱地30~60 cm土壤层可溶性盐含量的技术,为了对比这两种技术改良盐碱地的效果,科研人员在同一区域采集了12个土壤样本,平均分成A,B两组,测得A组土壤可溶性盐含量数据样本平均数=0.82,方差=0.029 3,B组土壤可溶性盐含量数据样本平均数=0.83,方差=0.169 7.用技术1对A组土壤进行可溶性盐改良试验,用技术2对B组土壤进行可溶性盐改良试验,分别获得改良后土壤可溶性盐含量数据如下:
A组y1 0.66 0.68 0.69 0.71 0.72 0.74
B组y2 0.46 0.48 0.49 0.49 0.51 0.54
改良后A组、B组土壤可溶性盐含量数据样本平均数分别为和,样本方差分别记为和.
(1)求,,,;
(2)应用技术1与技术2土壤可溶性盐改良试验后,土壤可溶性盐含量是否有显著降低 (若>2,i=1,2,则认为应用技术有显著降低土壤可溶性盐含量,否则不认为有显著
降低)
【解】 (1)=×(0.66+0.68+0.69+0.71+0.72+0.74)=0.70,
=×[(0.66-0.70)2+(0.68-0.70)2+(0.69-0.70)2+(0.71-0.70)2+(0.72-0.70)2+(0.74-0.70)2]=0.000 7,
=×(0.46+0.48+0.49+0.49+0.51+0.54)=0.495,
=×[(0.46-0.495)2+(0.48-0.495)2+(0.49-0.495)2+(0.49-0.495)2+(0.51-0.495)2+
(0.54-0.495)2]=0.000 625.
(2)当i=1时,||2=0.014 4,
(2)2=0.02,
因为0.014 4<0.02,所以<2,
所以应用技术1后,土壤可溶性盐含量没有显著降低;
当i=2时,=0.112 225,
(2)2=0.113 55,
因为0.112 225<0.113 55,
所以<2,
所以应用技术2后,土壤可溶性盐含量没有显著降低.
故应用技术1和技术2后,土壤可溶性盐含量没有显著降低.
15.(多选题)(2025·湖北荆州模拟)某班语文老师对该班甲、乙、丙、丁4名同学连续7周每周阅读的天数(每周阅读天数可以是1,2,3,4,5,6,7)进行统计,根据统计所得数据对这4名同学这7周每周的阅读天数分别做了如下描述:
甲:中位数为4,极差为3;
乙:中位数为3,众数为5;
丙:中位数为4,平均数为3;
丁:平均数为3,方差为3.
那么可以判断一周阅读天数一定没有出现7天的是(  )
[A] 甲 [B] 乙 [C] 丙 [D] 丁
【答案】 BCD
【解析】 对于甲,因为中位数为4,极差为3,所以这7个数可以是4,4,4,4,4,4,7,故甲不符合题意;
对于乙,因为中位数为3,众数为5,所以这7个数从小到大排列后,第4个数是3,所以1,2,3中一定有一个数出现2次,5出现3次,所以这7个数中一定没有出现7,故乙符合题意;
对于丙,若出现1个7,则这7个数从小到大排列后,后4个数之和最小为19,前3个数之和最小为3,从而这7个数的平均数最小为>3,即这7个数的平均数不可能为3,故丙符合
题意;
对于丁,设这7个数分别为x1,x2,x3,x4,x5,x6,x7,则x1+x2+x3+x4+x5+x6+x7=21,
(x1-3)2+(x2-3)2+(x3-3)2+(x4-3)2+(x5-3)2+(x6-3)2+(x7-3)2=21.
若x1=7,则x2+x3+x4+x5+x6+x7=14,
(x2-3)2+(x3-3)2+(x4-3)2+(x5-3)2+(x6-3)2+(x7-3)2=5,
从而x2,x3,x4,x5,x6,x7这6个数可能是4,4,4,4,4,3或4,4,4,4,3,2或4,4,4,3,2,2或4,4,3,2,2,2或4,3,2,2,2,2或3,2,2,2,2,2或5,4,3,3,3,3或5,3,3,3,3,2或4,3,3,3,3,1或3,3,3,3,2,1,这与x2+x3+x4+x5+x6+x7=14矛盾,
即这7个数中一定没有出现7,故丁符合题意.故选BCD.
(

12

)(共89张PPT)
第2节 用样本估计总体
1.能用样本估计总体的集中趋势参数(平均数、中位数、众数、百分位数),理解集中趋势参数的统计含义.
2.能用样本估计总体的离散程度参数(标准差、方差、极差),理解离散程度参数的统计含义.
[课程标准要求]
必备知识
课前回顾
知识梳理
1.百分位数
一般地,一组数据的第p百分位数是这样一个值,它使得这组数据中至少有
的数据小于或等于这个值,且至少有(100-p)%的数据
这个值.
p%
大于或等于
(2)中位数:将一组数据按从小到大或从大到小的顺序排列,处在最 的一个数据(当数据个数是奇数时)或最中间两个数据的 (当数据个数是偶数时).
(3)众数:一组数据中出现次数 的数据(即频数最大值所对应的样本数据).
知识梳理
2.平均数、中位数和众数
中间
平均数
最多
知识梳理
3.方差和标准差
重要结论
对点自测
1.(人教B版必修第二册P70练习A T2改编)样本数据36,27,25,22,20,16,13,12,11的中位数为(  )
[A] 16 [B] 18
[C] 20 [D] 21
C
对点自测
【解析】 将样本数据从小到大排序得11,12,13,16,20,22,25,27,36,位于中间的是20.故选C.
对点自测
2.有一组数据,按从小到大的顺序排列为1,2,x,8,9,10,这组数据的第40百分位数等于这组数据的平均数,则x为(   )
[A] 3 [B] 4
[C] 5 [D] 6
D
对点自测
对点自测
3.(多选题)(人教A版必修第二册P216习题9.2 T3改编)在去年某校高二年级足球比赛中,甲、乙两班每场比赛平均进球数、失球数及所有场次比赛进球个数、失球个数的标准差如下表:
项目 进球个数 平均数 失球个数 平均数 进球个数 标准差 失球个数
标准差
甲班 2.3 1.5 0.5 1.1
乙班 1.4 2.1 1.2 0.4
对点自测
下列说法正确的是(   )
[A] 甲班在防守中比乙班稳定
[B] 乙班总体实力优于甲班
[C] 乙班很少失球
[D] 乙班在进攻中有时表现很好,有时表现较差
CD
对点自测
【解析】 由失球个数的标准差可得A错误;由进球个数和失球个数的平均数可得B错误;由失球个数的标准差可知C正确;由进球个数的标准差可知D正确.故选CD.
对点自测
4.(苏教版必修第二册P257练习T3改编)已知样本数据x1,x2,…,x15的平均数为8,方差为32,由这组数据得到新样本数据y1,y2,…,y15,其中yi=3xi+1
(i=1,2,…,15),则得到的新样本数据的平均数和方差分别是      .
25,288
对点自测
对点自测
5.(2025·江苏南通模拟)某公司为了解用户对其产品的满意度,从使用该产品的用户中随机调查了100名用户,根据用户对产品的满意度评分,得到如图所示的用户满意度评分的频率分布直方图.若用户满意度评分的中位数、众数、平均数的估计值分别为a,b,c,则a,b,c的大小关系为     .(按从小到大的顺序排列)
b对点自测
【解析】 由频率分布直方图可知众数估计值为65,即b=65;由题图可知,组距为10,所以平均数估计值为45×0.15+55×0.2+65×0.25+75×0.2+85×0.1+
95×0.1=67,故c=67;设中位数为x,则有10×0.015+10×0.02+(x-60)×0.025=
0.5,解得 x=66,即中位数估计值为a=66,所以b关键能力
课堂突破
[例1] (1)(2025·天津模拟)某校高三数学备课组老师的年龄(单位:岁)分别为37,30,42,32,41,46,45,48,35,53,则这组数据的第60百分位数为(   )
[A] 45 [B] 42
[C] 43.5 [D] 45.5
考点一 总体百分位数的估计
C
(2)某科研单位对某APP的使用情况进行满意度调查,在一批用户的有效问卷(用户打分在50分到100分之间的问卷)中随机抽取了100份,按分数进行分组(每组为左闭右开的区间),得到如图所示的频率分布直方图,估计这批用户问卷的得分的第75百分位数为(  )
[A] 78.5
[B] 82.5
[C] 85
[D] 87.5
B
【解析】 (2)因为(0.01+0.025+0.035)×10=0.7<0.75,(0.01+0.025+
0.035+0.02)×10=0.9>0.75,所以第75百分位数位于[80,90),设为x,则(0.01+0.025+0.035)×10+0.02(x-80)=0.75,解得x=82.5,即这批用户问卷的得分的第75百分位数估计值为82.5.故选B.
解题策略
计算一组数据的第p百分位数的步骤
[针对训练] (1)(2025·浙江衢州模拟)将10个数据按照从小到大的顺序排列为11,15,17,a,23,26,27,34,37,38,若该组数据的第40百分位数为22,则a等于(  )
[A] 19 [B] 20
[C] 21 [D] 22
C
(2)(2025·湖北黄冈模拟)为了解高中学生每天的体育活动时间,某市教育部门随机抽取1 000名高中学生进行调查,把每天进行体育活动的时间按照时长
(单位:min)分成6组:[30,40),[40,50),[50,60),[60,70),[70,80),[80,90],然后对统计数据整理得到如图所示的频率分布直方图,则可估计这1 000名学生每天体育活动时间的第25百分位数为(  )
[A] 47.5 [B] 45.5
[C] 43.5 [D] 42.5
A
【解析】 (2)第25百分位数设为x,而0.1<0.25<0.1+0.2,则所求百分位数在第二组,则可列方程 0.1+0.02(x-40)=0.25,解得x=47.5,即这1 000名学生每天体育活动时间的第25百分位数的估计值为47.5.故选A.
考点二 总体集中趋势的估计
[例2] 某市为了制定合理的节水方案,对居民用水情况进行了调查,通过抽样,获得了某年100名居民每人的月均用水量(单位:吨),将数据按照[0,0.5),
[0.5,1),…,[4,4.5]分成9组,制成了如图所示的频率分布直方图.
(1)求频率分布直方图中a的值;
【解】 (1)由频率分布直方图知,(0.08+0.16+a+0.42+0.50+a+0.12+0.08+
0.04)×0.5=1,解得a=0.30,所以直方图中a的值为0.30.
【解】 (2)由题图得居民月均用水量不低于3吨的频率为0.5×(0.12+
0.08+0.04)=0.12,
所以估计全市居民中月均用水量不低于3吨的人数为300 000×0.12=36 000.
(2)已知该市有30万居民,估计全市居民中月均用水量不低于3吨的人数;
(3)估计居民月均用水量的众数、中位数(同一组中数据用该组区间中点值作代表).
频率分布直方图中数字特征的计算
(1)最高的小长方形底边中点的横坐标即是众数估计值.
(2)中位数估计值的左边和右边的小长方形的面积和是相等的.
(3)平均数是频率分布直方图的“重心”,其估计值等于频率分布直方图中每个小长方形的面积乘小长方形底边中点的横坐标之和.
解题策略
D
考点三 总体离散程度的估计
[例3] (2025·陕西安康模拟)某届展览会在各个展区中设置了多项互动体验活动,吸引了很多的中小学生.现从某个有互动体验活动的展区中随机抽取60名中小学生,统计他们的参观时间(从进入该展区到离开该展区的时长,单位:
min,时间取整数),将时间分成[40,50),[50,60),…,[90,100]六组,并绘制成如图所示的频率分布直方图.
(3)利用(2)中的结果,你认为展区是否应该设置互动体验活动 请说明理由.
【解】 (3)从(2)中可知,展区应该设置互动体验活动,这样可以吸引更多的中小学生进行观看与体验,使他们能更多地了解产品,并能更大程度地激发中小学生的兴趣爱好.
解题策略
利用样本的数字特征解决优化决策问题的依据
(1)平均数反映了数据取值的平均水平,标准差、方差描述了一组数据围绕平均数波动的大小.标准差、方差越大,数据的离散程度越大,越不稳定;标准差、方差越小,数据的离散程度越小,越稳定.
(2)用样本估计总体就是利用样本的数字特征来描述总体的数字特征.
[针对训练] (2023·全国乙卷)某厂为比较甲、乙两种工艺对橡胶产品伸缩率的处理效应,进行10次配对试验,每次配对试验选用材质相同的两个橡胶产品,随机地选其中一个用甲工艺处理,另一个用乙工艺处理,测量处理后的橡胶产品的伸缩率,甲、乙两种工艺处理后的橡胶产品的伸缩率分别记为xi,yi (i=1,2,…,10),试验结果如下:
试验 序号i 1 2 3 4 5 6 7 8 9 10
伸缩 率xi 545 533 551 522 575 544 541 568 596 548
伸缩 率yi 536 527 543 530 560 533 522 550 576 536
课时作业
(分值:95分)
选题明细表
单选每题5分,多选每题6分,填空每题5分.
知识点、方法 题号
总体百分位数的估计 1,2,3,7
总体集中趋势的估计 4,13
总体离散程度的估计 5,6,10,14
综合应用 8,9,11,12,15
1.有一组样本数据:2,3,3,3,4,4,5,5,6,6,则关于该组数据的下列数字特征中,数值最大的为(   )
[A] 第75百分位数
[B] 平均数
[C] 极差
[D] 众数
基础巩固练
A
基础巩固练
D
3.(2025·江西九江模拟)某中学举办了一次知识竞赛,从中随机抽取了部分学生的成绩绘制成如图所示的频率分布直方图,则估计该中学本次竞赛成绩的第70百分位数为(   )
[A] 68 [B] 71
[C] 76 [D] 77
C
【解析】 设m为抽取的学生成绩的第70百分位数,因为(0.016+0.030)×10=
0.46<0.7,(0.016+0.030+0.040)×10=0.86>0.7,所以 m∈[70,80),所以(m-70)×
0.04+0.46=0.7,解得m=76.故估计该中学本次竞赛成绩的第70百分位数为76.故选C.
4.(2024·新课标Ⅱ卷)某农业研究部门在面积相等的100块稻田上种植一种新型水稻,得到各块稻田的亩产量(单位:kg)并整理得下表:
亩产量 [900,950) [950,1 000) [1 000,1 050)
频数 6 12 18
亩产量 [1 050,1 100) [1 100,1 150) [1 150,1 200)
频数 30 24 10
根据表中数据,下列结论中正确的是(  )
[A] 100块稻田亩产量的中位数小于1 050 kg
[B] 100块稻田中亩产量低于1 100 kg的稻田所占比例超过80%
[C] 100块稻田亩产量的极差介于200 kg至300 kg 之间
[D] 100块稻田亩产量的平均值介于900 kg至 1 000 kg之间
C
5.(多选题)已知甲组数据为1,1,3,3,5,7,9,乙组数据为1,3,5,7,9,则下列说法正确的是(   )
[A] 这两组数据的第80百分位数相等
[B] 这两组数据的极差相等
[C] 这两组数据分别去掉一个最大值和一个最小值后,仅仅乙组数据的均值不变
[D] 甲组数据比乙组数据分散
BC
6.(多选题)(2025·广东汕头模拟)如图是样本甲与样本乙的频率分布直方图
(每组为左闭右开的区间,最后一组为闭区间),下列说法正确的是(   )
[A] 样本乙的极差一定大于样本甲的极差
[B] 样本乙的众数一定大于样本甲的众数
[C] 样本乙的方差一定小于样本甲的方差
[D] 样本甲的中位数一定小于样本乙的中位数
BCD
【解析】 对于A,甲的数据介于[1.5,7.5]之间,极差小于或等于6,乙的数据分布于[2.5,8.5],极差小于或等于6,从而甲和乙的极差可能相等,A错误;
对于B,根据频率分布直方图可知,甲的众数介于[2.5,5.5)之间,乙的众数介于[5.5,6.5)之间,乙的众数大于甲的众数,B正确;
对于C,甲的数据比较分散,乙的数据比较集中,因此乙的方差小于甲的方差,C正确;
对于D,甲的各组频率依次为0.15,0.20,0.20,0.20,0.15,0.10,其中位数位于[3.5,4.5)之间,
乙的各组频率依次为0.05,0.10,0.15,0.35,0.20,0.15,其中位数位于[5.5,6.5)之间,所以甲的中位数小于乙的中位数,D正确.故选BCD.
7.(5分)(2025·安徽合肥模拟)已知甲、乙两组按从小到大顺序排列的数据:甲组:24,30,36,m,40,50,52,54,57,60;乙组:27,32,n,44,48,52.若甲组数据的第30百分位数和乙组数据的第50百分位数相等,则m-n等于    .
8
8.(11分)文明城市是反映城市整体文明水平的综合性荣誉称号,作为普通市民,既是文明城市的最大受益者,更是文明城市的主要创造者.某市为提高市民对文明城市创建的认识,举办了“创建文明城市”知识竞赛,从所有答卷中随机抽取100份作为样本,将样本的成绩(满分100分,成绩均为不低于40分的整数)分成六段:[40,50),[50,60),…,[90,100],得到如图所示的频率分布直方图.
(1)求频率分布直方图中a的值;
【解】 (1)利用每组小矩形的面积之和为1可得,(0.005+0.010+0.020+a+
0.025+0.010)×10=1,解得a=0.030.
(2)估计样本成绩的第75百分位数;
【解】 (2)成绩落在[40,80)内的频率为(0.005+0.010+0.020+0.030)×10=
0.65,落在[40,90)内的频率为(0.005+0.010+0.020+0.030+0.025)×10=0.9,设第75百分位数为m,由0.65+(m-80)×0.025=0.75,得m=84,故第75百分位数的估计值为84.
综合运用练
9.(2025·陕西商洛模拟)某高校为宣扬中华文化,举办了“论语吟唱”的比赛,在比赛中,由A,B两个评委小组(各9人)给参赛选手打分.根据两个评委小组对同一名选手的打分绘制成如图所示折线图,则下列说法正确的是(   )
[A] B组打分的方差小于A组打分的方差
[B] B组打分的中位数为75
[C] A组的意见相对一致
[D] A组打分的众数为50
C
【解析】 对于A,观察题中折线图可知,B组的极差大于A组的极差,且数据波动性较A组更大,所以B组打分的方差大于A组打分的方差,故A错误;
对于B,B组打分的分值按照从小到大排列为36,55,58,62,66,68,68,70,75,所以中间数为66,故中位数为66,故B错误;
对于C,A组打分的分值比较均匀,波动更小,故A组意见相对一致,故C正确;
对于D,A组打分的分值为42,47,45,46,50,47,55,50,47,所以A组打分的分值的众数为47,故D错误.故选C.
10.从某小型加工厂生产的产品中抽取100件作为样本,将该样本进行某项质量指标值测量,下图是测量结果x的频率分布直方图.若同一组中的数据用该组区间的中点值作代表,则在下列选项中,关于该样本统计量的叙述不正确的是(   )
[A] 指标值在区间[195,205)的产品有33件
[B] 指标值的极差介于50与70之间
[C] 指标值的第60百分位数大于205
[D] 指标值的方差的估计值是150
C
【解析】 由直方图可得出,从第一组至第七组的频率依次是0.02,0.09,
0.22,0.33,0.24,0.08,0.02,
对于选项A,指标值在区间[195,205)的产品
有100×0.33=33(件),A选项正确;
对于选项B,指标值的最大极差为235-165=70,
最小极差大于225-175=50,B选项正确;
对于选项C,因为0.02+0.09+0.22=0.33<0.6,0.02+0.09+0.22+0.33=0.66>0.6,所以指标值的第60百分位数在[195,205)内,小于205,C选项不正确;
11.(多选题)(2023·新课标Ⅰ卷)有一组样本数据x1,x2,…,x6,其中x1是最小值,
x6是最大值,则(   )
[A] x2,x3,x4,x5的平均数等于x1,x2,…,x6的平均数
[B] x2,x3,x4,x5的中位数等于x1,x2,…,x6的中位数
[C] x2,x3,x4,x5的标准差不小于x1,x2,…,x6的标准差
[D] x2,x3,x4,x5的极差不大于x1,x2,…,x6的极差
BD
12.某学校开展“国学知识竞赛”,共有“诗经组”“论语组”“春秋组”“礼记组”
4个小组参赛,每组10名选手,若该组每名选手的失分不超过6分,该组获得
“优秀”称号,则根据每组选手的失分情况(竞赛分数为整数),下列小组一定
获得“优秀”称号的是(  )
[A] 中位数为3,众数为2的诗经组
[B] 平均数为3,方差为1的论语组
[C] 平均数为3,众数为2的春秋组
[D] 中位数为3,极差为4的礼记组
B
2 028
分别获得改良后土壤可溶性盐含量数据如下:
A组y1 0.66 0.68 0.69 0.71 0.72 0.74
B组y2 0.46 0.48 0.49 0.49 0.51 0.54
应用创新练
15.(多选题)(2025·湖北荆州模拟)某班语文老师对该班甲、乙、丙、丁4名同学连续7周每周阅读的天数(每周阅读天数可以是1,2,3,4,5,6,7)进行统计,根据统计所得数据对这4名同学这7周每周的阅读天数分别做了如下描述:
甲:中位数为4,极差为3;
乙:中位数为3,众数为5;
丙:中位数为4,平均数为3;
丁:平均数为3,方差为3.
那么可以判断一周阅读天数一定没有出现7天的是(   )
[A] 甲 [B] 乙 [C] 丙 [D] 丁
BCD
从而x2,x3,x4,x5,x6,x7这6个数可能是4,4,4,4,4,3或4,4,4,4,3,2或4,4,4,3,2,2或4,4,3,2,2,2或4,3,2,2,2,2或3,2,2,2,2,2或5,4,3,3,3,3或5,3,3,3,3,2或4,3,3,3,3,1或3,3,3,3,2,1,这与x2+x3+x4+x5+x6+x7=14矛盾,
即这7个数中一定没有出现7,故丁符合题意.故选BCD.

展开更多......

收起↑

资源列表