资源简介 专题 9.2 用样本估计总体【十大题型】【人教 A 版(2019)】【题型 1 频率分布直方图的绘制】 ........................................................................................................................2【题型 2 根据统计图解决实际问题】 ....................................................................................................................4【题型 3 频率分布直方图的相关计算问题】 ........................................................................................................6【题型 4 统计图的综合应用问题】 ........................................................................................................................7【题型 5 百分位数的求解】 ..................................................................................................................................11【题型 6 众数、中位数、平均数的计算与求参】 ..............................................................................................12【题型 7 众数、中位数、平均数的实际应用】 ..................................................................................................12【题型 8 方差、标准差的求解及应用】 ..............................................................................................................14【题型 9 频率分布直方图中集中趋势参数的计算】 ..........................................................................................15【题型 10 其他统计图表中反映的集中趋势与离散程度】 ................................................................................18【知识点 1 总体取值规律的估计】1.频率分布直方图(1)频率分布表与频率分布直方图的意义为了探索一组数据的取值规律,一般先要用表格对数据进行整理,或者用图将数据直观表示出来.在初中,我们曾用频数分布表和频数分布图来整理和表示这种数值型数据,由此能使我们清楚地知道数据分布在各个小组的个数.有时,我们更关心各个小组的数据在样本容量中所占比例的大小,所以选择频率分布表和频率分布直方图来整理和表示数据.(2)频率分布表与频率分布直方图的制作步骤与画频数分布直方图类似,我们可以按以下步骤制作频率分布表、画频率分布直方图.第一步,求极差极差为一组数据中最大值与最小值的差.第二步,决定组距与组数第三步,将数据分组通常对组内数据取左闭右开区间,最后一组数据取闭区间.第四步,列频率分布表计算各小组的频率,作出频率分布表.第五步,画频率分布直方图画图时,以横轴表示分组,纵轴(小长方形的高度)表示 .2.其他几类常用统计图——条形图、折线图、扇形图条形图 折线图 扇形图一般地,条形图中,一条轴 用一个单位长度表示一定 用整个圆表示总体,扇形上显示的是所关注的数据类 的数量,用折线的起伏表示 图中,每一个扇形的圆心特型,另一条轴上对应的是数 数量的增减变化. 角以及弧长,都与这一部点量、个数或者比例,条形图 分表示的数据大小成正中每一长方形都是等宽的. 比.作 能清楚地表示每个项目的具 能清楚地看出数量增减变 可以形象地表示出各部分用 体数量,便于相互比较大小. 化的情况及各部分数量的 数据在全部数据中所占的及 多少.常用来表示随时间变 比例情况.选 化的数据,当然,也可以用用 在其他合适的情形中.情景图例【题型 1 频率分布直方图的绘制】【例 1】(24-25 高二·上海·课堂例题)从高一学生中抽取 50 名参加调研考试,成绩的分组及各组的频数如下(单位:分):[40,50),2;[50,60),3;[60,70),10;[70,80),15;[80,90),12;[90,100],8.(1)列出样本的频率分布表;(2)画出频率分布直方图;(3)估计成绩在[70,80)分的学生所占总体的百分比.【变式 1-1】(24-25 高一下·全国·课后作业)为加强中学生实践创新能力和团队精神的培养,促进教育教学改革,某市教育局将举办全市中学生创新知识竞赛.某校举行选拔赛,共有 200 名学生参加,为了解成绩情况,从中抽取 50 名学生的成绩(得分均为整数,满分为 100 分)进行统计,请你根据尚未完成的频率分布表解答下列问题:分组 频数 频率[60.5,70.5) a 0.26[70.5,80.5) 15 c[80.5,90.5) 18 0.36[90.5,100.5] b d合计 50 e(1)求 a,b,c,d,e 的值;(2)作出频率分布直方图.【变式 1-2】(23-24 高二·上海·课堂例题)某医学研究团队为了研究一种降血脂新药的有效性,给 50 名患者服用该药,一周后测得低密度脂蛋白的含量(单位:mmol/L)如下:2.80 3.54 3.02 3.43 3.69 2.46 3.03 3.06 3.35 3.573.72 4.36 2.56 4.11 2.81 2.77 5.32 3.34 3.68 3.952.98 3.63 3.65 3.22 3.90 3.97 3.86 3.93 3.17 3.723.36 3.56 3.80 4.57 5.02 3.31 3.52 3.27 3.98 4.723.03 4.09 2.14 2.06 3.00 2.75 3.84 2.16 3.09 2.81(1)制作频率分布表;(2)绘制频率分布直方图和频率分布折线图.【变式 1-3】(2024 高一下·全国·专题练习)如表所示给出了在某校 500 名 12 岁男孩中,用随机抽样得出的 120 人的身高(单位:cm).区间[122,126) [126,130) [130,134) [134,138) [138,142) [142,146) [146,150) [150,154) [154,158]界限人5 8 10 22 33 20 11 6 5数(1)列出样本频率分布表;(2)画出频率分布直方图;(3)估计身高小于 134 cm 的人数占总人数的百分比.【题型 2 根据统计图解决实际问题】【例 2】(2024·陕西西安·模拟预测)2017 年至 2022 年某省年生产总量及其增长速度如图所示,则下列结论错误的是( )A.2017 年至 2022 年该省年生产总量逐年增加B.2017 年至 2022 年该省年生产总量的极差为 14842.3 亿元C.2017 年至 2022 年该省年生产总量的增长速度逐年降低D.2017 年至 2022 年该省年生产总量的增长速度的中位数为 7.6%【变式 2-1】(2024 高二下·浙江绍兴·学业考试)下图为某同学两次月考成绩占总成绩百分数的扇形统计图,已知该同学第一次月考总分低于第二次月考总分,则( )A.该同学数学学科成绩一定下降 B.该同学政治学科成绩一定下降C.该同学化学学科成绩可能下降 D.该同学语文学科成绩一定提升【变式 2-2】(23-24 高一下·陕西·期末)如图是 2020 年 2 月 15 日至 3 月 2 日武汉市新冠肺炎新增确诊病例的折线统计图.则下列说法不正确的是( )A.武汉市新冠肺炎疫情防控取得了阶段性的成果,但防控要求不能降低B.2020 年 2 月 19 日武汉市新增新冠肺炎确诊病例比前日降低了 1045 人C.2020 年 2 月 15 日到 3 月 2 日武汉市新冠肺炎新增确诊病例最多的一天是最少的一天 16 倍多D.2020 年 2 月 19 日至 3 月 2 日武汉市新增新冠肺炎确诊病例低于 500 人的有 10 天【变式 2-3】(23-24 高一下·湖南·阶段练习)如图为近一年我国商品零售总额和餐饮收入总额同比增速情况折线图,根据该图,下列结论正确的是( )(注:同比,指当前的数据与上一年同期进行比对;环比,指当前数据与上个月的数据进行比对.)A.2024 年1 2月份,商品零售总额同比增长9.2%B.2023 年3 12月份,餐饮收入总额同比都降低C.2023 年6 10月份,商品零售总额同比都增加D.2023 年 12 月,餐饮收入总额环比增速为 14.1%【题型 3 频率分布直方图的相关计算问题】【例 3】(23-24 高一下·湖南邵阳·期末)某校高一年级有 800 名学生选学物理,将某次联考的物理成绩绘制成的频率分布直方图如图所示,则高一年级这次联考的物理成绩位于区间[60,80)的人数约为( )A.200 B.220 C.240 D.260【变式 3-1】(23-24 高一下·广东广州·阶段练习)要调查某地区高中学生身体素质,从高中生中抽取 100 人进行跳远测试,根据测试成绩制作频率分布直方图如下图,现再从这 100 人中用分层抽样的方法抽取 20 人,应从[120,130)间抽取人数为 b,则 b 为( )A.4 B.5 C.6 D.7【变式 3-2】(23-24 高一下·北京朝阳·期末)李华统计了他爸爸 2024 年 5 月的手机通话明细清单,发现他爸爸该月共通话 60 次,他按每次通话时间长短进行分组(每组为左闭右开的区间),画出了如图所示的频率分布直方图.则每次通话时长不低于 5 分钟且小于 15 分钟的次数为( )A.18 B.21 C.24 D.27【变式 3-3】(2025 高三上·河南·专题练习)为了调查某工厂生产的一批口罩的质量情况,随机抽取了一批口罩,所得数据如下图所示,为了进一步了解情况,研究人员在被抽取的口罩中按照质量的指标值再次进行分层抽样,共抽取 个,若质量的指标值在[110,120)中的抽取80个,则下列说法正确的是( )A.质量的指标值在[140,150)中的抽取5个B.质量的指标值在[130,140)中的抽取60个C.质量的指标值在[120,130)中的抽取40个D. = 200【题型 4 统计图的综合应用问题】【例 4】(23-24 高一下·四川内江·期末)某调查机构对全国互联网行业进行调查统计,得到整个互联网行业从业者年龄的分布饼状图 90 后从事互联网行业者的岗位分布条形图,则下列结论中不一定正确的是( )A.互联网行业从事技术岗位的人数中,90 后比 80 后多B.90 后互联网行业者中从事技术岗位的人数超过整个从事互联网行业者总人数的20%C.互联网行业中从事运营岗位的人数 90 后比 80 前多D.互联网行业从业人员中 90 后占一半以上【变式 4-1】(2024·河南·二模)某银行为客户定制了 A,B,C,D,E 共 5 个理财产品,并对 5 个理财产品的持有客户进行抽样调查,得出如下的统计图:用该样本估计总体,以下四个说法错误的是( )A.44~56 周岁人群理财人数最多B.18~30 周岁人群理财总费用最少C.B 理财产品更受理财人青睐D.年龄越大的年龄段的人均理财费用越高【变式 4-2】(24-25 高一上·全国·课后作业)以下是某手机店根据某手机销售的相关数据绘制的统计图的一部分.请根据图 1、图 2 解答下列问题:(1)来自该店财务部的数据报告表明,该手机店 1~4 月的手机销售总额一共是 290 万元,请将图 1 中的统计图补充完整;(2)该店 1 月份音乐手机的销售额为多少万元 (3)小刚观察图 2 后,认为 4 月份音乐手机的销售额比 3 月份减少了,你同意他的看法吗 请说明理由.【变式 4-3】(2025 高一·全国·专题练习)某市为了增强学生体质,全面实施“学生饮用奶”营养工程.某品牌牛奶供应商提供了原味、草莓味、菠萝味、香橙味、核桃味五种口味的牛奶供学生饮用.某中学为了了解学生对不同口味牛奶的喜好,对全校订购牛奶的学生进行了随机调查(每盒各种口味牛奶的体积相同),绘制了如下两张不完整的统计图:(1)本次被调查的学生有多少名?(2)补全上面的条形统计图①,并计算出喜好菠萝味牛奶的学生人数在扇形统计图②中所占圆心角的度数;(3)该校共有 1200 名学生订购了该品牌的牛奶,牛奶供应商每天只为每名订购牛奶的学生配送一盒牛奶.要使学生每天都喝到自己喜好的口味的牛奶,牛奶供应商每天送往该校的牛奶中,草莓味要比原味的多多少盒?【知识点 2 总体百分位数、集中趋势与离散程度的估计】1.总体百分位数的估计(1)概念一般地,一组数据的第 p 百分位数是这样一个值,它使得这组数据中至少有 p%的数据小于或等于这个值,且至少有(100-p)%的数据大于或等于这个值.(2)求解步骤可以通过下面的步骤计算一组 n 个数据的第 p 百分位数:第 1 步,按从小到大排列原始数据.第 2 步,计算 i=n×p%.第 3 步,若 i 不是整数,而大于 i 的比邻整数为 j,则第 p 百分位数为第 j 项数据;若 i 是整数,则第 p百分位数为第 i 项与第(i+1)项数据的平均数.2.总体集中趋势的估计在初中的学习中我们已经了解到,平均数、中位数和众数等都是刻画“中心位置”的量,它们从不同角度刻画了一组数据的集中趋势.具体概念回顾如下:名称 概念平如果有 n 个数 x1,x2,…,xn,那么 就是这组数据均数 的平均数,用 表示,即 .中 将一组数据按从小到大或从大到小的顺序排列,处在最中间的一个数据位 (当数据个数是奇数时)或最中间两个数据的平均数(当数据个数是偶数 数时)称为这组数据的中位数.众 一组数据中出现次数最多的数据(即频数最大值所对应的样本数据)称数 为这组数据的众数.3.总体离散程度的估计(1)方差和标准差假设一组数据是 , , , ,用 表示这组数据的平均数,则我们称 为这组数据的方差.有时为了计算方差的方便,我们还把方差写成 的形式.我们对方差开平方,取它的算数平方根 ,称为这组数据的标准差.(2)总体(样本)方差和总体标准差①一般式:如果总体中所有个体的变量值分别为 ,总体平均数为 ,则总体方差.②加权式:如果总体的 N 个变量值中,不同的值共有 k(k≤N)个,不妨记为 ,其中出现的频数为 ,则总体方差为 .总体标准差:S= .(3)标准差与方差的统计意义①标准差刻画了数据的离散程度或波动幅度,标准差越大,数据的离散程度越大;标准差越小,数据的离散程度越小.②在刻画数据的分散程度上,方差与标准差是一样的,但在解决实际问题时,一般多采用标准差.③标准差(方差)的取值范围为[0,+∞).若样本数据都相等,表明数据没有波动幅度,数据没有离散性,则标准差为 0.反之,标准差为 0 的样本,其中的数据都相等.4.频率分布直方图中的统计参数(1)频率分布直方图中的“众数”根据众数的意义可知,在频率分布直方图中最高矩形中的某个(些)点的横坐标为这组数据的众数.一般用中点近似代替.(2)频率分布直方图中的“中位数”根据中位数的意义,在样本中,有 50%的个体小于或等于中位数,也有 50%的个体大于或等于中位数.因此,在频率分布直方图中,中位数左边和右边的直方图的面积应该相等,由此可估计中位数的值.(3)频率分布直方图中的“平均数”平均数是频率分布直方图的“重心”.因为平均数可以表示为数据与它的频率的乘积之和,所以在频率分布直方图中,样本平均数可以用每个小矩形底边中点的横坐标与小矩形的面积的乘积之和近似代替.【题型 5 百分位数的求解】【例 5】(23-24 高一下·贵州黔西·期末)兴义市峰林布依景区在春节期间,迎来众多游客,其中某天接受了一个小型的旅行团,他们的年龄(单位:岁)如下:6,6,7,8,10,37,39,45,46,52,53,61,则这组数据的第 75 百分位数是( )A.34.5 B.46 C.49 D.52【变式 5-1】(23-24 高一下·广东广州·期末)有一组数据按从小到大排序如下:70,71,73,75,76,则这组数据的 40%分位数,70%分位数分别是( )A.71,74 B.71,75 C.72,74 D.72,75【变式 5-2】(23-24 高一下·江苏苏州·期末)某科研单位对 ChatGPT 的使用情况进行满意度调查,在一批用户的有效问卷(用户打分在 50 分到 100 分之间的问卷)中随机抽取了 100 份,按分数进行分组(每组为左闭右开的区间),得到如图所示的频率分布直方图,估计这批用户问卷的得分的第75百分位数为( )A.78.5 B.82.5 C.85 D.87.5【变式 5-3】(23-24 高一下·天津南开·期末)一组数据:53,57,45,61,79,49,x,若这组数据的第 80百分位数与第 60 百分位数的差为 3,则 = ( )A.58 或 64 B.58 C.59 或 64 D.59【题型 6 众数、中位数、平均数的计算与求参】【例 6】(2024·浙江绍兴·三模)已知实数1 < 2 < < ,若 = 36,且这四个数的中位数是 3,则这四个数的平均数是( )A 5 7.2 B.3 C.2 D.4【变式 6-1】(24-25 高一上·四川南充·开学考试)“杂交水稻之父”袁隆平培育的超级杂交稻在全世界推广种植.某种植户为了考察所种植的杂交水稻苗的长势,从稻田中随机抽取 7 株水稻苗,测得苗高(单位:cm)分别是 23,24,23,25,26,23,25.则这组数据的众数和中位数分别是( )A.24,25 B.23,23C.23,24 D.24,24【变式 6-2】(2024·江苏南通·三模)某同学测得连续 7 天的最低气温分别为1,2,2, ,6,2,8(单位:℃),若这组数据的平均数是中位数的 2 倍,则 = ( )A.2 B.3 C.6 D.7【变式 6-3】(23-24 高一下·云南曲靖·期末)已知一组数据丢失了其中一个大于 3 的数据,剩下的六个数据分别是 3,3,5,3,6,11,若这组数据的平均数与众数的和是中位数的 2 倍,则丢失的数据可能是( )A.5 B.12 C.18 D.20【题型 7 众数、中位数、平均数的实际应用】【例 7】(23-24 高一下·河北邯郸·期末)在一次数学智力测验中,将 100 名参赛者的成绩进行分组整理后得到如下频率分布直方图(每组为左闭右开的区间),根据此频率分布直方图,下列结论正确的是( )A.这 100 名学生中成绩在[80,90)内的频率为 0.012B.这 100 名学生中成绩在[70,90)内的人数为 14C.这 100 名学生的平均成绩为 68.2(同一组中的数据用该组区间的中点值代表)D.这 100 名学生成绩的中位数为 75【变式 7-1】(2024·黑龙江哈尔滨·三模)如图所示,下列频率分布直方图显示了三种不同的形态.图(1)形成对称形态,图(2)形成“右拖尾”形态,图(3)形成“左拖尾”形态,根据所给图作出以下判断,正确的是( )A.图(1)的平均数=中位数>众数 B.图(2)的众数<中位数<平均数C.图(2)的平均数<众数<中位数 D.图(3)的中位数<平均数<众数【变式 7-2】(2024·陕西西安·二模)某教育机构为调查中小学生每日完成作业的时间,收集了某位学生 100天每天完成作业的时间,并绘制了如图所示的频率分布直方图(每个区间均为左闭右开),根据此直方图得出了下列结论,其中正确的是( )A.估计该学生每日完成作业的时间在 2 小时至 2.5 小时的有 50 天B.估计该学生每日完成作业时间超过 3 小时的概率为 0.3C.估计该学生每日完成作业时间的平均数为 2.75 小时D.估计该学生每日完成作业时间的中位数与平均数相等【变式 7-3】(2024·全国·模拟预测)如图为 2014—2022 年中国游戏用户规模(单位:百万人)及同比增长率、2010—2022 年中国国产游戏获批版号数量(单位:个)的统计图,则下列结论正确的是( )A.2014—2022 年中国游戏用户规模逐年增长B.2014—2022 年中国游戏用户规模的同比增长率的中位数为3.1%C.2010—2022 年中国国产游戏获批版号数量的极差为 223 个D.2010—2022 年中国国产游戏获批版号数量的平均数超过 1600 个【题型 8 方差、标准差的求解及应用】【例 8】(23-24 高一下·宁夏·期末)已知某 4 个数据的平均数为 6,方差为 3,现又加入一个数据 6,此时这 5 个数据的方差为( )A 24 B 16 C 14 D 12. 5 . 5 . 5 . 5【变式 8-1】(24-25 高一·全国·单元测试)某班统计一次数学测验成绩的平均分与方差,计算完毕才发现有个同学的分数还未录入,只好重算一次.已知原平均分和原方差分别为 , 2,新平均分和新方差分别为 1, 21,若此同学的得分恰好为 ,则( )A. = 1, 2 = 21 B. = 1, 2 < 21C. = 2 2 21, > 1 D. < 1, = 21【变式 8-2】(24-25 高二上·吉林·开学考试)有两位射击运动员在一次射击测试中各射靶 10 次,每次命中的环数如下:甲:7 8 7 9 5 4 9 10 7 4乙:9 5 7 8 7 6 8 6 7 7设甲、乙两名运动员射击平均环数分别记为 和 ,方差分别记为 21和 22.(1)求 , , 21, 22;(2)如果你是教练,你如何对这次射击情况作出评价?如果这是一次选拔性考核,你应当如何作出选择?【变式 8-3】(23-24 高一下·江苏苏州·期末)2023 年 10 月 22 日,汉江生态城 2023 襄阳马拉松在湖北省襄阳市成功举行,志愿者的服务工作是马拉松成功举办的重要保障,襄阳市新时代文明实践中心承办了志愿者选拔的面试工作.现随机抽取了 100 名候选者的面试成绩,并分成五组:第一组[45,55),第二组[55,65),第三组[65,75),第四组[75,85),第五组[85,95],绘制成如图所示的频率分布直方图.已知第一、二组的频率之和为 0.3,第一组和第五组的频率相同.(1)估计这 100 名候选者面试成绩的平均数和第 25 百分位数;(2)在这 100 名候选者用分层随机抽样的方法从第四组和第五组面试者内抽取 10 人,再从这 10 名面试者中随机抽取两名,求两名面试者成绩都在第五组的概率.(3)现从以上各组中用分层随机抽样的方法选取 20 人,担任本市的宣传者.若本市宣传者中第二组面试者的面试成绩的平均数和方差分别为 62 和 40,第四组面试者的面试成绩的平均数和方差分别为 80 和 70,据此估计这次第二组和第四组所有面试者的面试成绩的方差.【题型 9 频率分布直方图中集中趋势参数的计算】【例 9】(23-24 高一下·辽宁朝阳·开学考试)对某校高三年级学生参加社区服务的次数进行统计,随机抽取 M 名学生,得到这 M 名学生参加社区服务的次数,根据此数据作出如下频率分布表和频率分布直方图.分组 频数 频率[10,15) 10 0.20[15,20) 24 n[20,25) m p[25,30] 2 0.04合计 M 1(1)求出表中 M,p 及图中 a 的值;(2)若该校有高三学生 300 人,试估计该校高三学生参加社区服务的次数在区间[15,20)内的人数;(3)估计该校高三学生参加社区服务次数的众数、中位数及平均数.(保留一位小数)【变式 9-1】(23-24 高一上·内蒙古呼和浩特·期末)2023 年秋末冬初,呼和浩特市发生了流感疾病. 为了彻底击败病毒,人们更加讲究卫生讲究环保. 某学校开展组织学生参加线上环保知识竞赛活动,现从中抽取200 名学生,记录他们的首轮竞赛成绩并作出如图所示的频率直方图,根据图形,请回答下列问题:(1)若从成绩低于 60 分的同学中按分层抽样方法抽取 5 人成绩,求 5 人中成绩低于 50 分的人数;(2)以样本估计总体,利用组中值估计该校学生首轮竞赛成绩的平均数;(3)首轮竞赛成绩位列前10%的学生入围第二轮的复赛,请根据图中信息,估计入围复赛的成绩(记为 ).【变式 9-2】(23-24 高一下·湖南长沙·期末) (身体质量指数)是目前国际上常用的衡量人体胖瘦程度体重(单位:kg)以及是否健康的一个标准,其计算公式是: = 2 : m2 .中国成人的 数值参考标准为: < 18.5身高 单位为偏瘦;18.5 ≤ < 24为正常;24 ≤ < 28为偏胖; ≥ 28为肥胖.某公司为了解公司员工的身体肥胖情况,研究人员从公司员工体检数据中,采用分层随机抽样的方法抽取了 60 名男员工,40 名女员工的身高体重数据,通过计算男女员工的 值,整理得到如下的频率分布直方图.(1)求频率分布直方图中 a 的值,并估计该公司员工为肥胖的百分比;(2)估计该公司员工的 值的众数,中位数;(3)已知样本中 60 名男员工 值的平均数为 1 = 22.4,根据频率分布直方图,估计样本中 40 名女员工 值的平均数 2.【变式 9-3】(23-24 高一下·四川达州·阶段练习)有一种鱼的身体吸收汞,身体中汞的含量超过其体重的1.00ppm(百万分之一)的鱼被人食用后,就会对人体产生危害.某检测中心从一批这种鱼中随机抽取了 50 条,检测其汞含量(单位:ppm),并将所得数据分为 6 组:[0,0.4),[0.4,0.8),[0.8,1.2),[1.2,1.6),[1.6,2.0),[2.0,2.4],整理后得到如下频率分布直方图.(1)由频率分布直方图估计样本的80%分位数(精确到 0.01);(2)由频率分布直方图估计这批鱼汞含量的平均值(同一组中的数据用该组区间的中点值为代表);(3)从实际情况看,许多鱼的汞含量超标的原因是这些鱼在出售之前没有被检测过.你认为每批这种鱼的平均汞含量都比1.00ppm大吗 并说明理由.【题型 10 其他统计图表中反映的集中趋势与离散程度】【例 10】(23-24 高一下·湖北武汉·期末)近年来,“直播带货”受到越来越多人的喜爱,目前已经成为推动消费的一种流行的营销形式.某直播平台 1200 个直播商家,对其进行调查统计,发现所售商品多为小吃、衣帽、生鲜、玩具、饰品类等,各类直播商家所占比例如图所示.(1)该直播平台为了更好地服务买卖双方,打算随机抽取 60 个直播商家进行问询交流.如果按照比例分层抽样的方式抽取,则应抽取小吃类、生鲜类商家各多少家?(2)在问询了解直播商家的利润状况时,工作人员对(1)中抽取的 60 个商家的平均日利润进行了统计(单位:元),所得频率分布直方图如右图所示,请根据频率分布直方图计算下面的问题:①估计该直播平台商家平均日利润的中位数与平均数(结果保留一位小数,求平均数时同一组中的数据用该组区间的中点值作代表);②若将平均日利润超过 430 元的商家评为“优秀商家”,估计该直播平台“优秀商家”的个数.【变式 10-1】(23-24 高二上·四川成都·期末)为了了解甲、乙两个工厂生产的轮胎的宽度是否达标,分别从两厂随机选取了 10 个轮胎,将每个轮胎的宽度(单位:mm) 记录下来并绘制出折线图:(1)分别计算甲、 乙两厂提供 10 个轮胎宽度的平均值;(2)轮胎的宽度在[193,195]内,则称这个轮胎是标准轮胎,试比较甲、 乙两厂分别提供的 10 个轮胎中所有标准轮胎宽度的方差的大小,根据两厂的标准轮胎宽度的平均水平及其波动情况,判断这两个工厂哪个厂的轮胎相对更好.【变式 10-2】(23-24 高一下·宁夏·期末)某公司为了提高职工的健身意识,鼓励大家加入健步运动,要求200 名职工每天晚上 9:30 上传手机计步截图,对于步数超过 10000 的予以奖励.图 1 为甲乙两名职工在某一星期内的运动步数统计图,图 2 为根据这星期内某一天全体职工的运动步数做出的频率分布直方图.(1)请根据频率分布直方图,求 m 的值,并求出该天运动步数不少于 15000 步的人数;(2)估计全体职工在该天运动步数的众数、平均数和中位数;(3)如果当天甲的排名为第 130 名,乙的排名为第 40 名,试判断做出的是星期几的频率分布直方图.【变式 10-3】(23-24 高一下·广东东莞·期末)树人中学男女学生比例约为2:3,某数学兴趣社团为了解该校学生课外体育锻炼情况(锻炼时间长短(单位:小时),采用样本量比例分配的分层抽样,抽取男生 人,女生 人进行调查.记男生样本为 1, 2, , ,样本平均数、方差分别为 、 21;女生样本为 1, 2, , ,样本平均数、方差分别为 、 22;总样本平均数、方差分别为 、 2. (1)证明: ( )2 = 2 21 + ( ) ; =1(2)该兴趣社团通过分析给出以下两个统计图,假设两个统计图中每个组内的数据均匀分布,根据两图信息分别估计男生样本、女生样本的平均数;(3)已知男生样本方差 21 = 5.5,女生样本方差 22 = 5.7,请结合(2)问的结果计算总样本方差 2的估计值.专题 9.2 用样本估计总体【十大题型】【人教 A 版(2019)】【题型 1 频率分布直方图的绘制】 ........................................................................................................................2【题型 2 根据统计图解决实际问题】 ....................................................................................................................7【题型 3 频率分布直方图的相关计算问题】 ......................................................................................................10【题型 4 统计图的综合应用问题】 ......................................................................................................................12【题型 5 百分位数的求解】 ..................................................................................................................................18【题型 6 众数、中位数、平均数的计算与求参】 ..............................................................................................19【题型 7 众数、中位数、平均数的实际应用】 ..................................................................................................20【题型 8 方差、标准差的求解及应用】 ..............................................................................................................23【题型 9 频率分布直方图中集中趋势参数的计算】 ..........................................................................................26【题型 10 其他统计图表中反映的集中趋势与离散程度】 ................................................................................30【知识点 1 总体取值规律的估计】1.频率分布直方图(1)频率分布表与频率分布直方图的意义为了探索一组数据的取值规律,一般先要用表格对数据进行整理,或者用图将数据直观表示出来.在初中,我们曾用频数分布表和频数分布图来整理和表示这种数值型数据,由此能使我们清楚地知道数据分布在各个小组的个数.有时,我们更关心各个小组的数据在样本容量中所占比例的大小,所以选择频率分布表和频率分布直方图来整理和表示数据.(2)频率分布表与频率分布直方图的制作步骤与画频数分布直方图类似,我们可以按以下步骤制作频率分布表、画频率分布直方图.第一步,求极差极差为一组数据中最大值与最小值的差.第二步,决定组距与组数第三步,将数据分组通常对组内数据取左闭右开区间,最后一组数据取闭区间.第四步,列频率分布表计算各小组的频率,作出频率分布表.第五步,画频率分布直方图画图时,以横轴表示分组,纵轴(小长方形的高度)表示 .2.其他几类常用统计图——条形图、折线图、扇形图条形图 折线图 扇形图一般地,条形图中,一条轴 用一个单位长度表示一定 用整个圆表示总体,扇形上显示的是所关注的数据类 的数量,用折线的起伏表示 图中,每一个扇形的圆心特型,另一条轴上对应的是数 数量的增减变化. 角以及弧长,都与这一部点量、个数或者比例,条形图 分表示的数据大小成正中每一长方形都是等宽的. 比.作 能清楚地表示每个项目的具 能清楚地看出数量增减变 可以形象地表示出各部分用 体数量,便于相互比较大小. 化的情况及各部分数量的 数据在全部数据中所占的及 多少.常用来表示随时间变 比例情况.选 化的数据,当然,也可以用用 在其他合适的情形中.情景图例【题型 1 频率分布直方图的绘制】【例 1】(24-25 高二·上海·课堂例题)从高一学生中抽取 50 名参加调研考试,成绩的分组及各组的频数如下(单位:分):[40,50),2;[50,60),3;[60,70),10;[70,80),15;[80,90),12;[90,100],8.(1)列出样本的频率分布表;(2)画出频率分布直方图;(3)估计成绩在[70,80)分的学生所占总体的百分比.【解题思路】(1)根据题中所给数据 即可得出频率分布表;(2)根据频率分布表画出频率分布直方图即可;(3)根据频率分布直方图即可得解.【解答过程】(1)频率分布表如下:成绩分组 频数 频率[40,50) 2 0.04[50,60) 3 0.06[60,70) 10 0.20[70,80) 15 0.30[80,90) 12 0.24[90,100] 8 0.16合计 50 1.00(2)由题意知组距为 10,取小矩形的高根据表格画出如下的频率分布直方图:(3)由频率分布直方图,可估计成绩在[70,80)分的学生所占总体的百分比是0.03 × 10 = 0.3 = 30%.【变式 1-1】(24-25 高一下·全国·课后作业)为加强中学生实践创新能力和团队精神的培养,促进教育教学改革,某市教育局将举办全市中学生创新知识竞赛.某校举行选拔赛,共有 200 名学生参加,为了解成绩情况,从中抽取 50 名学生的成绩(得分均为整数,满分为 100 分)进行统计,请你根据尚未完成的频率分布表解答下列问题:分组 频数 频率[60.5,70.5) a 0.26[70.5,80.5) 15 c[80.5,90.5) 18 0.36[90.5,100.5] b d合计 50 e(1)求 a,b,c,d,e 的值;(2)作出频率分布直方图.【解题思路】(1)根据频率分布表中的数据,利用频率公式结合频数为 50,频率和为 1 求解;(2)根据频率分布表中的数据,以组距为 x 轴,以频率比组距为 y 轴,画出频率分布直方图;【解答过程】(1)根据题意,得分在[60.5,70.5)内的频数 a=50×0.26=13,在[90.5,100.5]内的频数 b=50-13-15-18=4,在[70.5,80.5) 15内的频率 c=50 = 0.30,在[90.5 4,100.5]内的频率 d=50 = 0.08,频率和 e=1.(2)根据频率分布表作出频率分布直方图,如图所示.【变式 1-2】(23-24 高二·上海·课堂例题)某医学研究团队为了研究一种降血脂新药的有效性,给 50 名患者服用该药,一周后测得低密度脂蛋白的含量(单位:mmol/L)如下:2.80 3.54 3.02 3.43 3.69 2.46 3.03 3.06 3.35 3.573.72 4.36 2.56 4.11 2.81 2.77 5.32 3.34 3.68 3.952.98 3.63 3.65 3.22 3.90 3.97 3.86 3.93 3.17 3.723.36 3.56 3.80 4.57 5.02 3.31 3.52 3.27 3.98 4.723.03 4.09 2.14 2.06 3.00 2.75 3.84 2.16 3.09 2.81(1)制作频率分布表;(2)绘制频率分布直方图和频率分布折线图.【解题思路】(1)根据所给数据求出极差,分组,求出各区间的频数及频率即可求出频率分布表;(2)根据(1)作出频率分布直方图,再由频率分布直方图得出折线图即可【解答过程】(1)由题目数据可知极差为5.32 2.06 = 3.26,组距为0.5,所以分 7 组较好,[2.06,2.56),[2.56,3.06),[3.06,3.56),[3.56,4.06),[4.06,4.56),[4.56,5.06),[5.06,5.56),频率分布表如下:分组 频数 频率[2.06,2.56) 4 0.08[2.56,3.06) 11 0.22[3.06,3.56) 12 0.24[3.56,4.06) 16 0.32[4.06,4.56) 3 0.06[4.56,5.06) 3 0.06[5.06,5.56) 1 0.02合计 50 1.00(2)根据(1)的频率分布表可以画出频率分布直方图如图所示:频率折线图如图:【变式 1-3】(2024 高一下·全国·专题练习)如表所示给出了在某校 500 名 12 岁男孩中,用随机抽样得出的 120 人的身高(单位:cm).区间[122,126) [126,130) [130,134) [134,138) [138,142) [142,146) [146,150) [150,154) [154,158]界限人5 8 10 22 33 20 11 6 5数(1)列出样本频率分布表;(2)画出频率分布直方图;(3)估计身高小于 134 cm 的人数占总人数的百分比.【解题思路】(1)借助所给表格计算即可得;(2)借助频率分布直方图的定义及所给表格即可得;(3)计算出相应频率之和即可得.【解答过程】(1)样本频率分布表如下:分组 频数 频率[122,126) 5 0.04[126,130) 8 0.07[130,134) 10 0.08[134,138) 22 0.18[138,142) 33 0.28[142,146) 20 0.17[146,150) 11 0.09[150,154) 6 0.05[154,158] 5 0.04合计 120 1.00(2)其频率分布直方图如下:(3)0.04 + 0.07 + 0.08 = 0.19,故可估计身高小于 134 cm 的人数占总人数的19%.【题型 2 根据统计图解决实际问题】【例 2】(2024·陕西西安·模拟预测)2017 年至 2022 年某省年生产总量及其增长速度如图所示,则下列结论错误的是( )A.2017 年至 2022 年该省年生产总量逐年增加B.2017 年至 2022 年该省年生产总量的极差为 14842.3 亿元C.2017 年至 2022 年该省年生产总量的增长速度逐年降低D.2017 年至 2022 年该省年生产总量的增长速度的中位数为 7.6%【解题思路】根据给定的条形图和折线图,逐项分析判断即得.【解答过程】对于 A,观察条形图知,2017 年至 2022 年该省年生产总量逐年增加,A 正确;对于 B,2017 年至 2022 年该省年生产总量的极差为48670.4 33828.1 = 14842.3(亿元),B 正确;对于 C,2017 年至 2020 年该省年生产总量的增长速度逐年降低,而 2021 年该省年生产总量的增长速度比 2020 年该省年生产总量的增长速度高,C 错误;对于 D,2017 年至 2020 年该省年生产总量的增长速度由小到大排列为:3.8%,4.5%,7.6%,7.6%,7.8%,8.0%,7.6%+7.6%因此增长速度的中位数为 2 = 7.6%,D 正确.故选:C.【变式 2-1】(2024 高二下·浙江绍兴·学业考试)下图为某同学两次月考成绩占总成绩百分数的扇形统计图,已知该同学第一次月考总分低于第二次月考总分,则( )A.该同学数学学科成绩一定下降 B.该同学政治学科成绩一定下降C.该同学化学学科成绩可能下降 D.该同学语文学科成绩一定提升【解题思路】根据扇形统计图一一分析即可.【解答过程】对于 A:第一次月考数学成绩占16%,第二次月考数学成绩占17%,且第一次月考总分低于第二次月考总分,所以第二次月考数学成绩比第一次数学成绩要高,故 A 错误;对于 B:第一次月考政治成绩占17%,第二次月考政治成绩占16%,由于只知道第一次月考总分低于第二次月考总分,故无法判断这两次月考政治学科成绩的变化,故 B 错误;对于 C:第一次月考化学成绩占16%,第二次月考化学成绩占17%,且第一次月考总分低于第二次月考总分,所以第二次月考化学成绩比第一次化学成绩要高,故 C 错误;对于 D:第一次月考语文成绩占16%,第二次月考语文成绩占18%,且第一次月考总分低于第二次月考总分,所以第二次月考语文成绩比第一次语文成绩要高,故 D 正确.故选:D.【变式 2-2】(23-24 高一下·陕西·期末)如图是 2020 年 2 月 15 日至 3 月 2 日武汉市新冠肺炎新增确诊病例的折线统计图.则下列说法不正确的是( )A.武汉市新冠肺炎疫情防控取得了阶段性的成果,但防控要求不能降低B.2020 年 2 月 19 日武汉市新增新冠肺炎确诊病例比前日降低了 1045 人C.2020 年 2 月 15 日到 3 月 2 日武汉市新冠肺炎新增确诊病例最多的一天是最少的一天 16 倍多D.2020 年 2 月 19 日至 3 月 2 日武汉市新增新冠肺炎确诊病例低于 500 人的有 10 天【解题思路】直接利用折线图以及统计的相关知识逐一分析即可【解答过程】对于 A, 19 日后新增确诊病例人数与之前的各天新增确诊病例人数相比较呈大幅下降趋势,故防控取得了阶段性的成果,但新增人数还较多,故防控要求不能降低,故 A 正确;对于 B,由图可知 18 日新增确诊病例人数 1660 人,19 日新增确诊病例人数 615 人,故 2020 年 2 月 19 日武汉市新增新冠肺炎确诊病例比前日降低了 1045 人,故 B 正确;对于 C,由图新增确诊病例最多一天的人数为 1690,新增确诊病例最少一天的人数 111 人,故 2020 年 2 月 15 日到 3 月 2 日武汉市新冠肺炎新增确诊病例最多的一天人数与最少的一天的人数的比值1690为 111 < 16,C 错误,对于 D,由图得到,病例低于 500 人的有 2 月 20 日、21 日、23 日、24 日、25 日、26 日、27 日、28 日、3月 1 日、2 日,共 10 天,故 D 正确;故选:C.【变式 2-3】(23-24 高一下·湖南·阶段练习)如图为近一年我国商品零售总额和餐饮收入总额同比增速情况折线图,根据该图,下列结论正确的是( )(注:同比,指当前的数据与上一年同期进行比对;环比,指当前数据与上个月的数据进行比对.)A.2024 年1 2月份,商品零售总额同比增长9.2%B.2023 年3 12月份,餐饮收入总额同比都降低C.2023 年6 10月份,商品零售总额同比都增加D.2023 年 12 月,餐饮收入总额环比增速为 14.1%【解题思路】根据折线统计图一一分析即可.【解答过程】对于 A,2024 年1 2月份,商品零售总额同比增长2.9%,故 A 错误;对于 B,2023 年 8 月份,餐饮收入总额同比增加,故 B 错误;对于 C,2023 年6 10月份,商品零售总额同比都增加,故 C 正确;对于 D,2023 年 12 月,餐饮收入总额环比增速并未告知,故 D 错误.故选:C.【题型 3 频率分布直方图的相关计算问题】【例 3】(23-24 高一下·湖南邵阳·期末)某校高一年级有 800 名学生选学物理,将某次联考的物理成绩绘制成的频率分布直方图如图所示,则高一年级这次联考的物理成绩位于区间[60,80)的人数约为( )A.200 B.220 C.240 D.260【解题思路】根据频率和为1可构造方程求得 的值,再由频率分布直方图可求得成绩落在[60,80)的频率,由样本估计总体可计算得到结果.【解答过程】(0.01 + 0.02 + + 0.005) × 20 = 1 = 0.015,成绩落在[60,80)的频率为0.015 × 20 = 0.3,则成绩位于区间[60,80)的人数约为800 × 0.3 = 240(人).故选:C.【变式 3-1】(23-24 高一下·广东广州·阶段练习)要调查某地区高中学生身体素质,从高中生中抽取 100 人进行跳远测试,根据测试成绩制作频率分布直方图如下图,现再从这 100 人中用分层抽样的方法抽取 20 人,应从[120,130)间抽取人数为 b,则 b 为( )A.4 B.5 C.6 D.7【解题思路】先由频率之和为1解得 值,计算可得[120,130)之间的学生人数,根据抽样比可求得 .【解答过程】由题得10 × (0.005 + 0.035 + + 0.020 + 0.010) = 1,所以 = 0.030.在[120,130)之间的学生:100 × 10 × 0.030 = 30人,现再从这100人中用分层抽样的方法抽取20人,应从[120,130) 20间抽取人数为100 × 30 = 6,故 = 6.故选:C.【变式 3-2】(23-24 高一下·北京朝阳·期末)李华统计了他爸爸 2024 年 5 月的手机通话明细清单,发现他爸爸该月共通话 60 次,他按每次通话时间长短进行分组(每组为左闭右开的区间),画出了如图所示的频率分布直方图.则每次通话时长不低于 5 分钟且小于 15 分钟的次数为( )A.18 B.21 C.24 D.27【解题思路】根据给定的频率分布直方图,求出每次通话时长不低于 5 分钟且小于 15 分钟的频率即可得解.【解答过程】观察频率分布直方图,得每次通话时长不低于 5 分钟且小于 15 分钟的频率为:1 5(0.06 + 0.03 + 0.02 + 0.02) = 0.35,则60 × 0.35 = 21,所以每次通话时长不低于 5 分钟且小于 15 分钟的次数为 21.故选:B.【变式 3-3】(2025 高三上·河南·专题练习)为了调查某工厂生产的一批口罩的质量情况,随机抽取了一批口罩,所得数据如下图所示,为了进一步了解情况,研究人员在被抽取的口罩中按照质量的指标值再次进行分层抽样,共抽取 个,若质量的指标值在[110,120)中的抽取80个,则下列说法正确的是( )A.质量的指标值在[140,150)中的抽取5个B.质量的指标值在[130,140)中的抽取60个C.质量的指标值在[120,130)中的抽取40个D. = 200【解题思路】计算出质量的指标值在[110,120)内的频率,由频率、频数以及总容量三者之间的关系额可求得 的值,可判断 D 选项;然后将 的值乘以对应组的频率,可判断 ABC 选项.【解答过程】质量的指标值在[110,120)内的频率为0.04 × 10 = 0.4,所以, =800.4 = 200,所以,质量的指标值在[140,150)中的抽取的数量为200 × 0.005 × 10 = 10个,质量的指标值在[130,140)中的抽取的数量为200 × 0.02 × 10 = 40个,质量的指标值在[120,130)的抽取的数量为200 × 0.03 × 10 = 60个,ABC 错,D 对.故选:D.【题型 4 统计图的综合应用问题】【例 4】(23-24 高一下·四川内江·期末)某调查机构对全国互联网行业进行调查统计,得到整个互联网行业从业者年龄的分布饼状图 90 后从事互联网行业者的岗位分布条形图,则下列结论中不一定正确的是( )A.互联网行业从事技术岗位的人数中,90 后比 80 后多B.90 后互联网行业者中从事技术岗位的人数超过整个从事互联网行业者总人数的20%C.互联网行业中从事运营岗位的人数 90 后比 80 前多D.互联网行业从业人员中 90 后占一半以上【解题思路】利用整个互联网行业从业者年龄分布饼状图、90 后从事互联网行业岗位分布条形图即可判断各选项的真假.【解答过程】选项 A;设整个互联网行业总人数为 a,互联网行业中从事技术岗位的 90 后人数为56% × 39.6% = 22.176% ,小于 80 后的人数38% ,但 80 后中从事技术岗位的人数比例未知,故 A 错误.选项 B:设整个互联网行业总人数为 a,90 后从事技术岗位人数为 56%×39.6%a,而 90 后总人数的 20%为56% × 39.6% ,故 B 正确;选项 C:设整个互联网行业总人数为 a,互联网行业中从事运营岗位的 90 后人数为56% × 17% = 9.52% ,超过 80 前的人数 6%a,且 80 前中从事运营岗位的人数比例未知,故 C 正确;选项 D: 由整个互联网行业从业者年龄分布饼状图得到互联网行业从业人员中 90 后占56%,故 D 正确.故选:A.【变式 4-1】(2024·河南·二模)某银行为客户定制了 A,B,C,D,E 共 5 个理财产品,并对 5 个理财产品的持有客户进行抽样调查,得出如下的统计图:用该样本估计总体,以下四个说法错误的是( )A.44~56 周岁人群理财人数最多B.18~30 周岁人群理财总费用最少C.B 理财产品更受理财人青睐D.年龄越大的年龄段的人均理财费用越高【解题思路】A.由扇形图判断;B.设总人数为 a,按照扇形图得到各段人数,再由折线图求解判断;C.利用条形图判断;D.利用折线图判断.【解答过程】A.44~56 周岁人群理财人数所占比例是 37%,是最多的,故正确;B.设总人数为 a,则 18~30 周岁人群的人均理财费用约为0.28 × 3500 = 980 ,31~43 周岁人群的人均理财费用约为0.3 × 4500 = 1350 ,44~56 周岁人群的人均理财费用约为0.37 × 5500 = 2035 ,57 周岁人群的人均理财费用约为0.05 × 6200 = 310 ,所以 57 周岁及以上人群的人均理财费用最少,故错误;C.由条形图可知:B 理财产品更受理财人青睐,故正确;D.由折线图知:年龄越大的年龄段的人均理财费用越高,故正确,故选:B.【变式 4-2】(24-25 高一上·全国·课后作业)以下是某手机店根据某手机销售的相关数据绘制的统计图的一部分.请根据图 1、图 2 解答下列问题:(1)来自该店财务部的数据报告表明,该手机店 1~4 月的手机销售总额一共是 290 万元,请将图 1 中的统计图补充完整;(2)该店 1 月份音乐手机的销售额为多少万元 (3)小刚观察图 2 后,认为 4 月份音乐手机的销售额比 3 月份减少了,你同意他的看法吗 请说明理由.【解题思路】(1)用 290 减去 1 月,2 月和 4 月的销售额可得 3 月份的销售额,从而可将图 1 中的统计图补充完整,(2)用 1 月份的销售额乘以 1 月份音乐手机所占的百分比可得结果,(3)根据两个分别计算 3 月份和 4 月份音乐手机的销售额,然后比较可得结论.【解答过程】(1)290 (85 + 80 + 65) = 60(万元),补图如下图.(2)85 × 23% = 19.55(万元),所以该店 1 月份音乐手机的销售额为19.55万元.(3)不同意.理由如下:3 月份音乐手机的销售额是60 × 18% = 10.8(万元),4 月份音乐手机的销售额是65 × 17% = 11.05(万元),而10.8 < 11.05,因此 4 月份音乐手机的销售额比 3 月份的销售额增多了.【变式 4-3】(2025 高一·全国·专题练习)某市为了增强学生体质,全面实施“学生饮用奶”营养工程.某品牌牛奶供应商提供了原味、草莓味、菠萝味、香橙味、核桃味五种口味的牛奶供学生饮用.某中学为了了解学生对不同口味牛奶的喜好,对全校订购牛奶的学生进行了随机调查(每盒各种口味牛奶的体积相同),绘制了如下两张不完整的统计图:(1)本次被调查的学生有多少名?(2)补全上面的条形统计图①,并计算出喜好菠萝味牛奶的学生人数在扇形统计图②中所占圆心角的度数;(3)该校共有 1200 名学生订购了该品牌的牛奶,牛奶供应商每天只为每名订购牛奶的学生配送一盒牛奶.要使学生每天都喝到自己喜好的口味的牛奶,牛奶供应商每天送往该校的牛奶中,草莓味要比原味的多多少盒?【解题思路】(1)根据题意,由核桃味的人数以及其占比,即可得到样本容量;(2)根据题意,直接补全条形图,再由喜好菠萝味牛奶的学生人数占比,即可得到其所占圆心角的度数;(3)根据题意,代入公式计算即可得到结果.【解答过程】(1)根据喜好核桃味的学生数,得本次被调查的学生数(样本容量)为10 ÷ 50 0 = 200.(2)喜好香橙味牛奶的学生数是200 38 62 50 10 = 40补全条形图如图所示,喜好菠萝味牛奶的学生人数为 50,50在扇形统计图中所占圆心角的度数为200 × 360° = 90°1200(3)草莓味要比原味多 200 × (62 38) = 144 (盒).【知识点 2 总体百分位数、集中趋势与离散程度的估计】1.总体百分位数的估计(1)概念一般地,一组数据的第 p 百分位数是这样一个值,它使得这组数据中至少有 p%的数据小于或等于这个值,且至少有(100-p)%的数据大于或等于这个值.(2)求解步骤可以通过下面的步骤计算一组 n 个数据的第 p 百分位数:第 1 步,按从小到大排列原始数据.第 2 步,计算 i=n×p%.第 3 步,若 i 不是整数,而大于 i 的比邻整数为 j,则第 p 百分位数为第 j 项数据;若 i 是整数,则第 p百分位数为第 i 项与第(i+1)项数据的平均数.2.总体集中趋势的估计在初中的学习中我们已经了解到,平均数、中位数和众数等都是刻画“中心位置”的量,它们从不同角度刻画了一组数据的集中趋势.具体概念回顾如下:名称 概念平如果有 n 个数 x1,x2,…,xn,那么 就是这组数据均数 的平均数,用 表示,即 .中 将一组数据按从小到大或从大到小的顺序排列,处在最中间的一个数据位 (当数据个数是奇数时)或最中间两个数据的平均数(当数据个数是偶数 数时)称为这组数据的中位数.众 一组数据中出现次数最多的数据(即频数最大值所对应的样本数据)称数 为这组数据的众数.3.总体离散程度的估计(1)方差和标准差假设一组数据是 , , , ,用 表示这组数据的平均数,则我们称 为这组数据的方差.有时为了计算方差的方便,我们还把方差写成 的形式.我们对方差开平方,取它的算数平方根 ,称为这组数据的标准差.(2)总体(样本)方差和总体标准差①一般式:如果总体中所有个体的变量值分别为 ,总体平均数为 ,则总体方差.②加权式:如果总体的 N 个变量值中,不同的值共有 k(k≤N)个,不妨记为 ,其中出现的频数为 ,则总体方差为 .总体标准差:S= .(3)标准差与方差的统计意义①标准差刻画了数据的离散程度或波动幅度,标准差越大,数据的离散程度越大;标准差越小,数据的离散程度越小.②在刻画数据的分散程度上,方差与标准差是一样的,但在解决实际问题时,一般多采用标准差.③标准差(方差)的取值范围为[0,+∞).若样本数据都相等,表明数据没有波动幅度,数据没有离散性,则标准差为 0.反之,标准差为 0 的样本,其中的数据都相等.4.频率分布直方图中的统计参数(1)频率分布直方图中的“众数”根据众数的意义可知,在频率分布直方图中最高矩形中的某个(些)点的横坐标为这组数据的众数.一般用中点近似代替.(2)频率分布直方图中的“中位数”根据中位数的意义,在样本中,有 50%的个体小于或等于中位数,也有 50%的个体大于或等于中位数.因此,在频率分布直方图中,中位数左边和右边的直方图的面积应该相等,由此可估计中位数的值.(3)频率分布直方图中的“平均数”平均数是频率分布直方图的“重心”.因为平均数可以表示为数据与它的频率的乘积之和,所以在频率分布直方图中,样本平均数可以用每个小矩形底边中点的横坐标与小矩形的面积的乘积之和近似代替.【题型 5 百分位数的求解】【例 5】(23-24 高一下·贵州黔西·期末)兴义市峰林布依景区在春节期间,迎来众多游客,其中某天接受了一个小型的旅行团,他们的年龄(单位:岁)如下:6,6,7,8,10,37,39,45,46,52,53,61,则这组数据的第 75 百分位数是( )A.34.5 B.46 C.49 D.52【解题思路】根据题意结合百分位数的定义运算求解.46+52【解答过程】因为12 × 75% = 9,所以这组数据的第 75 百分位数是第 9 位数和第 10 位数的中位数 2= 49.故选:C.【变式 5-1】(23-24 高一下·广东广州·期末)有一组数据按从小到大排序如下:70,71,73,75,76,则这组数据的 40%分位数,70%分位数分别是( )A.71,74 B.71,75 C.72,74 D.72,75【解题思路】按步骤求解百分位数即可.【解答过程】数据从小到大排序:70,71,73,75,76,∵ 5 × 40% = 2 ∴ 40% 71+73是整数, 这组数据的 分位数是 2 = 72;∵ 5 × 70% = 3.5不是整数, ∴ 这组数据的 70%分位数是75.故选:D.【变式 5-2】(23-24 高一下·江苏苏州·期末)某科研单位对 ChatGPT 的使用情况进行满意度调查,在一批用户的有效问卷(用户打分在 50 分到 100 分之间的问卷)中随机抽取了 100 份,按分数进行分组(每组为左闭右开的区间),得到如图所示的频率分布直方图,估计这批用户问卷的得分的第75百分位数为( )A.78.5 B.82.5 C.85 D.87.5【解题思路】根据百分位数计算规则计算可得.【解答过程】因为(0.01 + 0.025 + 0.035) × 10 = 0.7 < 0.75,(0.01 + 0.025 + 0.035 + 0.02) × 10 = 0.9 > 0.75,所以第75百分位数位于[80,90),设为 ,则(0.01 + 0.025 + 0.035) × 10 + 0.02( 80) = 0.75,解得 = 82.5.故选:B.【变式 5-3】(23-24 高一下·天津南开·期末)一组数据:53,57,45,61,79,49,x,若这组数据的第 80百分位数与第 60 百分位数的差为 3,则 = ( )A.58 或 64 B.58 C.59 或 64 D.59【解题思路】先对数据从小到大排序,分 ≤ 57, ≥ 79,57 < < 79三种情况,舍去不合要求的情况,列出方程,求出答案,【解答过程】将已知的 6 个数从小到大排序为 45,49,53,57,61,79.若 ≤ 57,则这组数据的第 80 百分位数与第 60 百分位数分别为 61 和 57,他们的差为 4,不符合条件;若 ≥ 79,则这组数据的第 80 百分位数与第 60 百分位数分别为 79 和 61,它们的差为 18,不符合条件;若57 < < 79,则这组数据的第 80 百分位数与第 60 百分位数分别为 x 和 61(或 61 和 x),则| 61| = 3,解得 = 58或 = 64故选:A.【题型 6 众数、中位数、平均数的计算与求参】【例 6】(2024·浙江绍兴·三模)已知实数1 < 2 < < ,若 = 36,且这四个数的中位数是 3,则这四个数的平均数是( )A 5.2 B.3 C7.2 D.4【解题思路】借助中位数与平均数定义结合题目所给条件计算即可得.2+ = 3 = 4【解答过程】由题意可得 2 ,即 , = 36 = 9 = 1+2+4+9则 4 = 4.故选:D.【变式 6-1】(24-25 高一上·四川南充·开学考试)“杂交水稻之父”袁隆平培育的超级杂交稻在全世界推广种植.某种植户为了考察所种植的杂交水稻苗的长势,从稻田中随机抽取 7 株水稻苗,测得苗高(单位:cm)分别是 23,24,23,25,26,23,25.则这组数据的众数和中位数分别是( )A.24,25 B.23,23C.23,24 D.24,24【解题思路】把给定数据由小到大排列,再求出众数、中位数即得.【解答过程】苗高由小到大排列为:23,23,23,24,25,25,26,所以这组数据的众数和中位数分别是 23,24.故选:C.【变式 6-2】(2024·江苏南通·三模)某同学测得连续 7 天的最低气温分别为1,2,2, ,6,2,8(单位:℃),若这组数据的平均数是中位数的 2 倍,则 = ( )A.2 B.3 C.6 D.721+ 【解题思路】根据题意分析可知:平均数为 7 ,中位数为 2,列式求解即可.1+2+2+ +6+2+8 21+ 【解答过程】由题意可知:这组数据的平均数为 7 = 7 ,除 外,将数据按升序排列可得1,2,2,2,6,8,结合 21+ 的任意性可知中位数为 2,则 7 = 2 × 2,解得 = 7.故选:D.【变式 6-3】(23-24 高一下·云南曲靖·期末)已知一组数据丢失了其中一个大于 3 的数据,剩下的六个数据分别是 3,3,5,3,6,11,若这组数据的平均数与众数的和是中位数的 2 倍,则丢失的数据可能是( )A.5 B.12 C.18 D.20【解题思路】设丢失的数据为 ,即可求出平均数与众数,再对 分3 < < 5和 ≥ 5两种情况讨论,得到中位数,即可得到方程,解得即可;31+ 【解答过程】设丢失的数据为 ,则这七个数据的平均数为 7 ,众数是 3,若3 < < 5 31+ ,则中位数为 ,此时 7 +3 = 2 ,解得 = 4;31+ 若 ≥ 5,则中位数为 5,此时 7 +3 = 2 × 5,解得 = 18.综上所述,丢失的数据可能是 4,18.故选:C.【题型 7 众数、中位数、平均数的实际应用】【例 7】(23-24 高一下·河北邯郸·期末)在一次数学智力测验中,将 100 名参赛者的成绩进行分组整理后得到如下频率分布直方图(每组为左闭右开的区间),根据此频率分布直方图,下列结论正确的是( )A.这 100 名学生中成绩在[80,90)内的频率为 0.012B.这 100 名学生中成绩在[70,90)内的人数为 14C.这 100 名学生的平均成绩为 68.2(同一组中的数据用该组区间的中点值代表)D.这 100 名学生成绩的中位数为 75【解题思路】由概率之和为 1 可判断 A;结合频率与频数的关系可判断 B;结合平均数的公式可判断 C;由中位数的公式可判断 D.【解答过程】由频率分布直方图可得(0.008 + + 0.020 + 0.032 + 0.020 + 0.008) × 10 = 1,解得 = 0.012,所以成绩在[80,90)内的频率为0.012 × 10 = 0.12,故 A 不正确;这 100 名学生中成绩在[70,90)内的频率为(0.020 + 0.012) × 10 = 0.32,所以成绩在[70,90)内的人数为 32,故 B 不正确;根据频率分布直方图平均数的计算公式可得 = 45 × 0.08 + 55 × 0.2 + 65 × 0.32 + 75 × 0.2 + 85 × 0.12 + 95 × 0.08 = 68.2,故 C 正确;根据频率分布直方图可得,中位数在[60,70)之间,故 D 不正确.故选:C.【变式 7-1】(2024·黑龙江哈尔滨·三模)如图所示,下列频率分布直方图显示了三种不同的形态.图(1)形成对称形态,图(2)形成“右拖尾”形态,图(3)形成“左拖尾”形态,根据所给图作出以下判断,正确的是( )A.图(1)的平均数=中位数>众数 B.图(2)的众数<中位数<平均数C.图(2)的平均数<众数<中位数 D.图(3)的中位数<平均数<众数【解题思路】根据平均数,中位数,众数的概念结合图形分析判断.【解答过程】图(1)的分布直方图是对称的,所以平均数=中位数=众数,故 A 错误;图(2)频率直方图可得,单峰不对称且“右拖尾”,最高峰偏左,众数最小,平均数易受极端值的影响,与中位数相比,平均数总是在“拖尾”那边,平均数大于中位数,故 B 正确,C错误;同理图(3)“左拖尾”,众数最大,平均数小于中位数,故 D 错误.故选:B.【变式 7-2】(2024·陕西西安·二模)某教育机构为调查中小学生每日完成作业的时间,收集了某位学生 100天每天完成作业的时间,并绘制了如图所示的频率分布直方图(每个区间均为左闭右开),根据此直方图得出了下列结论,其中正确的是( )A.估计该学生每日完成作业的时间在 2 小时至 2.5 小时的有 50 天B.估计该学生每日完成作业时间超过 3 小时的概率为 0.3C.估计该学生每日完成作业时间的平均数为 2.75 小时D.估计该学生每日完成作业时间的中位数与平均数相等【解题思路】直接根据直方图来计算判断每一个选项.【解答过程】对于 A:估计该学生每日完成作业的时间在 2 小时至 2.5 小时的有100 × 0.5 × 0.5 = 25天,A错误;对于 B:估计该学生每日完成作业时间超过 3 小时的概率为(0.3 + 0.2 + 0.1 + 0.1) × 0.5 = 0.35,B 错误;对于 C:(1.25 × 0.1 + 1.75 × 0.3 + 2.25 × 0.5 + 2.75 × 0.4 + 3.25 × 0.3 + 3.75 × 0.2 + 4.25 × 0.1 + 4.75 × 0.1) × 0.5= 2.75,C 正确;对于 D:估计该学生每日完成作业时间的中位数为 ,则(0.1 + 0.3 + 0.5) × 0.5 + 0.4 × ( 2.5) = 0.5,解得 = 2.625,D 错误.故选:C.【变式 7-3】(2024·全国·模拟预测)如图为 2014—2022 年中国游戏用户规模(单位:百万人)及同比增长率、2010—2022 年中国国产游戏获批版号数量(单位:个)的统计图,则下列结论正确的是( )A.2014—2022 年中国游戏用户规模逐年增长B.2014—2022 年中国游戏用户规模的同比增长率的中位数为3.1%C.2010—2022 年中国国产游戏获批版号数量的极差为 223 个D.2010—2022 年中国国产游戏获批版号数量的平均数超过 1600 个【解题思路】根据条形统计图、折线统计图逐项分析样本的数字特征即可判断.【解答过程】A 选项:2022 年中国游戏用户规模比 2021 年少,A 错误;B 选项:2014—2022 年中国游戏用户规模的同比增长率从小到大依次为 0.3%,0.2%,2.5%,3.1%,3.2%,3.7%,4.6%,5.9%,7.3%,中位数为3.2%,B 错误;C 选项:2010—2022 年中国国产游戏获批版号数量的极差为9177 245 = 8932(个),C 错误;D 选项:200 + 2 × 400 + 2 × 500 + 3 × 600 + 2 × 1300 + 2000 + 4000 + 9100= 21500 > 13 × 1600 = 20800,D 正确.故选:D.【题型 8 方差、标准差的求解及应用】【例 8】(23-24 高一下·宁夏·期末)已知某 4 个数据的平均数为 6,方差为 3,现又加入一个数据 6,此时这 5 个数据的方差为( )A 24 16 14 12. 5 B. 5 C. 5 D. 5【解题思路】根据方差的定义运算化简即可得解.【解答过程】因为4个数据的平均数为6,方差为3,1 4所以4 ( 6)2 = 3(其中四个数分别为 , = 1,2,3,4) =14故 ( 2 6) = 12, =1加入一个数据6后,5个数的平均数还是6,1 4 12+0 12则方差为5 ( 6)2 + (6 6)2 = 5 = 5 , =15 12即这 个数据的方差为 5 .故选:D.【变式 8-1】(24-25 高一·全国·单元测试)某班统计一次数学测验成绩的平均分与方差,计算完毕才发现有个同学的分数还未录入,只好重算一次.已知原平均分和原方差分别为 , 2,新平均分和新方差分别为 1, 21,若此同学的得分恰好为 ,则( )A. = 1, 2 = 21 B. = 21, < 21C. = , 2 > 2 D. < , 2 = 21 1 1 1【解题思路】利用平均数和方差的公式即可求解.【解答过程】设这个班有 n 个同学,分数分别是 1, 2, 3,…, ,第 i 个同学的成绩 = 没录入,第一次计算时,总分是( 1) ,1方差 2 = 1[( 1 )2 + ( 2 )2 + + ( 2 2 1 ) + ( +1 ) + + ( )2];( 1) + 第二次计算时, 1 = = ,方差 21 =1 [( 1 )2 + ( )22 + + ( 1 )2 + ( 2 2 ) + ( +1 ) + + ( 2 1 2 ) ] = ,故 2 > 21.故选:C.【变式 8-2】(24-25 高二上·吉林·开学考试)有两位射击运动员在一次射击测试中各射靶 10 次,每次命中的环数如下:甲:7 8 7 9 5 4 9 10 7 4乙:9 5 7 8 7 6 8 6 7 7设甲、乙两名运动员射击平均环数分别记为 和 ,方差分别记为 2 21和 2.(1)求 , , 21, 22;(2)如果你是教练,你如何对这次射击情况作出评价?如果这是一次选拔性考核,你应当如何作出选择?【解题思路】(1)根据平均数和方差公式计算即可;(2)由(1)的结论,平均数一样,则通过方差判断其稳定性即可得结果.【解答过程】(1 = 7+8+7+9+5+4+9+10+7+4) 10 = 7, = 9+5+7+8+7+6+8+6+7+710 = 7, 21 2 21 = 10 [(7 7) + (8 7) + (7 7)2 + (9 7)2 + (5 7)2 + (4 7)2 + (9 7)2 + (10 7)2 + (7 7)2+ (4 7)2]= 4, 212 = 10 [(9 7)2 + (5 7)2 + (7 7)2 + (8 7)2 + (7 7)2 + (6 7)2 + (8 7)2 + (6 7)2 + (7 7)2 + (7 7)2]= 1.2.(2)由(1)知,甲乙射击的平均成绩一样,但乙比甲射击的成绩更稳定,所以选择乙.【变式 8-3】(23-24 高一下·江苏苏州·期末)2023 年 10 月 22 日,汉江生态城 2023 襄阳马拉松在湖北省襄阳市成功举行,志愿者的服务工作是马拉松成功举办的重要保障,襄阳市新时代文明实践中心承办了志愿者选拔的面试工作.现随机抽取了 100 名候选者的面试成绩,并分成五组:第一组[45,55),第二组[55,65),第三组[65,75),第四组[75,85),第五组[85,95],绘制成如图所示的频率分布直方图.已知第一、二组的频率之和为 0.3,第一组和第五组的频率相同.(1)估计这 100 名候选者面试成绩的平均数和第 25 百分位数;(2)在这 100 名候选者用分层随机抽样的方法从第四组和第五组面试者内抽取 10 人,再从这 10 名面试者中随机抽取两名,求两名面试者成绩都在第五组的概率.(3)现从以上各组中用分层随机抽样的方法选取 20 人,担任本市的宣传者.若本市宣传者中第二组面试者的面试成绩的平均数和方差分别为 62 和 40,第四组面试者的面试成绩的平均数和方差分别为 80 和 70,据此估计这次第二组和第四组所有面试者的面试成绩的方差.【解题思路】(1)首先算出 , ,然后根据平均数、百分位数的计算公式计算即可;(2)由列举法求解古典概型概率即可;(3)由分层抽样方差公式计算即可.1 10 + 10 = 0.3 = 0.005【解答过程】( )由题意可知: 10(0.045 + 0.020 + ) = 0.7 ,解得 = 0.025 ,可知每组的频率依次为:0.05,0.25,0.45,0.2,0.05,所以平均数为50 × 0.05 + 60 × 0.25 + 70 × 0.45 + 80 × 0.2 + 90 × 0.05 = 69.5,因为0.05 + 0.25 = 0.3 > 0.25,设第 25 百分位数为 ,则 ∈ [55,65),则0.05 + ( 55) × 0.025 = 0.25,解得 = 63,故第 25 百分位数为63.(2)10 人中,第四组为 8 人.第五组为 2 人,记第四组的人的编号为 1 到 8,第五组的人的编号为 9 和 10,则样本空间Ω = {(1,2),(1,3),(1,4), (1,10),(2,3),(2,4), (2,10),(3,4),(3,5), (3,10), (4,5),(4,6), (4,10),(5,6), (5,10),(6,7), (6,10),(7,8),(7,9),(7,10),(8,9),(8,10),(9,10)}共 45 个样本点,记两名面试者成绩都在第五组为事件 A, 则事件 = {(9,10)},故 ( ) =145;(3)设第二组、第四组面试者的面试成绩的平均数与方差分别为 1, 2, 2 21, 2,0.25 5 5×62+4×80且两组频率之比为0.20 = 4,则第二组和第四组所有面试者的面试成绩的平均数 = 9 = 70,第二组和第四组所有面试者的面试成绩的方差 2 = 5 2 4 5 4 4009 1 + ( )21 + 29 2 + ( 2 )2 = 9 40 + (62 70)2 + 9 70 + (80 70)2 = 3 .400故估计第二组和第四组所有面试者的面试成绩的方差是 3 .【题型 9 频率分布直方图中集中趋势参数的计算】【例 9】(23-24 高一下·辽宁朝阳·开学考试)对某校高三年级学生参加社区服务的次数进行统计,随机抽取 M 名学生,得到这 M 名学生参加社区服务的次数,根据此数据作出如下频率分布表和频率分布直方图.分组 频数 频率[10,15) 10 0.20[15,20) 24 n[20,25) m p[25,30] 2 0.04合计 M 1(1)求出表中 M,p 及图中 a 的值;(2)若该校有高三学生 300 人,试估计该校高三学生参加社区服务的次数在区间[15,20)内的人数;(3)估计该校高三学生参加社区服务次数的众数、中位数及平均数.(保留一位小数)【解题思路】(1)借助频数、频率与总数之间的关系计算即可得;(2)以所得频率估计概率计算即可得;(3)借助众数、中位数及平均数的定义计算即可得.10【解答过程】(1)由分组[10,15)对应的频数是 10,频率是 0.20,知 = 0.20,所以 = 50, 14 24所以10 + 24 + + 2 = 50,解得 = 14,所以 = = 50 = 0.28, = 50×5 = 0.096;2 24( )估计该校高三学生参加社区服务的次数在区间[15,20)内的人数为50 × 300 = 144;3 15+20( )估计该校高三学生参加社区服务次数的众数是 2 = 17.5. = 24因为 50 = 0.48,所以估计该校高三学生参加社区服务次数的中位数 x 满足:0.2 + ( 15) × 0.485 = 0.5,解得 = 18.125,所以该校高三学生参加社区服务次数的中位数约为 18.1,由12.5 × 0.20 + 17.5 × 0.48 + 22.5 × 0.28 + 27.5 × 0.04 = 18.3,所以估计该校高三学生参加社区服务次数的平均数是 18.3.【变式 9-1】(23-24 高一上·内蒙古呼和浩特·期末)2023 年秋末冬初,呼和浩特市发生了流感疾病. 为了彻底击败病毒,人们更加讲究卫生讲究环保. 某学校开展组织学生参加线上环保知识竞赛活动,现从中抽取200 名学生,记录他们的首轮竞赛成绩并作出如图所示的频率直方图,根据图形,请回答下列问题:(1)若从成绩低于 60 分的同学中按分层抽样方法抽取 5 人成绩,求 5 人中成绩低于 50 分的人数;(2)以样本估计总体,利用组中值估计该校学生首轮竞赛成绩的平均数;(3)首轮竞赛成绩位列前10%的学生入围第二轮的复赛,请根据图中信息,估计入围复赛的成绩(记为 ).【解题思路】(1)利用分层抽样的定义求解即可;(2)利用平均数公式求解即可;(3)根据题意设入围复赛的成绩的临界值为 ∈ [80,90),则(90 ) × 0.025 + 0.05 = 0.1,求出 的值即可.【解答过程】(1)成绩在[40,50)的人数为0.01 × 10 × 200 = 20(人),成绩在[50,60)的人数为0.015 × 10 × 200 = 30(人),则按分层抽样方法从成绩低于 60 分的同学中抽取 5 人,成绩低于 50 20分的人数为5 × 20+30 = 2(人).故 5 人中成绩低于 50 分的人数为 2 人;(2)由(0.01 + 0.015 + 0.015 + + 0.025 + 0.005) × 10 = 1,得 = 0.030,则平均数 = 45 × 0.1 + 55 × 0.15 + 65 × 0.15 + 75 × 0.3 + 85 × 0.25 + 95 × 0.05 = 71,故该校学生首轮竞赛成绩的平均数约为71分;(3)根据频率分布直方图可知:[90,100]的频率为0.005 × 10 = 0.05,[80,90)的频率为0.025 × 10 = 0.25,所以入围复赛的成绩一定在[80,90),可知入围复赛的成绩的临界值为 ∈ [80,90),则(90 ) × 0.025 + 0.05 = 0.1,解得 = 88,故估计入围复赛的成绩为 ≥ 88分.【变式 9-2】(23-24 高一下·湖南长沙·期末) (身体质量指数)是目前国际上常用的衡量人体胖瘦程度体重(单位:kg)以及是否健康的一个标准,其计算公式是: = 2身高 单位: m2 .中国成人的 数值参考标准为: < 18.5为偏瘦;18.5 ≤ < 24为正常;24 ≤ < 28为偏胖; ≥ 28为肥胖.某公司为了解公司员工的身体肥胖情况,研究人员从公司员工体检数据中,采用分层随机抽样的方法抽取了 60 名男员工,40 名女员工的身高体重数据,通过计算男女员工的 值,整理得到如下的频率分布直方图.(1)求频率分布直方图中 a 的值,并估计该公司员工为肥胖的百分比;(2)估计该公司员工的 值的众数,中位数;(3)已知样本中 60 名男员工 值的平均数为 1 = 22.4,根据频率分布直方图,估计样本中 40 名女员工 值的平均数 2.【解题思路】(1)利用频率之和为 1 可计算 的值,再结合频率分布直方图即可得肥胖的百分比;(2)利用频率分布直方图即可估计众数,中位数;(3)先计算整体的平均数,然后由分层抽样平均数的公式即可得解.【解答过程】(1)由题,2 × (0.01 + 0.02 + 0.03 + 0.06 + 0.07 + 0.08 + + 0.13) = 1,解得: = 0.1,由频率分布直方图可得,该公司员工为肥胖的百分比为2 × (0.01 + 0.03) × 100% = 8%;2 18+20( )由频率分布直方图可得,众数为 2 = 19,因为2 × (0.08 + 0.13) = 0.42 < 0.5,2 × (0.08 + 0.13 + 0.1) = 0.62 > 0.5,故中位数在[20,22),设为 ,则 = 20 + 0.5 0.422×0.1 × (22 20) = 20.8;(3)设样本平均数为 ,则由频率分布直方图可得;= 2 × (17 × 0.08 + 19 × 0.13 + 21 × 0.1 + 23 × 0.06 + 25 × 0.07 + 27 × 0.02 + 29 × 0.01 + 31 × 0.03) ,= 21.64 = 60 1+40 2又 100 ,60×22.4+40 2即 100 = 21.64,解得: 2 = 20.5.【变式 9-3】(23-24 高一下·四川达州·阶段练习)有一种鱼的身体吸收汞,身体中汞的含量超过其体重的1.00ppm(百万分之一)的鱼被人食用后,就会对人体产生危害.某检测中心从一批这种鱼中随机抽取了 50 条,检测其汞含量(单位:ppm),并将所得数据分为 6 组:[0,0.4),[0.4,0.8),[0.8,1.2),[1.2,1.6),[1.6,2.0),[2.0,2.4],整理后得到如下频率分布直方图.(1)由频率分布直方图估计样本的80%分位数(精确到 0.01);(2)由频率分布直方图估计这批鱼汞含量的平均值(同一组中的数据用该组区间的中点值为代表);(3)从实际情况看,许多鱼的汞含量超标的原因是这些鱼在出售之前没有被检测过.你认为每批这种鱼的平均汞含量都比1.00ppm大吗 并说明理由.【解题思路】(1)先求出每个区间的频率,然后利用频率和为 1 列式计算求出 ,再根据频率预估样本的80%分位数所在区间设为 ,列方程0.6 + 0.6( 1.2) = 0.8求解即可;(2)利用加权平均数的公式求解;(3)不一定,根据估计值不能确定准确值来说明解答.【解答过程】(1)依题意,由频率分布直方图可知这批鱼汞含量在区间[0,0.4),[0.4,0.8),[0.8,1.2),[1.2,1.6),[1.6,2.0),[2.0,2.4]的频率分别为0.12,0.2,0.4 ,0.24,0.12,0.04,所以0.12 + 0.2 + 0.4 + 0.24 + 0.12 + 0.04 = 1,解得 = 0.7,则0.4 = 0.28.因为0.12 + 0.2 + 0.28 = 0.6 < 0.8 < 0.6 + 0.24 = 0.84,样本的80%分位数在区间[1.2,1.6)内,设为 ,则0.6 + 0.6( 1.2) = 0.8,解得 ≈ 1.53.所以样本的80%分位数约为 1.53;(2)结合(1)中结论,可得这批鱼汞含量的平均值为0.12 × 0.2 + 0.2 × 0.6 + 0.28 × 1 + 0.24 × 1.4 + 0.12 × 1.8 + 0.04 × 2.2 = 1.064;(3)不一定,因为我们不知道其他各批鱼的汞含量分布是否都和这批鱼相同,即使其他各批鱼的汞含量分布与这批鱼相同,上面所得的平均数也只能为这个分布作出估计,不能保证每批鱼的平均汞含量都大于 1.00ppm.【题型 10 其他统计图表中反映的集中趋势与离散程度】【例 10】(23-24 高一下·湖北武汉·期末)近年来,“直播带货”受到越来越多人的喜爱,目前已经成为推动消费的一种流行的营销形式.某直播平台 1200 个直播商家,对其进行调查统计,发现所售商品多为小吃、衣帽、生鲜、玩具、饰品类等,各类直播商家所占比例如图所示.(1)该直播平台为了更好地服务买卖双方,打算随机抽取 60 个直播商家进行问询交流.如果按照比例分层抽样的方式抽取,则应抽取小吃类、生鲜类商家各多少家?(2)在问询了解直播商家的利润状况时,工作人员对(1)中抽取的 60 个商家的平均日利润进行了统计(单位:元),所得频率分布直方图如右图所示,请根据频率分布直方图计算下面的问题:①估计该直播平台商家平均日利润的中位数与平均数(结果保留一位小数,求平均数时同一组中的数据用该组区间的中点值作代表);②若将平均日利润超过 430 元的商家评为“优秀商家”,估计该直播平台“优秀商家”的个数.【解题思路】(1)根据分层抽样的定义计算即可;(2)①根据中位数和平均数的定义计算即可;②根据样本中“优秀商家”的个数来估计总体中“优秀商家”的个数即可.【解答过程】(1)60 × (1 25% 15% 10% 5% 5%) = 24,60 × 15% = 9,所以应抽取小吃类24家,生鲜类9家;(2)①根据题意可得(0.001 × 3 + + 0.003 + 0.005 + 0.007) × 50 = 1,解得 = 0.002,设中位数为 ,因为(0.001 + 0.003) × 50 = 0.2,(0.001 + 0.003 + 0.007) × 50 = 0.55,所以( 300) × 0.007 + 0.2 = 0.5,解得 ≈ 342.9,平均数为:(225 × 0.001 + 275 × 0.003 + 325 × 0.007 + 375 × 0.005 + 425 × 0.002 + 475 × 0.001 + 525 × 0.001)× 50 = 352.5,所以该直播平台商家平均日利润的中位数为 342.9,平均数为 352.5.② 450 430 × 0.002 + 0.001 + 0.001 × 50 × 1200 = 168,50所以估计该直播平台“优秀商家”的个数为168.【变式 10-1】(23-24 高二上·四川成都·期末)为了了解甲、乙两个工厂生产的轮胎的宽度是否达标,分别从两厂随机选取了 10 个轮胎,将每个轮胎的宽度(单位:mm) 记录下来并绘制出折线图:(1)分别计算甲、 乙两厂提供 10 个轮胎宽度的平均值;(2)轮胎的宽度在[193,195]内,则称这个轮胎是标准轮胎,试比较甲、 乙两厂分别提供的 10 个轮胎中所有标准轮胎宽度的方差的大小,根据两厂的标准轮胎宽度的平均水平及其波动情况,判断这两个工厂哪个厂的轮胎相对更好.【解题思路】(1)由折线图提供的数据,利用平均数公式代入计算即可;(2)分别找出甲乙两厂的所有标准轮胎宽度的数据,再分别求出平均值与方差,即可判断.【解答过程】(1)由题:甲厂轮胎宽度的平均值为:110(195 + 194 + 196 + 193 + 194 + 197 + 196 + 195 + 193 + 197) = 195;乙厂轮胎宽度的平均值为:110(195 + 196 + 193 + 192 + 195 + 194 + 195 + 192 + 195 + 193) = 194;所以甲、 乙两厂提供 10 个轮胎宽度的平均值分别为 195,194.(2)由题,甲厂提供的 10 个轮胎中所有标准轮胎宽度为:195,194,193,194,195,193 1,其平均数为:6(195 + 194 + 193 + 194 + 195 + 193) = 194,1其方差为:6(1 + 0 + 1 + 0 + 1 + 1) =23;乙厂提供的 10 个轮胎中所有标准轮胎宽度为:195,193,195,194,195,195,193 1,其平均数为:7(195 + 193 + 195 + 194 + 195 + 195 + 193) = 19427,1(25 + 81 + 25 + 4 + 25 + 25 81 266 2其方差为:7 49 49 49 49 49 49 + 49) = 343 > 3;从平均数上来看:乙厂提供的 10 个轮胎中所有标准轮胎宽度高于甲厂提供的 10 个轮胎中所有标准轮胎宽度,但乙厂提供的 10 个轮胎中所有标准轮胎宽度方差较大,不够稳定.【变式 10-2】(23-24 高一下·宁夏·期末)某公司为了提高职工的健身意识,鼓励大家加入健步运动,要求200 名职工每天晚上 9:30 上传手机计步截图,对于步数超过 10000 的予以奖励.图 1 为甲乙两名职工在某一星期内的运动步数统计图,图 2 为根据这星期内某一天全体职工的运动步数做出的频率分布直方图.(1)请根据频率分布直方图,求 m 的值,并求出该天运动步数不少于 15000 步的人数;(2)估计全体职工在该天运动步数的众数、平均数和中位数;(3)如果当天甲的排名为第 130 名,乙的排名为第 40 名,试判断做出的是星期几的频率分布直方图.【解题思路】(1)根据频率分布直方图中各组频率之和为 1,即可求得 m 的值;结合频率、频数之间的关系即可求得该天运动步数不少于 15000 步的人数;(2)根据频率分布直方图,依据众数、平均数和中位数的估计方法即可求得答案;(3)计算甲乙排名的占比,结合频率分布直方图计算出甲乙两人的步数,与已知的甲乙两名职工在某一星期内的运动步数统计图比较,即得答案.【解答过程】(1)由图可知(0.02 + 0.03 + 0.04 + 0.06 + ) × 5 = 1,解得 = 0.05;所以该天运动步数不少于 15000 的人数为(0.05 + 0.03) × 5 × 200 = 80(人);2 10+15( )众数是 2 = 12.5(千步);全体职工在该天的平均步数为:2.5 × 0.1+7.5 × 0.2+12.5 × 0.3 + 17.5 × 0.25 + 22.5 × 0.15 = 13.25(千步)由于前两组频率之和为0.1 + 0.2 = 0.3 < 0.5,前三组频率之和为0.1 + 0.2 + 0.3 > 0.5,故设中位数为 x,则0.3 + ( 10) × 0.06 = 0.5, ∴ = 403 ,40即中位数是: 3 (千步)(3)因为40 ÷ 200 = 0.2,130 ÷ 200 = 0.65,假设甲的步数为 千步,乙的步数为 千步,由频率分布直方图可得:0.02 × 5 + 0.04 × 5 + ( 10) × 0.06 = 1 0.6565,解得 = 6 (千步),0.02 × 5 + 0.04 × 5 + 0.06 × 5 + ( 15) × 0.05 = 1 0.2,解得 = 19(千步),所以可得出是星期二的频率分布直方图.【变式 10-3】(23-24 高一下·广东东莞·期末)树人中学男女学生比例约为2:3,某数学兴趣社团为了解该校学生课外体育锻炼情况(锻炼时间长短(单位:小时),采用样本量比例分配的分层抽样,抽取男生 人,女生 人进行调查.记男生样本为 1, 2, , ,样本平均数、方差分别为 、 21;女生样本为 1, 2, , ,样本平均数、方差分别为 、 22;总样本平均数、方差分别为 、 2. (1)证明: ( )2 = 21 + ( )2 ; =1(2)该兴趣社团通过分析给出以下两个统计图,假设两个统计图中每个组内的数据均匀分布,根据两图信息分别估计男生样本、女生样本的平均数;(3)已知男生样本方差 21 = 5.5,女生样本方差 22 = 5.7,请结合(2)问的结果计算总样本方差 2的估计值.【解题思路】(1)利用平均数和方差计算公式结合完全平方运算化简即可证明;(2)利用平均数计算公式分别计算即可;(3)先求出总样本平均数,根据方差公式结合(1)中结论化简求解即可. 【解答过程】(1) ( )2 = ( 2 2 2 + ) = ( ) + 2( )( ) + ( ) =1 =1 =1 = ( )2 + 2( ) ( ) + ( )2 =1 =1 =1 = ( )2 +2( ) + ( )2, =1 =11 1 因为 21 = ( )2, = , =1 =1 所以 2 2 2 = 0,则 ( ) = 1 + ( ) ; =1 =1(2)因为每个组内的数据均匀分布,所以以各组的区间中点值代表该组的各个值,由频率分布直方图估计男生样本课外体育锻炼时间的平均数为 = 1 × 0.05 × 2 + 3 × 0.1 × 2 + 5 × 0.175 × 2 + 7 × 0.1 × 2 + 9 × 0.075 × 2 = 5.2,由扇形图估计女生样本课外体育锻炼时间的平均数为 = 1 × 0.15 + 3 × 0.25 + 5 × 0.30 + 7 × 0.2 + 9 × 0.1 = 4.7;(3)因为采用按比例分配的分层随机抽样,所以 : = 2:3, + 估计树人中学学生课外运动时间的平均数为 = = 0.4 × 5.2 + 0.6 × 4.7 = 4.9 + , 2 = 1 ( )2 2 =1 2 2 2 2 + + ( ) =1 =1 + 1 + ( ) + 2 + ( ) 2 = + 1 + ( )2 + 2 2 + 2 + ( )= 2 35 5.5 + (5.2 4.9)2 + 5 5.7 + (4.7 4.9)2 = 5.68. 展开更多...... 收起↑ 资源列表 专题9.2 用样本估计总体【十大题型】(举一反三)(原卷版)2024-2025学年高一数学举一反三系列(人教A版2019必修第二册).pdf 专题9.2 用样本估计总体【十大题型】(举一反三)(解析版)2024-2025学年高一数学举一反三系列(人教A版2019必修第二册).pdf