资源简介 专题9.2 用样本估计总体【八大题型】【人教A版(2019)】【题型1 频率分布直方图的绘制】 2【题型2 频率分布直方图的相关计算问题】 5【题型3 统计图的综合应用问题】 7【题型4 百分位数的求解】 10【题型5 众数、中位数、平均数的应用】 11【题型6 方差、标准差的求解及应用】 12【题型7 频率分布直方图中集中趋势参数的计算】 13【题型8 其他统计图表中反映的集中趋势与离散程度】 16【知识点1 总体取值规律的估计】1.频率分布直方图(1)频率分布表与频率分布直方图的意义为了探索一组数据的取值规律,一般先要用表格对数据进行整理,或者用图将数据直观表示出来.在初中,我们曾用频数分布表和频数分布图来整理和表示这种数值型数据,由此能使我们清楚地知道数据分布在各个小组的个数.有时,我们更关心各个小组的数据在样本容量中所占比例的大小,所以选择频率分布表和频率分布直方图来整理和表示数据.(2)频率分布表与频率分布直方图的制作步骤与画频数分布直方图类似,我们可以按以下步骤制作频率分布表、画频率分布直方图.第一步,求极差极差为一组数据中最大值与最小值的差.第二步,决定组距与组数第三步,将数据分组通常对组内数据取左闭右开区间,最后一组数据取闭区间.第四步,列频率分布表计算各小组的频率,作出频率分布表.第五步,画频率分布直方图画图时,以横轴表示分组,纵轴(小长方形的高度)表示.2.其他几类常用统计图——条形图、折线图、扇形图条形图 折线图 扇形图特 点 一般地,条形图中,一条轴上显示的是所关注的数据类型,另一条轴上对应的是数量、个数或者比例,条形图中每一长方形都是等宽的. 用一个单位长度表示一定的数量,用折线的起伏表示数量的增减变化. 用整个圆表示总体,扇形图中,每一个扇形的圆心角以及弧长,都与这一部分表示的数据大小成正比.作用及选用情景 能清楚地表示每个项目的具体数量,便于相互比较大小. 能清楚地看出数量增减变化的情况及各部分数量的多少.常用来表示随时间变化的数据,当然,也可以用在其他合适的情形中. 可以形象地表示出各部分数据在全部数据中所占的比例情况.图例【题型1 频率分布直方图的绘制】【例1】(23-24高一下·辽宁阜新·阶段练习)有一个容量为60的样本(60名学生的数学考试成绩),分组情况如下表:分组频数 3 6 12频率 0.3 (1)补全表中所剩的空格;(2)画出频率分布直方图和频率分布折线图.【变式1-1】(23-24高一下·山西晋中·阶段练习)某制造商为运动会生产一批直径为40mm的乒乓球,现随机抽样检查20只,测得每只球的直径(单位:mm,保留两位小数)如下:40.02 40.00 39.98 40.00 39.9940.00 39.98 40.01 39.98 39.9940.00 39.99 39.95 40.01 40.0239.98 40.00 39.99 40.00 39.96(1)完成下面的频率分布表,并画出频率分布直方图;分组 频数 频率合计 (2)假定乒乓球的直径误差不超过0.02mm为合格品,若这批乒乓球的总数为10000只,试根据抽样检查结果估计这批产品的合格只数.【变式1-2】(22-23高一下·天津河东·期末)《天津日报》2022年11月24日报道,我市扎实推进实施深入打好污染防治攻坚战“1+3+8”行动方案,生态环境质量持续稳定向好,特别是大气环境质量改善成效显著.记者从市生态环境局获悉,1至10月份,全市PM2.5平均浓度为34微克/立方米,同比改善8.1%,优良天数222天,同比增加3天,重污染天2天,同比减少4天,为10年来最好水平.小明所在的数学兴趣小组根据2022年8月天津市空气质量指数(AQI趋势图)进行数据统计,分析空气质量指数在不同范围内的天数占一个月天数的比例,步骤为“求极差”“决定组距与组数”“数据分组”“列频率分布表”“画频率分布直方图”,请完成上述步骤,绘制频率分布直方图(横轴为空气质量指数,纵轴保留两位有效数字). 【变式1-3】(2023高一·全国·专题练习)为了了解九年级学生中女生的身高(单位:cm)情况,某中学对九年级部分女生身高进行了一次测量,所得数据整理后列出频率分布表如下所示:分组 频数 频率[145.5,149.5) 1 0.02[149.5,153.5) 4 0.08[153.5,157.5) 20 0.40[157.5,161.5) 15 0.30[161.5,165.5) 8 0.16[165.5,169.5] m n合计 M N(1)求出表中m,n,M,N所表示的数分别是多少?(2)画出频率分布直方图;(3)全体女生中身高在哪组范围内的人数最多?估计九年级学生中女生的身高在161.5cm以上的频率.【题型2 频率分布直方图的相关计算问题】【例2】(23-24高三上·安徽亳州·期末)如图所示为某企业员工年龄(岁)的频率分布直方图,从左到右依次为第一组 第二组、……、第五组,若第五组的员工有80人,则第二组的员工人数为( )A.140 B.240 C.280 D.320【变式2-1】(2024·四川成都·模拟预测)年月日,第届世界大学生夏季运动会(简称大运会)在四川成都开幕,这是继北京大运会,深圳大运会之后,中国第三次举办夏季大运会;在成都大运会中,中国代表团取得了骄人的成绩.为向大学生普及大运会的相关知识,某高校进行“大运会知识竞赛”,并随机从中抽取了名学生的成绩(满分分)进行统计,成绩均在内,将其分成组:、、、、,并整理得到如下的频率分布直方图,则在被抽取的学生中,成绩落在区间内的人数为( ) A. B. C. D.【变式2-2】(23-24高三上·天津南开·期末)某研究机构为了解某地年轻人的阅读情况,通过随机抽样调查了100位年轻人,对这些人每天的阅读时间(单位:分钟)进行统计,得到样本的频率分布直方图如图所示,则的值为( )A.0.02 B.0.2 C.0.04 D.0.4【变式2-3】(23-24高三上·天津河北·期中)某班的全体学生参加数学测试,成绩的频率分布直方图如图,数据的分组依次为,,,.若低于60分的人数是15,则该班的学生人数是( ) A.40 B.45 C.50 D.60【题型3 统计图的综合应用问题】【例3】(23-24高三下·内蒙古锡林郭勒盟·开学考试)为了积极推进国家乡村振兴战略,某示范村不断自主创新,拓宽村民增收渠道,近年来取得了显著成效.据悉该村2023年经济总收入是2022年的2倍,为了更好地了解该村经济收入变化情况,统计了该村两年的经济收入构成比例,得到如图所示的条形图和饼图.则以下说法错误的是( )A.2023年“种植收入”和2022年“种植收入”一样多B.2023 年“养殖收入”与“第三产业收入”之和比2022年的全年总收入还多C.2023年“外出务工收入”是2022年“外出务工收入”的D.2023年“其他收入”比2022年“其他收入”的2倍还多【变式3-1】(2023·河南·二模)某银行为客户定制了A,B,C,D,E共5个理财产品,并对5个理财产品的持有客户进行抽样调查,得出如下的统计图: 用该样本估计总体,以下四个说法错误的是( )A.44~56周岁人群理财人数最多B.18~30周岁人群理财总费用最少C.B理财产品更受理财人青睐D.年龄越大的年龄段的人均理财费用越高【变式3-2】(2023·陕西商洛·模拟预测)如图为国家统计局于2023年1月20日发布的2016-2022年全国R&D经费总量与R&D经费与GDP之比的数据图表,则( ) A.R&D经费总量的平均数超过23000亿元B.R&D经费总量的中位数为19678亿元C.R&D经费与GDP之比的极差为0.45%D.R&D经费与GDP之比增幅最大的是2021年到2022年【变式3-3】(23-24高一下·全国·课时练习)给出如图所示的三幅统计图及四个命题:①从折线图能看出世界人口的变化情况;②2050年非洲人口将达到大约15亿;③2050年亚洲人口比其他各洲人口的总和还要多;④从1957年到2050年各洲中北美洲人口增长速度最慢.其中命题正确的有( )A.①② B.①③ C.①④ D.②④【知识点2 总体百分位数、集中趋势与离散程度的估计】1.总体百分位数的估计(1)概念一般地,一组数据的第p百分位数是这样一个值,它使得这组数据中至少有p%的数据小于或等于这个值,且至少有(100-p)%的数据大于或等于这个值.(2)求解步骤可以通过下面的步骤计算一组n个数据的第p百分位数:第1步,按从小到大排列原始数据.第2步,计算i=n×p%.第3步,若i不是整数,而大于i的比邻整数为j,则第p百分位数为第j项数据;若i是整数,则第p百分位数为第i项与第(i+1)项数据的平均数.2.总体集中趋势的估计在初中的学习中我们已经了解到,平均数、中位数和众数等都是刻画“中心位置”的量,它们从不同角度刻画了一组数据的集中趋势.具体概念回顾如下:名称 概念平 均 数 如果有n个数x1,x2,…,xn,那么(x1+x2+…+xn)就是这组数据的平均数,用表示,即=(x1+x2+…+xn).中 位 数 将一组数据按从小到大或从大到小的顺序排列,处在最中间的一个数据(当数据个数是奇数时)或最中间两个数据的平均数(当数据个数是偶数时)称为这组数据的中位数.众 数 一组数据中出现次数最多的数据(即频数最大值所对应的样本数据)称为这组数据的众数.3.总体离散程度的估计(1)方差和标准差假设一组数据是,,,,用表示这组数据的平均数,则我们称为这组数据的方差.有时为了计算方差的方便,我们还把方差写成的形式.我们对方差开平方,取它的算数平方根,称为这组数据的标准差.(2)总体(样本)方差和总体标准差①一般式:如果总体中所有个体的变量值分别为,,,,总体平均数为,则总体方差=.②加权式:如果总体的N个变量值中,不同的值共有k(kN)个,不妨记为,,,,其中出现的频数为(i=1,2,,k),则总体方差为=.总体标准差:S=.(3)标准差与方差的统计意义①标准差刻画了数据的离散程度或波动幅度,标准差越大,数据的离散程度越大;标准差越小,数据的离散程度越小.②在刻画数据的分散程度上,方差与标准差是一样的,但在解决实际问题时,一般多采用标准差.③标准差(方差)的取值范围为[0,+).若样本数据都相等,表明数据没有波动幅度,数据没有离散性,则标准差为0.反之,标准差为0的样本,其中的数据都相等.4.频率分布直方图中的统计参数(1)频率分布直方图中的“众数”根据众数的意义可知,在频率分布直方图中最高矩形中的某个(些)点的横坐标为这组数据的众数.一般用中点近似代替.(2)频率分布直方图中的“中位数”根据中位数的意义,在样本中,有50%的个体小于或等于中位数,也有50%的个体大于或等于中位数.因此,在频率分布直方图中,中位数左边和右边的直方图的面积应该相等,由此可估计中位数的值.(3)频率分布直方图中的“平均数”平均数是频率分布直方图的“重心”.因为平均数可以表示为数据与它的频率的乘积之和,所以在频率分布直方图中,样本平均数可以用每个小矩形底边中点的横坐标与小矩形的面积的乘积之和近似代替.【题型4 百分位数的求解】【例4】(23-24高三下·湖南湘潭·阶段练习)抽样统计某位学生8次的数学成绩分别为,则该学生这8次成绩的分位数为( )A.85 B.85.5 C.87 D.88.5【变式4-1】(23-24高三下·河北·开学考试)已知一组数据3,7,4,11,15,6,8,13,去掉一个最大值和一个最小值后所得数据的上四分位数为( )A.4 B.6 C.11 D.13【变式4-2】(2024·安徽安庆·二模)在一次学科核心素养能力测试活动中,随机抽取了100名同学的成绩(评分满分为100分),将所有数据按,,,,,进行分组,整理得到频率分布直方图如图所示,则估计这次调查数据的第64百分位数为( )A.80 B.78 C.76 D.74【变式4-3】(23-24高三上·山东德州·期末)按从小到大顺序排列的两组数据:甲组:;乙组:,若这两组数据的第30百分位数,第50百分位数都分别对应相等,则( )A.60 B.65 C.70 D.71【题型5 众数、中位数、平均数的应用】【例5】(2023高二下·湖南·学业考试)某中学有男生600人,女生400人.为了调查学生身高情况,按性别进行分层,用分层随机抽样的方法抽取一个容量为10的样本,样本按比例分配,得到男生、女生的平均身高分别为170cm和160cm.用样本估计总体,则该校学生的平均身高是( )A.162cm B.164cm C.166cm D.168cm【变式5-1】(23-24高二上·云南昆明·期末)我国是世界上严重缺水的国家,城市缺水问题较为突出.某市政府为了制定居民节约用水相关政策,抽样调查了该市200户居民月均用水量(单位:),绘制成频率分布直方图如图1,则下列说法不正确的是( ) A.图中小矩形的面积为0.24B.该市居民月均用水量众数约为C.该市大约有85%的居民月均用水量不超过D.这200户居民月均用水量的中位数大于平均数【变式5-2】(2024高一上·湖南邵阳·竞赛)如果将一组数据5、4、6、5、4、13、5依次重复写10次,会得到70个数组成的一组新数据,关于这组新数据的中位数、众数、平均数,下列说法正确的是( )A.中位数和众数都是5 B.众数是10C.中位数是4 D.中位数、平均数都是5【变式5-3】(2024·辽宁·一模)下图是2022年5月一2023年5月共13个月我国纯电动汽车月度销量及增长情况统计图(单位:万辆),则下列说法错误的是( )(注:同比:和上一年同期相比) A.2023年前5个月我国纯电动汽车的销量超过214万辆B.这13个月我国纯电动汽车月度销量的中位数为61.5万辆C.这13个月我国纯电动汽车月度销量的众数为52.2万辆D.和上一年同期相比,我国纯电动汽车月度销量有增有减【题型6 方差、标准差的求解及应用】【例6】(2024·陕西西安·模拟预测)已知一组样本数据的方差为10,且,则样本数据的方差为( )A.9.2 B.10.8 C.9.75 D.10.25【变式6-1】(23-24高三下·江苏苏州·阶段练习)已知某4个数据的平均数为6,方差为3,现再加入一个数据8,则这5个数据的方差为( )A. B. C. D.【变式6-2】(23-24高一上·北京房山·期末)甲、乙两名射击运动员在某次测试中各射击10次,两人的测试成绩如下表:甲的成绩 乙的成绩环数 6 7 8 9 10 环数 6 7 8 9 10频数 1 2 4 2 1 频数 3 2 1 1 3甲、乙两人成绩的平均数分别记作,,标准差分别记作,,则( )A., B.,C., D.,【变式6-3】(23-24高二上·四川资阳·期末)已知甲、乙两位同学在一次射击练习中各射靶10次,射中环数频率分布如图所示: 令,分别表示甲、乙射中环数的均值;,分别表示甲、乙射中环数的方差,则( )A., B.,C., D.,【题型7 频率分布直方图中集中趋势参数的计算】【例7】(2024·内蒙古呼和浩特·一模)为了解甲、乙两种农药在某种绿植表面的残留程度,进行如下试验:将100株同种绿植随机分成两组,每组50株,其中组绿植喷甲农药,组绿植喷乙农药,每株绿植所喷的农药体积相同、摩尔浓度相同.经过一段时间后用某种科学方法测算出残留在绿植表面的百分比,根据试验数据分别得到如图直方图:记为事件:“乙农药残留在表面的百分比不低于5.5”,根据直方图得到的估计值为0.70.(1)求乙农药残留百分比直方图中的值;(2)估计甲农药残留百分比的平均数(同一组中的数据用该组区间的中点值为代表);(3)估计乙农药残留百分比的中位数.(保留2位小数)【变式7-1】(23-24高一上·江西上饶·期末)某校在上饶市期末数学测试中为统计学生的考试情况,从学校的1000名学生中随机抽取50名学生的考试成绩,被测学生成绩全部介于65分到145分之间(满分150分),将统计结果按如下方式分成八组:第一组,第二组,……第八组,如图是按上述分组方法得到的频率分布直方图的一部分.(1)求第八组的频率,并完成频率分布直方图;(2)用样本数据估计该校的1000名学生这次考试成绩的平均分(同一组中的数据用该组区间的中点值代表该组数据平均值)和中位数(保留小数点后面一位)【变式7-2】(23-24高一下·陕西咸阳·阶段练习)某市为了了解学生的体能情况,从全市所有高一学生中按的比例随机抽取人进行一分钟跳绳测试,将所得数据整理后,分为组画出频率分布直方图(如图所示),由于操作失误,导致第一组和第二组的数据丢失,但知道第二组频率是第一组的倍.(1)求和的值;(2)若次数在以上(含次)为优秀,试估计全市高一学生的优秀率是多少?全市优秀学生的人数约为多少?(3)估计全市学生跳绳次数的中位数和平均数?【变式7-3】(23-24高一上·河南·期末)某调研小组调查了某市1000名外卖骑手平均每天完成的任务量(简称“单量”),得到如下的频数分布表:单量/单人数 100 120 130 180 220 150 60 30 10(1)补全该市1000名外卖骑手每天单量的频率分布直方图;(2)根据图表数据,试求样本数据的中位数(精确到0.1);(3)根据外卖骑手的每天单量,参考某平台的类别将外卖骑手分成三类,调查获知不同类别的外卖骑手开展工作所投入的装备成本不尽相同,如下表:日单量/单类別 普通骑手 精英骑手 王牌骑手装备价格/元 2500 4000 4800根据以上数据,估计该市外卖骑手购买装备的平均成本.【题型8 其他统计图表中反映的集中趋势与离散程度】【例8】(23-24高三上·黑龙江鸡西·期末)为了了解甲、乙两个工厂生产的轮胎的宽度是否达标,分别从两厂随机选取了10个轮胎,将每个轮胎的宽度(单位:)记录下来并绘制出折线图:(1)分别计算甲、乙两厂提供10个轮胎宽度的平均值;(2)轮胎的宽度在内,则称这个轮胎是标准轮胎.试比较甲、乙两厂分别提供的10个轮胎中所有标准轮胎宽度的方差的大小,根据两厂的标准轮胎宽度的平均水平及其波动情况,判断这两个工厂哪个厂的轮胎相对更好 【变式8-1】(23-24高一上·湖南长沙·开学考试)为了了解学生关注热点新闻的情况,“两会”期间,小明对班级同学一周内收看“两会”新闻的次数情况作了调查,调查结果统计如图所示(其中男生收看3次的人数没有标出). 根据上述信息,解答下列各题:(1)该班级女生人数是________,女生收看“两会”新闻次数的中位数是________;(2)对于某个群体,我们把一周内收看某热点新闻次数不低于3次的人数占其所在群体总人数的百分比叫做该群体对某热点新闻的“关注指数”.如果该班级男生对“两会”新闻的“关注指数”比女生低5%,试求该班级男生人数;(3)为进一步分析该班级男、女生收看“两会”新闻次数的特点,小明给出了男生的部分统计量(如表).统计量 平均数(次) 中位数(次) 众数(次) 方差该班级男生 3 3 4 2根据你所学过的统计知识,适当计算女生的有关统计量,进而比较该班级男、女生收看“两会”新闻次数的波动幅度大小.【变式8-2】(22-23高一下·山西太原·阶段练习)甲、乙两人在相同条件下各射靶次,每次射靶的成绩情况如图所示. (1)请填写下表:平均数 方差 中位数 命中环及环以上的次数甲乙(2)请从下列四个不同的角度对这次测试结果进行分析:①从平均数和方差相结合看(谁的成绩更稳定);②从平均数和中位数相结合看(谁的成绩好些);③从平均数和命中环及环以上的次数相结合看(谁的成绩好些);④从折线统计图上两人射击命中环数的走势看(谁更有潜力).【变式8-3】(22-23高一下·广东东莞·期末)树人中学男女学生比例约为,某数学兴趣社团为了解该校学生课外体育锻炼情况(锻炼时间长短(单位:小时),采用样本量比例分配的分层抽样,抽取男生人,女生人进行调查.记男生样本为,,,,样本平均数、方差分别为、;女生样本为,,,,样本平均数、方差分别为、;总样本平均数、方差分别为、. (1)证明:;(2)该兴趣社团通过分析给出以下两个统计图,假设两个统计图中每个组内的数据均匀分布,根据两图信息分别估计男生样本、女生样本的平均数;(3)已知男生样本方差,女生样本方差,请结合(2)问的结果计算总样本方差的估计值.专题9.2 用样本估计总体【八大题型】【人教A版(2019)】【题型1 频率分布直方图的绘制】 2【题型2 频率分布直方图的相关计算问题】 8【题型3 统计图的综合应用问题】 10【题型4 百分位数的求解】 15【题型5 众数、中位数、平均数的应用】 16【题型6 方差、标准差的求解及应用】 19【题型7 频率分布直方图中集中趋势参数的计算】 22【题型8 其他统计图表中反映的集中趋势与离散程度】 27【知识点1 总体取值规律的估计】1.频率分布直方图(1)频率分布表与频率分布直方图的意义为了探索一组数据的取值规律,一般先要用表格对数据进行整理,或者用图将数据直观表示出来.在初中,我们曾用频数分布表和频数分布图来整理和表示这种数值型数据,由此能使我们清楚地知道数据分布在各个小组的个数.有时,我们更关心各个小组的数据在样本容量中所占比例的大小,所以选择频率分布表和频率分布直方图来整理和表示数据.(2)频率分布表与频率分布直方图的制作步骤与画频数分布直方图类似,我们可以按以下步骤制作频率分布表、画频率分布直方图.第一步,求极差极差为一组数据中最大值与最小值的差.第二步,决定组距与组数第三步,将数据分组通常对组内数据取左闭右开区间,最后一组数据取闭区间.第四步,列频率分布表计算各小组的频率,作出频率分布表.第五步,画频率分布直方图画图时,以横轴表示分组,纵轴(小长方形的高度)表示.2.其他几类常用统计图——条形图、折线图、扇形图条形图 折线图 扇形图特 点 一般地,条形图中,一条轴上显示的是所关注的数据类型,另一条轴上对应的是数量、个数或者比例,条形图中每一长方形都是等宽的. 用一个单位长度表示一定的数量,用折线的起伏表示数量的增减变化. 用整个圆表示总体,扇形图中,每一个扇形的圆心角以及弧长,都与这一部分表示的数据大小成正比.作用及选用情景 能清楚地表示每个项目的具体数量,便于相互比较大小. 能清楚地看出数量增减变化的情况及各部分数量的多少.常用来表示随时间变化的数据,当然,也可以用在其他合适的情形中. 可以形象地表示出各部分数据在全部数据中所占的比例情况.图例【题型1 频率分布直方图的绘制】【例1】(23-24高一下·辽宁阜新·阶段练习)有一个容量为60的样本(60名学生的数学考试成绩),分组情况如下表:分组频数 3 6 12频率 0.3 (1)补全表中所剩的空格;(2)画出频率分布直方图和频率分布折线图.【解题思路】(1)分别计算各分数段的频率与频数,再补表格即可;(2)分别计算各分数段的频率除以组距的值,然后画出频率分布直方图和频率分布折线图即可.【解答过程】(1)根据题意,的频率为;的频率为;的频率为;的频率为,频数为;的频数为.填表如下.分组频数 3 6 12 21 18频率 0.05 0.1 0.2 0.35 0.3(2)计算的,的,的,的,的.画出的频率分布直方图和频率分布折线图如图所示. 【变式1-1】(23-24高一下·山西晋中·阶段练习)某制造商为运动会生产一批直径为40mm的乒乓球,现随机抽样检查20只,测得每只球的直径(单位:mm,保留两位小数)如下:40.02 40.00 39.98 40.00 39.9940.00 39.98 40.01 39.98 39.9940.00 39.99 39.95 40.01 40.0239.98 40.00 39.99 40.00 39.96(1)完成下面的频率分布表,并画出频率分布直方图;分组 频数 频率合计 (2)假定乒乓球的直径误差不超过0.02mm为合格品,若这批乒乓球的总数为10000只,试根据抽样检查结果估计这批产品的合格只数.【解题思路】(1)根据所给的频数和样本容量,用频数除以样本容量做出每一组数据对应的频率,填入表中,画出对应的频率分步直方图和频率分布折线图.(2)计算抽样产品在的个数,计算合格率,即可求出这批产品的合格只数.【解答过程】(1)频率分布表如下:分组 频数 频率2 0.10 54 0.20 1010 0.50 254 0.20 10合计 20 1.00 50频率分布直方图、频率分布折线图如图所示. (2)因为抽样的20只产品中在范围内的有18只,所以合格率为.所以根据抽样检查结果,可以估计这批产品的合格只数为9000.【变式1-2】(22-23高一下·天津河东·期末)《天津日报》2022年11月24日报道,我市扎实推进实施深入打好污染防治攻坚战“1+3+8”行动方案,生态环境质量持续稳定向好,特别是大气环境质量改善成效显著.记者从市生态环境局获悉,1至10月份,全市PM2.5平均浓度为34微克/立方米,同比改善8.1%,优良天数222天,同比增加3天,重污染天2天,同比减少4天,为10年来最好水平.小明所在的数学兴趣小组根据2022年8月天津市空气质量指数(AQI趋势图)进行数据统计,分析空气质量指数在不同范围内的天数占一个月天数的比例,步骤为“求极差”“决定组距与组数”“数据分组”“列频率分布表”“画频率分布直方图”,请完成上述步骤,绘制频率分布直方图(横轴为空气质量指数,纵轴保留两位有效数字). 【解题思路】先求极差,分组,然后列出频率分布表,根据频率直方图的作图方法直接作图即可.【解答过程】由图中数据知,空气质量指数的最大值为64,最小值为23,它们的差是64-23=41,即极差为41,根据极差确定组距为7,组数为6,频率分布表如下:空气质量指数 频数 频率5410363由频率分布表,可得频率分布直方图,如下:【变式1-3】(2023高一·全国·专题练习)为了了解九年级学生中女生的身高(单位:cm)情况,某中学对九年级部分女生身高进行了一次测量,所得数据整理后列出频率分布表如下所示:分组 频数 频率[145.5,149.5) 1 0.02[149.5,153.5) 4 0.08[153.5,157.5) 20 0.40[157.5,161.5) 15 0.30[161.5,165.5) 8 0.16[165.5,169.5] m n合计 M N(1)求出表中m,n,M,N所表示的数分别是多少?(2)画出频率分布直方图;(3)全体女生中身高在哪组范围内的人数最多?估计九年级学生中女生的身高在161.5cm以上的频率.【解题思路】(1)方法一,利用频率总和为1求出,再利用样本容量与各组频率、频数的关系求出作答.方法二,利用1除以组距求出,进而得,由频率总和为1得,再利用频率的意义求出作答.(2)根据已知数表及(1)画出频率分布直方图作答.(3)利用频率分布直方图求出最大频率的分组区间并求出女生的身高在161.5cm以上的频率作答.【解答过程】(1)方法一 N=1.00,,,解得m=2,.方法二 ,,N=1.00,.(2)作出平面直角坐标系,组距为4,纵轴表示,横轴表示身高,画出频率分布直方图如图所示. (3)由频率分布直方图知,样本中身高在范围内的人数最多,且身高在161.5cm以上的频率为,由此可估计全体女生中身高在范围内的人数最多,九年级学生中女生的身高在161.5cm以上的频率约为0.20.【题型2 频率分布直方图的相关计算问题】【例2】(23-24高三上·安徽亳州·期末)如图所示为某企业员工年龄(岁)的频率分布直方图,从左到右依次为第一组 第二组、……、第五组,若第五组的员工有80人,则第二组的员工人数为( )A.140 B.240 C.280 D.320【解题思路】根据频率分布直方图的性质,求得的值,进一步计算即可 .【解答过程】由已知得,所以,因为第五组的员工人数为80,所以第二组的员工人数为.故选:C.【变式2-1】(2024·四川成都·模拟预测)年月日,第届世界大学生夏季运动会(简称大运会)在四川成都开幕,这是继北京大运会,深圳大运会之后,中国第三次举办夏季大运会;在成都大运会中,中国代表团取得了骄人的成绩.为向大学生普及大运会的相关知识,某高校进行“大运会知识竞赛”,并随机从中抽取了名学生的成绩(满分分)进行统计,成绩均在内,将其分成组:、、、、,并整理得到如下的频率分布直方图,则在被抽取的学生中,成绩落在区间内的人数为( ) A. B. C. D.【解题思路】根据频率分布直方图可求出成绩落在区间内的人数.【解答过程】由频率直方图可知,成绩落在区间内的人数为.故选:C.【变式2-2】(23-24高三上·天津南开·期末)某研究机构为了解某地年轻人的阅读情况,通过随机抽样调查了100位年轻人,对这些人每天的阅读时间(单位:分钟)进行统计,得到样本的频率分布直方图如图所示,则的值为( )A.0.02 B.0.2 C.0.04 D.0.4【解题思路】根据题意结合频率和为1列式求解.【解答过程】由频率分布直方图可知:每组频率依次为,则,解得.故选:A.【变式2-3】(23-24高三上·天津河北·期中)某班的全体学生参加数学测试,成绩的频率分布直方图如图,数据的分组依次为,,,.若低于60分的人数是15,则该班的学生人数是( ) A.40 B.45 C.50 D.60【解题思路】由频率分布直方图可得低于60分的人的频率,结合低于60分的人数即可求得答案.【解答过程】由频率分布直方图可得低于60分的人的频率为,由于低于60分的人数是15,则该班的学生人数是,故选:C.【题型3 统计图的综合应用问题】【例3】(23-24高三下·内蒙古锡林郭勒盟·开学考试)为了积极推进国家乡村振兴战略,某示范村不断自主创新,拓宽村民增收渠道,近年来取得了显著成效.据悉该村2023年经济总收入是2022年的2倍,为了更好地了解该村经济收入变化情况,统计了该村两年的经济收入构成比例,得到如图所示的条形图和饼图.则以下说法错误的是( )A.2023年“种植收入”和2022年“种植收入”一样多B.2023 年“养殖收入”与“第三产业收入”之和比2022年的全年总收入还多C.2023年“外出务工收入”是2022年“外出务工收入”的D.2023年“其他收入”比2022年“其他收入”的2倍还多【解题思路】设2022年总收入为m,则2023年总收入为,A选项,分别计算出2022年和2023年种植收入,得到A正确;B选项,计算出,B正确;C选项,分别计算出2022年和2023年外出务工收入,得到C错误;D选项,分别计算出2022年和2023年其他收入,得到D正确.【解答过程】设2022年总收入为m,则2023年总收入为,对于A,2022年种植收入为,2023年种植收入为,A正确;对于B,2023年养殖收入和第三产业收入之和为,B正确;对于C,2022年外出务工收入为,2023年外出务工收入为,是2022年外出务工收入的,C不正确;对于D,2022年其他收入为,2023年其他收入为,由于,故2023年其他收入比2022年其他收入的2倍还多,D正确.故选:C.【变式3-1】(2023·河南·二模)某银行为客户定制了A,B,C,D,E共5个理财产品,并对5个理财产品的持有客户进行抽样调查,得出如下的统计图: 用该样本估计总体,以下四个说法错误的是( )A.44~56周岁人群理财人数最多B.18~30周岁人群理财总费用最少C.B理财产品更受理财人青睐D.年龄越大的年龄段的人均理财费用越高【解题思路】A.由扇形图判断;B.设总人数为a,按照扇形图得到各段人数,再由折线图求解判断;C.利用条形图判断;D.利用折线图判断.【解答过程】A.44~56周岁人群理财人数所占比例是37%,是最多的,故正确;B.设总人数为a,则18~30周岁人群的人均理财费用约为,31~43周岁人群的人均理财费用约为,44~56周岁人群的人均理财费用约为,57周岁人群的人均理财费用约为,所以57周岁及以上人群的人均理财费用最少,故错误;C.由条形图可知:B理财产品更受理财人青睐,故正确;D.由折线图知:年龄越大的年龄段的人均理财费用越高,故正确,故选:B.【变式3-2】(2023·陕西商洛·模拟预测)如图为国家统计局于2023年1月20日发布的2016-2022年全国R&D经费总量与R&D经费与GDP之比的数据图表,则( ) A.R&D经费总量的平均数超过23000亿元B.R&D经费总量的中位数为19678亿元C.R&D经费与GDP之比的极差为0.45%D.R&D经费与GDP之比增幅最大的是2021年到2022年【解题思路】根据数据图表逐项判断可得答案.【解答过程】对于选项A,R&D经费总量的平均数为,所以A错误;对于选项B,R&D经费总量的中位数为22144亿元,所以B错误;对于选项C,R&D经费与之比的极差为,所以C正确;对于选项D,R&D经费与GDP之比增幅最大的是2019年到2020年,所以D错误.故选:C.【变式3-3】(23-24高一下·全国·课时练习)给出如图所示的三幅统计图及四个命题:①从折线图能看出世界人口的变化情况;②2050年非洲人口将达到大约15亿;③2050年亚洲人口比其他各洲人口的总和还要多;④从1957年到2050年各洲中北美洲人口增长速度最慢.其中命题正确的有( )A.①② B.①③ C.①④ D.②④【解题思路】根据所给折线图、扇形图及条形图,可依次判断各选项.【解答过程】①从折线图中能看出世界人口的变化情况,故①正确;②从条形图中可得到2050年非洲人口大约将达到18亿,故②错;③从扇形图中能够明显地得到结论:2050年亚洲人口比其他各洲人口的总和还要多,故③正确;④由题中三幅统计图并不能得出从1957年到2050年中哪个洲人口增长速度最慢,故④错误.因此正确的命题有①③.故选:B.【知识点2 总体百分位数、集中趋势与离散程度的估计】1.总体百分位数的估计(1)概念一般地,一组数据的第p百分位数是这样一个值,它使得这组数据中至少有p%的数据小于或等于这个值,且至少有(100-p)%的数据大于或等于这个值.(2)求解步骤可以通过下面的步骤计算一组n个数据的第p百分位数:第1步,按从小到大排列原始数据.第2步,计算i=n×p%.第3步,若i不是整数,而大于i的比邻整数为j,则第p百分位数为第j项数据;若i是整数,则第p百分位数为第i项与第(i+1)项数据的平均数.2.总体集中趋势的估计在初中的学习中我们已经了解到,平均数、中位数和众数等都是刻画“中心位置”的量,它们从不同角度刻画了一组数据的集中趋势.具体概念回顾如下:名称 概念平 均 数 如果有n个数x1,x2,…,xn,那么(x1+x2+…+xn)就是这组数据的平均数,用表示,即=(x1+x2+…+xn).中 位 数 将一组数据按从小到大或从大到小的顺序排列,处在最中间的一个数据(当数据个数是奇数时)或最中间两个数据的平均数(当数据个数是偶数时)称为这组数据的中位数.众 数 一组数据中出现次数最多的数据(即频数最大值所对应的样本数据)称为这组数据的众数.3.总体离散程度的估计(1)方差和标准差假设一组数据是,,,,用表示这组数据的平均数,则我们称为这组数据的方差.有时为了计算方差的方便,我们还把方差写成的形式.我们对方差开平方,取它的算数平方根,称为这组数据的标准差.(2)总体(样本)方差和总体标准差①一般式:如果总体中所有个体的变量值分别为,,,,总体平均数为,则总体方差=.②加权式:如果总体的N个变量值中,不同的值共有k(kN)个,不妨记为,,,,其中出现的频数为(i=1,2,,k),则总体方差为=.总体标准差:S=.(3)标准差与方差的统计意义①标准差刻画了数据的离散程度或波动幅度,标准差越大,数据的离散程度越大;标准差越小,数据的离散程度越小.②在刻画数据的分散程度上,方差与标准差是一样的,但在解决实际问题时,一般多采用标准差.③标准差(方差)的取值范围为[0,+).若样本数据都相等,表明数据没有波动幅度,数据没有离散性,则标准差为0.反之,标准差为0的样本,其中的数据都相等.4.频率分布直方图中的统计参数(1)频率分布直方图中的“众数”根据众数的意义可知,在频率分布直方图中最高矩形中的某个(些)点的横坐标为这组数据的众数.一般用中点近似代替.(2)频率分布直方图中的“中位数”根据中位数的意义,在样本中,有50%的个体小于或等于中位数,也有50%的个体大于或等于中位数.因此,在频率分布直方图中,中位数左边和右边的直方图的面积应该相等,由此可估计中位数的值.(3)频率分布直方图中的“平均数”平均数是频率分布直方图的“重心”.因为平均数可以表示为数据与它的频率的乘积之和,所以在频率分布直方图中,样本平均数可以用每个小矩形底边中点的横坐标与小矩形的面积的乘积之和近似代替.【题型4 百分位数的求解】【例4】(23-24高三下·湖南湘潭·阶段练习)抽样统计某位学生8次的数学成绩分别为,则该学生这8次成绩的分位数为( )A.85 B.85.5 C.87 D.88.5【解题思路】将题设中的数据按由小到大排列后可求分位数.【解答过程】8次的数学成绩由小到大排列为:,因,故分位数为,故选:D.【变式4-1】(23-24高三下·河北·开学考试)已知一组数据3,7,4,11,15,6,8,13,去掉一个最大值和一个最小值后所得数据的上四分位数为( )A.4 B.6 C.11 D.13【解题思路】把新数据按由小到大排列,利用上四分位数的定义求解即得.【解答过程】依题意,所得新数据按由小到大排列为:4,6,7,8,11,13,由,得所得数据的上四分位数为11.故选:C.【变式4-2】(2024·安徽安庆·二模)在一次学科核心素养能力测试活动中,随机抽取了100名同学的成绩(评分满分为100分),将所有数据按,,,,,进行分组,整理得到频率分布直方图如图所示,则估计这次调查数据的第64百分位数为( )A.80 B.78 C.76 D.74【解题思路】借助百分位数的定义计算即可得.【解答过程】由,,故这次调查数据的第64百分位数位于之间,设这次调查数据的第64百分位数为,则有,解得.故选:B.【变式4-3】(23-24高三上·山东德州·期末)按从小到大顺序排列的两组数据:甲组:;乙组:,若这两组数据的第30百分位数,第50百分位数都分别对应相等,则( )A.60 B.65 C.70 D.71【解题思路】根据给定条件,利用第p百分位数的定义分别求出第30百分位数和第50百分位数即可得解.【解答过程】由,则甲组数据的第30百分位数为31,乙组数据的第30百分位数为n,即,第50百分位数即中位数,则乙组数据的第50百分位数为,甲组数据的第50百分位数为,于是,解得,所以.故选:D.【题型5 众数、中位数、平均数的应用】【例5】(2023高二下·湖南·学业考试)某中学有男生600人,女生400人.为了调查学生身高情况,按性别进行分层,用分层随机抽样的方法抽取一个容量为10的样本,样本按比例分配,得到男生、女生的平均身高分别为170cm和160cm.用样本估计总体,则该校学生的平均身高是( )A.162cm B.164cm C.166cm D.168cm【解题思路】由分层抽样与平均数的概念求解,【解答过程】由题意得在抽取的10人中,男生6人,女生4人,故样本平均数为,估计该校学生的平均身高是166cm故选:C.【变式5-1】(23-24高二上·云南昆明·期末)我国是世界上严重缺水的国家,城市缺水问题较为突出.某市政府为了制定居民节约用水相关政策,抽样调查了该市200户居民月均用水量(单位:),绘制成频率分布直方图如图1,则下列说法不正确的是( ) A.图中小矩形的面积为0.24B.该市居民月均用水量众数约为C.该市大约有85%的居民月均用水量不超过D.这200户居民月均用水量的中位数大于平均数【解题思路】由概率和为1,求得,求出矩形的面积判断A;求出众数判断B;求出用水量不超过的概率判断C;求出中位数及平均数判断D.【解答过程】解:由,可得,所以,故A正确;由题意可知该市居民月均用水量众数约为,故B正确;由题意可得该市居民月均用水量不超过的频率为:,故C正确;设200户居民月均用水量的中位数为,因为第一个矩形的面积为0.04,第二个矩形的面积为0.3,第三个矩形的面积为0.24,所以中位数,则,这200户居民月均用水量的平均数,因为,所以这200户居民月均用水量的中位数小于平均数,故D不正确.故选:D.【变式5-2】(2024高一上·湖南邵阳·竞赛)如果将一组数据5、4、6、5、4、13、5依次重复写10次,会得到70个数组成的一组新数据,关于这组新数据的中位数、众数、平均数,下列说法正确的是( )A.中位数和众数都是5 B.众数是10C.中位数是4 D.中位数、平均数都是5【解题思路】根据平均数,众数,中位数的定义和性质即可求解.【解答过程】将这组数据从小到大的顺序排列为4,4,5,5,5,6,13,处于中间位置的那个数是5,每个数字重复写10次,5依然处于中间位置,由中位数的定义可知,这组新数据的中位数是5,这组新数据中出现次数最多的数是5,出现了30次,所以众数为5,故A正确,BC错误.平均数,故D错误.故选:A.【变式5-3】(2024·辽宁·一模)下图是2022年5月一2023年5月共13个月我国纯电动汽车月度销量及增长情况统计图(单位:万辆),则下列说法错误的是( )(注:同比:和上一年同期相比) A.2023年前5个月我国纯电动汽车的销量超过214万辆B.这13个月我国纯电动汽车月度销量的中位数为61.5万辆C.这13个月我国纯电动汽车月度销量的众数为52.2万辆D.和上一年同期相比,我国纯电动汽车月度销量有增有减【解题思路】根据统计图表数据一一分析即可.【解答过程】2023年前5个月我国纯电动汽车的销量为万辆,即2023年前5个月我国纯电动汽车的销量超过214万辆,故A正确;将这13个月纯电动汽车的月度销量由小到大依次排列为,,则中位数为其中第个数据,即万辆,故B错误;这些数据中只有出现2次,其他数据均只出现1次,故众数为万辆,故C正确;2023年1月的同比增长率为负数,其它月份的同比增长率为正数,故和上一年同期相比,我国纯电动汽车月度销量有增有减,故D正确.故选:B.【题型6 方差、标准差的求解及应用】【例6】(2024·陕西西安·模拟预测)已知一组样本数据的方差为10,且,则样本数据的方差为( )A.9.2 B.10.8 C.9.75 D.10.25【解题思路】根据条件中的方差和,代入新数据的方差公式,即可求解.【解答过程】设样本数据的平均数为,则,且样本数据的平均数也为,故:故选:B.【变式6-1】(23-24高三下·江苏苏州·阶段练习)已知某4个数据的平均数为6,方差为3,现再加入一个数据8,则这5个数据的方差为( )A. B. C. D.【解题思路】根据题意,由平均数以及方差的计算公式,代入计算,即可得到结果.【解答过程】设原来4个数据依次为,则,方差为3,则,即,所以,则再加入一个数据8,则其平均数为,则这5个数据的方差为.故选:C.【变式6-2】(23-24高一上·北京房山·期末)甲、乙两名射击运动员在某次测试中各射击10次,两人的测试成绩如下表:甲的成绩 乙的成绩环数 6 7 8 9 10 环数 6 7 8 9 10频数 1 2 4 2 1 频数 3 2 1 1 3甲、乙两人成绩的平均数分别记作,,标准差分别记作,,则( )A., B.,C., D.,【解题思路】根据平均数、方差公式运算求解.【解答过程】由题意可得:,,,,所以,.故选:C.【变式6-3】(23-24高二上·四川资阳·期末)已知甲、乙两位同学在一次射击练习中各射靶10次,射中环数频率分布如图所示: 令,分别表示甲、乙射中环数的均值;,分别表示甲、乙射中环数的方差,则( )A., B.,C., D.,【解题思路】根据频率分布图分别计算,,比较大小可得.【解答过程】由图可知,,,所以,.故选:D.【题型7 频率分布直方图中集中趋势参数的计算】【例7】(2024·内蒙古呼和浩特·一模)为了解甲、乙两种农药在某种绿植表面的残留程度,进行如下试验:将100株同种绿植随机分成两组,每组50株,其中组绿植喷甲农药,组绿植喷乙农药,每株绿植所喷的农药体积相同、摩尔浓度相同.经过一段时间后用某种科学方法测算出残留在绿植表面的百分比,根据试验数据分别得到如图直方图:记为事件:“乙农药残留在表面的百分比不低于5.5”,根据直方图得到的估计值为0.70.(1)求乙农药残留百分比直方图中的值;(2)估计甲农药残留百分比的平均数(同一组中的数据用该组区间的中点值为代表);(3)估计乙农药残留百分比的中位数.(保留2位小数)【解题思路】(1)由的估计值为0.70,可得,求得值,再由整体频率为即可求得;(2)根据平均数的定义,取组区间的中点值进行计算即可得解;(3)中位数在使得直方图面积为处取得,经计算即可得解.【解答过程】(1)为事件:“乙农药残留在表面的百分比不低于5.5”,根据直方图得到的估计值为0.70.则由频率分布直方图得:,解得,所以乙农药残留在表面的百分比直方图中.(2)估计甲农药残留百分比的平均数为:.(3)设乙农药残留百分比的中位数为,则,解得,所以估计乙农药残留百分比的中位数约为.【变式7-1】(23-24高一上·江西上饶·期末)某校在上饶市期末数学测试中为统计学生的考试情况,从学校的1000名学生中随机抽取50名学生的考试成绩,被测学生成绩全部介于65分到145分之间(满分150分),将统计结果按如下方式分成八组:第一组,第二组,……第八组,如图是按上述分组方法得到的频率分布直方图的一部分.(1)求第八组的频率,并完成频率分布直方图;(2)用样本数据估计该校的1000名学生这次考试成绩的平均分(同一组中的数据用该组区间的中点值代表该组数据平均值)和中位数(保留小数点后面一位)【解题思路】(1)根据频率分布直方图的性质,建立方程,求得频率,补全频率分布直方图,可得答案;(2)先根据平均数的计算公式求平均数,然后利用中位数的定义列方程求解即可.【解答过程】(1)因为各组的频率和等于1,故第八组的频率为:,则第八组对应矩形的高为,补全频率分布直方图如图所示:(2)用样本数据估计该校的1000名学生这次考试成绩的平均分为:(分);因为,,所以中位数在内,设中位数为x,则,解得;所以估计中位数是分.【变式7-2】(23-24高一下·陕西咸阳·阶段练习)某市为了了解学生的体能情况,从全市所有高一学生中按的比例随机抽取人进行一分钟跳绳测试,将所得数据整理后,分为组画出频率分布直方图(如图所示),由于操作失误,导致第一组和第二组的数据丢失,但知道第二组频率是第一组的倍.(1)求和的值;(2)若次数在以上(含次)为优秀,试估计全市高一学生的优秀率是多少?全市优秀学生的人数约为多少?(3)估计全市学生跳绳次数的中位数和平均数?【解题思路】(1)根据频率之和为列方程,结合已知条件求得.(2)根据频率分布直方图计算出优秀率,并计算出全市优秀学生的人数.(3)根据中位数、平均数的求法求得正确答案.【解答过程】(1)由题意得,解得.(2)由图可知,超过分的组的频率分别为,,,优秀率为.全市优秀学生的人数约为(人).(3)第组的频率分别为,,,,前三组的频率和为,中位数约为.平均数约为.【变式7-3】(23-24高一上·河南·期末)某调研小组调查了某市1000名外卖骑手平均每天完成的任务量(简称“单量”),得到如下的频数分布表:单量/单人数 100 120 130 180 220 150 60 30 10(1)补全该市1000名外卖骑手每天单量的频率分布直方图;(2)根据图表数据,试求样本数据的中位数(精确到0.1);(3)根据外卖骑手的每天单量,参考某平台的类别将外卖骑手分成三类,调查获知不同类别的外卖骑手开展工作所投入的装备成本不尽相同,如下表:日单量/单类別 普通骑手 精英骑手 王牌骑手装备价格/元 2500 4000 4800根据以上数据,估计该市外卖骑手购买装备的平均成本.【解题思路】(1)计算出第二组和第四组的频率,得出对应小矩形的高,在图中标出即可;(2)根据已知,分别求出样本数据分布在以及之间的频率,得出中位数,进而列出方程,求解即可得出答案;(3)根据已知得出不同类别骑手的人数,计算平均数即可得出答案.【解答过程】(1)由第二组的频数得频率为,从而第二组矩形的高为,由第四组的频数得频率为,从而第二组矩形的高为,补全该市1000名外卖骑手周单量的频率分布直方图,如下:(2)由已知可得,样本数据分布在之间的频率为;样本数据分布在之间的频率为.设样本数据的中位数为,则,且有,解得,即样本数据的中位数约为29.2.(3)依题意可知,被调查的1000人中,普通骑手共有(人),精英骑手共有(人),王牌骑手共有(人),所以,这1000名外卖骑手购买装备的平均成本为(元),所以估计该市外卖骑手购买装备的平均成本为3750元.【题型8 其他统计图表中反映的集中趋势与离散程度】【例8】(23-24高三上·黑龙江鸡西·期末)为了了解甲、乙两个工厂生产的轮胎的宽度是否达标,分别从两厂随机选取了10个轮胎,将每个轮胎的宽度(单位:)记录下来并绘制出折线图:(1)分别计算甲、乙两厂提供10个轮胎宽度的平均值;(2)轮胎的宽度在内,则称这个轮胎是标准轮胎.试比较甲、乙两厂分别提供的10个轮胎中所有标准轮胎宽度的方差的大小,根据两厂的标准轮胎宽度的平均水平及其波动情况,判断这两个工厂哪个厂的轮胎相对更好 【解题思路】(1)根据平均数的求法可直接求得结果;(2)确定甲、乙两厂生产的轮胎中标准轮胎的宽度数据,由此可计算得到平均数和方差,对比数据即可得到结论.【解答过程】(1)记甲厂提供的个轮胎宽度的平均值为,乙厂提供的个轮胎宽度的平均值为,,.(2)甲厂个轮胎宽度在内的数据为,则平均数为,所以方差;乙厂个轮胎宽度在内的数据为,则平均数为,所以方差;因为甲、乙两厂生产的标准轮胎宽度的平均值一样,但乙厂的方差更小,所有乙厂的轮胎相对更好.【变式8-1】(23-24高一上·湖南长沙·开学考试)为了了解学生关注热点新闻的情况,“两会”期间,小明对班级同学一周内收看“两会”新闻的次数情况作了调查,调查结果统计如图所示(其中男生收看3次的人数没有标出). 根据上述信息,解答下列各题:(1)该班级女生人数是________,女生收看“两会”新闻次数的中位数是________;(2)对于某个群体,我们把一周内收看某热点新闻次数不低于3次的人数占其所在群体总人数的百分比叫做该群体对某热点新闻的“关注指数”.如果该班级男生对“两会”新闻的“关注指数”比女生低5%,试求该班级男生人数;(3)为进一步分析该班级男、女生收看“两会”新闻次数的特点,小明给出了男生的部分统计量(如表).统计量 平均数(次) 中位数(次) 众数(次) 方差该班级男生 3 3 4 2根据你所学过的统计知识,适当计算女生的有关统计量,进而比较该班级男、女生收看“两会”新闻次数的波动幅度大小.【解题思路】(1)根据题目数据及中位数的定义直接计算即可;(2)先求出女生对“两会”新闻的“关注指数”,即可得男生对“两会”新闻的“关注指数”,列方程解答即可;(3)利用方差公式求解女生收看“两会”新闻次数的方差,即可比较大小.【解答过程】(1)该班级女生人数是,女生收看“两会”新闻次数的中位数是3.(2)由题意:该班女生对“两会”新闻的“关注指数”为,所以男生对“两会”新闻的“关注指数”为.设该班的男生有人,则,解得.(3)该班级女生收看“两会”新闻次数的平均数为,女生收看“两会”新闻次数的方差为,因为男、女生收看“两会”新闻次数的平均数与中位数都相等,而方差,所以男生比女生的波动幅度大.【变式8-2】(22-23高一下·山西太原·阶段练习)甲、乙两人在相同条件下各射靶次,每次射靶的成绩情况如图所示. (1)请填写下表:平均数 方差 中位数 命中环及环以上的次数甲乙(2)请从下列四个不同的角度对这次测试结果进行分析:①从平均数和方差相结合看(谁的成绩更稳定);②从平均数和中位数相结合看(谁的成绩好些);③从平均数和命中环及环以上的次数相结合看(谁的成绩好些);④从折线统计图上两人射击命中环数的走势看(谁更有潜力).【解题思路】(1)根据平均数、方差、中位数的定义和折线图的数据依次计算即可;(2)根据(1)中数据依次分析即可.【解答过程】(1)由图可知,甲打靶的成绩分别为,,,,,,,,,,乙打靶的成绩分别为,,,,,,,,,.甲打靶成绩的平均数为,方差为,中位数是,命中环及环以上的次数为;乙打靶成绩的平均数为,方差为,中位数是,命中环及环以上次数为.可填写表格如下:平均数 方差 中位数 命中9环及9环以上的次数甲乙(2)①甲、乙的平均数相同,乙的方差较大,所以甲的成绩更稳定;②甲、乙的平均数相同,乙的中位数较大,所以乙的成绩好些;③甲、乙的平均数相同,乙命中环及环以上的次数比甲多,所以乙的成绩较好;④从折线统计图上看,在后半部分,乙呈上升趋势,而甲起伏不定,且均未超过乙,故乙更有潜力.【变式8-3】(22-23高一下·广东东莞·期末)树人中学男女学生比例约为,某数学兴趣社团为了解该校学生课外体育锻炼情况(锻炼时间长短(单位:小时),采用样本量比例分配的分层抽样,抽取男生人,女生人进行调查.记男生样本为,,,,样本平均数、方差分别为、;女生样本为,,,,样本平均数、方差分别为、;总样本平均数、方差分别为、. (1)证明:;(2)该兴趣社团通过分析给出以下两个统计图,假设两个统计图中每个组内的数据均匀分布,根据两图信息分别估计男生样本、女生样本的平均数;(3)已知男生样本方差,女生样本方差,请结合(2)问的结果计算总样本方差的估计值.【解题思路】(1)利用平均数和方差计算公式结合完全平方运算化简即可证明;(2)利用平均数计算公式分别计算即可;(3)先求出总样本平均数,根据方差公式结合(1)中结论化简求解即可.【解答过程】(1),因为,,所以,则;(2)因为每个组内的数据均匀分布,所以以各组的区间中点值代表该组的各个值,由频率分布直方图估计男生样本课外体育锻炼时间的平均数为,由扇形图估计女生样本课外体育锻炼时间的平均数为;(3)因为采用按比例分配的分层随机抽样,所以,估计树人中学学生课外运动时间的平均数为,. 展开更多...... 收起↑ 资源列表 专题9.2 用样本估计总体【八大题型】(举一反三)(人教A版2019必修第二册)(原卷版).docx 专题9.2 用样本估计总体【八大题型】(举一反三)(人教A版2019必修第二册)(解析版).docx