资源简介 9.2.3 总体集中趋势的估计【课程标准要求】 1.会求样本数据的众数、中位数、平均数.2.理解用样本的数字特征、频率分布直方图估计总体的集中趋势.知识点一 平均数、中位数、众数的概念及比较1.平均数、中位数、众数的概念平均数:数据x1,x2,x3,…,xn的平均数为=.中位数:一般地,若一组数据有奇数个数,且按照从小到大排序后为x1,x2,…,x2n+1,则称xn+1为这组数据的中位数.若一组数据有偶数个数,且按照从小到大排序后为x1,x2,…,x2n,则称为这组数据的中位数.众数:一组数据中,某个数据出现的次数称为这个数据的频数,出现的次数最多的数据称为这组数据的众数.2.平均数、中位数和众数的比较名称 优点 缺点平均数 平均数与每一个数据有关,对数据有“取齐”的作用,代表了一组数据的数值平均水平 样本平均数与每一个样本数据有关,样本中的任何一个数据的改变都会引起平均数的改变.对极端值更加敏感,因此一般的比赛记分中,常去掉“最高分”与“最低分”中位数 中位数仅与数据的排列位置有关.某些数据的改变对中位数没有影响,不受少数极端数据的影响,中位数只有唯一一个 对极端值不敏感续 表名称 优点 缺点众数 众数反映各数据出现的频率,其大小只与这组数据中的部分数据有关,它是样本数据的最大集中点 一组数据的众数可能有一个,也可能有多个,若数据中有两个或两个以上出现得最多,且出现次数一样多,则这些数据都是众数众数、中位数、平均数的意义(1)样本的众数、中位数和平均数常用来表示样本数据的“中心值”,其中众数和中位数容易计算,不受少数几个极端值的影响,但只能表达样本数据中的少量信息,平均数代表了数据更多的信息,但受样本中每个数据的影响,越极端的数据对平均数的影响越大.(2)当一组数据中有不少数据重复出现时,其众数往往更能反映问题,当一组数据中个别数据较大时,可用中位数描述其集中趋势.知识点二 中位数、平均数与频率分布直方图的关系 一般来说,对一个单峰的频率分布直方图来说,如果直方图的形状是对称的(图①),那么平均数和中位数应该大体上差不多;如果直方图在右边“拖尾”(图②),那么平均数大于中位数;如果直方图在左边“拖尾”(图③),那么平均数小于中位数.也就是说,和中位数相比,平均数总是在“长尾巴”那边.知识拓展 在频率分布直方图中平均数、中位数、众数的估计值(1)平均数:在频率分布直方图中,样本平均数可以用每个小矩形底边中点的横坐标与小矩形的面积的乘积之和近似代替.(2)中位数:在频率分布直方图中,中位数左边和右边的直方图的面积应该相等.(3)众数:众数是最高小矩形底边的中点所对应的横坐标.基础自测1.一组数据为1,3,5,7,9,11,13,15,则该组数据的中位数是( )[A] 6 [B] 7 [C] 8 [D] 9【答案】 C【解析】 样本数据1,3,5,7,9,11,13,15的中位数是=8.故选C.2.一组数据为26,32,7,13,42,114,则该组数据的平均数为( )[A] 36 [B] 39 [C] 40 [D] 41【答案】 B【解析】 由题意可知该组数据的平均数为=39.故选B.3.众数、平均数、中位数都描述了数据的集中趋势,它们的大小关系和数据分布的形态有关.在如图所示的分布形态中,平均数、众数和中位数的大小关系是( )[A] 众数<中位数<平均数[B] 平均数<众数<中位数[C] 中位数<平均数<众数[D] 众数<平均数<中位数【答案】 A【解析】 众数是最高矩形底边中点的横坐标,因此众数在直方图第二组的中点处.因为直方图第二、第三组所占数据较多,且在右边“拖尾”,所以平均数大于中位数,中位数在第三组的位置,因此有众数<中位数<平均数.故选A.4.(人教A版必修第二册P209练习T3改编)在一些比赛中,对评委打分的处理方法一般是去掉一个最高分和一个最低分,然后计算余下评分的平均数作为参赛者的得分.在一次有9名评委参加的赛事中,评委对一名参赛者所打的9个分数,去掉一个最高分和一个最低分后,一定不变的数字特征为( )[A] 平均数 [B] 中位数[C] 众数 [D] 极差【答案】 B【解析】 一共9个数据,从小到大排序结果为a1,a2,a3,a4,a5,a6,a7,a8,a9,则a5为中位数,去掉一个最高分a9和一个最低分a1后,还有7个数据,第4个数据,即a5为中位数,故中位数一定不变,其余数字特征可能改变,不妨设9个分数为3,3,4,5,5,7,8,9,10,平均数为=6,众数为3和5,极差为7,去掉最高分10和一个最低分3后,平均数为=,众数为5,极差为6,平均数、众数和极差均发生变化.故选B.题型一 样本数据的平均数、中位数、众数[例1] 某小区广场上有甲、乙两群市民,两群市民的年龄(单位:岁)如下.甲群:13,13,14,15,15,15,15,16,17,17.乙群:54,3,4,4,5,6,6,6,6,56.(1)甲群市民年龄的平均数、中位数和众数各是多少 其中哪个统计量能较好地反映甲群市民的年龄特征 (2)乙群市民年龄的平均数、中位数和众数各是多少 其中哪个统计量能较好地反映乙群市民的年龄特征 【解】 (1)甲群市民年龄的平均数为=15,中位数为15,众数为15.平均数、中位数和众数相等,因此它们都能较好地反映甲群市民的年龄特征.(2)乙群市民年龄的平均数为=15,中位数为6,众数为6.由于乙群市民大多数是儿童,所以中位数和众数能较好地反映乙群市民的年龄特征,而平均数的可靠性较差.[变式训练] 如果将一组数据5,4,6,5,4,13,5依次重复写10次,会得到70个数组成的一组新数据,关于这组新数据的中位数、众数和平均数,下列说法正确的是( )[A] 中位数和众数都是5[B] 众数是10[C] 中位数是4[D] 中位数和平均数都是5【答案】 A【解析】 将原数据从小到大排序为4,4,5,5,5,6,13,处于中间位置的数是5,每个数字重复写10次,5依然处于中间位置,由中位数的定义可知,这组新数据的中位数是5,这组新数据中出现次数最多的数是5,出现了30次,所以众数为5,故A正确,B,C错误.平均数=6,故D错误.故选A.题型二 由频率分布直方图求平均数、中位数、众数[例2] (人教B版必修第二册P84例2)某市为了制定合理的节水方案,对家庭用水情况进行了调查,通过抽样,获得了某年100个家庭的月均用水量(单位:t),将数据按照[0,1),[1,2),[2,3),[3,4),[4,5]分成5组,制成了如图所示的频率分布直方图.(1)求图中a的值;(2)设该市有10万个家庭,估计全市月均用水量不低于3 t的家庭数;(3)假设同组中的每个数据都用该组区间的中点值代替,估计全市家庭月均用水量的平均数.【解】 (1)因为频率分布直方图所有矩形的面积之和为1,所以(0.12+0.22+0.36+a+0.12)×1=1,解得a=0.18.(2)抽取的样本中,月均用水量不低于3 t的家庭所占比例为(a+0.12)×1=0.3=30%,因此估计全市月均用水量不低于3 t的家庭所占比例也为30%,所求家庭数为100 000×30%=30 000.(3)因为0.12×0.5+0.22×1.5+0.36×2.5+0.18×3.5+0.12×4.5=2.46,所以估计全市家庭月均用水量的平均数为2.46.[变式训练] 一批乒乓球,随机抽取100个进行检查,乒乓球的直径频率分布直方图如图,试估计这个样本的众数、中位数和平均数(每组为左闭右开的区间,同一组中的数据用该组区间的中点值作代表).【解】 众数约为=40;因为四个小矩形的面积分别是0.02×5=0.1,0.02×10=0.2,0.02×25=0.5,0.02×10=0.2,所以中位数约为39.99+=39.998;平均数约为39.96×0.1+39.98×0.2+40×0.5+40.02×0.2=39.996.题型三 对实际问题的决策[例3] 某公司销售部有销售人员15人,销售部为了制定某种商品的月销售定额,统计了这15人某月的销售量如下表:销售量/件 1 800 510 250 210 150 120人数 1 1 3 5 3 2(1)求这15名销售人员该月销售量的平均数、中位数及众数;(2)假设销售部负责人把每名销售人员的月销售量定为320件,你认为是否合理,为什么 如果不合理,请你制定一个较为合理的销售定额.【解】 (1)平均数是=320;表中的数据是按从大到小的顺序排列的,处于中间位置的是210,因此中位数是210;因为210出现了5次,次数最多,所以众数是210.(2)不合理.因为15人中有13人的销售量不到320件,320件虽是所给一组数据的平均数,它却不能很好地反映销售人员的一般水平.销售量定为210件合适些,因为210件既是中位数,又是众数,且是大部分人能达到的销售定额.平均数反映出样本数据的较多信息,对样本中的极端值更加敏感.平均数、中位数和众数都是刻画“中心位置”的量,从不同的角度刻画了一组数据的集中趋势.[变式训练] 某校甲班、乙班各有49名学生,两班在一次音乐素养测试中的成绩(满分100分)统计如下表:班级 平均分 众数 中位数甲班 79 70 87乙班 79 70 79(1)请你对下面的一段话给予简要分析.甲班的小刚回家对妈妈说:“昨天的音乐素养测试,全班平均79分,得70分的人最多,我得了85分,在班里算是上游了!”(2)请你根据表中数据,对这两个班的测试情况进行简要分析,并提出教学建议.【解】 (1)由中位数可知,85分排在第25名之后,从名次上讲,85分不算是上游,但也不能单以名次来判断学习成绩的好坏,小刚得了85分,说明他对这阶段的学习内容掌握较好.(2)甲班学生成绩的中位数为87分,说明高于或等于87分的学生占一半以上,而平均分为79分,说明两极分化严重,建议对学习有困难的学生多给一些帮助;乙班学生成绩的中位数和平均分均为79分,说明学生成绩之间差别较小,成绩很差的学生少,但成绩优异的学生也很少,建议采取措施提高优秀率.(分值:75分) 单选每题5分,多选每题6分.1.从某班所有学生中随机抽取10人,获得他们某学年参加社区服务次数的数据如下:4,4,4,7,7,8,8,9,9,10,这组数据的众数是( )[A] 9 [B] 8 [C] 7 [D] 4【答案】 D【解析】 由数据可知,某学年参加社区服务次数为4的人数最多,故众数为4.故选D.2.某市职业技能大赛的移动机器人比赛项目有19名学生参赛,他们在预赛中所得的积分互不相同,只有积分在前10名的学生才能进入决赛.若该比赛项目中的某学生知道自己的积分后,要判断自己能否进入决赛,则他只需要知道这19名学生的预赛积分的( )[A] 平均数 [B] 众数[C] 中位数 [D] 方差【答案】 C【解析】 因为19名学生的积分,中位数是第10名学生的积分,所以知道中位数即可判断自己能否进入决赛.故选C.3.已知甲、乙两组数据可以整理成如图所示的茎叶图.若甲组数据的中位数为a,乙组数据的75%分位数为b,则a+b的值是( )[A] 37 [B] 38 [C] 39 [D] 40【答案】 D【解析】 甲组数据从小到大排序为7,8,9,15,17,19,23,24,26,32,共10个数据,所以中位数为=18,所以a=18.乙组数据从小到大排序为5,7,8,11,11,13,20,22,30,31,共10个数据,又75%×10=7.5,所以乙组数据的75%分位数为22,所以b=22,所以a+b=18+22=40.故选D.4.某企业有1 000名职工,现按照总体的10%抽取样本,通过比例分配的分层随机抽样得到如下年收入表:年收 入/万元 30 15 10 8 6 4人数 1 6 15 55 20 3某次工资上调中,只提高了最低收入,即从年收入4万元提高到4.5万元,其他职工的年收入不变,则下列关于本企业职工年收入的说法正确的是( )[A] 平均数和众数都提高了[B] 平均数和中位数都提高了[C] 平均数不变,中位数提高了[D] 中位数和众数不变,平均数提高了【答案】 D【解析】 由于提高了最低收入,即从年收入4万元提高到4.5万元,其他职工的年收入不变,所以平均数提高了.提高最低收入后,有1个人年收入30万元,6个人年收入15万元,15个人年收入10万元,55个人年收入8万元,20个人年收入6万元,3个人年收入4.5万元,所以众数还是8万元,中位数还是8万元,众数和中位数没有变化.故选D.5.某校抽取180名高一学生进行了一次视力调查,发现视力都在区间[4.0,5.5)内,其频数分布直方图(不完整,每组为左闭右开的区间)如图所示.设这次抽样调查所得数据的中位数为x,根据图中的信息判断:x的取值范围是( )[A] [4.0,4.3) [B] [4.3,4.6)[C] [4.6,4.9) [D] [4.9,5.2)【答案】 B【解析】 由题图可知,第一组有50人,第二组有50人,因为被调查的学生总人数为180人,所以将这180名高一学生进行抽样调查所得数据按从小到大的顺序排列,第90和91个数据的平均数为这组数据的中位数.因为第90和91个数据均落在第二组,所以这次抽样调查所得数据的中位数的取值范围是[4.3,4.6).故选B.6.(多选题)某学校为了解学生每周行走的步数,从高一、高二两个年级分别随机调查了200名学生,得到高一和高二学生每周行走步数的频率分布直方图,如图所示.若高一和高二学生每周行走步数的中位数估计值分别为x1,x2,平均数估计值分别为y1,y2,则下列选项正确的是(同一组中的数据用该组区间的中点值作代表,每组为左闭右开的区间)( )[A] x1>x2 [B] x1[C] y1>y2 [D] y1【答案】 BD【解析】 由高一年级的频率分布直方图,得(0.015+0.020)×10=0.35,(0.015+0.020+0.025)×10=0.6,由高二年级的频率分布直方图,得(0.005+0.020)×10=0.25,(0.005+0.020+0.035)×10=0.6,则x1∈[60,70),x2∈[70,80),进行数据分析可得(x1-60)×0.025+0.15+0.2=0.5,解得x1=66,(x2-70)×0.035+0.05+0.2=0.5,解得x2==77,所以每周行走步数的中位数x1y1=45×0.15+55×0.2+65×0.25+75×0.2+85×0.1+95×0.1=67,y2=55×0.05+65×0.2+75×0.35+85×0.25+95×0.15=77.5,所以每周行走步数的平均数y17.(5分)数据x1,x2,…,xn的平均数为8,数据y1,y2,…,yn的平均数为.如果满足y1=3x1+2,y2=3x2+2,…,yn=3xn+2,则= . 【答案】 26【解析】 根据平均数性质知=3+2=3×8+2=26.8.(5分)某电子商务公司对10 000名网络购物者2025年度的消费情况进行统计,发现每个人的消费金额(单位:万元)都在区间[0.3,0.9]内,其频率分布直方图如图所示.直方图中的a= ,在这些购物者中,平均消费金额约为 万元.(同一组中的数据用该组区间的中点值作代表) 【答案】 3 0.537【解析】 由0.1×1.5+0.1×2.5+0.1a+0.1×2.0+0.1×0.8+0.1×0.2=1,解得a=3,因此平均消费金额约为0.35×0.15+0.45×0.25+0.55×0.3+0.65×0.2+0.75×0.08+0.85×0.02=0.537(万元).9.(14分)课外阅读有很多好处,可以帮助提高阅读能力、拓展知识面、提高思维能力、提高情感素养和提高人际交往能力.某校为了解学生课外阅读的情况,随机统计了n名学生的一个学期课外阅读时长(单位:h),所得数据都在[50,150]内,将所得的数据分成4组:[50,75),[75,100),[100,125),[125,150],得到如图所示的频率分布直方图,现知道课外阅读时长在[125,150]内的有80人.(1)求n和a的值;(2)估计该校学生一个学期课外阅读时长的平均数(同一组中的数据用该组区间的中点值作代表);(3)估计所得数据的中位数.【解】 (1)根据题意,课外阅读时长在[125,150]内的有80人,频率为0.008×25=0.2,所以n==400,再由频率分布直方图可知,(0.004+0.008+0.012+a)×25=1,解得a=0.016.(2)估计该校学生一个学期课外阅读时长的平均数为62.5×0.1+87.5×0.3+112.5×0.4+137.5×0.2=105.(3)显然中位数位于[100,125)内,设中位数为x,则0.1+0.3+(x-100)×0.016=0.5,解得x=106.25.所以所得数据的中位数估计值为106.25.10.一组数据1,3,7,9,m(m>0)的中位数不小于平均数,则m的取值范围为( )[A] [5,7] [B] [5,15][C] [7,15] [D] [5,20]【答案】 B【解析】 因为这组数据的平均数为=4+>4,所以这组数据的中位数只可能是m或7,若这组数据的中位数是m,则4+≤m≤7,即5≤m≤7;若这组数据的中位数是7,则4+≤7≤m,即7≤m≤15.综上所述,m的取值范围为[5,15].故选B.11.(15分)治理沙漠离不开优质的树苗,现从苗圃中随机地抽测了200株树苗的高度(单位:cm),得到以下频率分布直方图(每组为左闭右开的区间,同一组中的数据用该组区间的中点值作代表).(1)求直方图中a的值和中位数的估计值.(2)若树高185 cm及以上是可以移栽的合格树苗.从样本中按比例分配的分层随机抽样的方法抽取40株树苗做进一步研究,则不合格树苗、合格树苗分别应抽取多少株 【解】 (1)由(0.001 5+0.011 0+0.022 5+0.030 0+a+0.008 0+0.002 0)×10=1,可得a=0.025 0.设中位数为x,因为(0.001 5+0.011 0+0.022 5)×10=0.35<0.5,(0.001 5+0.011 0+0.022 5+0.030 0)×10=0.65>0.5,所以185≤x<195,所以(0.001 5+0.011 0+0.022 5)×10+0.030 0(x-185)=0.5,解得x=190,即中位数约为190.(2)由题意得,不合格的抽取40×0.35=14(株),合格的抽取40×0.65=26(株),故不合格树苗、合格树苗分别应抽取14株和26株.9.2.3 总体集中趋势的估计【课程标准要求】 1.会求样本数据的众数、中位数、平均数.2.理解用样本的数字特征、频率分布直方图估计总体的集中趋势.知识点一 平均数、中位数、众数的概念及比较1.平均数、中位数、众数的概念平均数:数据x1,x2,x3,…,xn的平均数为=.中位数:一般地,若一组数据有奇数个数,且按照从小到大排序后为x1,x2,…,x2n+1,则称xn+1为这组数据的中位数.若一组数据有偶数个数,且按照从小到大排序后为x1,x2,…,x2n,则称为这组数据的中位数.众数:一组数据中,某个数据出现的次数称为这个数据的频数,出现的次数最多的数据称为这组数据的众数.2.平均数、中位数和众数的比较名称 优点 缺点平均数 平均数与每一个数据有关,对数据有“取齐”的作用,代表了一组数据的数值平均水平 样本平均数与每一个样本数据有关,样本中的任何一个数据的改变都会引起平均数的改变.对极端值更加敏感,因此一般的比赛记分中,常去掉“最高分”与“最低分”中位数 中位数仅与数据的排列位置有关.某些数据的改变对中位数没有影响,不受少数极端数据的影响,中位数只有唯一一个 对极端值不敏感续 表名称 优点 缺点众数 众数反映各数据出现的频率,其大小只与这组数据中的部分数据有关,它是样本数据的最大集中点 一组数据的众数可能有一个,也可能有多个,若数据中有两个或两个以上出现得最多,且出现次数一样多,则这些数据都是众数众数、中位数、平均数的意义(1)样本的众数、中位数和平均数常用来表示样本数据的“中心值”,其中众数和中位数容易计算,不受少数几个极端值的影响,但只能表达样本数据中的少量信息,平均数代表了数据更多的信息,但受样本中每个数据的影响,越极端的数据对平均数的影响越大.(2)当一组数据中有不少数据重复出现时,其众数往往更能反映问题,当一组数据中个别数据较大时,可用中位数描述其集中趋势.知识点二 中位数、平均数与频率分布直方图的关系 一般来说,对一个单峰的频率分布直方图来说,如果直方图的形状是对称的(图①),那么平均数和中位数应该大体上差不多;如果直方图在右边“拖尾”(图②),那么平均数大于中位数;如果直方图在左边“拖尾”(图③),那么平均数小于中位数.也就是说,和中位数相比,平均数总是在“长尾巴”那边.知识拓展 在频率分布直方图中平均数、中位数、众数的估计值(1)平均数:在频率分布直方图中,样本平均数可以用每个小矩形底边中点的横坐标与小矩形的面积的乘积之和近似代替.(2)中位数:在频率分布直方图中,中位数左边和右边的直方图的面积应该相等.(3)众数:众数是最高小矩形底边的中点所对应的横坐标.基础自测1.一组数据为1,3,5,7,9,11,13,15,则该组数据的中位数是( )[A] 6 [B] 7 [C] 8 [D] 92.一组数据为26,32,7,13,42,114,则该组数据的平均数为( )[A] 36 [B] 39 [C] 40 [D] 413.众数、平均数、中位数都描述了数据的集中趋势,它们的大小关系和数据分布的形态有关.在如图所示的分布形态中,平均数、众数和中位数的大小关系是( )[A] 众数<中位数<平均数[B] 平均数<众数<中位数[C] 中位数<平均数<众数[D] 众数<平均数<中位数因为直方图第二、第三组所占数据较多,且在右边“拖尾”,所以平均数大于中位数,中位数在第三组的位置,因此有众数<中位数<平均数.故选A.4.(人教A版必修第二册P209练习T3改编)在一些比赛中,对评委打分的处理方法一般是去掉一个最高分和一个最低分,然后计算余下评分的平均数作为参赛者的得分.在一次有9名评委参加的赛事中,评委对一名参赛者所打的9个分数,去掉一个最高分和一个最低分后,一定不变的数字特征为( )[A] 平均数 [B] 中位数[C] 众数 [D] 极差题型一 样本数据的平均数、中位数、众数[例1] 某小区广场上有甲、乙两群市民,两群市民的年龄(单位:岁)如下.甲群:13,13,14,15,15,15,15,16,17,17.乙群:54,3,4,4,5,6,6,6,6,56.(1)甲群市民年龄的平均数、中位数和众数各是多少 其中哪个统计量能较好地反映甲群市民的年龄特征 (2)乙群市民年龄的平均数、中位数和众数各是多少 其中哪个统计量能较好地反映乙群市民的年龄特征 (2)乙群市民年龄的平均数为=15,中位数为6,众数为6.由于乙群市民大多数是儿童,所以中位数和众数能较好地反映乙群市民的年龄特征,而平均数的可靠性较差.[变式训练] 如果将一组数据5,4,6,5,4,13,5依次重复写10次,会得到70个数组成的一组新数据,关于这组新数据的中位数、众数和平均数,下列说法正确的是( )[A] 中位数和众数都是5[B] 众数是10[C] 中位数是4[D] 中位数和平均数都是5每个数字重复写10次,5依然处于中间位置,由中位数的定义可知,这组新数据的中位数是5,这组新数据中出现次数最多的数是5,出现了30次,所以众数为5,故A正确,B,C错误.平均数=6,故D错误.故选A.题型二 由频率分布直方图求平均数、中位数、众数[例2] (人教B版必修第二册P84例2)某市为了制定合理的节水方案,对家庭用水情况进行了调查,通过抽样,获得了某年100个家庭的月均用水量(单位:t),将数据按照[0,1),[1,2),[2,3),[3,4),[4,5]分成5组,制成了如图所示的频率分布直方图.(1)求图中a的值;(2)设该市有10万个家庭,估计全市月均用水量不低于3 t的家庭数;(3)假设同组中的每个数据都用该组区间的中点值代替,估计全市家庭月均用水量的平均数.(2)抽取的样本中,月均用水量不低于3 t的家庭所占比例为(a+0.12)×1=0.3=30%,因此估计全市月均用水量不低于3 t的家庭所占比例也为30%,所求家庭数为100 000×30%=30 000.(3)因为0.12×0.5+0.22×1.5+0.36×2.5+0.18×3.5+0.12×4.5=2.46,所以估计全市家庭月均用水量的平均数为2.46.[变式训练] 一批乒乓球,随机抽取100个进行检查,乒乓球的直径频率分布直方图如图,试估计这个样本的众数、中位数和平均数(每组为左闭右开的区间,同一组中的数据用该组区间的中点值作代表).因为四个小矩形的面积分别是0.02×5=0.1,0.02×10=0.2,0.02×25=0.5,0.02×10=0.2,所以中位数约为39.99+=39.998;平均数约为39.96×0.1+39.98×0.2+40×0.5+40.02×0.2=39.996.题型三 对实际问题的决策[例3] 某公司销售部有销售人员15人,销售部为了制定某种商品的月销售定额,统计了这15人某月的销售量如下表:销售量/件 1 800 510 250 210 150 120人数 1 1 3 5 3 2(1)求这15名销售人员该月销售量的平均数、中位数及众数;(2)假设销售部负责人把每名销售人员的月销售量定为320件,你认为是否合理,为什么 如果不合理,请你制定一个较为合理的销售定额.表中的数据是按从大到小的顺序排列的,处于中间位置的是210,因此中位数是210;因为210出现了5次,次数最多,所以众数是210.(2)不合理.因为15人中有13人的销售量不到320件,320件虽是所给一组数据的平均数,它却不能很好地反映销售人员的一般水平.销售量定为210件合适些,因为210件既是中位数,又是众数,且是大部分人能达到的销售定额.平均数反映出样本数据的较多信息,对样本中的极端值更加敏感.平均数、中位数和众数都是刻画“中心位置”的量,从不同的角度刻画了一组数据的集中趋势.[变式训练] 某校甲班、乙班各有49名学生,两班在一次音乐素养测试中的成绩(满分100分)统计如下表:班级 平均分 众数 中位数甲班 79 70 87乙班 79 70 79(1)请你对下面的一段话给予简要分析.甲班的小刚回家对妈妈说:“昨天的音乐素养测试,全班平均79分,得70分的人最多,我得了85分,在班里算是上游了!”(2)请你根据表中数据,对这两个班的测试情况进行简要分析,并提出教学建议.(2)甲班学生成绩的中位数为87分,说明高于或等于87分的学生占一半以上,而平均分为79分,说明两极分化严重,建议对学习有困难的学生多给一些帮助;乙班学生成绩的中位数和平均分均为79分,说明学生成绩之间差别较小,成绩很差的学生少,但成绩优异的学生也很少,建议采取措施提高优秀率.(分值:75分) 单选每题5分,多选每题6分.1.从某班所有学生中随机抽取10人,获得他们某学年参加社区服务次数的数据如下:4,4,4,7,7,8,8,9,9,10,这组数据的众数是( )[A] 9 [B] 8 [C] 7 [D] 42.某市职业技能大赛的移动机器人比赛项目有19名学生参赛,他们在预赛中所得的积分互不相同,只有积分在前10名的学生才能进入决赛.若该比赛项目中的某学生知道自己的积分后,要判断自己能否进入决赛,则他只需要知道这19名学生的预赛积分的( )[A] 平均数 [B] 众数[C] 中位数 [D] 方差3.已知甲、乙两组数据可以整理成如图所示的茎叶图.若甲组数据的中位数为a,乙组数据的75%分位数为b,则a+b的值是( )[A] 37 [B] 38 [C] 39 [D] 404.某企业有1 000名职工,现按照总体的10%抽取样本,通过比例分配的分层随机抽样得到如下年收入表:年收 入/万元 30 15 10 8 6 4人数 1 6 15 55 20 3某次工资上调中,只提高了最低收入,即从年收入4万元提高到4.5万元,其他职工的年收入不变,则下列关于本企业职工年收入的说法正确的是( )[A] 平均数和众数都提高了[B] 平均数和中位数都提高了[C] 平均数不变,中位数提高了[D] 中位数和众数不变,平均数提高了5.某校抽取180名高一学生进行了一次视力调查,发现视力都在区间[4.0,5.5)内,其频数分布直方图(不完整,每组为左闭右开的区间)如图所示.设这次抽样调查所得数据的中位数为x,根据图中的信息判断:x的取值范围是( )[A] [4.0,4.3) [B] [4.3,4.6)[C] [4.6,4.9) [D] [4.9,5.2)6.(多选题)某学校为了解学生每周行走的步数,从高一、高二两个年级分别随机调查了200名学生,得到高一和高二学生每周行走步数的频率分布直方图,如图所示.若高一和高二学生每周行走步数的中位数估计值分别为x1,x2,平均数估计值分别为y1,y2,则下列选项正确的是(同一组中的数据用该组区间的中点值作代表,每组为左闭右开的区间)( )[A] x1>x2 [B] x1[C] y1>y2 [D] y1得(0.015+0.020)×10=0.35,(0.015+0.020+0.025)×10=0.6,由高二年级的频率分布直方图,得(0.005+0.020)×10=0.25,(0.005+0.020+0.035)×10=0.6,则x1∈[60,70),x2∈[70,80),进行数据分析可得(x1-60)×0.025+0.15+0.2=0.5,解得x1=66,(x2-70)×0.035+0.05+0.2=0.5,解得x2==77,所以每周行走步数的中位数x1y1=45×0.15+55×0.2+65×0.25+75×0.2+85×0.1+95×0.1=67,y2=55×0.05+65×0.2+75×0.35+85×0.25+95×0.15=77.5,所以每周行走步数的平均数y17.(5分)数据x1,x2,…,xn的平均数为8,数据y1,y2,…,yn的平均数为.如果满足y1=3x1+2,y2=3x2+2,…,yn=3xn+2,则= . 8.(5分)某电子商务公司对10 000名网络购物者2025年度的消费情况进行统计,发现每个人的消费金额(单位:万元)都在区间[0.3,0.9]内,其频率分布直方图如图所示.直方图中的a= ,在这些购物者中,平均消费金额约为 万元.(同一组中的数据用该组区间的中点值作代表) 因此平均消费金额约为0.35×0.15+0.45×0.25+0.55×0.3+0.65×0.2+0.75×0.08+0.85×0.02=0.537(万元).9.(14分)课外阅读有很多好处,可以帮助提高阅读能力、拓展知识面、提高思维能力、提高情感素养和提高人际交往能力.某校为了解学生课外阅读的情况,随机统计了n名学生的一个学期课外阅读时长(单位:h),所得数据都在[50,150]内,将所得的数据分成4组:[50,75),[75,100),[100,125),[125,150],得到如图所示的频率分布直方图,现知道课外阅读时长在[125,150]内的有80人.(1)求n和a的值;(2)估计该校学生一个学期课外阅读时长的平均数(同一组中的数据用该组区间的中点值作代表);(3)估计所得数据的中位数.所以n==400,再由频率分布直方图可知,(0.004+0.008+0.012+a)×25=1,解得a=0.016.(2)估计该校学生一个学期课外阅读时长的平均数为62.5×0.1+87.5×0.3+112.5×0.4+137.5×0.2=105.(3)显然中位数位于[100,125)内,设中位数为x,则0.1+0.3+(x-100)×0.016=0.5,解得x=106.25.所以所得数据的中位数估计值为106.25.10.一组数据1,3,7,9,m(m>0)的中位数不小于平均数,则m的取值范围为( )[A] [5,7] [B] [5,15][C] [7,15] [D] [5,20]11.(15分)治理沙漠离不开优质的树苗,现从苗圃中随机地抽测了200株树苗的高度(单位:cm),得到以下频率分布直方图(每组为左闭右开的区间,同一组中的数据用该组区间的中点值作代表).(1)求直方图中a的值和中位数的估计值.(2)若树高185 cm及以上是可以移栽的合格树苗.从样本中按比例分配的分层随机抽样的方法抽取40株树苗做进一步研究,则不合格树苗、合格树苗分别应抽取多少株 设中位数为x,因为(0.001 5+0.011 0+0.022 5)×10=0.35<0.5,(0.001 5+0.011 0+0.022 5+0.030 0)×10=0.65>0.5,所以185≤x<195,所以(0.001 5+0.011 0+0.022 5)×10+0.030 0(x-185)=0.5,解得x=190,即中位数约为190.(2)由题意得,不合格的抽取40×0.35=14(株),合格的抽取40×0.65=26(株),故不合格树苗、合格树苗分别应抽取14株和26株.(共34张PPT)9.2.3 总体集中趋势的估计1.会求样本数据的众数、中位数、平均数.2.理解用样本的数字特征、频率分布直方图估计总体的集中趋势.【课程标准要求】必备知识·归纳落实知识点一 平均数、中位数、众数的概念及比较1.平均数、中位数、众数的概念xn+1众数:一组数据中,某个数据出现的次数称为这个数据的 ,出现的的数据称为这组数据的众数.频数次数最多2.平均数、中位数和众数的比较名称 优点 缺点平均数 平均数与每一个数据有关,对数据有“取齐”的作用,代表了一组数据的数值平均水平 样本平均数与每一个样本数据有关,样本中的任何一个数据的改变都会引起平均数的改变.对极端值更加敏感,因此一般的比赛记分中,常去掉“最高分”与“最低分”中位数 中位数仅与数据的排列位置有关.某些数据的改变对中位数没有影响,不受少数极端数据的影响,中位数只有唯一一个 对极端值不敏感众数 众数反映各数据出现的频率,其大小只与这组数据中的部分数据有关,它是样本数据的最大集中点 一组数据的众数可能有一个,也可能有多个,若数据中有两个或两个以上出现得最多,且出现次数一样多,则这些数据都是众数·温馨提示·众数、中位数、平均数的意义(1)样本的众数、中位数和平均数常用来表示样本数据的“中心值”,其中众数和中位数容易计算,不受少数几个极端值的影响,但只能表达样本数据中的少量信息,平均数代表了数据更多的信息,但受样本中每个数据的影响,越极端的数据对平均数的影响越大.(2)当一组数据中有不少数据重复出现时,其众数往往更能反映问题,当一组数据中个别数据较大时,可用中位数描述其集中趋势.知识点二 中位数、平均数与频率分布直方图的关系一般来说,对一个单峰的频率分布直方图来说,如果直方图的形状是对称的(图①),那么平均数和中位数应该大体上差不多;如果直方图在右边“拖尾”(图②),那么平均数大于中位数;如果直方图在左边“拖尾”(图③),那么平均数小于中位数.也就是说,和中位数相比,平均数总是在“长尾巴”那边.『知识拓展』在频率分布直方图中平均数、中位数、众数的估计值(1)平均数:在频率分布直方图中,样本平均数可以用每个小矩形底边中点的横坐标与小矩形的面积的乘积之和近似代替.(2)中位数:在频率分布直方图中,中位数左边和右边的直方图的面积应该相等.(3)众数:众数是最高小矩形底边的中点所对应的横坐标.基础自测1.一组数据为1,3,5,7,9,11,13,15,则该组数据的中位数是( )[A] 6 [B] 7[C] 8 [D] 9C2.一组数据为26,32,7,13,42,114,则该组数据的平均数为( )[A] 36 [B] 39 [C] 40 [D] 41B3.众数、平均数、中位数都描述了数据的集中趋势,它们的大小关系和数据分布的形态有关.在如图所示的分布形态中,平均数、众数和中位数的大小关系是( )[A] 众数<中位数<平均数[B] 平均数<众数<中位数[C] 中位数<平均数<众数[D] 众数<平均数<中位数A【解析】 众数是最高矩形底边中点的横坐标,因此众数在直方图第二组的中点处.因为直方图第二、第三组所占数据较多,且在右边“拖尾”,所以平均数大于中位数,中位数在第三组的位置,因此有众数<中位数<平均数.故选A.4.(人教A版必修第二册P209练习T3改编)在一些比赛中,对评委打分的处理方法一般是去掉一个最高分和一个最低分,然后计算余下评分的平均数作为参赛者的得分.在一次有9名评委参加的赛事中,评委对一名参赛者所打的9个分数,去掉一个最高分和一个最低分后,一定不变的数字特征为( )[A] 平均数 [B] 中位数[C] 众数 [D] 极差B关键能力·素养培优题型一 样本数据的平均数、中位数、众数[例1] 某小区广场上有甲、乙两群市民,两群市民的年龄(单位:岁)如下.甲群:13,13,14,15,15,15,15,16,17,17.乙群:54,3,4,4,5,6,6,6,6,56.(1)甲群市民年龄的平均数、中位数和众数各是多少 其中哪个统计量能较好地反映甲群市民的年龄特征 (2)乙群市民年龄的平均数、中位数和众数各是多少 其中哪个统计量能较好地反映乙群市民的年龄特征 [变式训练] 如果将一组数据5,4,6,5,4,13,5依次重复写10次,会得到70个数组成的一组新数据,关于这组新数据的中位数、众数和平均数,下列说法正确的是( )[A] 中位数和众数都是5[B] 众数是10[C] 中位数是4[D] 中位数和平均数都是5A[例2] (人教B版必修第二册P84例2)某市为了制定合理的节水方案,对家庭用水情况进行了调查,通过抽样,获得了某年100个家庭的月均用水量(单位:t),将数据按照[0,1),[1,2),[2,3),[3,4),[4,5]分成5组,制成了如图所示的频率分布直方图.题型二 由频率分布直方图求平均数、中位数、众数(1)求图中a的值;【解】 (1)因为频率分布直方图所有矩形的面积之和为1,所以(0.12+0.22+0.36+a+0.12)×1=1,解得a=0.18.(2)设该市有10万个家庭,估计全市月均用水量不低于3 t的家庭数;【解】 (2)抽取的样本中,月均用水量不低于3 t的家庭所占比例为(a+0.12)×1=0.3=30%,因此估计全市月均用水量不低于3 t的家庭所占比例也为30%,所求家庭数为100 000×30%=30 000.(3)假设同组中的每个数据都用该组区间的中点值代替,估计全市家庭月均用水量的平均数.【解】 (3)因为0.12×0.5+0.22×1.5+0.36×2.5+0.18×3.5+0.12×4.5=2.46,所以估计全市家庭月均用水量的平均数为2.46.[变式训练] 一批乒乓球,随机抽取100个进行检查,乒乓球的直径频率分布直方图如图,试估计这个样本的众数、中位数和平均数(每组为左闭右开的区间,同一组中的数据用该组区间的中点值作代表).[例3] 某公司销售部有销售人员15人,销售部为了制定某种商品的月销售定额,统计了这15人某月的销售量如下表:题型三 对实际问题的决策销售量/件 1 800 510 250 210 150 120人数 1 1 3 5 3 2(1)求这15名销售人员该月销售量的平均数、中位数及众数;(2)假设销售部负责人把每名销售人员的月销售量定为320件,你认为是否合理,为什么 如果不合理,请你制定一个较为合理的销售定额.【解】 (2)不合理.因为15人中有13人的销售量不到320件,320件虽是所给一组数据的平均数,它却不能很好地反映销售人员的一般水平.销售量定为210件合适些,因为210件既是中位数,又是众数,且是大部分人能达到的销售定额.·解题策略·平均数反映出样本数据的较多信息,对样本中的极端值更加敏感.平均数、中位数和众数都是刻画“中心位置”的量,从不同的角度刻画了一组数据的集中趋势.[变式训练] 某校甲班、乙班各有49名学生,两班在一次音乐素养测试中的成绩(满分100分)统计如下表:班级 平均分 众数 中位数甲班 79 70 87乙班 79 70 79(1)请你对下面的一段话给予简要分析.甲班的小刚回家对妈妈说:“昨天的音乐素养测试,全班平均79分,得70分的人最多,我得了85分,在班里算是上游了!”【解】 (1)由中位数可知,85分排在第25名之后,从名次上讲,85分不算是上游,但也不能单以名次来判断学习成绩的好坏,小刚得了85分,说明他对这阶段的学习内容掌握较好.(2)请你根据表中数据,对这两个班的测试情况进行简要分析,并提出教学建议.【解】 (2)甲班学生成绩的中位数为87分,说明高于或等于87分的学生占一半以上,而平均分为79分,说明两极分化严重,建议对学习有困难的学生多给一些帮助;乙班学生成绩的中位数和平均分均为79分,说明学生成绩之间差别较小,成绩很差的学生少,但成绩优异的学生也很少,建议采取措施提高优秀率.感谢观看 展开更多...... 收起↑ 资源列表 第九章 9.2 9.2.3 总体集中趋势的估计 - 学生版.docx 第九章 9.2 9.2.3 总体集中趋势的估计.docx 第九章 9.2 9.2.3 总体集中趋势的估计.pptx