资源简介 6.4.3 用频率分布直方图估计总体分布核心知识目标 核心素养目标1.能根据实际问题的特点,选择频率分布直方图对数据进行可视化描述,体会使用频率分布直方图的重要性. 2.结合实例,能用样本估计总体的取值规律. 1.在学习绘制频率分布直方图的过程中,培养学生直观想象、数据分析的核心素养. 2.通过应用频率分布直方图等统计图表估计总体的取值规律,培养学生直观想象、数据分析和数学建模的核心素养.1.分析数据数据被收集后,必须从中寻找所包含的信息,以使我们通过样本估计总体.由于数据多而杂乱,我们往往无法直接从原始数据中理解它们的含义.因此,必须通过图、表、计算来分析数据,帮我们找出数据中的规律,使数据所包含的信息转化成直观的容易理解的形式.2.作频率分布直方图作频率分布直方图的步骤一般是计算极差、决定组距和组数、将数据分组、列频率分布表、画频率分布直方图.1.下列关于频率分布直方图的说法正确的是( D )A.频率分布直方图的高表示取某数的频率B.频率分布直方图的高表示该组上的个体在样本中出现的频率C.频率分布直方图的高表示取某组上的个体在样本中出现的频数与组距的比值D.频率分布直方图的高表示取该组上的个体在样本中出现的频率与组距的比值解析:要注意频率分布直方图的特点.在直方图中,纵轴(矩形的高)表示频率与组距的比值,其相应组距上的频率等于该组距上的矩形的面积.故选D.2.将容量为100的样本数据按由小到大排列分成8个小组,如表所示,但第6组被墨汁污染,则第6组的频率为( C )组号 1 2 3 4 5 6 7 8频数 10 13 14 20 13 12 9A.0.14 B.0.12 C.0.09 D.0.10解析:第6组的频数为100-(10+13+14+20+13+12+9)=9.故第6组的频率为=0.09.故选C.3.某拖拉机厂生产了400台新型农用拖拉机,出厂前测试时,这批拖拉机通过某一路段的时速的频率分布直方图如图所示,则时速在[50,70)内的拖拉机台数大约为( D )A.28 B.70C.160 D.280解析:时速在[50,70)内的拖拉机的频率为(0.03+0.04)×10=0.7,所以时速在[50,70)内的拖拉机台数大约为400×0.7=280(台).故选D.4.某班的全体学生参加英语测试,成绩的频率分布直方图如图,数据的分组依次为[20,40),[40,60),[60,80),[80,100].若低于60分的人数是15,则该班的学生人数是 . 解析:设该班人数为n,则20×(0.005+0.01)n=15,n=50.答案:50 频率分布概念的理解[例1] (1)已知样本10,8,10,8,6,13,11,10,12,7,9,8,12,9,11,12,9,10,11,10,那么频率为0.2的范围是( )A.5.5~7.5 B.7.5~9.5C.9.5~11.5 D.11.5~13.5(2)某班学生在一次数学考试中各分数段以及人数的成绩分布为[0,80),2人;[80,90),6人;[90,100),4人;[100,110),8人;[110,120),12人;[120,130),5人;[130,140),6人;[140,150],2人.那么分数在[100,130)中的频数为 ,频率为 . 解析:(1)共20个数据,频率为0.2,在此范围内的数据有4个,只有在11.5~13.5范围内有4个数据:13,12,12,12.故选D.(2)由[100,130)中的人数为8+12+5=25,得频数为25,频率为≈0.56.答案:(1)D (2)25 0.56[即时训练1-1] 一个容量为100的样本,其数据的分组与各组的频数如下:组别 [0, 10) [10, 20) [20, 30) [30, 40) [40, 50) [50, 60) [60, 70]频数 12 13 24 15 16 13 7则样本数据落在[10,40)上的频率为( )A.0.13 B.0.39C.0.52 D.0.64解析:由题意可知数据在[10,40)上的有13+24+15=52(个),所以频率为=0.52.故选C.频率概念的理解将一批数据按照要求分成若干组,各组内数据的个数,叫作该组的频数,每组的频数除以样本容量的商叫作该组的频率,频率反映每组数据在样本中所占比例的大小. 频率分布直方图的绘制[例2] 如表所示给出了在某校500名12岁男孩中,用随机抽样得出的120人的身高(单位:cm).区间 界限 [122, 126) [126, 130) [130, 134) [134, 138) [138, 142)人数 5 8 10 22 33区间 界限 [142, 146) [146, 150) [150, 154) [154, 158] —人数 20 11 6 5 —(1)列出样本频率分布表;(2)画出频率分布直方图;(3)估计身高小于134 cm的人数占总人数的百分比.解:(1)样本频率分布表如下:分组 频数 频率[122,126) 5 0.04[126,130) 8 0.07[130,134) 10 0.08[134,138) 22 0.18[138,142) 33 0.28[142,146) 20 0.17[146,150) 11 0.09[150,154) 6 0.05[154,158] 5 0.04合计 120 1.00(2)频率分布直方图如图.(3)由样本频率分布表可知,身高小于134 cm的男孩出现的频率为0.04+0.07+0.08=0.19,所以我们估计身高小于134 cm的人数占总人数的19%.[即时训练2-1] 有一容量为200的样本,数据的分组以及各组的频数如下:[-20,-15),7;[-15,-10),11;[-10,-5),15;[-5,0),40;[0,5),49;[5,10),41;[10,15),20;[15,20],17.(1)列出样本的频率分布表;(2)画出频率分布直方图和频率分布折线图;(3)求样本数据不足0的频率.解:(1)由已知数据知,频率分布表如下:分组 频数 频率[-20,-15) 7 0.035[-15,-10) 11 0.055[-10,-5) 15 0.075[-5,0) 40 0.2[0,5) 49 0.245[5,10) 41 0.205[10,15) 20 0.1[15,20] 17 0.085合计 200 1.00(2)频率分布直方图和频率分布折线图如图所示.(3)样本数据不足0的频率为0.035+0.055+0.075+0.2=0.365.绘制频率分布直方图应注意的问题(1)首先画频率分布表,画表格时数据要合理分组,组距要选取恰当,一般尽量取整,数据为30~100个左右时,应分成5~12组,在频率分布直方图中,各个小长方形的面积等于各组的频率,小长方形的高与频数成正比,各组频数之和等于样本容量,频率之和为1.(2)在绘制出频率分布表后,画频率分布直方图的关键就是确定小矩形的高.一般地,频率分布直方图中两坐标轴上的单位长度一般是不一致的,合理的定高方法是“以一个恰当的单位长度”,然后以各组的“”所占的比例来定高. 频率分布表及频率分布直方图的应用探究角度1 求频率分布直方图纵坐标中的参数[例3] 高二年级某班有50人,某次数学测验的分数在[50,100]内,现将这次数学测验的分数分成如下5个组:[50,60),[60,70),…,[90,100],绘制成如图所示的频率分布直方图,则图中的a值为( )A.0.032 B.0.16C.0.32 D.0.016解析:根据频率和为1,得2a×10=1-(0.008+0.032+0.028)×10=0.32,解得a=0.016.故选D.[即时训练3-1] 某校从高二年级学生中随机抽取60名学生,将期中考试的政治成绩(均为整数)分成六段:[40,50),[50,60),[60,70),…,[90,100]后得到如图所示的频率分布直方图,则a= . 解析:由题意可得(0.01+0.015×2+a+0.025+0.005)×10=1,解得a=0.03.答案:0.03由于频率分布直方图中的纵坐标为,因此涉及纵坐标中含参数问题,应根据频率之和为1列式求解.探究角度2 根据频率分布直方图(表)求样本数据在某一区间内的频率(数)[例4] (1)如图是样本容量为200的频率分布直方图.根据样本的频率分布直方图估计,样本数据落在(2,10)内的频数约为 . (2)一个社会调查机构就某地居民的月收入调查了 10 000人,并根据所得数据画了样本的频率分布直方图(如图).为了分析居民的收入与年龄、学历、职业等方面的关系,要从这10 000人中再用分层随机抽样方法抽出100人作进一步调查,则在[2 100,3 000)(单位:元)月收入段的人数所占的频率为 . 解析:(1)观察直方图易得数据落在(2,10)内的频率为数据落在(2,6)与(6,10)频率之和.根据频率=组距×矩形的高可得样本数据落在(2,10)内的频率约为0.02×4+0.08×4=0.4.因此频数为200×0.4=80.(2)由题意得在[2 500,3 000)(单位:元)月收入段人数所占频率为0.000 5×500=0.25.设[2 100,2 500)(单位:元)月收入段人数所占频率为x,则=,解得x=0.2,因此[2 100,3 000)(单位:元)月收入段的人数所占的频率为0.2+0.25=0.45.答案:(1)80 (2)0.45[即时训练4-1] 某校从参加高一年级期末考试的学生中抽出60名学生,将其成绩(均为整数)分成六段(单位:分):[40,50),[50,60),…,[90,100],然后画出如图所示的频率分布直方图,则分数在[60,88)的人数为 . 解析:依题意分数段在[80,88)之间的人数所占频率x满足==,解得x=0.2,因此分数段在[60,88)段的人占的频率为(0.015+0.030)×10+0.2=0.65,分数在[60,88)的人数为0.65×60=39.答案:39(1)根据频率分布直方图(表)求样本数据在某一区间内的频率就是样本数据在该区间内的各组频率的和,而求解相应的频数还要根据频率乘样本容量.(2)若所求区间包含频率分布直方图中非分组的端点,可以利用“比例法”求解.探究角度3 巧用各个矩形面积的和为1解题[例5] 在样本的频率分布直方图中,共有9个小长方形,若中间一个小长方形的面积等于其他8个小长方形面积的和的,且样本量为200,则中间一组的频数为( )A.0.2 B.0.25 C.40 D.50解析:设中间一组的频率为x,则其他8组的频率为1-x,由题意知x=(1-x),得x=,所以中间一组频数为×200=50.故选D.[即时训练5-1] 在样本的频率分布直方图中,共有9个小长方形,若中间一个小长方形的面积等于其他8个小长方形面积的和的,中间一组的频数为50,则样本量为 . 解析:设样本量为x,则=,解得x=200.答案:200由于频率分布直方图的所有矩形的面积的和为1,因此涉及各矩形面积之间的关系时,可利用此性质解题.1.如图是500名学生某次数学测试成绩(单位:分)的频率分布直方图,则这500名学生中测试成绩在区间[90,100)中的学生人数是( D )A.60 B.55 C.45 D.50解析:由频率分布直方图可得测试成绩落在[90,100)中的频率为0.01×10=0.1,所以测试成绩落在[90,100)中的人数为500×0.1=50.故选D.2.从一堆苹果中任取10个,称得它们的质量如下(单位:g):125 120 122 105 130 114 116 95 120 134则样本数据落在[114.5,124.5)内的频率为( C )A.0.2 B.0.3 C.0.4 D.0.5解析:在125,120,122,105,130,114,116,95,120,134这10个数字中,落在[114.5,124.5)内的有116,120,120,122,共4个,所以样本数据在[114.5,124.5)内的频率为=0.4.故选C.3.一组数据3,-1,0,2,x的极差为5,则x= . 解析:由x-(-1)=5,得x=4,由3-x=5,得x=-2,故x的值为4或-2.答案:4或-24.某村有农户200户,他们2021年的家庭收入经过统计整理得到如图所示的频率分布直方图.当地政策规定,若家庭收入不足1.5万元,则可以享受一定的国家扶贫政策,则该村享受国家扶贫政策的有 户. 解析:该村享受国家扶贫政策的有0.01×5×200=10(户).答案:10选题明细表知识点、方法 题号频率分布的概念 1频率分布直方图的运用 2,3,4,5,9,10统计图表 6,7,8,13,14频率分布直方图综合 11,12基础巩固1.在抽查某产品的尺寸过程中,将其尺寸分成若干个组,[a,b)是其中一组,抽查出的个体数在该组上的频率为m,该组上的频率分布直方图的高度为h,则|a-b|等于( A )A. B.m C.mh D.解析:根据频率直方图中每组上的频率直方图的高为知,=h,所以|a-b|=.故选A.2.统计某校1 000名学生的数学水平测试成绩,得到样本的频率分布直方图如图所示.若满分为100分,规定不低于60分为及格,则及格率是( D )A.20% B.25% C.60% D.80%解析:样本中及格的频率为(0.025+0.035+0.010+0.010)×10=0.8=80%,由样本估计总体,得及格率是80%.故选D.3.某学校为了调查学生在课外读物方面的支出情况,抽取了一个容量为n的样本,其频率分布直方图如图所示,其中支出在[20,40)(单位:元)的同学有34人,则n的值为( A )A.100 B.1 000 C.90 D.900解析:由题意,支出在[20,40)(单位:元)的同学有34人,由频率分布直方图可知,支出在[20,40)的同学的频率为(0.01+0.024)×10=0.34,所以n==100.故选A.4.在某次赛车中,50名参赛选手的成绩(单位:min)全部介于13到18之间(包括13和18),将比赛成绩分为五组:第一组[13,14),第二组[14,15),…,第五组[17,18],其频率分布直方图如图所示.若成绩在[13,15)内的选手可获奖,则这50名选手中获奖的人数为( A )A.11 B.15 C.35 D.39解析:由题意可得成绩在[13,15)内的频率为1-0.08-0.32-0.38=0.22,又本次赛车中,共50名参赛选手,所以这50名选手中获奖的人数为50×0.22=11.故选A.5.某校高三年级的学生参加了一次数学测试,学生的成绩全部介于60分到140分之间(满分150分),为统计学生的这次考试情况,从中随机抽取100名学生的考试成绩作为样本进行统计.将这100名学生的测试成绩的统计结果按如下方式分成八组:第一组[60,70),第二组[70,80),第三组[80,90),….如图是按上述分组方法得到的频率分布直方图的一部分,则第七组的频数为( A )A.8 B.10 C.12 D.16解析:设第七组的频率为p,p=1-(0.004+0.012+0.016+0.03+0.02+0.006+0.004)×10=0.08.故第七组的频数为100×0.08=8.故选A.6.一个频数分布表(样本量为50)不小心被损坏了一部分,只记得样本中数据在[20,60)内的频率为0.6,则估计样本在[40,50),[50,60)内的数据个数之和是 .解析:根据题意,设分布在[40,50),[50,60)内的数据个数分别为x,y.因为样本中数据在[20,60)内的频率为0.6,样本量为50,所以=0.6,解得x+y=21.即样本在[40,50),[50,60)内的数据个数之和为21.答案:21能力提升7.某高中有1 300名高一学生,1 200名高二学生,1 500名高三学生,其性别比例如图所示,则该校女生人数是( A )A.1 660 B.1 960C.2 040 D.2 340解析:由扇形图可知女生人数n=1 300×40%+1 200×45%+1 500×40%=1 660.故选A.8.将一个样本量为100的数据分组,各组的频数如下:[17,19),1;[19,21),1;[21,23),3;[23,25),3;[25,27),18;[27,29),16;[29,31),28;[31,33],30.根据样本频率分布,估计小于29的数据大约占总体的( B )A.58% B.42% C.40% D.16%解析:将一个样本量为100的数据分组,各组的频数如下:[17,19),1;[19,21),1;[21,23),3;[23,25),3;[25,27),18;[27,29),16;[29,31),28;[31,33],30.根据样本频率分布,估计小于29的数据大约占总体的百分比为×100%=42%.故选B.9.(多选题)统计某校n名学生的某次数学同步练习成绩,根据成绩分数依次分成六组:[90,100),[100,110),[110,120),[120,130),[130,140),[140,150],得到频率分布直方图如图所示,若不低于140分的人数为110,则下列说法正确的是( AC )A.m=0.031B.n=800C.100分以下的人数为60D.分数在区间[120,140)的人数占大半解析:由题意,根据频率分布直方图的性质得10(m+0.020+0.016+0.016+0.011+0.006)=1,解得m=0.031.故A正确;因为不低于140分的频率为0.011×10=0.11,所以n==1 000,故B错误;由100分以下的频率为0.006×10=0.06,所以100分以下的人数为1 000×0.06=60,故C正确;分数在区间[120,140)的人数占0.031×10+0.016×10=0.47,应该是占小半,故D错误.故选AC.10.某地区为了解小学生的身高发育情况,从某小学随机抽取100名同学,将他们的身高(单位:厘米)数据绘制成频率分布直方图(如图).若a∶b=7,由图可知,身高落在[110,130)范围内的学生人数是( D )A.35 B.24 C.46 D.65解析:因为10(a+b)=1-10×(0.010+0.020+0.030)=0.4,所以a+b=0.04,又a∶b=7,解得a=0.035,所以身高落在[110,130)内的频率为10×(0.035+0.030)=0.65,所以身高落在[110,130)范围内的学生人数为100×0.65=65.故选D.11.为了了解某校高三美术生的身体状况,抽查了部分美术生的体重(单位:kg),将所得数据整理后,作出了如图所示的频率分布直方图.已知图中从左到右的前3个小组的频率之比为1∶3∶5,第2个小组的频数为15,则前3个小组的频率之和为 ,被抽查的美术生的人数是 . 解析:设被抽查的美术生的人数为n,因为后2个小组的频率之和为(0.037 5+0.012 5)×5=0.25,所以前3个小组的频率之和为0.75.又前3个小组的频率之比为 1∶3∶5,第2个小组的频数为15,所以前3个小组的频数分别为5,15,25,所以n==60.答案:0.75 6012.随机抽取100名学生,测得他们的身高(单位:cm),按照区间[160,165),[165,170),[170,175),[175,180),[180,185]分组,得到样本身高的频率分布直方图如图所示.(1)求频率分布直方图中x的值及身高在170 cm及以上的学生人数;(2)将身高在[170,175),[175,180),[180,185]区间内的学生依次记为A,B,C三个组,用分层随机抽样的方法从这三个组中抽取6人,求这三个组分别抽取的学生人数.解:(1)由频率分布直方图可知5×(0.01+0.02+0.04+x+0.07)=1,解得x=0.06.身高在170 cm及以上的学生人数为100×(0.06×5+0.04×5+0.02×5)=60.(2)A组人数为100×0.06×5=30,B组人数为100×0.04×5=20,C组人数为100×0.02×5=10,由题意可知抽样比k==,故应从A,B,C三组中分别抽取30×=3(人),20×=2(人),10×=1(人).应用创新13.甲、乙、丙三家企业产品的成本分别为10 000,12 000,15 000,其成本构成如图所示,则关于这三家企业下列说法错误的是( C )A.成本最大的企业是丙企业B.费用支出最高的企业是丙企业C.支付工资最少的企业是乙企业D.材料成本最高的企业是丙企业解析:甲企业的成本为10 000,乙企业的成本为12 000,丙企业的成本为15 000,故成本最大的是丙企业,故A正确;甲企业费用支出为10 000×5%=500,乙企业费用支出为12 000×17%=2 040,丙企业费用支出为15 000×15%=2 250,故费用支出最高的企业是丙企业,故B正确;甲企业支付工资为10 000×35%=3 500,乙企业支付工资为12 000×30%=3 600,丙企业支付工资为15 000×25%=3 750,故甲企业支付的工资最少,故C错误;甲企业材料成本为10 000×60%=6 000,乙企业材料成本为12 000×53%=6 360,丙企业材料成本为15 000×60%=9 000,故材料成本最高的企业是丙企业,故D正确.故选C.14.(多选题)居民消费价格指数(简称CPI),是度量居民生活消费品和服务价格水平随着时间变动的相对数,综合反映居民购买的生活消费品和服务价格水平的变动情况.如图为国家统计局于2020年4月公布的2019年3月至2020年3月CPI数据同比和环比涨跌幅折线图.(注:同比=,同比涨跌幅=×100%,环比=,环比涨跌幅=×100%),则下列说法正确的是( BC )A.2019年12月与2018年12月CPI相等B.2020年3月比2019年3月CPI上涨4.3%C.2019年7月至2019年11月CPI持续增长D.2020年1月至2020年3月CPI持续下降解析:由题图可知,2019年12月比2018年12月CPI上涨4.5%,故A不正确;2020年3月比2019年3月CPI上涨4.3%,故B正确;2019年7月至2019年11月的环比均为正数,所以CPI持续增长,故C正确;2020年1月至2020年3月的环比有正有负,所以CPI有升有降,故D不正确.故选BC.21世纪教育网(www.21cnjy.com)(共35张PPT)6.4.3 用频率分布直方图估计总体分布核心知识目标 核心素养目标1.能根据实际问题的特点,选择频率分布直方图对数据进行可视化描述,体会使用频率分布直方图的重要性.2.结合实例,能用样本估计总体的取值规律. 1.在学习绘制频率分布直方图的过程中,培养学生直观想象、数据分析的核心素养.2.通过应用频率分布直方图等统计图表估计总体的取值规律,培养学生直观想象、数据分析和数学建模的核心素养.知识探究·素养启迪1.分析数据数据被收集后,必须从中寻找所包含的信息,以使我们通过样本估计总体.由于数据多而杂乱,我们往往无法直接从原始数据中理解它们的含义.因此,必须通过图、表、计算来分析数据,帮我们找出数据中的规律,使数据所包含的信息转化成直观的容易理解的形式.2.作频率分布直方图作频率分布直方图的步骤一般是计算极差、决定组距和组数、将数据分组、、画频率分布直方图.知识探究列频率分布表小试身手D1.下列关于频率分布直方图的说法正确的是( )A.频率分布直方图的高表示取某数的频率B.频率分布直方图的高表示该组上的个体在样本中出现的频率C.频率分布直方图的高表示取某组上的个体在样本中出现的频数与组距的比值D.频率分布直方图的高表示取该组上的个体在样本中出现的频率与组距的比值解析:要注意频率分布直方图的特点.在直方图中,纵轴(矩形的高)表示频率与组距的比值,其相应组距上的频率等于该组距上的矩形的面积.故选D.2.将容量为100的样本数据按由小到大排列分成8个小组,如表所示,但第6组被墨汁污染,则第6组的频率为( )C组号 1 2 3 4 5 6 7 8频数 10 13 14 20 13 12 9A.0.14 B.0.12 C.0.09 D.0.103.某拖拉机厂生产了400台新型农用拖拉机,出厂前测试时,这批拖拉机通过某一路段的时速的频率分布直方图如图所示,则时速在[50,70)内的拖拉机台数大约为( )A.28 B.70C.160 D.280D解析:时速在[50,70)内的拖拉机的频率为(0.03+0.04)×10=0.7,所以时速在[50,70)内的拖拉机台数大约为400×0.7=280(台).故选D.4.某班的全体学生参加英语测试,成绩的频率分布直方图如图,数据的分组依次为[20,40),[40,60),[60,80),[80,100].若低于60分的人数是15,则该班的学生人数是 . 解析:设该班人数为n,则20×(0.005+0.01)n=15,n=50.答案:50课堂探究·素养培育探究点一频率分布概念的理解[例1] (1)已知样本10,8,10,8,6,13,11,10,12,7,9,8,12,9,11,12,9,10,11,10,那么频率为0.2的范围是( )A.5.5~7.5 B.7.5~9.5C.9.5~11.5 D.11.5~13.5解析:(1)共20个数据,频率为0.2,在此范围内的数据有4个,只有在11.5~13.5范围内有4个数据:13,12,12,12.故选D.答案:(1)D(2)某班学生在一次数学考试中各分数段以及人数的成绩分布为[0,80),2人;[80,90),6人;[90,100),4人;[100,110),8人;[110,120),12人;[120,130),5人;[130,140),6人;[140,150],2人.那么分数在[100,130)中的频数为 ,频率为 . 答案:(2)25 0.56[即时训练1-1] 一个容量为100的样本,其数据的分组与各组的频数如下:组别 [0,10) [10,20) [20,30) [30,40) [40,50) [50,60) [60,70]频数 12 13 24 15 16 13 7则样本数据落在[10,40)上的频率为( )A.0.13 B.0.39C.0.52 D.0.64方法技巧频率概念的理解将一批数据按照要求分成若干组,各组内数据的个数,叫作该组的频数,每组的频数除以样本容量的商叫作该组的频率,频率反映每组数据在样本中所占比例的大小.探究点二频率分布直方图的绘制[例2] 如表所示给出了在某校500名12岁男孩中,用随机抽样得出的120人的身高(单位:cm).区间界限 [122,126) [126,130) [130,134) [134,138) [138,142)人数 5 8 10 22 33区间界限 [142,146) [146,150) [150,154) [154,158] —人数 20 11 6 5 —(1)列出样本频率分布表;解:(1)样本频率分布表如下:分组 频数 频率[122,126) 5 0.04[126,130) 8 0.07[130,134) 10 0.08[134,138) 22 0.18[138,142) 33 0.28[142,146) 20 0.17[146,150) 11 0.09[150,154) 6 0.05[154,158] 5 0.04合计 120 1.00[例2] 如表所示给出了在某校500名12岁男孩中,用随机抽样得出的120人的身高(单位:cm).(2)画出频率分布直方图;区间界限 [122,126) [126,130) [130,134) [134,138) [138,142)人数 5 8 10 22 33区间界限 [142,146) [146,150) [150,154) [154,158] —人数 20 11 6 5 —解:(2)频率分布直方图如图.[例2] 如表所示给出了在某校500名12岁男孩中,用随机抽样得出的120人的身高(单位:cm).(3)估计身高小于134 cm的人数占总人数的百分比.解:(3)由样本频率分布表可知,身高小于134 cm的男孩出现的频率为0.04+0.07+0.08=0.19,所以我们估计身高小于134 cm的人数占总人数的19%.区间界限 [122,126) [126,130) [130,134) [134,138) [138,142)人数 5 8 10 22 33区间界限 [142,146) [146,150) [150,154) [154,158] —人数 20 11 6 5 —[即时训练2-1] 有一容量为200的样本,数据的分组以及各组的频数如下:[-20,-15),7;[-15,-10),11;[-10,-5),15;[-5,0),40;[0,5),49;[5,10),41;[10,15),20;[15,20],17.(1)列出样本的频率分布表;解:(1)由已知数据知,频率分布表如下:分组 频数 频率[-20,-15) 7 0.035[-15,-10) 11 0.055[-10,-5) 15 0.075[-5,0) 40 0.2[0,5) 49 0.245[5,10) 41 0.205[10,15) 20 0.1[15,20] 17 0.085合计 200 1.00[即时训练2-1] 有一容量为200的样本,数据的分组以及各组的频数如下:[-20,-15),7;[-15,-10),11;[-10,-5),15;[-5,0),40;[0,5),49;[5,10),41;[10,15),20;[15,20],17.(2)画出频率分布直方图和频率分布折线图;解:(2)频率分布直方图和频率分布折线图如图所示.[即时训练2-1] 有一容量为200的样本,数据的分组以及各组的频数如下:[-20,-15),7;[-15,-10),11;[-10,-5),15;[-5,0),40;[0,5),49;[5,10),41;[10,15),20;[15,20],17.(3)求样本数据不足0的频率.解:(3)样本数据不足0的频率为0.035+0.055+0.075+0.2=0.365.方法技巧绘制频率分布直方图应注意的问题(1)首先画频率分布表,画表格时数据要合理分组,组距要选取恰当,一般尽量取整,数据为30~100个左右时,应分成5~12组,在频率分布直方图中,各个小长方形的面积等于各组的频率,小长方形的高与频数成正比,各组频数之和等于样本容量,频率之和为1.探究点三频率分布表及频率分布直方图的应用探究角度1 求频率分布直方图纵坐标中的参数[例3] 高二年级某班有50人,某次数学测验的分数在[50,100]内,现将这次数学测验的分数分成如下5个组:[50,60),[60,70),…,[90,100],绘制成如图所示的频率分布直方图,则图中的a值为( )A.0.032 B.0.16C.0.32 D.0.016解析:根据频率和为1,得2a×10=1-(0.008+0.032+0.028)×10=0.32,解得a=0.016.故选D.[即时训练3-1] 某校从高二年级学生中随机抽取60名学生,将期中考试的政治成绩(均为整数)分成六段:[40,50),[50,60),[60,70),…,[90,100]后得到如图所示的频率分布直方图,则a= . 解析:由题意可得(0.01+0.015×2+a+0.025+0.005)×10=1,解得a=0.03.答案:0.03方法技巧探究角度2 根据频率分布直方图(表)求样本数据在某一区间内的频率(数)解析:(1)观察直方图易得数据落在(2,10)内的频率为数据落在(2,6)与(6,10)频率之和.根据频率=组距×矩形的高可得样本数据落在(2,10)内的频率约为0.02×4+0.08×4=0.4.因此频数为200×0.4=80.[例4] (1)如图是样本容量为200的频率分布直方图.根据样本的频率分布直方图估计,样本数据落在(2,10)内的频数约为 . 答案:(1)80(2)一个社会调查机构就某地居民的月收入调查了 10 000人,并根据所得数据画了样本的频率分布直方图(如图).为了分析居民的收入与年龄、学历、职业等方面的关系,要从这10 000人中再用分层随机抽样方法抽出100人作进一步调查,则在[2 100,3 000)(单位:元)月收入段的人数所占的频率为 . 答案:(2)0.45[即时训练4-1] 某校从参加高一年级期末考试的学生中抽出60名学生,将其成绩(均为整数)分成六段(单位:分):[40,50),[50,60),…,[90,100],然后画出如图所示的频率分布直方图,则分数在[60,88)的人数为 . 答案:39方法技巧(1)根据频率分布直方图(表)求样本数据在某一区间内的频率就是样本数据在该区间内的各组频率的和,而求解相应的频数还要根据频率乘样本容量.(2)若所求区间包含频率分布直方图中非分组的端点,可以利用“比例法”求解.探究角度3 巧用各个矩形面积的和为1解题答案:200方法技巧由于频率分布直方图的所有矩形的面积的和为1,因此涉及各矩形面积之间的关系时,可利用此性质解题.课堂达标D1.如图是500名学生某次数学测试成绩(单位:分)的频率分布直方图,则这500名学生中测试成绩在区间[90,100)中的学生人数是( )A.60 B.55 C.45 D.50解析:由频率分布直方图可得测试成绩落在[90,100)中的频率为0.01×10=0.1,所以测试成绩落在[90,100)中的人数为500×0.1=50.故选D.2.从一堆苹果中任取10个,称得它们的质量如下(单位:g):125 120 122 105 130 114 116 95 120 134则样本数据落在[114.5,124.5)内的频率为( )A.0.2 B.0.3 C.0.4 D.0.5C解析:由x-(-1)=5,得x=4,由3-x=5,得x=-2,故x的值为4或-2.3.一组数据3,-1,0,2,x的极差为5,则x= . 答案:4或-24.某村有农户200户,他们2021年的家庭收入经过统计整理得到如图所示的频率分布直方图.当地政策规定,若家庭收入不足1.5万元,则可以享受一定的国家扶贫政策,则该村享受国家扶贫政策的有 户. 解析:该村享受国家扶贫政策的有0.01×5×200=10(户).答案:106.4.3 用频率分布直方图估计总体分布选题明细表知识点、方法 题号频率分布的概念 1频率分布直方图的运用 2,3,4,5,9,10统计图表 6,7,8,13,14频率分布直方图综合 11,12基础巩固1.在抽查某产品的尺寸过程中,将其尺寸分成若干个组,[a,b)是其中一组,抽查出的个体数在该组上的频率为m,该组上的频率分布直方图的高度为h,则|a-b|等于( A )A. B.m C.mh D.解析:根据频率直方图中每组上的频率直方图的高为知,=h,所以|a-b|=.故选A.2.统计某校1 000名学生的数学水平测试成绩,得到样本的频率分布直方图如图所示.若满分为100分,规定不低于60分为及格,则及格率是( D )A.20% B.25% C.60% D.80%解析:样本中及格的频率为(0.025+0.035+0.010+0.010)×10=0.8=80%,由样本估计总体,得及格率是80%.故选D.3.某学校为了调查学生在课外读物方面的支出情况,抽取了一个容量为n的样本,其频率分布直方图如图所示,其中支出在[20,40)(单位:元)的同学有34人,则n的值为( A )A.100 B.1 000 C.90 D.900解析:由题意,支出在[20,40)(单位:元)的同学有34人,由频率分布直方图可知,支出在[20,40)的同学的频率为(0.01+0.024)×10=0.34,所以n==100.故选A.4.在某次赛车中,50名参赛选手的成绩(单位:min)全部介于13到18之间(包括13和18),将比赛成绩分为五组:第一组[13,14),第二组[14,15),…,第五组[17,18],其频率分布直方图如图所示.若成绩在[13,15)内的选手可获奖,则这50名选手中获奖的人数为( A )A.11 B.15 C.35 D.39解析:由题意可得成绩在[13,15)内的频率为1-0.08-0.32-0.38=0.22,又本次赛车中,共50名参赛选手,所以这50名选手中获奖的人数为50×0.22=11.故选A.5.某校高三年级的学生参加了一次数学测试,学生的成绩全部介于60分到140分之间(满分150分),为统计学生的这次考试情况,从中随机抽取100名学生的考试成绩作为样本进行统计.将这100名学生的测试成绩的统计结果按如下方式分成八组:第一组[60,70),第二组[70,80),第三组[80,90),….如图是按上述分组方法得到的频率分布直方图的一部分,则第七组的频数为( A )A.8 B.10 C.12 D.16解析:设第七组的频率为p,p=1-(0.004+0.012+0.016+0.03+0.02+0.006+0.004)×10=0.08.故第七组的频数为100×0.08=8.故选A.6.一个频数分布表(样本量为50)不小心被损坏了一部分,只记得样本中数据在[20,60)内的频率为0.6,则估计样本在[40,50),[50,60)内的数据个数之和是 .解析:根据题意,设分布在[40,50),[50,60)内的数据个数分别为x,y.因为样本中数据在[20,60)内的频率为0.6,样本量为50,所以=0.6,解得x+y=21.即样本在[40,50),[50,60)内的数据个数之和为21.答案:21能力提升7.某高中有1 300名高一学生,1 200名高二学生,1 500名高三学生,其性别比例如图所示,则该校女生人数是( A )A.1 660 B.1 960C.2 040 D.2 340解析:由扇形图可知女生人数n=1 300×40%+1 200×45%+1 500×40%=1 660.故选A.8.将一个样本量为100的数据分组,各组的频数如下:[17,19),1;[19,21),1;[21,23),3;[23,25),3;[25,27),18;[27,29),16;[29,31),28;[31,33],30.根据样本频率分布,估计小于29的数据大约占总体的( B )A.58% B.42% C.40% D.16%解析:将一个样本量为100的数据分组,各组的频数如下:[17,19),1;[19,21),1;[21,23),3;[23,25),3;[25,27),18;[27,29),16;[29,31),28;[31,33],30.根据样本频率分布,估计小于29的数据大约占总体的百分比为×100%=42%.故选B.9.(多选题)统计某校n名学生的某次数学同步练习成绩,根据成绩分数依次分成六组:[90,100),[100,110),[110,120),[120,130),[130,140),[140,150],得到频率分布直方图如图所示,若不低于140分的人数为110,则下列说法正确的是( AC )A.m=0.031B.n=800C.100分以下的人数为60D.分数在区间[120,140)的人数占大半解析:由题意,根据频率分布直方图的性质得10(m+0.020+0.016+0.016+0.011+0.006)=1,解得m=0.031.故A正确;因为不低于140分的频率为0.011×10=0.11,所以n==1 000,故B错误;由100分以下的频率为0.006×10=0.06,所以100分以下的人数为1 000×0.06=60,故C正确;分数在区间[120,140)的人数占0.031×10+0.016×10=0.47,应该是占小半,故D错误.故选AC.10.某地区为了解小学生的身高发育情况,从某小学随机抽取100名同学,将他们的身高(单位:厘米)数据绘制成频率分布直方图(如图).若a∶b=7,由图可知,身高落在[110,130)范围内的学生人数是( D )A.35 B.24 C.46 D.65解析:因为10(a+b)=1-10×(0.010+0.020+0.030)=0.4,所以a+b=0.04,又a∶b=7,解得a=0.035,所以身高落在[110,130)内的频率为10×(0.035+0.030)=0.65,所以身高落在[110,130)范围内的学生人数为100×0.65=65.故选D.11.为了了解某校高三美术生的身体状况,抽查了部分美术生的体重(单位:kg),将所得数据整理后,作出了如图所示的频率分布直方图.已知图中从左到右的前3个小组的频率之比为1∶3∶5,第2个小组的频数为15,则前3个小组的频率之和为 ,被抽查的美术生的人数是 . 解析:设被抽查的美术生的人数为n,因为后2个小组的频率之和为(0.037 5+0.012 5)×5=0.25,所以前3个小组的频率之和为0.75.又前3个小组的频率之比为 1∶3∶5,第2个小组的频数为15,所以前3个小组的频数分别为5,15,25,所以n==60.答案:0.75 6012.随机抽取100名学生,测得他们的身高(单位:cm),按照区间[160,165),[165,170),[170,175),[175,180),[180,185]分组,得到样本身高的频率分布直方图如图所示.(1)求频率分布直方图中x的值及身高在170 cm及以上的学生人数;(2)将身高在[170,175),[175,180),[180,185]区间内的学生依次记为A,B,C三个组,用分层随机抽样的方法从这三个组中抽取6人,求这三个组分别抽取的学生人数.解:(1)由频率分布直方图可知5×(0.01+0.02+0.04+x+0.07)=1,解得x=0.06.身高在170 cm及以上的学生人数为100×(0.06×5+0.04×5+0.02×5)=60.(2)A组人数为100×0.06×5=30,B组人数为100×0.04×5=20,C组人数为100×0.02×5=10,由题意可知抽样比k==,故应从A,B,C三组中分别抽取30×=3(人),20×=2(人),10×=1(人).应用创新13.甲、乙、丙三家企业产品的成本分别为10 000,12 000,15 000,其成本构成如图所示,则关于这三家企业下列说法错误的是( C )A.成本最大的企业是丙企业B.费用支出最高的企业是丙企业C.支付工资最少的企业是乙企业D.材料成本最高的企业是丙企业解析:甲企业的成本为10 000,乙企业的成本为12 000,丙企业的成本为15 000,故成本最大的是丙企业,故A正确;甲企业费用支出为10 000×5%=500,乙企业费用支出为12 000×17%=2 040,丙企业费用支出为15 000×15%=2 250,故费用支出最高的企业是丙企业,故B正确;甲企业支付工资为10 000×35%=3 500,乙企业支付工资为12 000×30%=3 600,丙企业支付工资为15 000×25%=3 750,故甲企业支付的工资最少,故C错误;甲企业材料成本为10 000×60%=6 000,乙企业材料成本为12 000×53%=6 360,丙企业材料成本为15 000×60%=9 000,故材料成本最高的企业是丙企业,故D正确.故选C.14.(多选题)居民消费价格指数(简称CPI),是度量居民生活消费品和服务价格水平随着时间变动的相对数,综合反映居民购买的生活消费品和服务价格水平的变动情况.如图为国家统计局于2020年4月公布的2019年3月至2020年3月CPI数据同比和环比涨跌幅折线图.(注:同比=,同比涨跌幅=×100%,环比=,环比涨跌幅=×100%),则下列说法正确的是( BC )A.2019年12月与2018年12月CPI相等B.2020年3月比2019年3月CPI上涨4.3%C.2019年7月至2019年11月CPI持续增长D.2020年1月至2020年3月CPI持续下降解析:由题图可知,2019年12月比2018年12月CPI上涨4.5%,故A不正确;2020年3月比2019年3月CPI上涨4.3%,故B正确;2019年7月至2019年11月的环比均为正数,所以CPI持续增长,故C正确;2020年1月至2020年3月的环比有正有负,所以CPI有升有降,故D不正确.故选BC.21世纪教育网(www.21cnjy.com) 展开更多...... 收起↑ 资源列表 湘教版高中数学必修第一册第6章统计学初步6.4.3用频率分布直方图估计总体分布学案.docx 湘教版高中数学必修第一册第6章统计学初步6.4.3用频率分布直方图估计总体分布课件.ppt 湘教版高中数学必修第一册第6章统计学初步6.4.3用频率分布直方图估计总体分布课时练习含答案(教师用).docx