资源简介 (共69张PPT)14.4.3 用频率分布直方图估计总体分布14.4.4 百分位数新课程标准解读 核心素养1.结合实例,能用样本估计总体的取值规律 数据分析2.结合实例,理解百分位数的统计含义,能用样本估计百分位数 数学运算目录基础知识·重落实01典型例题·精研析02知能演练·扣课标03基础知识·重落实01课前预习 必备知识梳理某大学专业课程考试结果揭晓,根据规定,0.8%的同学需要补考.【问题】 如何确定需要补考的分数线?知识点 百分位数1. 定义:一般地,一组数据的k百分位数是这样一个值pk,它使得这组数据中至少有 的数据小于或等于pk,且至少有 的数据大于或等于pk.k百分位数也称为第k百分位数或k%分位数.如果将样本数据 ,那么k百分位数pk所处位置如图所示.k% (100-k)% 从小到大排列成一行 2. 计算一组n个数据的k百分位数的步骤通常,我们按如下方法计算有n个数据的大样本的k百分位数:第1步 将所有数值按从小到大的顺序排列;第2步 计算 ;第3步 如果结果为整数,那么k百分位数位于第 位和下一位数之间,通常取这两个位置上数值的平均数为k百分位数;第4步 如果n· 不是整数,那么将其 (即其整数部分加上1),在该位置上的数值即为k百分位数.n· n· 向上取整 3. 四分位数25,50,75这三个百分位数把一组由小到大排列后的数据分成四等份,因此称为四分位数,其中,中位数即为50百分位数,25百分位数也称为下四分位数,75百分位数也称为上四分位数.【想一想】1. 某组数据的k百分位数在此组数据中一定存在吗?为什么?提示:不一定.因为按照计算k百分位数的步骤,第2步计算所得的n· 如果是整数,则k百分位数为第n· 位和下一位数值的平均数,若第n· 位和下一位数值不相等,则k百分位数在此组数据中就不存在.2. 班级人数为50的班主任老师说“90%的同学能够考取本科院校”,这里的“90%”是百分位数吗?提示:不是.是指能够考取本科院校的同学占同学总数的百分比.1. (多选)下列表述不正确的是( )A. 第p百分位数可以有单位B. 一个总体的四分位数有4个C. 样本容量越大,第p百分位数估计总体就越准确D. 对于考试成绩的统计,若小明的成绩处在第95百分位数上,则小明得了95分√√解析: 易知A、C正确;一个总体的四分位数有3个,故B错误;第95百分位数是指把数据从小到大排序,至少有95%的数据小于或等于这个值,至少有5%的数据大于或等于这个值,故D错误.故选B、D.2. 已知100个数据的75%分位数是9.3,则下列说法正确的是( )A. 这100个数据中一定有75个数小于或等于9.3B. 把这100个数据从小到大排列后,9.3是第75个数据C. 把这100个数据从小到大排列后,9.3是第75个数据和第76个数据的平均数D. 把这100个数据从小到大排列后,9.3是第74个数据和第75个数据的平均数解析: 因为100×75%=75为整数,所以第75个数据和第76个数据的平均数为75%分位数,是9.3,故C正确.故选C.√3. (2024·南通期中)某学生8次素养测试的成绩统计如下:72,76,78,82,86,88,92,98,则该组数据的第80百分位数为 .解析:因为8× =6.4,所以该组数据的第80百分位数为第七个数92.92 典型例题·精研析02课堂互动 关键能力提升题型一 用频率分布直方图估计总体分布【例1】 某校组织了航天知识竞赛,根据该校男、女生人数比例,使用分层抽样的方法随机调查了200名学生,统计他们的成绩(单位:分),样本数据按照[40,50),[50,60),…,[90,100]进行分组,得到如图所示的频率分布直方图.(1)求a的值并估计该校学生成绩的平均数(每组数据以该组区间的中点值为代表)和中位数;解: 由10×(0.001+0.002+0.017+0.04+a+0.018)=1,得a=0.022.平均数为10×(45×0.001+55×0.002+65×0.017+75×0.04+85×0.022+95×0.018)=78.4(分).设这200名学生成绩的中位数为m,由频率分布直方图可知m∈[70,80),且(0.001+0.002+0.017)×10+0.04×(m-70)=0.5,解得m=77.5(分).估计该校学生成绩的平均数和中位数分别为78.4分,77.5分.(2)已知样本中有 的男生的成绩小于80分,成绩不小于80分的男、女生人数相等,则估计该校男生与女生的人数之比.解: 由频率分布直方图可知样本中成绩不小于80分的人数为(0.022+0.018)×10×200=80.由题意知这80人中有40人是男生,又因为成绩小于80分的男生占样本中男生人数的 ,故这40名男生占样本中所有男生人数的 ,因此样本中男生人数为120,女生人数为80,因此样本是采用分层抽样的方法得到的,故估计该校男生与女生的人数之比为120∶80=3∶2.通性通法解决与频率分布直方图有关问题的关系式(1) ×组距=频率;(2) =频率,此关系式的变形为 =样本容量,样本容量×频率=频数.【跟踪训练】 某地区的经济林共有树木8万棵,为了解经济林的生长情况,随机测量其中20棵树木的底部周长,树木的底部周长数据(单位:cm)统计如下表:分组 频数 频率 频率/组距[180,200) 1 0.05 0.002 5[200,220) 1 0.05 0.002 5[220,240) 2 0.10 0.005 0[240,260) 3 0.15 0.007 5[260,280) 4 0.20 0.010 0[280,300) 6 0.30 0.015 0[300,320) 2 0.10 0.005 0[320,340] 1 0.05 0.002 5合计 20 1 0.050 0(1)绘制频率分布直方图;解: 频率分布直方图如图所示.(2)估计这8万棵树木中底部周长不低于280 cm的有多少棵;解: 由题意得8×(0.30+0.10+0.05)=3.6(万棵),所以估计8万棵树木中底部周长不低于280 cm有3.6万棵.(3)假设同一组中的数据用该组区间的中点值代替,估计这8万棵树木底部周长的平均周长是多少?解: 由频率直方图得 =190×0.05+210×0.05+230×0.10+250×0.15+270×0.20+290×0.30+310×0.10+330×0.05=269(cm).故估计这8万棵树木底部周长的平均周长是269 cm.题型二 百分位数的计算【例2】 (链接教科书第261页例11)从某珍珠加工公司生产的产品中,任意抽取12颗珍珠,得到它们的质量(单位:g)如下:7.9,9.0,8.9,8.6,8.4,8.5,8.5,8.5,9.9,7.8,8.3,8.0.(1)求这组数据的下四分位数和上四分位数;解: 下四分位数为25百分位数,上四分位数为75百分位数,将所有数据从小到大排列,得7.8,7.9,8.0,8.3,8.4,8.5,8.5,8.5,8.6,8.9,9.0,9.9,因为共有12个数据,所以12× =3,又这组数据的第3和第4位数分别是8.0和8.3,所以这组数据的下四分位数是 =8.15;又12× =9,这组数据的第9和第10位数分别是8.6和8.9,所以这组数据的上四分位数是 =8.75.(2)求这组数据的95百分位数;解: 因为共有12个数据,所以12× =11.4,将11.4向上取整得整数12,由(1)得,从小到大排序后的数据的第12位数是9.9.所以95百分位数是第12个数据为9.9.(3)若用25、75、95百分位数把公司生产的珍珠划分为次品、合格品、优等品和特优品,依照这个样本的数据,给出该公司珍珠等级的划分标准.解: 由(1)可知样本数据的25百分位数是8.15,75百分位数为8.75,95百分位数是9.9,所以质量小于或等于8.15 g的珍珠为次品,质量大于8.15 g且小于或等于8.75 g的珍珠为合格品,质量大于8.75 g且小于等于9.9 g的珍珠为优等品,质量大于9.9 g的珍珠为特优品.通性通法计算一组n个数据的k百分位数的步骤(1)排序:将所有数值按照从小到大的顺序排列;(2)计算i:计算i=n×k%;(3)定数:若i不是整数,大于i的最小整数为j,则k百分位数为第j项数据;若i是整数,则k百分位数为第i项与第(i+1)项数据的平均数.【跟踪训练】1. 如图所示是根据某市3月1日至3月10日的最低气温(单位:℃)的情况绘制的折线统计图,由图可知这10天最低气温的80百分位数是( )A. -2 B. 0C. 1 D. 2√解析: 由折线图可知,这10天的最低气温按照从小到大的顺序排列为:-3,-2,-1,-1,0,0,1,2,2,2,因为共有10个数据,所以10×80%=8,是整数,则这10天最低气温的80百分位数是 =2.2. 数据3.2,3.4,3.8,4.2,4.3,4.5,x,6.6的65百分位数是4.5,则实数x的取值范围是( )A. [4.5,+∞) B. [4.5,6.6)C. (4.5,+∞) D. [4.5,6.6]解析: 因为8× =5.2,所以这组数据的65百分位数是第6项数据4.5,则x≥4.5,故选A.√题型三 百分位数的综合应用【例3】 某市为了鼓励市民节约用电,实行“阶梯式”电价,将该市每户居民的月用电量划分为三档,月用电量不超过200千瓦时的部分按0.5元/千瓦时收费,超过200千瓦时但不超过400千瓦时的部分按0.8元/千瓦时收费,超过400千瓦时的部分按1.0元/千瓦时收费.(1)求某户居民用电费用y(单位:元)关于月用电量x(单位:千瓦时)的函数解析式;解: 当0≤x≤200时,y=0.5x;当200<x≤400时,y=0.5×200+0.8×(x-200)=0.8x-60;当x>400时,y=0.5×200+0.8×200+1.0×(x-400)=x-140.所以y与x之间的函数解析式为y=(2)为了了解居民的用电情况,通过抽样获得了今年1月份100户居民每户的用电量,统计分析后得到如图所示的频率分布直方图.若这100户居民中,今年1月份用电费用不超过260元的占80%,求a,b的值;解: 由(1)可知,当y=260时,x=400,即用电量不超过400千瓦时的占80%,结合频率分布直方图可知 解得a=0.001 5,b=0.002 0.(3)根据(2)中求得的数据计算用电量的75百分位数.解: 设75百分位数为m,因为用电量低于300千瓦时的频率为(0.001+0.002+0.003)×100=0.6,用电量不超过400千瓦时的频率为0.8,所以75百分位数m在[300,400)内,所以0.6+(m-300)×0.002=0.75,解得m=375千瓦时,即用电量的75百分位数为375千瓦时.【母题探究】 (变设问)根据(2)中求得的数据计算用电量的15百分位数.解:设15百分位数为n,因为用电量低于100千瓦时的频率为0.001×100=0.1,用电量不超过200千瓦时的频率为0.3,所以15百分位数n在[100,200)内,所以0.1+(n-100)×0.002=0.15,解得n=125千瓦时,即用电量的15百分位数为125千瓦时.通性通法 频率分布直方图中p百分位数的求解方法(1)确定p百分位数所在的区间[a,b);(2)确定小于a和小于b的数据所占的百分比分别为fa%,fb%,则p百分位数为a+ ×(b-a).【跟踪训练】 从某校随机抽取100名学生,获取了他们一周课外阅读时间(单位:小时)的数据,整理得到数据分组及频率分布表如下:排号 分组 频数 频率1 [0,2) 6 0.062 [2,4) 8 0.083 [4,6) 17 b4 [6,8) 22 0.225 [8,10) 25 0.25排号 分组 频数 频率6 [10,12) 12 0.127 [12,14) a 0.068 [14,16) 2 0.029 [16,18] 2 0.02合计 100 1(1)求频率分布表中a,b的值;解: a=0.06×100=6,b= =0.17.(2)计算这组数据的50%分位数,并估计是否有50%的学生的阅读时间达到7.68小时.解: 阅读时间小于6小时的所占比例是0.06+0.08+0.17=0.31,阅读时间小于8小时的所占比例是0.06+0.08+0.17+0.22=0.53,所以50%分位数在[6,8)内,所以50%分位数约为6+2× ≈7.73.因为7.73>7.68,所以估计有50%的学生的阅读时间达到7.68小时.1. 有统计部门记录了某城市轨道交通1号线中的10个车站在某个时间点上车的人数,统计数据如下:70,60,60,50,60,40,40,30,30,10.则这组数据的60百分位数是( )A. 50 B. 55C. 60 D. 40解析: 将数据从小到大排序为10,30,30,40,40,50,60,60,60,70.因为数据个数为10,且10× =6,所以这组数据的60百分位数为 =55.故选B.√2. (多选)某厂10名工人在一小时内生产零件的个数分别是15,17,14,10,15,17,17,16,14,12,设该组数据的平均数为a,50百分位数为b,则有( )A. a=14.7 B. a=14C. b=15.5 D. b=15√√解析: 把该组数据按从小到大的顺序排列为10,12,14,14,15,15,16,17,17,17,其平均数a= ×(10+12+14+14+15+15+16+17+17+17)=14.7,50百分位数为b==15.故选A、D.3. 为了了解某学校学生的身体发育情况,抽查了该校100名高中男生的体重情况,根据所得数据画出样本的频率分布直方图如图所示.根据此图,估计该校2 000名高中男生中体重不小于70.5 kg的人数为 .360 解析:由题中频率分布直方图,得这100名高中男生体重不小于70.5 kg的频率是(0.04+0.035+0.015)×2=0.18,所以估计该校2 000名高中男生中体重不小于70.5 kg的频率是0.18,则估计该校2 000名高中男生中体重不小于70.5 kg的人数为2 000×0.18=360.4. 求下列数据的四分位数.13,15,12,27,22,24,28,30,31,18,19,20.解:把12个数据按从小到大的顺序排列可得:12,13,15,18,19,20,22,24,27,28,30,31,计算12× =3,12× =6,12× =9,所以数据的25百分位数为 =16.5,50百分位数为 =21,75百分位数为 =27.5.知能演练·扣课标03课后巩固 核心素养落地1. 已知有8个样本数据分别为4,7,8,11,13,15,20,22,则估计该组数据的第75百分位数为( )A. 9 B. 12C. 17.5 D. 21解析: 8×0.75=6,故该组数据的第75百分位数为第6个数和第7个数的平均数 =17.5.故选C.1234567891011121314√2. 高一年级共有1 000名学生参加物理测试,若所有学生成绩(单位:分)的第80百分位数是75,则物理成绩大于或等于75分的学生数至少有( )A. 200 B. 220C. 240 D. 260解析: 由1 000× =800,所以小于75分的学生最多有800人,所以大于或等于75分的学生至少有200人.故选A.√12345678910111213143. 某班学生体检中检查视力的结果如下表,从表中可以看出,全班视力数据的30%分位数是( )视力 0.6及 以下 0.7 0.8 0.9 1.0 1.0及以上占全班人数 的百分比 2% 5% 3% 20% 65% 5%A. 0.9 B. 1.0解析: 从表中看出,视力为0.9及以下的人数占的百分比为2%+5%+3%+20%=30%,所以全班视力数据的30%分位数为0.9.故选A.C. 0.7 D. 0.6及以下√12345678910111213144. 某商场在五一促销活动中,对5月1日9时至14时的销售额进行统计,其频率分布直方图如图所示,已知9时至10时的销售额为2.5万元,则11时到12时的销售额为( )A. 6万元 B. 8万元C. 10万元 D. 12万元√解析: 因为9时至10时的销售额为2.5万元,又9时至10时的频率为0.1,11时至12时的频率为0.4,故11时至12时的销售额为 ×0.4=10(万元).故选C.12345678910111213145. 某学习小组共有20人,在一次数学测试中,得100分的有2人,得95分的有4人,得90分的有5人,得85分的有3人,得80分的有5人,得75分的有1人,则这个学习小组成员该次数学测试成绩的第70百分位数是( )A. 82.5 B. 85C. 90 D. 92.5√解析: 根据题意,20× =14,这个学习小组成员该次数学测试成绩的第14项为90,第15项为95,故第70百分位数为 =92.5.12345678910111213146. (多选)(2024·苏州质检)某校高一(1)班某次测试数学成绩累积频数分布折线图如图所示,则下列说法正确的是( )A. 没有人的成绩在30~40分这组内B. 第50百分位数位于60~70分这组内C. 第25百分位数位于40~50分这组内D. 第75百分位数位于70~80分这组内√√√1234567891011121314解析: 由题图知没有人的成绩在30~40分这组内,故A正确;由40× =20,取第20、21项数据的平均数,所以第50百分位数位于60~70分这组内,故B正确;由40× =10,取第10、11项数据的平均数,所以第25百分位数位于40~50分这组内,故C正确;由40× =30,取第30、31项数据的平均数,所以第75百分位数位于60~70分这组内,故D不正确.故选A、B、C.12345678910111213147. 按从小到大顺序排列的9个数据:10,16,25,33,39,43,m,65,70,若这组数据的下四分位数与上四分位数的和是73,则m= .解析:对于按从小到大顺序排列的9个数据:10,16,25,33,39,43,m,65,70,因为9× =2.25,所以下四分位数为25.因为9× =6.75,所以上四分位数为m,所以25+m=73,解得m=48.48 12345678910111213148. 在共有100名学生参加的某项测试中,小张的成绩排名是第75名,小李的成绩是75百分位数,则他们两人中成绩较好的是 .解析:因为小李的成绩是75百分位数,所以约有75名学生的成绩比小李低,即小李的排名大约为第25名,因为小张的成绩排名是第75名,所以小李成绩较好.小李 12345678910111213149. 某年级120名学生在一次百米测试中,成绩全部介于13秒与18秒之间,将测试结果分成5组:[13,14),[14,15),[15,16),[16,17),[17,18],得到如图所示的频率分布直方图,如果从左到右的5个小矩形的面积之比为1∶3∶7∶6∶3,那么成绩的第70百分位数约为 秒.16.5 解析:设成绩的第70百分位数为x,因为 =0.55, =0.85,所以x∈[16,17),所以0.55+(x-16)× =0.70,解得x=16.5.123456789101112131410. (2024·盐城月考)某大学艺术专业400名学生参加某次测评,根据男女学生人数比例,使用分层抽样的方法从中随机抽取了100名学生,记录他们的分数,将数据分成7组:[20,30),[30,40),…,[80,90],并整理得到如图所示的频率分布直方图:(1)估计总体400名学生中分数小于70的人数;解: 根据频率分布直方图可知,样本中分数不小于70的频率为(0.02+0.04)×10=0.6,所以样本中分数小于70的频率为1-0.6=0.4.所以总体400名学生中分数小于70的人数约为400×0.4=160.1234567891011121314(2)已知样本中分数小于40的学生有5人,试估计总体中分数在区间[40,50)内的人数;解: 根据题意,样本中分数不小于50的频率为(0.01+0.02+0.04+0.02)×10=0.9,分数在区间[40,50)内的人数为100-100×0.9-5=5.所以总体中分数在区间[40,50)内的人数估计为400× =20.1234567891011121314(3)根据该大学规定,把15%的学生划定为不及格,利用(2)中的数据,确定本次测试的及格分数线.解: 由(2)可知,分数小于50的频率为 =0.1,分数小于60的频率为0.1+0.1=0.2,所以分数的第15百分位数在[50,60)内,由50+10× =55,则本次考试的及格分数线为55分.123456789101112131411. 某地区想实行阶梯电价,经调查发现,该地区居民用电量信息如下:分位数 50% 分位数 70% 分位数 80% 分位数 90%分位数用电量/ (kW·h) 160 176 215 230如果要求约70%的居民用电在第一阶梯内,约20%的居民用电在第二阶梯内,可确定第二阶梯电价的用电量范围为( )A. (160,176] B. (176,215]C. (176,230] D. (230,+∞)√1234567891011121314解析: ∵约70%的居民用电在第一阶梯内,约20%的居民用电在第二阶梯内,∴由表中数据可得,第二阶梯电价的用电量范围为(176,230].故选C.123456789101112131412. (多选)甲、乙两人在一次射击比赛中各射靶5次,两人成绩的条形统计图如图所示,则( )A. 甲的成绩的平均数小于乙的成绩的平均数B. 甲的成绩的平均数等于乙的成绩的平均数C. 甲的成绩的第80百分位数等于乙的成绩的第80百分位数D. 甲的成绩的极差等于乙的成绩的极差√√√1234567891011121314解析: 由题图可得, = =6, = =6,A项错误,B项正确;甲的成绩的第80百分位数是 =7.5,乙的成绩的第80百分位数是 =7.5,所以二者相等,C项正确;甲的成绩的极差为4,乙的成绩的极差也为4,D项正确.123456789101112131413. 小明班上有15名女生,其身高(单位:cm)的第25百分位数为155,后来转走了一位身高为165 cm的女生,则班上女生身高的第25百分位数 .(填“变大”“变小”或“不变”)解析:当班上有15名女生时,由15× =3.75,可知女生身高的第25百分位数是第4项数据,当转走1人,剩下14名女生时,由14× =3.5,可知女生身高的第25百分位数是第4项数据,易知转走女生的身高数据不在前4项,所以班上女生身高的第25百分位数不变.不变 123456789101112131414. 某市政府为了减少水资源的浪费,计划通过阶梯式水价制度鼓励居民节约用水,即确定一户居民月均用水量标准x(单位:t),用水量不超过x的部分按平价收费,超出x的部分按议价收费.现通过简单随机抽样获得了100户居民用户的月均用水量数据(单位:t),并将数据按照[0,4),[4,8),…,[16,20]分成5组,制成了如图所示的频率分布直方图.1234567891011121314(1)设该市共有20万居民用户,试估计全市居民用户月均用水量不高于12 t的用户数;解: 由频率分布直方图可得(a+0.06+0.11+a+0.02)×4=1,解得a=0.03.居民用户月均用水量不超过12 t的频率为(0.03+0.06+0.11)×4=0.80,所以估计全市20万居民用户中月均用水量不高于12 t的用户数为20×0.80=16(万).1234567891011121314(2)若该市政府希望使85%的居民用户月均用水量不超过标准xt,试估计x的值(精确到0.01);解: 由频率分布直方图知,居民用户月均用水量不超过12 t 的频率为0.80.月均用水量不超过16 t的频率为0.92.则85%的居民用户月均用水量不超过的标准x∈[12,16),故0.80+0.03(x-12)=0.85,解得x≈13.67,即x的值为13.67.1234567891011121314(3)假设该市最终确定三级阶梯价制如下:级差 水量基数x(单位:t) 水费价格(元/t)第一阶梯 x≤14 1.4第二阶梯 14<x≤20 2.1第三阶梯 x>20 2.8小明家上个月需支付水费共28元,试求小明家上个月的用水量.1234567891011121314解: 因为19.6=14×1.4<28<14×1.4+(20-14)×2.1=32.2.所以小明家上个月的用水量达到第二阶梯收费,未达到第三阶梯收费.设小明家上个月的用水量为m t,由28=14×1.4+(m-14)×2.1,得m=18,所以小明家上个月的用水量为18 t.1234567891011121314谢 谢 观 看!14.4.3 用频率分布直方图估计总体分布14.4.4 百分位数1.已知有8个样本数据分别为4,7,8,11,13,15,20,22,则估计该组数据的第75百分位数为( )A.9 B.12 C.17.5 D.212.高一年级共有1 000名学生参加物理测试,若所有学生成绩(单位:分)的第80百分位数是75,则物理成绩大于或等于75分的学生数至少有( )A.200 B.220C.240 D.2603.某班学生体检中检查视力的结果如下表,从表中可以看出,全班视力数据的30%分位数是( )视力 0.6及以下 0.7 0.8 0.9 1.0 1.0及以上占全班人数 的百分比 2% 5% 3% 20% 65% 5%A.0.9 B.1.0C.0.7 D.0.6及以下4.某商场在五一促销活动中,对5月1日9时至14时的销售额进行统计,其频率分布直方图如图所示,已知9时至10时的销售额为2.5万元,则11时到12时的销售额为( )A.6万元 B.8万元C.10万元 D.12万元5.某学习小组共有20人,在一次数学测试中,得100分的有2人,得95分的有4人,得90分的有5人,得85分的有3人,得80分的有5人,得75分的有1人,则这个学习小组成员该次数学测试成绩的第70百分位数是( )A.82.5 B.85C.90 D.92.56.(多选)(2024·苏州质检)某校高一(1)班某次测试数学成绩累积频数分布折线图如图所示,则下列说法正确的是( )A.没有人的成绩在30~40分这组内B.第50百分位数位于60~70分这组内C.第25百分位数位于40~50分这组内D.第75百分位数位于70~80分这组内7.按从小到大顺序排列的9个数据:10,16,25,33,39,43,m,65,70,若这组数据的下四分位数与上四分位数的和是73,则m= .8.在共有100名学生参加的某项测试中,小张的成绩排名是第75名,小李的成绩是75百分位数,则他们两人中成绩较好的是 .9.某年级120名学生在一次百米测试中,成绩全部介于13秒与18秒之间,将测试结果分成5组:[13,14),[14,15),[15,16),[16,17),[17,18],得到如图所示的频率分布直方图,如果从左到右的5个小矩形的面积之比为1∶3∶7∶6∶3,那么成绩的第70百分位数约为 秒.10.(2024·盐城月考)某大学艺术专业400名学生参加某次测评,根据男女学生人数比例,使用分层抽样的方法从中随机抽取了100名学生,记录他们的分数,将数据分成7组:[20,30),[30,40),…,[80,90],并整理得到如图所示的频率分布直方图:(1)估计总体400名学生中分数小于70的人数;(2)已知样本中分数小于40的学生有5人,试估计总体中分数在区间[40,50)内的人数;(3)根据该大学规定,把15%的学生划定为不及格,利用(2)中的数据,确定本次测试的及格分数线.11.某地区想实行阶梯电价,经调查发现,该地区居民用电量信息如下:分位数 50% 分位数 70% 分位数 80% 分位数 90% 分位数用电量/ (kW·h) 160 176 215 230如果要求约70%的居民用电在第一阶梯内,约20%的居民用电在第二阶梯内,可确定第二阶梯电价的用电量范围为( )A.(160,176] B.(176,215]C.(176,230] D.(230,+∞)12.(多选)甲、乙两人在一次射击比赛中各射靶5次,两人成绩的条形统计图如图所示,则( )A.甲的成绩的平均数小于乙的成绩的平均数B.甲的成绩的平均数等于乙的成绩的平均数C.甲的成绩的第80百分位数等于乙的成绩的第80百分位数D.甲的成绩的极差等于乙的成绩的极差13.小明班上有15名女生,其身高(单位:cm)的第25百分位数为155,后来转走了一位身高为165 cm的女生,则班上女生身高的第25百分位数 .(填“变大”“变小”或“不变”)14.某市政府为了减少水资源的浪费,计划通过阶梯式水价制度鼓励居民节约用水,即确定一户居民月均用水量标准x(单位:t),用水量不超过x的部分按平价收费,超出x的部分按议价收费.现通过简单随机抽样获得了100户居民用户的月均用水量数据(单位:t),并将数据按照[0,4),[4,8),…,[16,20]分成5组,制成了如图所示的频率分布直方图.(1)设该市共有20万居民用户,试估计全市居民用户月均用水量不高于12 t的用户数;(2)若该市政府希望使85%的居民用户月均用水量不超过标准x t,试估计x的值(精确到0.01);(3)假设该市最终确定三级阶梯价制如下:级差 水量基数x(单位:t) 水费价格(元/t)第一阶梯 x≤14 1.4第二阶梯 14<x≤20 2.1第三阶梯 x>20 2.8小明家上个月需支付水费共28元,试求小明家上个月的用水量.14.4.3 用频率分布直方图估计总体分布14.4.4 百分位数1.C 8×0.75=6,故该组数据的第75百分位数为第6个数和第7个数的平均数=17.5.故选C.2.A 由1 000×=800,所以小于75分的学生最多有800人,所以大于或等于75分的学生至少有200人.故选A.3.A 从表中看出,视力为0.9及以下的人数占的百分比为2%+5%+3%+20%=30%,所以全班视力数据的30%分位数为0.9.故选A.4.C 因为9时至10时的销售额为2.5万元,又9时至10时的频率为0.1,11时至12时的频率为0.4,故11时至12时的销售额为×0.4=10(万元).故选C.5.D 根据题意,20×=14,这个学习小组成员该次数学测试成绩的第14项为90,第15项为95,故第70百分位数为=92.5.6.ABC 由题图知没有人的成绩在30~40分这组内,故A正确;由40×=20,取第20、21项数据的平均数,所以第50百分位数位于60~70分这组内,故B正确;由40×=10,取第10、11项数据的平均数,所以第25百分位数位于40~50分这组内,故C正确;由40×=30,取第30、31项数据的平均数,所以第75百分位数位于60~70分这组内,故D不正确.故选A、B、C.7.48 解析:对于按从小到大顺序排列的9个数据:10,16,25,33,39,43,m,65,70,因为9×=2.25,所以下四分位数为25.因为9×=6.75,所以上四分位数为m,所以25+m=73,解得 m=48.8.小李 解析:因为小李的成绩是75百分位数,所以约有75名学生的成绩比小李低,即小李的排名大约为第25名,因为小张的成绩排名是第75名,所以小李成绩较好.9.16.5 解析:设成绩的第70百分位数为x,因为=0.55,=0.85,所以x∈[16,17),所以0.55+(x-16)×=0.70,解得x=16.5.10.解:(1)根据频率分布直方图可知,样本中分数不小于70的频率为(0.02+0.04)×10=0.6,所以样本中分数小于70的频率为1-0.6=0.4.所以总体400名学生中分数小于70的人数约为400×0.4=160.(2)根据题意,样本中分数不小于50的频率为(0.01+0.02+0.04+0.02)×10=0.9,分数在区间[40,50)内的人数为100-100×0.9-5=5.所以总体中分数在区间[40,50)内的人数估计为400×=20.(3)由(2)可知,分数小于50的频率为=0.1,分数小于60的频率为0.1+0.1=0.2,所以分数的第15百分位数在[50,60)内,由50+10×=55,则本次考试的及格分数线为55分.11.C ∵约70%的居民用电在第一阶梯内,约20%的居民用电在第二阶梯内,∴由表中数据可得,第二阶梯电价的用电量范围为(176,230].故选C.12.BCD 由题图可得,==6,==6,A项错误,B项正确;甲的成绩的第80百分位数是=7.5,乙的成绩的第80百分位数是=7.5,所以二者相等,C项正确;甲的成绩的极差为4,乙的成绩的极差也为4,D项正确.13.不变 解析:当班上有15名女生时,由15×=3.75,可知女生身高的第25百分位数是第4项数据,当转走1人,剩下14名女生时,由14×=3.5,可知女生身高的第25百分位数是第4项数据,易知转走女生的身高数据不在前4项,所以班上女生身高的第25百分位数不变.14.解:(1)由频率分布直方图可得(a+0.06+0.11+a+0.02)×4=1,解得a=0.03.居民用户月均用水量不超过12 t的频率为(0.03+0.06+0.11)×4=0.80,所以估计全市20万居民用户中月均用水量不高于12 t的用户数为20×0.80=16(万).(2)由频率分布直方图知,居民用户月均用水量不超过12 t 的频率为0.80.月均用水量不超过16 t的频率为0.92.则85%的居民用户月均用水量不超过的标准x∈[12,16),故0.80+0.03(x-12)=0.85,解得x≈13.67,即x的值为13.67.(3)因为19.6=14×1.4<28<14×1.4+(20-14)×2.1=32.2.所以小明家上个月的用水量达到第二阶梯收费,未达到第三阶梯收费.设小明家上个月的用水量为m t,由28=14×1.4+(m-14)×2.1,得m=18,所以小明家上个月的用水量为18 t.3 / 314.4.3 用频率分布直方图估计总体分布14.4.4 百分位数新课程标准解读 核心素养1.结合实例,能用样本估计总体的取值规律 数据分析2.结合实例,理解百分位数的统计含义,能用样本估计百分位数 数学运算 某大学专业课程考试结果揭晓,根据规定,0.8%的同学需要补考.【问题】 如何确定需要补考的分数线? 知识点 百分位数1.定义:一般地,一组数据的k百分位数是这样一个值pk,它使得这组数据中至少有 的数据小于或等于pk,且至少有 的数据大于或等于pk.k百分位数也称为第k百分位数或k%分位数.如果将样本数据 ,那么k百分位数pk所处位置如图所示.2.计算一组n个数据的k百分位数的步骤通常,我们按如下方法计算有n个数据的大样本的k百分位数:第1步 将所有数值按从小到大的顺序排列;第2步 计算 ;第3步 如果结果为整数,那么k百分位数位于第 位和下一位数之间,通常取这两个位置上数值的平均数为k百分位数;第4步 如果n·不是整数,那么将其 (即其整数部分加上1),在该位置上的数值即为k百分位数.3.四分位数25,50,75这三个百分位数把一组由小到大排列后的数据分成四等份,因此称为四分位数,其中,中位数即为50百分位数,25百分位数也称为下四分位数,75百分位数也称为上四分位数.【想一想】1.某组数据的k百分位数在此组数据中一定存在吗?为什么?2.班级人数为50的班主任老师说“90%的同学能够考取本科院校”,这里的“90%”是百分位数吗?1.(多选)下列表述不正确的是( )A.第p百分位数可以有单位B.一个总体的四分位数有4个C.样本容量越大,第p百分位数估计总体就越准确D.对于考试成绩的统计,若小明的成绩处在第95百分位数上,则小明得了95分2.已知100个数据的75%分位数是9.3,则下列说法正确的是( )A.这100个数据中一定有75个数小于或等于9.3B.把这100个数据从小到大排列后,9.3是第75个数据C.把这100个数据从小到大排列后,9.3是第75个数据和第76个数据的平均数D.把这100个数据从小到大排列后,9.3是第74个数据和第75个数据的平均数3.(2024·南通期中)某学生8次素养测试的成绩统计如下:72,76,78,82,86,88,92,98,则该组数据的第80百分位数为 .题型一 用频率分布直方图估计总体分布【例1】 某校组织了航天知识竞赛,根据该校男、女生人数比例,使用分层抽样的方法随机调查了200名学生,统计他们的成绩(单位:分),样本数据按照[40,50),[50,60),…,[90,100]进行分组,得到如图所示的频率分布直方图.(1)求a的值并估计该校学生成绩的平均数(每组数据以该组区间的中点值为代表)和中位数;(2)已知样本中有的男生的成绩小于80分,成绩不小于80分的男、女生人数相等,则估计该校男生与女生的人数之比.通性通法解决与频率分布直方图有关问题的关系式(1)×组距=频率;(2)=频率,此关系式的变形为=样本容量,样本容量×频率=频数.【跟踪训练】 某地区的经济林共有树木8万棵,为了解经济林的生长情况,随机测量其中20棵树木的底部周长,树木的底部周长数据(单位:cm)统计如下表:分组 频数 频率 频率/组距[180,200) 1 0.05 0.002 5[200,220) 1 0.05 0.002 5[220,240) 2 0.10 0.005 0[240,260) 3 0.15 0.007 5[260,280) 4 0.20 0.010 0[280,300) 6 0.30 0.015 0[300,320) 2 0.10 0.005 0[320,340] 1 0.05 0.002 5合计 20 1 0.050 0(1)绘制频率分布直方图;(2)估计这8万棵树木中底部周长不低于280 cm的有多少棵;(3)假设同一组中的数据用该组区间的中点值代替,估计这8万棵树木底部周长的平均周长是多少?题型二 百分位数的计算【例2】 (链接教科书第261页例11)从某珍珠加工公司生产的产品中,任意抽取12颗珍珠,得到它们的质量(单位:g)如下:7.9,9.0,8.9,8.6,8.4,8.5,8.5,8.5,9.9,7.8,8.3,8.0.(1)求这组数据的下四分位数和上四分位数;(2)求这组数据的95百分位数;(3)若用25、75、95百分位数把公司生产的珍珠划分为次品、合格品、优等品和特优品,依照这个样本的数据,给出该公司珍珠等级的划分标准.通性通法计算一组n个数据的k百分位数的步骤(1)排序:将所有数值按照从小到大的顺序排列;(2)计算i:计算i=n×k%;(3)定数:若i不是整数,大于i的最小整数为j,则k百分位数为第j项数据;若i是整数,则k百分位数为第i项与第(i+1)项数据的平均数.【跟踪训练】1.如图所示是根据某市3月1日至3月10日的最低气温(单位:℃)的情况绘制的折线统计图,由图可知这10天最低气温的80百分位数是( )A.-2 B.0C.1 D.22.数据3.2,3.4,3.8,4.2,4.3,4.5,x,6.6的65百分位数是4.5,则实数x的取值范围是( )A.[4.5,+∞) B.[4.5,6.6)C.(4.5,+∞) D.[4.5,6.6]题型三 百分位数的综合应用【例3】 某市为了鼓励市民节约用电,实行“阶梯式”电价,将该市每户居民的月用电量划分为三档,月用电量不超过200千瓦时的部分按0.5元/千瓦时收费,超过200千瓦时但不超过400千瓦时的部分按0.8元/千瓦时收费,超过400千瓦时的部分按1.0元/千瓦时收费.(1)求某户居民用电费用y(单位:元)关于月用电量x(单位:千瓦时)的函数解析式;(2)为了了解居民的用电情况,通过抽样获得了今年1月份100户居民每户的用电量,统计分析后得到如图所示的频率分布直方图.若这100户居民中,今年1月份用电费用不超过260元的占80%,求a,b的值;(3)根据(2)中求得的数据计算用电量的75百分位数.【母题探究】 (变设问)根据(2)中求得的数据计算用电量的15百分位数.通性通法 频率分布直方图中p百分位数的求解方法(1)确定p百分位数所在的区间[a,b);(2)确定小于a和小于b的数据所占的百分比分别为fa%,fb%,则p百分位数为a+×(b-a).【跟踪训练】 从某校随机抽取100名学生,获取了他们一周课外阅读时间(单位:小时)的数据,整理得到数据分组及频率分布表如下:排号 分组 频数 频率1 [0,2) 6 0.062 [2,4) 8 0.083 [4,6) 17 b4 [6,8) 22 0.225 [8,10) 25 0.256 [10,12) 12 0.127 [12,14) a 0.068 [14,16) 2 0.029 [16,18] 2 0.02合计 100 1(1)求频率分布表中a,b的值;(2)计算这组数据的50%分位数,并估计是否有50%的学生的阅读时间达到7.68小时.1.有统计部门记录了某城市轨道交通1号线中的10个车站在某个时间点上车的人数,统计数据如下:70,60,60,50,60,40,40,30,30,10.则这组数据的60百分位数是( )A.50 B.55C.60 D.402.(多选)某厂10名工人在一小时内生产零件的个数分别是15,17,14,10,15,17,17,16,14,12,设该组数据的平均数为a,50百分位数为b,则有( )A.a=14.7 B.a=14C.b=15.5 D.b=153.为了了解某学校学生的身体发育情况,抽查了该校100名高中男生的体重情况,根据所得数据画出样本的频率分布直方图如图所示.根据此图,估计该校2 000名高中男生中体重不小于70.5 kg的人数为 .4.求下列数据的四分位数.13,15,12,27,22,24,28,30,31,18,19,20.14.4.3 用频率分布直方图估计总体分布14.4.4 百分位数【基础知识·重落实】知识点1.k% (100-k)% 从小到大排列成一行 2.n· n· 向上取整想一想1.提示:不一定.因为按照计算k百分位数的步骤,第2步计算所得的n·如果是整数,则k百分位数为第n·位和下一位数值的平均数,若第n·位和下一位数值不相等,则k百分位数在此组数据中就不存在.2.提示:不是.是指能够考取本科院校的同学占同学总数的百分比.自我诊断1.BD 易知A、C正确;一个总体的四分位数有3个,故B错误;第95百分位数是指把数据从小到大排序,至少有95%的数据小于或等于这个值,至少有5%的数据大于或等于这个值,故D错误.故选B、D.2.C 因为100×75%=75为整数,所以第75个数据和第76个数据的平均数为75%分位数,是9.3,故C正确.故选C.3.92 解析:因为8×=6.4,所以该组数据的第80百分位数为第七个数92.【典型例题·精研析】【例1】 解:(1)由10×(0.001+0.002+0.017+0.04+a+0.018)=1,得a=0.022.平均数为10×(45×0.001+55×0.002+65×0.017+75×0.04+85×0.022+95×0.018)=78.4(分).设这200名学生成绩的中位数为m,由频率分布直方图可知m∈[70,80),且(0.001+0.002+0.017)×10+0.04×(m-70)=0.5,解得m=77.5(分).估计该校学生成绩的平均数和中位数分别为78.4分,77.5分.(2)由频率分布直方图可知样本中成绩不小于80分的人数为(0.022+0.018)×10×200=80.由题意知这80人中有40人是男生,又因为成绩小于80分的男生占样本中男生人数的,故这40名男生占样本中所有男生人数的,因此样本中男生人数为120,女生人数为80,因此样本是采用分层抽样的方法得到的,故估计该校男生与女生的人数之比为120∶80=3∶2.跟踪训练 解:(1)频率分布直方图如图所示.(2)由题意得8×(0.30+0.10+0.05)=3.6(万棵),所以估计8万棵树木中底部周长不低于280 cm有3.6万棵.(3)由频率直方图得=190×0.05+210×0.05+230×0.10+250×0.15+270×0.20+290×0.30+310×0.10+330×0.05=269(cm).故估计这8万棵树木底部周长的平均周长是269 cm.【例2】 解:(1)下四分位数为25百分位数,上四分位数为75百分位数,将所有数据从小到大排列,得7.8,7.9,8.0,8.3,8.4,8.5,8.5,8.5,8.6,8.9,9.0,9.9,因为共有12个数据,所以12×=3,又这组数据的第3和第4位数分别是8.0和8.3,所以这组数据的下四分位数是=8.15;又12×=9,这组数据的第9和第10位数分别是8.6和8.9,所以这组数据的上四分位数是=8.75.(2)因为共有12个数据,所以12×=11.4,将11.4向上取整得整数12,由(1)得,从小到大排序后的数据的第12位数是9.9.所以95百分位数是第12个数据为9.9.(3)由(1)可知样本数据的25百分位数是8.15,75百分位数为8.75,95百分位数是9.9,所以质量小于或等于8.15 g的珍珠为次品,质量大于8.15 g且小于或等于8.75 g的珍珠为合格品,质量大于8.75 g且小于等于9.9 g的珍珠为优等品,质量大于9.9 g的珍珠为特优品.跟踪训练1.D 由折线图可知,这10天的最低气温按照从小到大的顺序排列为:-3,-2,-1,-1,0,0,1,2,2,2,因为共有10个数据,所以10×80%=8,是整数,则这10天最低气温的80百分位数是=2.2.A 因为8×=5.2,所以这组数据的65百分位数是第6项数据4.5,则x≥4.5,故选A.【例3】 解:(1)当0≤x≤200时,y=0.5x;当200<x≤400时,y=0.5×200+0.8×(x-200)=0.8x-60;当x>400时,y=0.5×200+0.8×200+1.0×(x-400)=x-140.所以y与x之间的函数解析式为y=(2)由(1)可知,当y=260时,x=400,即用电量不超过400千瓦时的占80%,结合频率分布直方图可知解得a=0.001 5,b=0.002 0.(3)设75百分位数为m,因为用电量低于300千瓦时的频率为(0.001+0.002+0.003)×100=0.6,用电量不超过400千瓦时的频率为0.8,所以75百分位数m在[300,400)内,所以0.6+(m-300)×0.002=0.75,解得m=375千瓦时,即用电量的75百分位数为375千瓦时.母题探究 解:设15百分位数为n,因为用电量低于100千瓦时的频率为0.001×100=0.1,用电量不超过200千瓦时的频率为0.3,所以15百分位数n在[100,200)内,所以0.1+(n-100)×0.002=0.15,解得n=125千瓦时,即用电量的15百分位数为125千瓦时.跟踪训练 解:(1)a=0.06×100=6,b==0.17.(2)阅读时间小于6小时的所占比例是0.06+0.08+0.17=0.31,阅读时间小于8小时的所占比例是0.06+0.08+0.17+0.22=0.53,所以50%分位数在[6,8)内,所以50%分位数约为6+2×≈7.73.因为7.73>7.68,所以估计有50%的学生的阅读时间达到7.68小时.随堂检测1.B 将数据从小到大排序为10,30,30,40,40,50,60,60,60,70.因为数据个数为10,且10×=6,所以这组数据的60百分位数为=55.故选B.2.AD 把该组数据按从小到大的顺序排列为10,12,14,14,15,15,16,17,17,17,其平均数a=×(10+12+14+14+15+15+16+17+17+17)=14.7,50百分位数为b==15.故选A、D.3.360 解析:由题中频率分布直方图,得这100名高中男生体重不小于70.5 kg的频率是(0.04+0.035+0.015)×2=0.18,所以估计该校2 000名高中男生中体重不小于70.5 kg的频率是0.18,则估计该校2 000名高中男生中体重不小于70.5 kg的人数为2 000×0.18=360.4.解:把12个数据按从小到大的顺序排列可得:12,13,15,18,19,20,22,24,27,28,30,31,计算12×=3,12×=6,12×=9,所以数据的25百分位数为=16.5,50百分位数为=21,75百分位数为=27.5.4 / 5 展开更多...... 收起↑ 资源列表 14.4.3 用频率分布直方图估计总体分布 14.4.4 百分位数.pptx 14.4.3 用频率分布直方图估计总体分布14.4.4 百分位数.docx 14.4.3 用频率分布直方图估计总体分布14.4.4 百分位数(练习,含解析).docx