资源简介 9.2.2 总体百分位数的估计【课程标准要求】 1.结合实例,能用样本估计百分位数.2.理解百分位数的统计含义.知识点 百分位数1.第p百分位数一般地,一组数据的第p百分位数是这样一个值,它使得这组数据中至少有p%的数据小于或等于这个值,且至少有(100-p)%的数据大于或等于这个值.2.常用的百分位数(1)四分位数:第25百分位数,第50百分位数,第75百分位数,这三个分位数把一组由小到大排列后的数据分成四等份,因此称为四分位数.其中,第25百分位数也称为第一四分位数或下四分位数,第75百分位数也称为第三四分位数或上四分位数.第50百分位数也称中位数.(2)其他常用的百分位数:第1百分位数,第5百分位数,第95百分位数,第99百分位数.3.计算一组n个数据的第p百分位数的一般步骤第1步,按从小到大排列原始数据;第2步,计算i=n×p%;第3步,若i不是整数,而大于i的比邻整数为j,则第p百分位数为第j项数据;若i是整数,则第p百分位数为第i项与第(i+1)项数据的平均数.百分位数的特点(1)第0百分位数为数据组中的最小数,第100百分位数为数据组中的最大数.(2)一组数据的百分位数既可能是这组数据中的数,也可能不是.(3)一组数据的某些百分位数可能是同一个数.基础自测1.一组数据按从小到大的顺序排列为1,2,4,4,5,8,则该组数据的70%分位数是( )[A] 4 [B] 5 [C] 6 [D] 6.52.某校高三年级一共有1 200名同学参加数学测验,已知所有学生成绩的第80百分位数是103分,则数学成绩不小于103分的人数至少为( )[A] 220 [B] 240[C] 250 [D] 3003.一组数据为6,47,49,15,42,41,7,39,43,40,36,且这组数据的一个四分位数是15,则它是( )[A] 第15百分位数 [B] 第25百分位数[C] 第50百分位数 [D] 第75百分位数故选B.4.(人教A版必修第二册P204练习T3改编)如图所示是一个样本容量为100的频率分布直方图,则由图形中的数据,可知其第60百分位数为 . 则0.1×(x-10)=0.6-0.2,解得x=14.题型一 百分位数的理解与求法[例1] 某校高一年级18个班参加艺术节合唱比赛,通过简单随机抽样,获得了10个班的比赛得分如下:91,89,90,92,94,87,93,96,91,85,则这组数据的80%分位数为( )[A] 93 [B] 93.5 [C] 94 [D] 94.5求百分位数的注意事项(1)求百分位数时,一定要将数据按照从小到大的顺序排列.(2)计算i=n×p%后要弄清i是整数还是非整数.[变式训练] 某地区为了解最近11天该地区的空气质量,调查了该地区过去11天小颗粒物的浓度(单位:μg/m3),数据依次为53,56,69,70,72,79,65,80,45,41,m(m>50).已知这组数据的极差为40,则这组数据的第m百分位数为 . 故这组数据的第m百分位数为第九个数据79.题型二 根据频率分布直方图估计样本数据的第p百分位数[例2] 为更好地提升旅游品质,随机选择100名游客对某景区进行满意度评分(满分100分),根据评分,制成如图所示的频率分布直方图.(1)根据频率分布直方图,求x的值;(2)估计这100名游客对景区满意度评分的70%分位数.(2)根据频率分布直方图可知,10×(0.005+0.01+0.015+0.03)=0.6<0.7,0.7<10×(0.005+0.01+0.015+0.03+0.04)=1,所以70%分位数在区间[90,100]内,令其为m,则0.6+0.04×(m-90)=0.7,解得m=92.5,所以满意度评分的70%分位数为92.5.根据频率分布直方图计算样本数据的百分位数,首先要理解频率分布直方图中各组数据频率的计算方法,其次估计百分位数在哪一组,再应用方程的思想方法或比例法求解.[变式训练] 某中学举行电脑知识竞赛,现将高一参赛学生的成绩进行整理后分成五组绘制成如图所示的频率分布直方图.估计参赛学生成绩的25%,90%分位数.成绩在60分以下的学生所占比例为30%>25%,所以25%分位数一定位于[50,60)内.由50+10×≈58.3,可以估计参赛学生的成绩的25%分位数为58.3;成绩在80分以下的学生所占比例为30%+40%+15%=85%<90%,成绩在90分以下的学生所占比例为30%+40%+15%+10%=95%>90%,所以90%分位数一定位于[80,90)内.由80+10×=85,可以估计参赛学生的成绩的90%分位数为85.综上,估计参赛学生的成绩的25%,90%分位数分别为58.3,85.(分值:95分)单选每题5分,多选每题6分.1.15%分位数的含义是( )[A] 总体中任何一个数小于它的可能性是15%[B] 总体中任何一个数小于或等于它的可能性至少是15%[C] 总体中任何一个数大于它的可能性是15%[D] 总体中任何一个数大于或等于它的可能性是15%2.下面是一组学生某次跳绳活动课半分钟跳绳次数的数据:89,112,115,96,88,94,77,104,108,则这组数据的第65百分位数为( )[A] 96 [B] 104 [C] 106 [D] 108因为9×65%=5.85,所以第65百分位数为第6个数据104.故选B.3.在25个互不相等的数据中,记上四分位数为a,中位数为b,第75百分位数为c,则( )[A] a[C] c由25个互不相等的数据,则a=c>b.故选D.4.如图是根据某市1月1日至1月10日的最低气温(单位: ℃)的情况绘制的折线图,由图可知这 10天的最低气温的第40百分位数是( )[A] 2 [B] -1 [C] -0.5 [D] -25.某中学组织高中学生参加数学知识竞赛,现从中随机抽取100名学生的成绩,绘制成的频率分布直方图如图所示,则这组样本数据的70%分位数为( )[A] 85 [B] 86 [C] 87 [D] 88所以前两组的频率和为(0.005+0.030)×10=0.35,前三组的频率和为(0.005+0.030+0.050)×10=0.85,设这组样本数据的70%分位数为x,则0.035×10+(x-80)×0.05=0.7,解得x=87.故选C.6.(多选题)下列说法正确的是( )[A] 若一组样本数据各不相等,则其第35百分位数不小于第25百分位数[B] 若一组样本数据的第20百分位数是70,则在这组数据中有20%的数据大于70[C] 若一组样本数据的第20百分位数是35,则在这组数据中至少有80%的数据大于或等于35[D] 求一组数据的百分位数,可以将该组数据杂乱无章地排列7.(5分)已知按从小到大顺序排列的两组数据,甲组:27,30,37,m,40,50;乙组:24,n,33,44,48,52.若这两组数据的第30百分位数,第50百分位数都分别对应相等,则= . 甲组:第30百分位数为30,第50百分位数为.乙组:第30百分位数为n,第50百分位数为=.由已知得n=30,=,解得m=40,所以==.8.(5分)某地开展了环境治理专项活动,活动结束后对志愿者做了一次随机抽样调查,统计整理了部分志愿者的服务时长(单位:h),得到如图所示的频率分布直方图,据此估计志愿者服务时长的第90百分位数为 . 所以4×(0.005+0.040+0.090+0.065+a)=1,解得a=0.050,而4×(0.005+0.040+0.090+0.065)=0.8,则第90百分位数在[36,40]内,设其为x,得到0.8+0.05(x-36)=0.9,解得x=38.9.(13分)某旅游网考察了一个景点附近的15家酒店,根据清洁程度、舒适程度、服务态度、位置、早餐质量等给每个酒店一个评分(满分10分),结果如下:9.0,8.8,8.7,9.1,8.2,8.5,9.7,8.9,9.5,9.8,9.2,8.9,9.6,8.6,8.9.(1)计算第25百分位数.(2)某网站计划将评分在第95百分位数以上的酒店列为优先推荐酒店.若某酒店的评分为9.6,该酒店能否被列为优先推荐酒店 又0.25×15=3.75,所以第25百分位数为第4个数据8.7.(2)0.95×15=14.25,所以第95百分位数为第15个数据9.8.所以优先推荐酒店的评分必须不小于9.8分,所以若某酒店的评分为9.6,则该酒店不能被列为优先推荐酒店.10.(14分)某营养学研究人员用随机抽样的方法获得了某高校100名女大学生平均每日摄取的热量(单位:千大卡,1千大卡=1 000千卡),这组数据的频率分布直方图如图所示.(1)试估计该校有多少比例的女大学生摄取的热量在1.80~1.90千大卡(不含1.90千大卡)范围之内;(2)已知摄取热量范围在[1.90,2.00)的数据为1.90,1.90,1.91,1.91,1.91,1.93,1.94,1.94,1.95,1.95,1.96,1.96,1.97,1.98,1.99.若1.91是这100个样本数据的第k百分位数,求正整数k的值.解得a=2.1,故比例为2.1×0.1×100%=21%,综上该校有21%的女大学生摄取的热量在此范围内.(2)在区间[1.40,1.90)内有100×0.1×(0.6+1.1+1.1+1.8+2.1)=67(个)数,所以1.91是这100个样本数据的第70,71,72个数,则第70,71个数的平均数,或第71,72个数的平均数为1.91,同时,第69,70个数的平均数,或第72,73个数的平均数皆不是1.91,因为k∈N*,所以100×k%=k为整数,所以当1.91是这100个样本数据的第k百分位数时,必有k=70或k=71,故k的值为70或71.11.现有一份由连续正整数(可重复)组成的样本,其容量为m,满足上四分位数为28,第80百分位数为30,则m的最小值为( )[A] 24 [B] 25 [C] 28 [D] 29则24×=18,24×0.8=19.2,则第18,19个数据的平均数应为28,第20个数据应为30,由x1,x2,…,xn是连续的正整数,显然不符合情况,故A错误;对于B,若样本容量的最小值为25,则25×=18.75,25×0.8=20,则第19个数据应为28,第20,21个数据的平均数为30,由x1,x2,…,xn是连续的正整数,矛盾,故B错误;对于C,若样本容量的最小值为28,则28×=21,28×0.8=22.4,则第21,22个数据的平均数为28,第23个数据应为30,由x1,x2,…,xn是连续的正整数,矛盾,故C错误;对于D,若样本容量的最小值为29,则29×=21.75,29×0.8=23.2,则第22个数据应为28,第24个数据应为30,所以第23个数据应该是29,符合题意,故D正确.故选D.12.(5分)已知一组数据1,1,2,3,m,2m,1的第60百分位数为2,其中m∈N*,则这组数据的极差为 . 当m=1时,将数据从小到大排列为1,1,1,1,2,2,3,第5个数为2,满足题意,此时极差为3-1=2,当m=2时,将数据从小到大排列为1,1,1,2,2,3,4,第5个数为2,满足题意,此时极差为4-1=3,当m≥3,m∈N*时,将数据从小到大排列为1,1,1,2,3,m,2m,第5个数为3,不满足题意,故这组数据的极差为2或3.13.(17分)某市为了鼓励市民节约用电,实行“阶梯式”电价,将该市每户居民的月用电量划分为三档:月用电量不超过200 kW·h的部分按0.5元/(kW·h)收费,超过200 kW·h但不超过400 kW·h的部分按0.8元/(kW·h)收费,超过400 kW·h的部分按1.0元/(kW·h)收费.(2)为了了解居民的用电情况,通过抽样获得了今年1月份100户居民每户的用电量,统计分析后得到如图所示的频率分布直方图.若这100户居民中,今年1月份用电费用不超过260元的占80%,求a,b的值;(3)根据(2)中求得的数据估计月用电量的75%分位数.当200当x>400时,y=0.5×200+0.8×200+1.0×(x-400)=x-140.(2)由(1)可知,当y=260时,x=400,即月用电量不超过400 kW·h的居民占80%,结合频率分布直方图可知解得a=0.001 5,b=0.002 0.(3)设75%分位数为m,因为月用电量低于300 kW·h的居民所占比例为(0.001 0+0.002 0+0.003 0)×100×100%=60%,月用电量不超过400 kW·h的居民占80%,所以75%分位数m在[300,400)内,所以0.6+(m-300)×0.002 0=0.75,解得m=375,即估计月用电量的75%分位数为375 kW·h.9.2.2 总体百分位数的估计【课程标准要求】 1.结合实例,能用样本估计百分位数.2.理解百分位数的统计含义.知识点 百分位数1.第p百分位数一般地,一组数据的第p百分位数是这样一个值,它使得这组数据中至少有p%的数据小于或等于这个值,且至少有(100-p)%的数据大于或等于这个值.2.常用的百分位数(1)四分位数:第25百分位数,第50百分位数,第75百分位数,这三个分位数把一组由小到大排列后的数据分成四等份,因此称为四分位数.其中,第25百分位数也称为第一四分位数或下四分位数,第75百分位数也称为第三四分位数或上四分位数.第50百分位数也称中位数.(2)其他常用的百分位数:第1百分位数,第5百分位数,第95百分位数,第99百分位数.3.计算一组n个数据的第p百分位数的一般步骤第1步,按从小到大排列原始数据;第2步,计算i=n×p%;第3步,若i不是整数,而大于i的比邻整数为j,则第p百分位数为第j项数据;若i是整数,则第p百分位数为第i项与第(i+1)项数据的平均数.百分位数的特点(1)第0百分位数为数据组中的最小数,第100百分位数为数据组中的最大数.(2)一组数据的百分位数既可能是这组数据中的数,也可能不是.(3)一组数据的某些百分位数可能是同一个数.基础自测1.一组数据按从小到大的顺序排列为1,2,4,4,5,8,则该组数据的70%分位数是( )[A] 4 [B] 5 [C] 6 [D] 6.5【答案】 B【解析】 因为6×70%=4.2,所以该组数据从小到大排列,第5个数即为该组数据的70%分位数,即为5.故选B.2.某校高三年级一共有1 200名同学参加数学测验,已知所有学生成绩的第80百分位数是103分,则数学成绩不小于103分的人数至少为( )[A] 220 [B] 240[C] 250 [D] 300【答案】 B【解析】 由1 200×80%=960(人),所以小于103分的学生最多有960人,所以大于或等于103分的学生有1 200-960=240(人).故选B.3.一组数据为6,47,49,15,42,41,7,39,43,40,36,且这组数据的一个四分位数是15,则它是( )[A] 第15百分位数 [B] 第25百分位数[C] 第50百分位数 [D] 第75百分位数【答案】 B【解析】 将数据由小到大排列:6,7,15,36,39,40,41,42,43,47,49,一共11项,由11×25%=2.75,得第25百分位数是15.故选B.4.(人教A版必修第二册P204练习T3改编)如图所示是一个样本容量为100的频率分布直方图,则由图形中的数据,可知其第60百分位数为 . 【答案】 14【解析】 由题图可知第一组的频率为0.04×5=0.2<0.6,前两组的频率之和为0.04×5+0.1×5=0.7>0.6,则可知其第60百分位数在[10,15)内,设为x,则0.1×(x-10)=0.6-0.2,解得x=14.题型一 百分位数的理解与求法[例1] 某校高一年级18个班参加艺术节合唱比赛,通过简单随机抽样,获得了10个班的比赛得分如下:91,89,90,92,94,87,93,96,91,85,则这组数据的80%分位数为( )[A] 93 [B] 93.5 [C] 94 [D] 94.5【答案】 B【解析】 将比赛得分从小到大重新排列:85,87,89,90,91,91,92,93,94,96,因为10×80%=8,所以这组数据的80%分位数是第8个数与第9个数的平均数,即=93.5.故选B.求百分位数的注意事项(1)求百分位数时,一定要将数据按照从小到大的顺序排列.(2)计算i=n×p%后要弄清i是整数还是非整数.[变式训练] 某地区为了解最近11天该地区的空气质量,调查了该地区过去11天小颗粒物的浓度(单位:μg/m3),数据依次为53,56,69,70,72,79,65,80,45,41,m(m>50).已知这组数据的极差为40,则这组数据的第m百分位数为 . 【答案】 79【解析】 由题意得,数据的极差为40,因为数据中最小值为41,故m应为最大值,为81,则81%×11=8.91,将数据53,56,69,70,72,79,65,80,45,41,81从小到大排列:41,45,53,56,65,69,70,72,79,80,81,故这组数据的第m百分位数为第九个数据79.题型二 根据频率分布直方图估计样本数据的第p百分位数[例2] 为更好地提升旅游品质,随机选择100名游客对某景区进行满意度评分(满分100分),根据评分,制成如图所示的频率分布直方图.(1)根据频率分布直方图,求x的值;(2)估计这100名游客对景区满意度评分的70%分位数.【解】 (1)由图可知,10×(0.005+0.01+0.015+x+0.04)=1,解得x=0.03.(2)根据频率分布直方图可知,10×(0.005+0.01+0.015+0.03)=0.6<0.7,0.7<10×(0.005+0.01+0.015+0.03+0.04)=1,所以70%分位数在区间[90,100]内,令其为m,则0.6+0.04×(m-90)=0.7,解得m=92.5,所以满意度评分的70%分位数为92.5.根据频率分布直方图计算样本数据的百分位数,首先要理解频率分布直方图中各组数据频率的计算方法,其次估计百分位数在哪一组,再应用方程的思想方法或比例法求解.[变式训练] 某中学举行电脑知识竞赛,现将高一参赛学生的成绩进行整理后分成五组绘制成如图所示的频率分布直方图.估计参赛学生成绩的25%,90%分位数.【解】 由频率分布直方图得,从左到右的第一、二、三、四、五小组的频率分别是0.30,0.40,0.15,0.10,0.05.成绩在60分以下的学生所占比例为30%>25%,所以25%分位数一定位于[50,60)内.由50+10×≈58.3,可以估计参赛学生的成绩的25%分位数为58.3;成绩在80分以下的学生所占比例为30%+40%+15%=85%<90%,成绩在90分以下的学生所占比例为30%+40%+15%+10%=95%>90%,所以90%分位数一定位于[80,90)内.由80+10×=85,可以估计参赛学生的成绩的90%分位数为85.综上,估计参赛学生的成绩的25%,90%分位数分别为58.3,85.(分值:95分)单选每题5分,多选每题6分.1.15%分位数的含义是( )[A] 总体中任何一个数小于它的可能性是15%[B] 总体中任何一个数小于或等于它的可能性至少是15%[C] 总体中任何一个数大于它的可能性是15%[D] 总体中任何一个数大于或等于它的可能性是15%【答案】 B【解析】 根据第p百分位数的定义知,15%分位数的含义是总体中任何一个数小于或等于它的可能性至少是15%.故选B.2.下面是一组学生某次跳绳活动课半分钟跳绳次数的数据:89,112,115,96,88,94,77,104,108,则这组数据的第65百分位数为( )[A] 96 [B] 104 [C] 106 [D] 108【答案】 B【解析】 将这组数据从小到大排列为77,88,89,94,96,104,108,112,115,共9个数据,因为9×65%=5.85,所以第65百分位数为第6个数据104.故选B.3.在25个互不相等的数据中,记上四分位数为a,中位数为b,第75百分位数为c,则( )[A] a[C] c【答案】 D【解析】 由题意可知,a为第75百分位数,b为第50百分位数,c为第75百分位数,由25个互不相等的数据,则a=c>b.故选D.4.如图是根据某市1月1日至1月10日的最低气温(单位: ℃)的情况绘制的折线图,由图可知这 10天的最低气温的第40百分位数是( )[A] 2 [B] -1 [C] -0.5 [D] -2【答案】 C【解析】 由题图可知,这10天的最低气温按照从小到大排列为-3,-2,-1,-1,0,0,1,2,2,2,因为共有10个数据,所以10×40%=4,则这10天的最低气温的第40百分位数是=-0.5.故选C.5.某中学组织高中学生参加数学知识竞赛,现从中随机抽取100名学生的成绩,绘制成的频率分布直方图如图所示,则这组样本数据的70%分位数为( )[A] 85 [B] 86 [C] 87 [D] 88【答案】 C【解析】 由题意可得10×(0.005+0.015+0.030+a)=1,解得a=0.05,所以前两组的频率和为(0.005+0.030)×10=0.35,前三组的频率和为(0.005+0.030+0.050)×10=0.85,设这组样本数据的70%分位数为x,则0.035×10+(x-80)×0.05=0.7,解得x=87.故选C.6.(多选题)下列说法正确的是( )[A] 若一组样本数据各不相等,则其第35百分位数不小于第25百分位数[B] 若一组样本数据的第20百分位数是70,则在这组数据中有20%的数据大于70[C] 若一组样本数据的第20百分位数是35,则在这组数据中至少有80%的数据大于或等于35[D] 求一组数据的百分位数,可以将该组数据杂乱无章地排列【答案】 AC【解析】 根据百分位数的概念,可知A,C正确;若一组样本数据的第20百分位数是70,则在这组数据中至少有20%的数据小于或等于70,B错误;对于D,求一组数据的百分位数,必须将该组数据按照从小到大的顺序排列,D错误.故选AC.7.(5分)已知按从小到大顺序排列的两组数据,甲组:27,30,37,m,40,50;乙组:24,n,33,44,48,52.若这两组数据的第30百分位数,第50百分位数都分别对应相等,则= . 【答案】【解析】 因为30%×6=1.8,50%×6=3,甲组:第30百分位数为30,第50百分位数为.乙组:第30百分位数为n,第50百分位数为=.由已知得n=30,=,解得m=40,所以==.8.(5分)某地开展了环境治理专项活动,活动结束后对志愿者做了一次随机抽样调查,统计整理了部分志愿者的服务时长(单位:h),得到如图所示的频率分布直方图,据此估计志愿者服务时长的第90百分位数为 . 【答案】 38【解析】 由题意得组距24-20=4,因为小长方形面积和为1,所以4×(0.005+0.040+0.090+0.065+a)=1,解得a=0.050,而4×(0.005+0.040+0.090+0.065)=0.8,则第90百分位数在[36,40]内,设其为x,得到0.8+0.05(x-36)=0.9,解得x=38.9.(13分)某旅游网考察了一个景点附近的15家酒店,根据清洁程度、舒适程度、服务态度、位置、早餐质量等给每个酒店一个评分(满分10分),结果如下:9.0,8.8,8.7,9.1,8.2,8.5,9.7,8.9,9.5,9.8,9.2,8.9,9.6,8.6,8.9.(1)计算第25百分位数.(2)某网站计划将评分在第95百分位数以上的酒店列为优先推荐酒店.若某酒店的评分为9.6,该酒店能否被列为优先推荐酒店 【解】 (1)15个评分从小到大的顺序为8.2,8.5,8.6,8.7,8.8,8.9,8.9,8.9,9.0,9.1,9.2,9.5,9.6,9.7,9.8.又0.25×15=3.75,所以第25百分位数为第4个数据8.7.(2)0.95×15=14.25,所以第95百分位数为第15个数据9.8.所以优先推荐酒店的评分必须不小于9.8分,所以若某酒店的评分为9.6,则该酒店不能被列为优先推荐酒店.10.(14分)某营养学研究人员用随机抽样的方法获得了某高校100名女大学生平均每日摄取的热量(单位:千大卡,1千大卡=1 000千卡),这组数据的频率分布直方图如图所示.(1)试估计该校有多少比例的女大学生摄取的热量在1.80~1.90千大卡(不含1.90千大卡)范围之内;(2)已知摄取热量范围在[1.90,2.00)的数据为1.90,1.90,1.91,1.91,1.91,1.93,1.94,1.94,1.95,1.95,1.96,1.96,1.97,1.98,1.99.若1.91是这100个样本数据的第k百分位数,求正整数k的值.【解】 (1)因为小长方形面积和为1,所以0.1×(0.6+1.1+1.1+1.8+a+1.5+0.8+0.6+0.4)=1,解得a=2.1,故比例为2.1×0.1×100%=21%,综上该校有21%的女大学生摄取的热量在此范围内.(2)在区间[1.40,1.90)内有100×0.1×(0.6+1.1+1.1+1.8+2.1)=67(个)数,所以1.91是这100个样本数据的第70,71,72个数,则第70,71个数的平均数,或第71,72个数的平均数为1.91,同时,第69,70个数的平均数,或第72,73个数的平均数皆不是1.91,因为k∈N*,所以100×k%=k为整数,所以当1.91是这100个样本数据的第k百分位数时,必有k=70或k=71,故k的值为70或71.11.现有一份由连续正整数(可重复)组成的样本,其容量为m,满足上四分位数为28,第80百分位数为30,则m的最小值为( )[A] 24 [B] 25 [C] 28 [D] 29【答案】 D【解析】 对于A,若样本容量的最小值为24,则24×=18,24×0.8=19.2,则第18,19个数据的平均数应为28,第20个数据应为30,由x1,x2,…,xn是连续的正整数,显然不符合情况,故A错误;对于B,若样本容量的最小值为25,则25×=18.75,25×0.8=20,则第19个数据应为28,第20,21个数据的平均数为30,由x1,x2,…,xn是连续的正整数,矛盾,故B错误;对于C,若样本容量的最小值为28,则28×=21,28×0.8=22.4,则第21,22个数据的平均数为28,第23个数据应为30,由x1,x2,…,xn是连续的正整数,矛盾,故C错误;对于D,若样本容量的最小值为29,则29×=21.75,29×0.8=23.2,则第22个数据应为28,第24个数据应为30,所以第23个数据应该是29,符合题意,故D正确.故选D.12.(5分)已知一组数据1,1,2,3,m,2m,1的第60百分位数为2,其中m∈N*,则这组数据的极差为 . 【答案】 2或3【解析】 因为7×60%=4.2,故第60百分位数为第5个数,当m=1时,将数据从小到大排列为1,1,1,1,2,2,3,第5个数为2,满足题意,此时极差为3-1=2,当m=2时,将数据从小到大排列为1,1,1,2,2,3,4,第5个数为2,满足题意,此时极差为4-1=3,当m≥3,m∈N*时,将数据从小到大排列为1,1,1,2,3,m,2m,第5个数为3,不满足题意,故这组数据的极差为2或3.13.(17分)某市为了鼓励市民节约用电,实行“阶梯式”电价,将该市每户居民的月用电量划分为三档:月用电量不超过200 kW·h的部分按0.5元/(kW·h)收费,超过200 kW·h但不超过400 kW·h的部分按0.8元/(kW·h)收费,超过400 kW·h的部分按1.0元/(kW·h)收费.(1)求某户居民用电费用y(单位:元)关于月用电量x(单位:kW·h)的函数解析式;(2)为了了解居民的用电情况,通过抽样获得了今年1月份100户居民每户的用电量,统计分析后得到如图所示的频率分布直方图.若这100户居民中,今年1月份用电费用不超过260元的占80%,求a,b的值;(3)根据(2)中求得的数据估计月用电量的75%分位数.【解】 (1)当0≤x≤200时,y=0.5x;当200当x>400时,y=0.5×200+0.8×200+1.0×(x-400)=x-140.所以y关于x的函数解析式为y=(2)由(1)可知,当y=260时,x=400,即月用电量不超过400 kW·h的居民占80%,结合频率分布直方图可知解得a=0.001 5,b=0.002 0.(3)设75%分位数为m,因为月用电量低于300 kW·h的居民所占比例为(0.001 0+0.002 0+0.003 0)×100×100%=60%,月用电量不超过400 kW·h的居民占80%,所以75%分位数m在[300,400)内,所以0.6+(m-300)×0.002 0=0.75,解得m=375,即估计月用电量的75%分位数为375 kW·h.(共24张PPT)9.2.2 总体百分位数的估计1.结合实例,能用样本估计百分位数.2.理解百分位数的统计含义.【课程标准要求】必备知识·归纳落实知识点 百分位数1.第p百分位数一般地,一组数据的第p百分位数是这样一个值,它使得这组数据中至少有p%的数据 这个值,且至少有 的数据 这个值.小于或等于(100-p)%大于或等于2.常用的百分位数(1)四分位数:,这三个分位数把一组由小到大排列后的数据分成四等份,因此称为四分位数.其中,第25百分位数也称为第一四分位数或下四分位数,第75百分位数也称为第三四分位数或上四分位数.第50百分位数也称中位数.(2)其他常用的百分位数:第1百分位数, ,第95百分位数,.第25百分位数,第50百分位数,第75百分位数第5百分位数第99百分位数3.计算一组n个数据的第p百分位数的一般步骤第1步,按 排列原始数据;第2步,计算i= ;第3步,若i不是整数,而大于i的比邻整数为j,则第p百分位数为 ;若i是整数,则第p百分位数为第i项与第 项数据的 .从小到大n×p%第j项数据(i+1)平均数·温馨提示·百分位数的特点(1)第0百分位数为数据组中的最小数,第100百分位数为数据组中的最大数.(2)一组数据的百分位数既可能是这组数据中的数,也可能不是.(3)一组数据的某些百分位数可能是同一个数.基础自测1.一组数据按从小到大的顺序排列为1,2,4,4,5,8,则该组数据的70%分位数是( )[A] 4 [B] 5[C] 6 [D] 6.5B【解析】 因为6×70%=4.2,所以该组数据从小到大排列,第5个数即为该组数据的70%分位数,即为5.故选B.2.某校高三年级一共有1 200名同学参加数学测验,已知所有学生成绩的第80百分位数是103分,则数学成绩不小于103分的人数至少为( )[A] 220 [B] 240[C] 250 [D] 300B【解析】 由1 200×80%=960(人),所以小于103分的学生最多有960人,所以大于或等于103分的学生有1 200-960=240(人).故选B.3.一组数据为6,47,49,15,42,41,7,39,43,40,36,且这组数据的一个四分位数是15,则它是( )[A] 第15百分位数 [B] 第25百分位数[C] 第50百分位数 [D] 第75百分位数B【解析】 将数据由小到大排列:6,7,15,36,39,40,41,42,43,47,49,一共11项,由11×25%=2.75,得第25百分位数是15.故选B.4.(人教A版必修第二册P204练习T3改编)如图所示是一个样本容量为100的频率分布直方图,则由图形中的数据,可知其第60百分位数为 . 14【解析】 由题图可知第一组的频率为0.04×5=0.2<0.6,前两组的频率之和为0.04×5+0.1×5=0.7>0.6,则可知其第60百分位数在[10,15)内,设为x,则0.1×(x-10)=0.6-0.2,解得x=14.关键能力·素养培优题型一 百分位数的理解与求法[例1] 某校高一年级18个班参加艺术节合唱比赛,通过简单随机抽样,获得了10个班的比赛得分如下:91,89,90,92,94,87,93,96,91,85,则这组数据的80%分位数为( )[A] 93 [B] 93.5[C] 94 [D] 94.5B·解题策略·求百分位数的注意事项(1)求百分位数时,一定要将数据按照从小到大的顺序排列.(2)计算i=n×p%后要弄清i是整数还是非整数.[变式训练] 某地区为了解最近11天该地区的空气质量,调查了该地区过去11天小颗粒物的浓度(单位:μg/m3),数据依次为53,56,69,70,72,79,65,80,45,41,m(m>50).已知这组数据的极差为40,则这组数据的第m百分位数为 . 79【解析】 由题意得,数据的极差为40,因为数据中最小值为41,故m应为最大值,为81,则81%×11=8.91,将数据53,56,69,70,72,79,65,80,45,41,81从小到大排列:41,45,53,56,65,69,70,72,79,80,81,故这组数据的第m百分位数为第九个数据79.[例2] 为更好地提升旅游品质,随机选择100名游客对某景区进行满意度评分(满分100分),根据评分,制成如图所示的频率分布直方图.题型二 根据频率分布直方图估计样本数据的第p百分位数(1)根据频率分布直方图,求x的值;【解】 (1)由图可知,10×(0.005+0.01+0.015+x+0.04)=1,解得x=0.03.(2)估计这100名游客对景区满意度评分的70%分位数.【解】 (2)根据频率分布直方图可知,10×(0.005+0.01+0.015+0.03)=0.6<0.7,0.7<10×(0.005+0.01+0.015+0.03+0.04)=1,所以70%分位数在区间[90,100]内,令其为m,则0.6+0.04×(m-90)=0.7,解得m=92.5,所以满意度评分的70%分位数为92.5.·解题策略·根据频率分布直方图计算样本数据的百分位数,首先要理解频率分布直方图中各组数据频率的计算方法,其次估计百分位数在哪一组,再应用方程的思想方法或比例法求解.[变式训练] 某中学举行电脑知识竞赛,现将高一参赛学生的成绩进行整理后分成五组绘制成如图所示的频率分布直方图.估计参赛学生成绩的25%,90%分位数.感谢观看 展开更多...... 收起↑ 资源列表 第九章 9.2 9.2.2 总体百分位数的估计 - 学生版.docx 第九章 9.2 9.2.2 总体百分位数的估计.docx 第九章 9.2 9.2.2 总体百分位数的估计.pptx