资源简介 9.2.2 总体百分位数的估计1.结合实例,理解百分位数的统计含义(数学抽象). 2.能用样本估计总体百分位数(数据分析、数学运算). 知识点一|百分位数的定义问题 请阅读课本第202页到第203页,思考问题2中居民用户月均用水量标准转化为数学问题具体指什么?你能制定一个具体方案吗?【知识梳理】1.第p百分位数的定义一般地,一组数据的第p百分位数是这样一个值,它使得这组数据中至少有 的数据 这个值,且至少有(100-p)%的数据大于或等于这个值.2.四分位数25%,50%,75%这三个分位数把一组由小到大排列后的数据分成四等份,因此称为 ,其中第25百分位数也称为第一四分位数或下四分位数,第75百分位数也称为第三四分位数或上四分位数. 提醒:中位数是第50百分位数.【例1】 〔多选〕下列表述正确的是( )A.第p百分位数可以有单位B.一个总体的四分位数有4个C.样本容量越大,第p百分位数估计总体就越准确D.班主任老师说“90%的同学能考取本科院校”,这里的90%是第90百分位数【规律方法】分位数是用于衡量数据的位置的度量,但它所衡量的不一定是中心位置.百分位数提供了有关数据项如何在最小值与最大值之间分布的信息.训练1 (1)15%分位数的含义是( )A.总体中任何一个数小于它的可能性是15%B.总体中任何一个数小于或等于它的可能性是15% C.总体中任何一个数大于它的可能性是15%D.总体中任何一个数大于或等于它的可能性是15%(2)已知2 026个互不相同的实数,记其上四分位数为a,中位数为b,第75百分位数为c,则( )A.a<b<c B.b<a<cC.b<a=c D.a=c<b知识点二|由样本数据求百分位数【知识梳理】计算一组n个数据的第p百分位数的步骤第1步,按 排列原始数据;第2步,计算i= ;第3步,若i不是整数,而大于i的比邻整数为j,则第p百分位数为第 项数据;若i是整数,则第p百分位数为第i项与第(i+1)项数据的 .【例2】 (链接教材P203例2、P204例3)从某珍珠公司生产的产品中,任意抽取12颗珍珠,得到它们的质量(单位:g)如下:7.9,9.0,8.9,8.6,8.4,8.5,8.5,8.5,9.9,7.8,8.3,8.0.(1)分别求出这组数据的第25,75,95百分位数;(2)请你找出珍珠质量较小的前15%的珍珠质量.【规律方法】总体百分位数估计需要注意的两个问题(1)总体百分位数估计的基础是样本百分位数的计算,因此计算准确是关键;(2)由于样本量比较少,因此对总体的估计可能存在误差,因此对总体百分位数的估计一般是估计值而非精确值.训练2 (1)某良种培育基地正在培育一种小麦新品种A,将其种植了25亩,所得亩产数据(单位:千克)如下:421,399,445,359,415,443,367,454,368,375,392,400,423,405,412,427,414,423,430,388,430,357,434,445,451,则估计该品种小麦亩产的第80百分位数为 ,第95百分位数为 ;(2)已知按从小到大顺序排列的两组数据:甲组:27,30,37,m,40,50;乙组:24,n,33,44,48,52,若这两组数据的第30百分位数、第50百分位数都分别对应相等,则= .知识点三|由统计图表估计百分位数【例3】 我国是一个严重缺水的国家,城市缺水问题较为突出.某市政府为了节约生活用水,计划在本市实行居民生活用水定额管理,即确定一个居民用水量标准m,使得86%的居民生活用水不超过这个标准.在本市居民中随机抽取了100户家庭,统计其某年的月均用水量(单位:吨),通过数据分析得到如图所示的频率分布直方图.(1)求a,m的值;(2)如果我们称m为这组数据的86%分位数,那么这组数据的50%分位数是多少?变式 根据本例中的频率分布直方图计算月均用水量的20%分位数.【规律方法】由频率分布直方图求百分位数的思路(1)确定第p百分位数所在的区间[a,b);(2)确定小于a和小于b的数据所占的百分比分别为fa%,fb%,则第p百分位数为a+×(b-a).训练3 为了了解一片经济林的生长情况,随机抽测了其中60株树木的底部周长(单位:cm),所得数据均在区间[80,130]上,其频率分布直方图如图所示,你能估计一下60株树木的第50百分位数和第75百分位数吗?1.以下数据为参加数学竞赛决赛的15人的成绩:78,70,72,86,88,79,80,81,94,84,56,98,83,90,91,则这15人成绩的第80百分位数是( )A.90 B.90.5 C.91 D.91.52.〔多选〕已知100个数据的75%分位数是9.3,则下列说法正确的是( )A.这100个数据中至少有75个数小于或等于9.3B.把这100个数据从小到大排列后,9.3是第75个数据C.把这100个数据从小到大排列后,9.3是第75个数据和第76个数据的平均数D.把这100个数据从小到大排列后,9.3是第74个数据和第75个数据的平均数3.一组样本数据的频率分布直方图如图所示,试估计此样本数据的第50百分位数为 .4.如图是某市2025年4月1日至4月7日每天最高、最低气温的折线统计图,这7天的日最高气温的10%分位数为 ,日最低气温的80%分位数为 .1.理清单 (1)百分位数的定义; (2)由样本数据求百分位数; (3)由统计图表估计百分位数. 2.应体会 由统计图表求百分位数时要注意方程思想的应用. 3.避易错 求第p百分位数时,应先将数据从小到大排列.提示:完成课后作业 第九章 9.2 9.2.21 / 19.2.2 总体百分位数的估计课标要求 情境导入1.结合实例,理解百分位数的统计含义(数学抽象). 2.能用样本估计总体百分位数(数据分析、数学运算). 某省学业水平考试结果揭晓,根据规定,0.8%的同学需要补考,如何确定需要补考的分数线,就是我们本节将要学习的内容. 知识点一|百分位数的定义问题 请阅读课本第202页到第203页,思考问题2中居民用户月均用水量标准转化为数学问题具体指什么?你能制定一个具体方案吗?提示:寻找一个数a,使全市居民用户月均用水量中不超过a的占80%,大于a的占20%.方案如下:把得到的100个样本数据按从小到大排序,得到第80个数据和第81个数据分别为13.6和13.8.可以发现,区间[13.6,13.8)内的任意一个数,都能把样本数据分成符合要求的两部分.一般地,我们取这两个数的平均数=13.7.【知识梳理】1.第p百分位数的定义一般地,一组数据的第p百分位数是这样一个值,它使得这组数据中至少有 p% 的数据 小于或等于 这个值,且至少有(100-p)%的数据大于或等于这个值.2.四分位数25%,50%,75%这三个分位数把一组由小到大排列后的数据分成四等份,因此称为 四分位数 ,其中第25百分位数也称为第一四分位数或下四分位数,第75百分位数也称为第三四分位数或上四分位数. 提醒:中位数是第50百分位数.【例1】 〔多选〕下列表述正确的是( )A.第p百分位数可以有单位B.一个总体的四分位数有4个C.样本容量越大,第p百分位数估计总体就越准确D.班主任老师说“90%的同学能考取本科院校”,这里的90%是第90百分位数解析:AC 一个总体的25%分位数,50%分位数,75%分位数是总体的四分位数,有3个,故B错误;90%是指能够考取本科院校的同学与同学总数的百分比,故D错误;A、C正确.【规律方法】分位数是用于衡量数据的位置的度量,但它所衡量的不一定是中心位置.百分位数提供了有关数据项如何在最小值与最大值之间分布的信息.训练1 (1)15%分位数的含义是( B )A.总体中任何一个数小于它的可能性是15%B.总体中任何一个数小于或等于它的可能性是15%C.总体中任何一个数大于它的可能性是15%D.总体中任何一个数大于或等于它的可能性是15%解析:(1)根据第p百分位数的定义可知B正确.(2)已知2 026个互不相同的实数,记其上四分位数为a,中位数为b,第75百分位数为c,则( C )A.a<b<c B.b<a<cC.b<a=c D.a=c<b解析:(2)根据百分位数的概念可知,将这2 026个互不相同的实数从小到大排列后,其上四分位数即为第75百分位数,故a=c,由于这2 026个互不相同的实数最中间两个数为第1 013和第1 014个数,故中位数b为这两个数的平均数,又第50百分位数也为第1 013和第1 014个数的平均数,故b等于第50百分位数,而第50百分位数小于第75百分位数,故b<a=c.知识点二|由样本数据求百分位数【知识梳理】计算一组n个数据的第p百分位数的步骤第1步,按 从小到大 排列原始数据;第2步,计算i= n×p% ;第3步,若i不是整数,而大于i的比邻整数为j,则第p百分位数为第 j 项数据;若i是整数,则第p百分位数为第i项与第(i+1)项数据的 平均数 .【例2】 (链接教材P203例2、P204例3)从某珍珠公司生产的产品中,任意抽取12颗珍珠,得到它们的质量(单位:g)如下:7.9,9.0,8.9,8.6,8.4,8.5,8.5,8.5,9.9,7.8,8.3,8.0.(1)分别求出这组数据的第25,75,95百分位数;解:(1)将所有数据从小到大排列,得7.8,7.9,8.0,8.3,8.4,8.5,8.5,8.5,8.6,8.9,9.0,9.9,因为共有12个数据,所以12×25%=3,12×75%=9,12×95%=11.4,则第25百分位数是=8.15,第75百分位数是=8.75,第95百分位数是第12个数据为9.9.(2)请你找出珍珠质量较小的前15%的珍珠质量.解:(2)因为共有12个数据,所以12×15%=1.8,则第15百分位数是第2个数据为7.9.即产品质量较小的前15%的产品有2个,它们的质量分别为7.8 g,7.9 g.【规律方法】总体百分位数估计需要注意的两个问题(1)总体百分位数估计的基础是样本百分位数的计算,因此计算准确是关键;(2)由于样本量比较少,因此对总体的估计可能存在误差,因此对总体百分位数的估计一般是估计值而非精确值.训练2 (1)某良种培育基地正在培育一种小麦新品种A,将其种植了25亩,所得亩产数据(单位:千克)如下:421,399,445,359,415,443,367,454,368,375,392,400,423,405,412,427,414,423,430,388,430,357,434,445,451,则估计该品种小麦亩产的第80百分位数为 438.5 ,第95百分位数为 451 ;解析:(1)将25个样本数据按从小到大排序,可得357,359,367,368,375,388,392,399,400,405,412,414,415,421,423,423,427,430,430,434,443,445,445,451,454.由80%×25=20,95%×25=23.75,可知样本数据的第80百分位数为438.5,第95百分位数为第24项数据,为451.(2)已知按从小到大顺序排列的两组数据:甲组:27,30,37,m,40,50;乙组:24,n,33,44,48,52,若这两组数据的第30百分位数、第50百分位数都分别对应相等,则= .解析:(2)因为30%×6=1.8,50%×6=3,甲组:第30百分位数为30,第50百分位数为,乙组:第30百分位数为n,第50百分位数为=,由题意知n=30,=,解得m=40,所以==.知识点三|由统计图表估计百分位数【例3】 我国是一个严重缺水的国家,城市缺水问题较为突出.某市政府为了节约生活用水,计划在本市实行居民生活用水定额管理,即确定一个居民用水量标准m,使得86%的居民生活用水不超过这个标准.在本市居民中随机抽取了100户家庭,统计其某年的月均用水量(单位:吨),通过数据分析得到如图所示的频率分布直方图.(1)求a,m的值;解:(1)由频率分布直方图得(0.16+0.30+0.40+0.50+0.30+0.16+a+a+a)×0.5=1,解得a=0.06.由频率分布直方图得月均用水量在[0,3)内的频率为1-(0.16+0.06+0.06)×0.5=0.86.∵计划在本市实行居民生活用水定额管理,即确定一个居民用水量标准m,使得86%的居民生活用水不超过这个标准.∴m≈3.(2)如果我们称m为这组数据的86%分位数,那么这组数据的50%分位数是多少?解:(2)由频率分布直方图知,数据在[0,2)内的频率为(0.06+0.16+0.30+0.40)×0.5=0.46,在[2,2.5)内的频率为0.50×0.5=0.25,∴这组数据的50%分位数是2+×0.5=2.08(吨).变式 根据本例中的频率分布直方图计算月均用水量的20%分位数.解:由例3的频率分布直方图可知,月均用水量在[0,1)内的频率为(0.06+0.16)×0.5=0.11,在[1,1.5)内的频率为0.30×0.5=0.15.所以月均用水量的20%分位数应在[1,1.5)内,设月均用水量的20%分位数为x,则0.11+(x-1)×0.30=0.20,解得x=1.3.所以月均用水量的20%分位数为1.3(吨).【规律方法】由频率分布直方图求百分位数的思路(1)确定第p百分位数所在的区间[a,b);(2)确定小于a和小于b的数据所占的百分比分别为fa%,fb%,则第p百分位数为a+×(b-a).训练3 为了了解一片经济林的生长情况,随机抽测了其中60株树木的底部周长(单位:cm),所得数据均在区间[80,130]上,其频率分布直方图如图所示,你能估计一下60株树木的第50百分位数和第75百分位数吗?解:由题意知在[80,100)上的频率为0.4,在[100,110)上的频率为0.3,在[110,120)上的频率为0.2,可知第50百分位数一定落在区间[100,110)上,法一 则100+10×=100+≈103.3;第75百分位数一定落在区间[110,120)上,则110+10×=110+=112.5.法二 设第50百分位数为m,第75百分位数为n,则0.4+(m-100)×0.03=0.5,解得m≈103.3;0.7+(n-110)×0.02=0.75,解得n=112.5.综上可知,第50百分位数和第70百分位数的估计值分别为103.3 cm,112.5 cm.1.以下数据为参加数学竞赛决赛的15人的成绩:78,70,72,86,88,79,80,81,94,84,56,98,83,90,91,则这15人成绩的第80百分位数是( )A.90 B.90.5C.91 D.91.5解析:B 把成绩按从小到大的顺序排列为:56,70,72,78,79,80,81,83,84,86,88,90,91,94,98,因为15×80%=12,所以这15人成绩的第80百分位数是=90.5.2.〔多选〕已知100个数据的75%分位数是9.3,则下列说法正确的是( )A.这100个数据中至少有75个数小于或等于9.3B.把这100个数据从小到大排列后,9.3是第75个数据C.把这100个数据从小到大排列后,9.3是第75个数据和第76个数据的平均数D.把这100个数据从小到大排列后,9.3是第74个数据和第75个数据的平均数解析:AC 通过定义知A正确;因为100×75%=75为整数,所以第75个数据和第76个数据的平均数为75%分位数,是9.3,则C正确.3.一组样本数据的频率分布直方图如图所示,试估计此样本数据的第50百分位数为 .解析:样本数据低于10的频率为(0.08+0.02)×4=0.40,样本数据低于14的频率为0.40+0.09×4=0.76,所以此样本数据的第50百分位数在[10,14)内,估计此样本数据的第50百分位数为10+×4=.4.如图是某市2025年4月1日至4月7日每天最高、最低气温的折线统计图,这7天的日最高气温的10%分位数为 24 ℃ ,日最低气温的80%分位数为 16 ℃ .解析:由折线图可知,把日最高气温按照从小到大排序,得24,24.5,24.5,25,26,26,27,因为共有7个数据,所以7×10%=0.7,不是整数,所以这7天日最高气温的10%分位数是第1个数据,为24 ℃.把日最低气温按照从小到大排序,得12,12,13,14,15,16,17,因为共有7个数据,所以7×80%=5.6,不是整数,所以这7天日最低气温的80%分位数是第6个数据,为16 ℃.课堂小结1.理清单 (1)百分位数的定义; (2)由样本数据求百分位数; (3)由统计图表估计百分位数. 2.应体会 由统计图表求百分位数时要注意方程思想的应用. 3.避易错 求第p百分位数时,应先将数据从小到大排列.1.数据7.0,8.4,8.4,8.4,8.6,8.7,9.0,9.1的30%分位数为( )A.8.4 B.8.5C.8.6 D.8.3解析:A 因为8×30%=2.4,故30%分位数是由小到大排列后的第三项数据8.4.2.高一年级共有1 000名学生参加物理测试,若所有学生成绩(单位:分)的第80百分位数是75,则物理成绩大于或等于75分的学生数至少有( )A.200 B.220C.240 D.260解析:A 由1 000×80%=800,所以小于75分的学生最多有800人,所以大于或等于75分的学生至少有200人.故选A.3.按从小到大顺序排列的9个数据:10,16,25,33,39,43,m,65,70,若这组数据的第一四分位数与第三四分位数的和是73,则m=( )A.40 B.45C.48 D.62解析:C 因为9×25%=2.25,所以第一四分位数为25,因为9×75%=6.75,所以第三四分位为m,则25+m=73,所以m=48.4.某学习小组共有20人,在一次数学测试中,得100分的有2人,得95分的有4人,得90分的有5人,得85分的有3人,得80分的有5人,得75分的有1人,则这个学习小组成员该次数学测试成绩的第70百分位数是( )A.82.5 B.85C.90 D.92.5解析:D 根据题意,20×70%=14,这个学习小组成员该次数学测试成绩的第14项为90,第15项为95,故第70百分位数为=92.5.5.已知按从小到大的顺序排列的一组数据:3,6,a,b,12,若其60%分位数为8,则下列情况可能的是( )A.a=7,b=9 B.a=7,b=10C.a=8,b=9 D.a=8,b=10解析:A ∵5×60%=3,∴60%分位数为第3项和第4项数据的平均数,∴=8,∴a+b=16.只有A选项满足此条件.6.某年级120名学生在一次百米测试中,成绩全部介于13秒与18秒之间,将测试结果分成5组:[13,14),[14,15),[15,16),[16,17),[17,18],得到如图所示的频率分布直方图,如果从左到右的5个小矩形的面积之比为1∶3∶7∶6∶3,那么成绩的第70百分位数为( )A.16 B.16.5C.17 D.17.4解析:B 设成绩的第70百分位数为x,因为=0.55,=0.85,所以x∈[16,17),所以0.55+(x-16)×=0.70,解得x=16.5.7.〔多选〕某校高二(13)班某次测试数学成绩累积频数分布折线图如图所示,则下列说法正确的是( )A.没有人的成绩在30~40分这组内B.第50百分位数位于60~70分这组内C.第25百分位数位于40~50分这组内D.第75百分位数位于70~80分这组内解析:ABC 由题图知没有人的成绩在30~40分这组内,故A正确;由40×50%=20,取第20,21项数据的平均数,所以第50百分位数位于60~70分这组内,故B正确;由40×25%=10,取第10,11项数据的平均数,所以第25百分位数位于40~50分这组内,故C正确;由40×75%=30,取第30,31项数据的平均数,所以第75百分位数位于60~70分这组内,故D不正确.故选A、B、C.8.在共有100名学生参加的某项测试中,小张的成绩排名是第75名,小李成绩的百分位数为75,则他们两人中成绩较好的是 小李 .解析:因为小李成绩的百分位数为75,所以约有75名学生的成绩比小李低,即小李的排名大约为第25名,因为小张的成绩排名是第75名,所以小李成绩较好.9.已知30个数据的第60百分位数是8.2,这30个数据从小到大排列后第18个数据是7.8,则第19个数据是 8.6 .解析:由于30×60%=18,设第19个数据为x,则=8.2,解得x=8.6,即第19个数据是8.6.10.(2025·宁波月考)某大学艺术专业400名学生参加某次测评,根据男女学生人数比例,使用分层随机抽样的方法从中随机抽取了100名学生,记录他们的分数,将数据分成7组:[20,30),[30,40),…,[80,90],并整理得到频率分布直方图:(1)估计总体400名学生中分数小于70的人数;(2)已知样本中分数小于40的学生有5人,试估计总体中分数在区间[40,50)内的人数;(3)根据该大学规定,把15%的学生划定为不及格,利用(2)中的数据,确定本次测试的及格分数线.解:(1)根据频率分布直方图可知,样本中分数不小于70的频率为(0.02+0.04)×10=0.6,所以样本中分数小于70的频率为1-0.6=0.4.所以总体400名学生中分数小于70的人数约为400×0.4=160.(2)根据题意,样本中分数不小于50的频率为(0.01+0.02+0.04+0.02)×10=0.9,分数在区间[40,50)内的人数为100-100×0.9-5=5.所以总体中分数在区间[40,50)内的人数估计为400×=20.(3)由(2)可知,分数小于50的频率为=0.1,分数小于60的频率为0.1+0.1=0.2,所以分数的第15百分位数在[50,60)内,由50+10×=55,则本次考试的及格分数线为55分.11.已知一组数据按从小到大的顺序排列:11,12,15,x,17,y,22,26,经过计算,该组数据的50%分位数是16,75%分位数是20,则x+y=( )A.48 B.38C.36 D.33解析:D 因为50%×8=4,所以50%分位数是=16,解得x=15.因为75%×8=6,所以75%分位数为=20,解得y=18.所以x+y=15+18=33.12.〔多选〕甲、乙两人在一次射击比赛中各射靶5次,两人成绩的条形统计图如图所示,则( )A.甲的成绩的平均数小于乙的成绩的平均数B.甲的成绩的平均数等于乙的成绩的平均数C.甲的成绩的第80百分位数等于乙的成绩的第80百分位数D.甲的成绩的极差等于乙的成绩的极差解析:BCD 由题图可得,==6,==6,A项错误,B项正确;甲的成绩的第80百分位数是=7.5,乙的成绩的第80百分位数是=7.5,所以二者相等,C项正确;甲的成绩的极差为4,乙的成绩的极差也为4,D项正确.13.某校组织学生参与航天知识竞答活动,某班8位同学成绩如下:7,6,8,9,8,7,10,m.若去掉m,该组数据的第25百分位数保持不变,则整数m(1≤m≤10)的值可以是 7(填7,8,9,10中任意一个均可) (写出一个满足条件的值即可).解析:7,6,8,9,8,7,10,m,若去掉m,该组数据从小到大排列为6,7,7,8,8,9,10,因为7×0.25=1.75,故第25百分位数为第二个数,即7,所以7,6,8,9,8,7,10,m的第25百分位数为7,而8×0.25=2,所以7为第二个数与第三个数的平均数,所以m(1≤m≤10)的值可以是7或8或9或10.14.某市政府为了减少水资源的浪费,计划通过阶梯式水价制度鼓励居民节约用水,即确定一户居民月均用水量标准x(单位:t),用水量不超过x的部分按平价收费,超出x的部分按议价收费.现通过简单随机抽样获得了100户居民用户的月均用水量数据(单位:t),并将数据按照[0,4),[4,8),…,[16,20]分成5组,制成了如图所示的频率分布直方图.(1)设该市共有20万居民用户,试估计全市居民用户月均用水量不高于12(t)的用户数;(2)若该市政府希望使85%的居民用户月均用水量不超过标准x(t),试估计x的值(精确到0.01);(3)假设该市最终确定三级阶梯价制如下:级差 水量基数x(单位:t) 水费价格(元/t)第一阶梯 x≤14 1.4第二阶梯 14<x≤20 2.1第三阶梯 x>20 2.8小明家上个月需支付水费共28元,试求小明家上个月的用水量.解:(1)由频率分布直方图可得(a+0.06+0.11+a+0.02)×4=1,解得a=0.03.居民用户月均用水量不超过12(t)的频率为(0.03+0.06+0.11)×4=0.80,所以估计全市20万居民用户中月均用水量不高于12(t)的用户数为20×0.80=16(万).(2)由频率分布直方图知,居民用户月均用水量不超过12(t)的频率为0.80.月均用水量不超过16(t)的频率为0.92.则85%的居民用户月均用水量不超过的标准x∈[12,16),故0.80+0.03(x-12)=0.85,解得x≈13.67,即x的值为13.67.(3)因为19.6=14×1.4<28<14×1.4+(20-14)×2.1=32.2.所以小明家上个月的用水量达到第二阶梯收费,未达到第三阶梯收费.设小明家上个月的用水量为m(t),由28=14×1.4+(m-14)×2.1,得m=18,所以小明家上个月的用水量为18(t).1 / 1 展开更多...... 收起↑ 资源列表 9.2.2 总体百分位数的估计.docx 9.2.2 总体百分位数的估计(教师版).docx