资源简介 (共27张PPT)9.2.2 总体百分位数的估计第9章 统计人教A版2019必修第二册学习目标1.结合实例,能用样本估计百分位数.2.理解百分位数的统计含义.前面我们用频率分布表、频率分布直方图描述了居民用户月均用水量的样本数据,通过对图表的观察与分析,得出了一些样本数据的频率分布规律,并由此推测了该市全体居民用户月均用水量的分布情况,得出了“大部分居民用户的月均用水集中在一个较低值区域”等推断接下来的问题是,如何利用这些信息,为政府决策服务呢 下面我们对此进行讨论问题2:如果该市政府希望使80%的居民用户生活用水费支出不受影响,根据9.2.1节中100户居民用户的月均用水量数据,你能给市政府提出确定居民用户月均用水量标准的建议吗?首先要明确一下问题:根据市政府的要求确定居民用户月均用水量标准,就是要寻求一个数,使全市居民用户月均用水量中不超过的占80%,大于的占20%.下面我们通过样本数据对的值进行估计.把100个样本数据按从小到大排序,得到第80个和第81个数据分别为13.6和13.8.可以发现区间内的任意一个数,都能把样本数据分成符合要求的两部分.一般地,我们取这两个数的平均数,并称此数为这组数据的第80百分位数或80%分位数.根据样本数据第80百分位数,我们可以估计总体数据的第80百分位数为13.7左右.由于样本的取值规律与总体的取值规律之间会存在偏差,而在决策问题中,只要临界值近似为第80百分位数即可,因此为了实际中操作的方便,可以建议市政府把月均用水量标准定为14,或者把年用水量标准定为168.一般地,一组数据的第百分位数是这样一个值,它使得这组数据中至少有的数据小于或等于这个值,且至少有的数据大于或等于这个值.可以通过下面的步骤计算一组个数据的第百分位数:第一步,按从小到大排列原始数据.第二步,计算.第三步,若不是整数,而大于的比邻整数为,则第百分位数为第项数据;若是整数,则第百分位数分位数为第项与第项数据的平均数.我们在初中学过的中位数,相当于是第50百分位数.在实际应用中,除了中位数外,常用的分位数还有第25百分位数、第75百分位数.这三个分位数把一组由小到大排列后的数据分成四等份,因此称为四分位数.其中第25百分位数也称第一四分位数或下四分位数等,第75百分位数,也称为第三四分位数或上四分位数等.另外,像第1百分位数,第5百分位数,第95百分位数和第99百分位数在统计中也经常被使用.例2 根据下列样本数据,估计树人中学高一年级女生第25,50,75百分位数.女生163.0 164.0 161.0 157.0 162.0 165.0 158.0 155.0 164.0162.5 154.0 154.0 164.0 149.0 159.0 161.0 170.0 171.0155.0 148.0 172.0 162.5 158.0 155.5 157.0 163.0 172.0解:把27名女生的样本数据按从小到大排序,可得148.0 149.0 154.0 154.0 155.0 155.0 155.5 157.0 157.0158.0 158.0 159.0 161.0 161.0 162.0 162.5 162.5 163.0163.0 164.0 164.0 165.0 170.0 171.0 172.0 172.0 172.0由25%×27=6.75,50%×27=13.5,75%×27=20.25,可知样本数据的第25,50,75百分位数为第7,14,21项数据,分别为155.5,161,164.据此可以估计树人中学高一年级女生的第25,50,75百分位数分别约为155.5,161和164.例3 根据下列图表,估计月均用水量的样本数据的80%和95%分位数.解:由上表可知,月均用水量在13.2t以下的居民用户所占比例为23%+32%+13%+9%=77%,在16.2t以下的居民用户所占比例为77%+9%=86%.因此,80%分位数一定位于[13.2,16.2)内.由13.2+3×(0.80-0.77)/(0.86-0.77)=14.2.可以估计月均用水量的样本数据的80%分位数约为14.2.类似地,由22.2+3×(0.95-0.94)/(0.98-0.94)=22.95可以估计月均用水量的样本数据的95%分位数约为22.95.课堂练习解:将100户居民的月均用水量按小到大的顺序排列如下:1.3 1.3 1.8 2.0 2.0 2.0 2.0 2.1 2.2 2.3 2.3 2.4 2.4 2.6 3.0 3.2 3.2 3.6 3.6 3.7 3.8 4.0 4.1 4.3 4.4 4.6 4.7 4.9 4.9 4.9 5.1 5.1 5.1 5.2 5.3 5.4 5.4 5.5 5.5 5.5 5.5 5.6 5.7 5.7 5.9 6.0 6.0 6.4 6.4 6.8 6.8 7.0 7.1 7.1 7.1 7.5 7.7 7.8 7.8 7.9 8.1 8.6 8.8 9.0 9.5 9.9 10.0 10.1 10.2 10.2 10.5 10.8 11.1 11.2 12.0 12.0 12.4 13.3 13.6 13.6 13.8 13.8 14.0 14.9 15.7 16.0 16.7 16.8 17.0 17.9 18.3 19.4 20.5 21.6 22.2 22.4 24.3 24.5 25.6 28.0由于100×60%=60.∴第60百分位数为第60个和第61个数据的平均数,即因此居民用户月均用水量标准应定为8.0合适.1. 在居民用户月均用水量标准制定的问题中,根据教科书中的调查数据,如果要让60%的居民不超出标准,居民用户月均用水量标准定为多少合适 解:把23名男生的样本数据按从小到大排序,结果如下:164.0 165.0 165.0 166.0 167.0 168.0 168.0 168.0 170.0 170.0 170.0 172.0172.0 172.0 173.0 173.0 173.0 173.0 174.0 175.0 175.0 175.0 176.0由23×25%=5.75,23×50%=11.5,23×75%=17.25,可知样本数据的第25,50,75百分位数为第6,12,18项数据,分别为168.0,172.0,173.0.据此可以估计树人中学高一年级男生的第25,50,75百分位数分别约为168.0,172.0,173.0.通过增加样本量,可以减少估计的误差.2. 根据9.1.2节问题3中男生的样本数据,请你估计树人中学高一年级男生的第25,50,75百分位数. 如果要减少估计的误差,你觉得应该怎么做 3.分别根据图9.2-21)(2)中的数据估计这组数据的月均用水量的第80和95百分位数与根据图9.21估计的结果比较,它们一样吗 你认为根据哪个图得到的估计更好 为什么 随堂检测1.(多选)已知100个数据的75%分位数是9.3,则下列说法不正确的是A.这100个数据中一定有75个数小于或等于9.3B.把这100个数据从小到大排列后,9.3是第75个数据C.把这100个数据从小到大排列后,9.3是第75个数据和第76个数据的平均数D.把这100个数据从小到大排列后,9.3是第75个数据和第74个数据的平均数√√√解析 因为100×75%=75为整数,所以第75个数据和76个数据的平均数为75%分位数,是9.3,则C正确,其它选项均不对,故选ABD.2.数据7.0,8.4,8.4,8.4,8.6,8.7,9.0,9.1的30%分位数为A.8.4 B.8.5C.8.6 D.8.3√解析 因为8×30%=2.4,故30%分位数是第三项数据8.4.3.数据12,14,15,17,19,23,27,30的第70百分位数是A.14 B.17C.19 D.23√解析 因为8×70%=5.6,故第70百分位数是第六项数据23.4.下列一组数据的第25百分位数是2.1,3.0,3.2,3.8,3.4,4.0,4.2,4.4,5.3,5.6A.3.2 B.3.0C.4.4 D.2.5√解析 把该组数据按照由小到大排列,可得:2.1,3.0,3.2,3.4,3.8,4.0,4.2,4.4,5.3,5.6,由i=10×25%=2.5,不是整数,则第3个数据3.2是第25百分位数.5.一组样本数据的频率分布直方图如图所示,试估计此样本数据的第50百分位数为_____.解析 样本数据低于10的比例为(0.08+0.02)×4=0.40,样本数据低于14的比例为0.40+0.09×4=0.76,所以此样本数据的第50百分位数在[10,14)内,解 将所有数据从小到大排列,得7.8,7.9,8.0,8.3,8.4,8.5,8.5,8.5,8.6,8.9,9.0,9.9,因为共有12个数据,所以12×25%=3,12×75%=9,12×95%=11.4,95%分位数是第12个数据为9.9.6. 从某公司生产的产品中,任意抽取12件,得到它们的质量(单位:kg)如下:7.9,9.0,8.9,8.6,8.4,8.5,8.5,8.5,9.9,7.8,8.3,8.0,分别求出这组数据的25%,75%,95%分位数.7.某市为了了解人们对“中国梦”的伟大构想的认知程度,对不同年龄和不同职业的人举办了一次“一带一路”知识竞赛,满分100分(90分及以上为认知程度高),现从参赛者中抽取了x人,按年龄分成5组(第一组:[20,25),第二组:[25,30),第三组:[30,35),第四组:[35,40),第五组:[40,45]),得到如图所示的频率分布直方图,已知第一组有5人.(1)求x;解 第一组频率为0.01×5=0.05,(2)求抽取的x人的年龄的50%分位数(结果保留整数);解 由题图可知年龄低于30岁的所占比例为40%,年龄低于35岁的所占比例为70%,所以抽取的x人的年龄的50%分位数在[30,35)内,所以抽取的x人的年龄的50%分位数为32.(3)以下是参赛的10人的成绩:90,96,97,95,92,92,98,88,96,99,求这10人成绩的20%分位数和平均数,以这两个数据为依据,评价参赛人员对“一带一路”的认知程度,并谈谈你的感想.解 把参赛的10人的成绩按从小到大的顺序排列:88,90,92,92,95,96,96,97,98,99,评价:从第20百分位数和平均数来看,参赛人员的认知程度很高.感想:结合本题和实际,符合社会主义核心价值观即可.课堂小结:总体百分位数的估计:一般地,一组数据的第p百分位数是这样一个值,它使得这组数据中至少有p%的数据小于或等于这个值,且至少有(100-p)%的数据大于或等于这个值.可以通过下面的步骤计算一组n个数据的第p百分位数:第一步:按从小到大排列原始数据;第二步:计算i=n×p%;第三步:若i不是整数,而大于i的比邻整数位j,则第p百分位数为第j项数据;若i是整数,则第p百分位数为第i项与第i+1项的平均数.THANKS“” 展开更多...... 收起↑ 资源预览