资源简介 (共78张PPT)第二讲 用样本估计总体1.会用统计图表对总体进行估计.2.理解集中趋势参数的统计含义;理解离散程度参数的统计含义;能用样本估计总体的取值规律;理解百分位数的统计含义.3.掌握分层随机抽样的样本均值与样本方差.1.总体取值规律的估计(1)绘制频率分布直方图的步骤①求极差:即一组数据中最大值与最小值的差.②决定组距和组数:当样本量不超过 100 时,常分成 5~12 组.③将数据分组:通常对组内数值所在区间取左闭右开区间,最后一组取闭区间.④列频率分布表:登记频数,计算频率,列出频率分布表.将样本数据分成若干组,每组包含的样本数量称作频数,频数与样本容量的比值称为该组的频率.频率反映各组在整体数据中所占比例的大小.⑤画频率分布直方图:把横轴分成若干段,每一段对应一个组距,然后以线段为底作一小长方形,它的高等于该组的频率组距,这样得到一系列的长方形,每个长方形的面积恰好是该组的频率.这些矩形就构成了频率分布直方图,各个长方形的面积总和等于 1.(2)不同统计图的特点扇形图主要用于直观描述各类数据占总数的比例;条形图和直方图主要用于直观描述不同类别或分组数据的频数和频率;折线图主要用于描述数据随时间的变化趋势.条形图适用于描述离散型数据,直方图适用于描述连续型数据.2.总体百分位数的估计(1)第 p 百分位数的定义一般地,一组数据的第 p 百分位数是这样一个值,它使得这组数据中至少有 p%的数据小于或等于这个值,且至少有(100-p)%的数据大于或等于这个值.(2)计算一组 n 个数据的第 p 百分位数的步骤第 1 步,按从小到大排列原始数据.第 2 步,计算 i=n×p%.第 3 步,若 i 不是整数,而大于 i 的比邻整数为 j,则第 p 百分位数为第 j 项数据;若 i 是整数,则第 p 百分位数为第 i 项与第(i+1)项数据的平均数.(3)四分位数第25百分位数,第50百分位数,第75百分位数,这三个分位数把一组由小到大排列后的数据分成四等份,因此称为四分位数.其中第25百分位数也称为第一四分位数或下四分位数,第75百分位数也称为第三四分位数或上四分位数.名称 概念平均数 如果有n个数x1,x2,…,xn,那么这组数据的平均数为 (x1+x2+…+xn)中位数 将一组数据按从小到大(或从大到小)的顺序排列,处在中间的一个数据(当数据个数是奇数时)或中间两个数据的平均数(当数据个数是偶数时)叫做这组数据的中位数众数 一组数据中出现次数最多的数据叫做这组数据的众数3.总体集中趋势的估计4.总体离散程度的估计(1)极差一组数据中最大值与最小值的差.(2)方差和标准差(3)总体方差和标准差(4)样本方差和标准差【名师点睛】平均数、方差的公式推广考点一 总体百分位数的估计考向 1 计算一组数据的第 p 百分位数[例 1]从某珍珠公司生产的产品中,任意抽取 12 颗珍珠,得到它们的质量(单位:g)如下:7.9,9.0,8.9,8.6,8.4,8.5,8.5,8.5,9.9,7.8,8.3,8.0.(1)分别求出这组数据的第 25,50,95 百分位数;(2)若用第25,50,95百分位数把公司生产的珍珠划分为次品、合格品、优等品和特优品,依照这个样本的数据,给出该公司珍珠等级的划分标准.解:(1)将所有数据从小到大排列,得7.8,7.9,8.0,8.3,8.4,8.5,8.5,8.5,8.6,8.9,9.0,9.9.因为共有12个数据,所以12×25%=3,12×50%=6,12×95%=11.4.第 95 百分位数是第 12 个数据 9.9.(2)由(1)可知样本数据的第 25 百分位数是 8.15,第 50 百分位数是 8.5,第 95 百分位数是 9.9,所以质量小于或等于 8.15 g 的珍珠为次品,质量大于 8.15 g 且小于或等于 8.5 g 的珍珠为合格品,质量大于 8.5 g 且小于或等于 9.9 g 的珍珠为优等品,质量大于9.9 g 的珍珠为特优品.考向 2 根据频率分布直方图估计样本数据的百分位数[例2](2024 年四川成都阶段练习)某市为提高市民对创建文明城市的认识,举办了“创建文明城市”知识竞赛,从所有答卷中随机抽取 100 份作为样本,将样本的成绩(满分 100 分,成绩均为不低于 40 分的整数)分成六段:[40,50),[50,60),…,[90,100],得到如图所示的频率分布直方图.(1)求频率分布直方图中 a 的值;(2)估计样本成绩的平均数和第 75 百分位数.落在[40,90)内的频率为 0.05+0.1+0.2+0.3+0.25=0.9>0.75,设第 75 百分位数为 m,则 m∈[80,90),由 0.65+(m-80)×0.025=0.75,解得 m=84,所以第 75 百分位数为 84.【题后反思】(1)计算一组 n 个数据的第 p 百分位数的一般步骤(2)频率分布直方图中第 p 百分位数的估计①确定百分位数所在的区间[a,b);②频率分布直方图中矩形的面积对应频率,第 p 百分位数的【考法全练】1.一组数据为 6, 47, 49, 15, 42, 41, 7, 39, 43, 40, 36,则这组数据的第 25 百分位数是()A.15B.25C.50D.75解析:把数据从小到大排列,可得 6, 7, 15, 36, 39, 40, 41, 42,43, 47, 49,一共 11 项.因为 11×25%=2.75,故第 25 百分位数是第 3项,为 15.故选 A.答案:A2.某校组织全体学生参加知识竞赛,随机抽取了 200 名学生进行成绩统计,发现抽取的学生的成绩都在 50 分至 100 分之间,进行适当分组后(每组为左闭右开的区间),得到的频率分布直方图如图所示.下列说法正确的是()A.直方图中 x 的值为 0.035B.在被抽取的学生中,成绩在区间[60,70)中的学生有 10 人C.估计全校学生的平均成绩不低于 80 分D.估计抽取的全校学生成绩的样本数据的 80%分位数约为 93解析:对于 A,由图可知(0.005+0.010+0.015+0.040+x)×10=1,解得 x=0.030,故 A 错误;对于 B,成绩在区间[60,70)中的被抽中的学生人数为0.010×10×200=20,故 B 错误;对于 C,由图可知平均数为 55×0.005×10+65×0.010×10+75×0.015×10+85×0.030×10+95×0.040×10=84,故 C 正确;答案:C考点二 总体集中趋势的估计1.某校高二年级进行消防知识竞赛,统计所有参赛同学的成绩(单位:分),成绩都在[50,100]内,得到如图所示的频率分布直方图,估计所有参赛同学成绩的第 75 百分位数为()A.65B.75C.85D.95解析:因为(0.2+0.3+0.7+0.6+0.2)a×10=1,所以 a=0.05.参赛成绩位于[50,80)内的频率为(0.2×0.05+0.3×0.05+0.7×0.05)×10=0.6<0.75,参赛成绩位于[50,90)内的频率为 1-0.2×0.05×10=0.9>0.75,则第 75 百分位数在[80,90)内,设为 80+y,则 0.6×0.05y=0.75-0.6=0.15,解得 y=5,即第 75 百分位数为 85,故选 C.答案:C答题居民序号 1 2 3 4 5 6 7 8 9 10得分/分 72 83 65 76 88 90 65 90 95 762.《“健康中国 2030”规划纲要》提出,健康是促进人的全面发展的必然要求,是经济社会发展的基础条件.实现国民健康长寿,是国家富强、民族振兴的重要标志,也是全国各族人民的共同愿望.为普及健康知识,某公益组织为社区居民组织了一场健康知识公益讲座.为了解讲座效果,在讲座后随机抽取了 10 位居民进行健康知识问卷调查,这 10 位居民的得分情况如下表所示:则以下说法错误的是()A.该 10 位居民的答卷得分的极差为 30B.该 10 位居民的答卷得分的中位数为 94C.该 10 位居民的答卷得分的中位数小于平均数D.该 10 位居民的答卷得分的方差为 104.4答案:B3.(多选题)(2024 年重庆阶段练习)为了激发学生的爱国热情,加强爱国主义教育,某学校积极举行了一场“强国有我”知识竞答比赛.比赛结束后,随机抽取了 60 名参赛学生的比赛成绩(单位:分)进行整理,按[50,60),[60,70),[70,80),[80,90),[90,100]分成 5 组,并绘制成如图所示的频率分布直方图,则下列结论正确的有()A.a=0.015B.估计样本的第 80 百分位数为 87.5C.若每组数据均以中间值作代表,则估计样本的平均数为 77D.按分层随机抽样从成绩位于[80,90)和[90,100)内的学生中抽 14 人,则[90,100)内被抽取到的学生人数为 6解析:A 选项,由已知得 10×(0.005+0.025+0.035+0.020+a)=1,解得 a=0.015,A 选项正确;B 选项,因为 10×(0.005+0.025+0.035)=0.65<0.8,10×(0.005+0.025+0.035+0.020)=0.85>0.8,所以第 80 百分位数 m∈[80,90),则 0.65+(m-80)×0.020=0.8,解得 m=87.5,B 选项正确;C 选项,平均数为 10×(0.005×55+0.025×65+0.035×75+0.020×85+0.015×95)=76.5,C 选项错误;D 选项,由频率分布直方图可知[80,90)与[90,100)的频率分别为 0.2 与 0.15,0.150.2+0.15=6,D 选项正确.则[90,100)内抽取的人数为 14×故选 ABD.答案:ABD【题后反思】(1)众数、中位数和平均数的意义众数描述的是在一组数据中出现次数最多的数据;中位数等分样本数据所占的频率;平均数反映所有数据的平均水平.(2)利用频率分布直方图估计样本的数字特征的方法①众数的估计值为最高矩形的底边中点对应的横坐标;②平均数的估计值等于频率分布直方图中每个小矩形的面积乘小矩形底边中点的横坐标之和;③中位数的估计值的左边和右边的小矩形面积的和是相等的.考点三 总体离散程度的估计考向 1 方差与标准差[例 3](2023 年全国乙卷理科)某厂为比较甲、乙两种工艺对橡胶产品伸缩率的处理效果,进行 10 次配对试验,每次配对试验选用材质相同的两个橡胶产品,随机地选其中一个用甲工艺处理,另一个用乙工艺处理,测量处理后的橡胶产品的伸缩率,甲、乙两种工艺处理后的橡胶产品的伸缩率分别记为xi,yi(i=1,2,…,10).试验结果如下表所示.试验序号 i 1 2 3 4 5 6 7 8 9 10伸缩率 xi 545 533 551 522 575 544 541 568 596 548伸缩率 yi 536 527 543 530 560 533 522 550 576 536考向 2 分层随机抽样的方差与标准差[例 4](2024 年四川成都期中考)2024 年 10 月 27 日,成都市举办马拉松比赛,其中志愿者是马拉松成功举办的重要保障.成都市文化广电旅游局承办了志愿者选拔的面试工作.随机抽取了 100 名候选者的面试成绩(单位:分),并分成五组:第一组[45,55),第二组[55,65),第三组[65,75),第四组[75,85),第五组[85,95].绘制成如图所示的频率分布直方图.(1)求 a 的值,并估计这 100 名候选者面试成绩的平均数;(2)从以上各组中用分层随机抽样的方法选取 20 人担任本市的宣传者.若本市宣传者中第二组面试者的面试成绩的平均数和方差分别为 62 和 40,第四组面试者的面试成绩的平均数和方差分别为 80 和 50,请据此估计这次第二组和第四组所有面试者的面试成绩的方差.【题后反思】分层随机抽样的均值与方差分数段/分 [60,70) [70,80) [80,90) [90,100]频数 10 30 40 20考向 3 用频率分布直方图估计方差[例 5]数字乡村既是乡村振兴的战略方向,也是建设数字中国的重要内容.某公司为了助力数字乡村发展,决定从 100 名员工中挑选 30 名员工组建“数字乡村发展部”,对这 100 名员工的各项素质进行综合评分,得到如下频数分布表:(1)根据频数分布表制作频率分布直方图.(2)估计这 100 名员工各项素质分数的平均数与方差.(同一组中的数据用该组区间的中点值作为代表)(3)若该公司准备挑选成绩较好的员工组建“数字乡村发展部”,则被挑选的员工的分数不低于多少?分数段/分 频数 频率 频率/组距[60,70) 10 0.1 0.01[70,80) 30 0.3 0.03[80,90) 40 0.4 0.04[90,100] 20 0.2 0.02解:(1)由题意可知,频率分布表如下.所以频率分布直方图如图所示.(2)由题知,平均数为 x =65×0.1+75×0.3+85×0.4+95×0.2=82,方差为s2=0.1×(65-82)2+0.3×(75-82)2+0.4×(85-82)2+0.2×(95-82)2=81.(3)因为从 100 名员工中挑选 30 名成绩较好的员工组建“数字乡村发展部”,所以应选成绩大于等于第 70 百分位数的员工.设第 70 百分位数为 m,则 0.1+0.3+(m-80)×0.04=0.7,解得 m=87.5,所以被挑选的员工的分数不低于 87.5 分.【考法全练】A.0.01B.0.1C.1D.10解析: ∵样本数据x1,x2,…,xn的方差为0.01,∴样本数据10x1,10x2,…,10xn的方差为102×0.01=1,故选C.答案:C1.设一组样本数据x1,x2,…,xn的方差为0.01,则数据10x1,10x2,…,10xn的方差为( )2.某班成立了 A,B 两个数学兴趣小组,A 组 10 人,B 组 30人,经过一周的学习后进行了一次测试,在该测试中,A 组的平均成绩为 130 分,方差为 115,B 组的平均成绩为 110 分,方差为215.求在这次测试中全班学生的平均成绩和方差.3.某学校为了解高二年级学生的数学运算能力,对高二年级的200 名学生进行了一次测试.已知参加此次测试的学生的分数 xi(i=1,2,3,…,200,单位:分)全部介于 45 到 95 之间,该校将所有分数分成 5 组:[45,55),[55,65),…,[85,95],整理得到如图所示的频率分布直方图(同组数据以这组数据的中间值作为代表).(1)求 m 的值,并估计此次校内测试分数的平均值 x ;解:(1)因为 0.006×10+0.014×10+10m+0.036×10+0.020×10=1,所以 m=0.024.此次校内测试分数的平均值的估计值为x =0.06×50 +0.14×60 +0.24×70 +0.36×80 +0.20×90 =75.⊙统计图表及其应用[例6]已知某市某居民小区户主人数和户主对户型结构的满意率分别如图 1 和图 2 所示,为了解该小区户主对户型结构的满意程度,用分层随机抽样的方法抽取 30%的户主进行调查,则样本量和抽取的户主对四居室满意的人数分别为()图 1图 2A.240,18C.240,20B.200,20D.200,18解析:样本量 n=(250+150+400)×30%=240,抽取的户主对四居室满意的人数为 150×30%×40%=18.答案:A[例 7](多选题)某校举行了交通安全知识主题演讲比赛,甲、乙两位同学演讲后,6 位评委对他们的演讲分别进行打分(满分 10分),得到如图所示的统计图,则()A.甲得分的中位数大于乙得分的中位数B.甲得分的极差大于乙得分的极差C.甲得分的第 75 百分位数小于乙得分的第 75 百分位数D.甲得分的方差大于乙得分的方差甲 7.0 8.3 8.9 8.9 9.2 9.3乙 8.1 8.5 8.6 8.6 8.7 9.1解析:甲、乙的得分(单位:分)从小到大排列如下.统计量 甲 乙 选项中位数 A 正确极差 9.3-7.0=2.3 9.1-8.1=1 B 正确第 75 百分位数 6×75%=4.5,故第 75 百分位数是第 5 个数9.2 8.7 C 错误方差 由题图可以看出甲得分的波动比乙大,故甲得分的方差大于乙得分的方差 D 正确故可得如下表格.答案:ABD【高分训练】1.已知某地区中小学生人数和近视情况分别如图 1 和图2所示.为了解该地区中小学生的近视形成原因,用分层随机抽样的方法抽取 2%的学生进行调查,则样本容量和抽取的高中生中近视的人数分别为()图 1A.200,20C.200,10图 2B.100,20D.100,10解析:由题意得样本容量为(3 500+2 000+4 500)×2%=10 000×2%=200,抽取的高中生人数为 2 000×2%=40,则抽取的高中生中近视的人数为 40×50%=20.故选 A.答案:A2.(2023 年巴彦淖尔市期末考)将甲、乙、丙 3 组数据绘制成如图所示的折线图,则这 3 组数据中,________(填汉字)组数据的方差最小.答案:乙 展开更多...... 收起↑ 资源预览