【备考2027】02 第53讲 统计图表、用样本估计总体 高频考点精讲 高三一轮总复习(基础版)

资源下载
  1. 二一教育资源

【备考2027】02 第53讲 统计图表、用样本估计总体 高频考点精讲 高三一轮总复习(基础版)

资源简介

第53讲 统计图表、用样本估计总体
【课标要求】 
1.能根据实际问题的特点,选择恰当的统计图表对数据进行可视化描述,体会合理使用统计图表的重要性.
2.能用样本估计总体的集中趋势参数(平均数、中位数、众数),理解集中趋势参数的统计含义.
3.能用样本估计总体的离散程度参数(标准差、方差、极差),理解离散程度参数的统计含义.
4.能用样本估计总体的取值规律.
5.能用样本估计百分位数,理解百分位数的统计含义.
1.数据的可视化描述
(1)各类统计图的特点
类型 作用
频率分布 直方图 主要以面积的形式描述数据落在各个小组的频率的大小,可以估计总体数据的分布趋势
扇形图 主要用于直观描述各类数据占总数的比例
条形图 主要用于直观描述不同类别或分组数据的频数和频率,尤其是离散型的数据
折线图 主要用于描述数据随时间的变化趋势
(2)作频率分布直方图的步骤
①求极差(即一组数据中     与    的差);
②决定    与    ;
③将数据    ;
④列      ;
⑤画       .
2.数据的数字特征
(1)平均数:如果给定的一组数是x1,x2,…,xn,则这组数的平均数为=         ,简记为=xi .
(2)中位数:把一组数据按          的顺序排列,处在    位置的一个数据(或两个数据的平均数).
(3)众数:一组数据中,出现次数    的数据.
(4)众数、中位数和平均数的比较
名称 优点 缺点
平均数 与中位数相比,平均数反映出样本数据中更多的信息,对样本中的    更加敏感 任何一个数据的改变都会引起     的改变.数据越“离群”,对    的影响越大
中位数 不受少数几个   数据(即排序靠前或靠后的数据)的影响 对    不敏感
众数 体现了样本数据的最大    众数只能传递数据中很少的一部分信息,对    不敏感
(5)百分位数
①定义:一般地,一组数据的第p百分位数是这样一个值,它使得这组数据中至少有p%的数据     这个值,且至少有(100-p)%的数据     这个值.
②计算一组n个数据的第p百分位数的步骤:
第1步,按      排列原始数据.
第2步,计算i=    .
第3步,若i不是整数,而大于i的比邻整数为j,则第p百分位数为第    项数据;若i是整数,则第p百分位数为第i项与第(i+1)项数据的    .
③四分位数:第25百分位数,第50百分位数,第75百分位数.
其中第25百分位数也称为      或      等,第75百分位数也称为第三四分位数或      等.
(6)方差和标准差
如果x1,x2,…,xn的平均数为,则其方差s2=(xi-)2=-,标准差s=.
注:方差越大,说明数据的离散程度或波动幅度越大,反之数据的离散程度或波动幅度越小.其单位是原始数据单位的平方.
常用结论
1.若数据x1,x2,…,xn的平均数为,方差为s2,则数据yi=axi+b(i=1,2,…,n,a,b∈R)的平均数=a+b,方差为a2s2.
2.众数、中位数(百分位数)、平均数与频率分布直方图的关系:
(1)众数:最高的小矩形底边中点的横坐标.
(2)中位数:从左侧开始满足小矩形面积和为0.5的横坐标的值;根据百分位数的定义,求百分位数同样转化为从左侧求小矩形的面积和满足的条件;
(3)平均数:每个小矩形底边中点的横坐标与对应频率的积的和.
3.平均数和中位数都描述了数据的集中趋势,它们的大小关系和数据分布的形态有关.
形状 关系
对称 平均数与中位数差不多
右边“拖尾” 平均数大于中位数
左边“拖尾” 平均数小于中位数
平均数总是在“长尾巴”那边
4.频率分布直方图的性质:
(1)纵轴表示;
(2)小长方形的面积=频率;
(3)各小长方形的面积的总和等于1;
(4)样本量=.
题组一 易错辨析
判断下列说法是否正确.(请在括号中打“√”或“×”)
(1)对一组数据来说,平均数和中位数总是非常接近. (  )
(2)一组数据的平均数、中位数、百分位数、众数都不是原数据的数. (  )
(3)已知一组数据的频率分布直方图如图所示,则中位数和众数都是65. (  )
题组二 教材改编
1.若数据1,2,2,3,4,5,6,6,7,8的中位数为m,60%分位数为a,则m=    ,a=    .
2.如图是某个容量为100的样本的频率分布直方图,则数据在区间[6,10)上的频数是    .
3.甲、乙、丙、丁四人参加运动会射击项目选拔赛,四人成绩的平均数和方差如下表所示:
甲 乙 丙 丁
平均数 8.5 8.8 8.8 8
方差s2 3.5 3.5 2.1 8.5
则参加运动会的最佳人选应为    .
 统计图表及其应用
例1 (1)为弘扬中华优秀传统文化,济南市公开招募志愿者.现从所有报名的志愿者中,随机选取300人进行调查,其中青年人、中年人、老年人三个年龄段的比例饼状图如图①所示,各年龄段志愿者的性别百分比等高堆积条形图如图②所示,则下列关于样本数据的分析正确的是 (  )
A.老年男性志愿者人数为90
B.老年女性志愿者人数大于中年女性志愿者人数
C.青年女性志愿者人数为72
D.中年男性志愿者人数大于青年男性志愿者人数
(2)[2026·广东江门期中] 某保险公司为客户定制了5个险种:甲,一年期短期;乙,两全保险;丙,理财类保险;丁,定期寿险;戊,重大疾病保险.各种保险按相关约定进行参保与理赔.该保险公司对5个险种参保客户进行抽样调查,得到如图①②③所示的统计图表,则下列说法中一定错误的是 (  )
A.丁险种参保人数超过五成
B.41岁以上参保人数超过总参保人数的五成
C.18~29周岁人群参保的总费用最少
D.人均参保费用不超过5000元
总结反思
扇形图、条形图、折线图的关注点
1.扇形图能清楚地表示出各部分数量同总数之间的关系.
2.条形图的长度表示各类别频数的多少,宽度是固定的类别,与频率分布直方图不同.
3.折线图可以显示随时间(根据常用比例放置)而变化的连续数据,因此非常适用于显示在相等时间间隔下数据的变化趋势.
【对点演练1】 (1)如图是某年中国的10个城市地铁运营里程(单位:公里)及运营线路条数的统计图,则下列说法正确的是 (  )
A.这10个城市中北京的地铁运营里程最长且运营线路条数最多
B.这10个城市地铁运营里程的中位数是516
C.这10个城市地铁运营线路条数的平均数为15.4
D.这10个城市地铁运营线路条数的极差是12
(2)(多选题)[2026·湖北随州期末] 某中学组织三个年级的学生进行党史知识竞赛.经统计,得到前200名学生人数分布的扇形图(如图①)和前200名学生中高一年级学生排名分布的频率条形图(如图②),则下列说法正确的是 (  )
A.成绩在前200名的学生中,高一年级学生人数比高二年级学生人数多30
B.成绩在第1~100名的学生中,高一年级学生人数不超过一半
C.成绩在第1~50名的学生中,高三年级学生最多有32人
D.成绩在第51~100名的学生中,高二年级学生人数比高一年级学生人数多
 样本的数字特征的求解与应用
例2 (1)数据40,40,20,18,16,16,14,12的下四分位数为 (  )
A.13  B.13.5  C.15  D.15.5
(2)[2026·福建龙岩质检] 某学校为了调查高一年级学生期中物理考试成绩的情况,随机选取了100名学生的物理成绩,绘制了如图所示的频率分布直方图,则下列说法正确的是 (  )
A.这100名学生物理成绩平均数的估计值为70(注:同一组数据用该组区间的中点值作为代表)
B.这100名学生物理成绩的第60百分位数的估计值为71
C.这100名学生物理成绩众数的估计值为75
D.随机选取的这100名学生中只有25名学生物理成绩不低于80分
总结反思
通过均值、中位数、众数等数字特征能反应数据的集中趋势,而方差、标准差、极差等数字特征则反应了数据的离散程度,通过对数字特征的分析,可以初步判断数据的集中趋势和离散程度.
【对点演练2】 (1)[2026·山东青岛质检] 某校为了解学生每个月在图书馆借阅书籍的数量,图书管理员甲抽取了一个容量为100的样本,并算得样本的平均数为5,方差为9;图书管理员乙也抽取了一个容量为100的样本,并算得样本的平均数为7,方差为16.若将两个样本合在一起组成一个容量为200的新样本,则新样本数据的 (  )
A.平均数为5.5 B.平均数为6.5
C.方差为12.5 D.方差为13.5
(2)(多选题)如图是某市2025年1月至7月全社会用电量(单位:亿千瓦时)的折线图,则 (  )
A.1月至7月全社会用电量逐月增加
B.1月至7月全社会用电量的极差是20.7
C.1月至7月全社会用电量的第75百分位数是64.3
D.1月至3月全社会用电量的方差比4月至6月全社会用电量的方差大
 用样本的数字特征估计总体的数字特征
例3 某中学全体学生参加了一场知识竞赛,随机抽取了2000名学生的成绩进行统计,发现抽取的学生的成绩都在50分至100分之间,进行适当分组后,绘制出如图所示的频率分布直方图,下列说法正确的是 (  )
A.在被抽取的学生中,成绩在区间[90,100)内的学生有850人
B.直方图中x的值为0.025
C.估计全体学生成绩的80%分位数约为95
D.估计全体学生成绩的中位数为85
总结反思
用样本的数字特征估计总体的数字特征常常是以频率分布直方图等为工具,应用平均数、方差、中位数等进行分析,解决问题时要注意正确建立统计模型,准确计算各个数字特征.
【对点演练3】 [2026·福建漳州期末] 为了帮助高一年级学生更好地了解自己适合选报物理还是历史,某校在学生选科之前组织了一场物理考试,并从中随机抽取了部分学生的成绩(满分为100分),将数据整理得到如图所示的频率分布直方图.根据该频率分布直方图,用样本估计总体,则下列说法正确的是 (  )
A.频率分布直方图中的m的值为0.15
B.估计该年级物理成绩的众数为80分(注:同一组数据用该组区间的中点值作为代表)
C.估计该年级物理成绩的平均数为75分
D.若物理成绩排名前70%的学生适合选报物理,则适合选报物理的学生此次成绩应不低于62分第53讲 统计图表、用样本估计总体
● 课前基础巩固
【知识聚焦】
1.(2)①最大值 最小值 ②组距 组数 ③分组 ④频率分布表
⑤频率分布直方图
2.(1)(x1+x2+…+xn)
(2)从小到大(或从大到小) 中间
(3)最多
(4)极端值 平均数 平均数 极端 极端值 集中点 极端值
(5)①小于或等于 大于或等于
②从小到大 n×p% j 平均数
③第一四分位数 下四分位数 上四分位数
【课前演练】
题组一
(1)× (2)× (3)√ [解析] (1)平均数指的是这组数据的平均水平,中位数指的是这组数据的中间水平,它们之间没有必然联系,所以该说法错误.
(2)一组数据的众数一定是原数据的数,所以该说法错误.
(3)因为最高的矩形底边中点的横坐标为65,所以众数为65.因为(0.030+0.040)×10=0.7>0.5,所以中位数位于[60,70)内.设中位数为60+x,则0.030×10+0.040x=0.5,解得x=5,所以中位数为65,所以该说法正确.
题组二
1.4.5 5.5 [解析] 由题意得,中位数m==4.5.由10×60%=6,得60%分位数a==5.5.
2.70 [解析] 由频率分布直方图得,数据在区间[6,10)上的频率为1-(0.025+0.050+0.075)×2=0.7,∵样本容量为100,∴数据在区间[6,10)上的频数为0.7×100=70.
3.丙 [解析] 从表格中可以看出乙和丙成绩的平均数较高,故平均成绩最好,又乙、丙两人之间,丙的方差较小,所以丙发挥得比乙稳定,故最佳人选应为丙.
● 课堂考点探究
探究点一
例1 (1)C (2)B [解析] (1)由题图①可知300名志愿者中,青年人有300×60%=180(人),中年人有300×30%=90(人),老年人有300×10%=30(人).对于A,由题图②可知样本中老年男性志愿者人数为30×30%=9,故A错误;对于B,由题图②可知样本中老年女性志愿者人数为30×70%=21,中年女性志愿者人数为90×30%=27,故B错误;对于C,样本中青年女性志愿者有180×40%=72(人),故C正确;对于D,样本中中年男性志愿者人数为90×70%=63,青年男性志愿者人数为180×60%=108,故D错误.故选C.
(2)对于A,由题图①可知丁险种参保比例为1-0.3-0.1-0.02-0.04=0.54>0.5,超过五成,故A中说法一定正确;对于B,由题图②可知,41岁以上参保人数占比为35%+10%=45%,故B中说法一定错误;对于C,由题图②与图③可知18~29周岁人群参保人数占比为15%,人均参保费用(单位:元)在(3000,4000)内,而54周岁及以上人群参保比例虽然为10%,但人均参保费用为6000元,所以18~29周岁人群参保的总费用最少,故C中说法一定正确;对于D,由题图②与图③可知,人均参保费用约为15%×4000+40%×4000+35%×5500+10%×6000=4725(元),不超过5000元,故D中说法一定正确.故选B.
对点演练1 (1)C (2)ABC [解析] (1)对于A,这10个城市中北京的地铁运营线路条数最多,而运营里程最长的是上海,故A错误;对于B,这10个城市地铁运营里程的中位数是=537.3,故B错误;对于C,这10个城市地铁运营线路条数的平均数为×(20+27+18+14+17+12+14+10+14+8)=15.4,故C正确;对于D,这10个城市地铁运营线路条数的极差是27-8=19,故D错误.故选C.
(2)由题图①知,成绩在前200名的学生中,高一年级学生人数比高二年级学生人数多200×(45%-30%)=30,A正确;由题图②知在前200名学生中高一年级学生名次在前100名和后100名的人数相等,因此成绩在第1~100名的学生中,高一年级学生人数为200×45%×0.5=45<50,B正确;成绩在第1~50名的学生中,高一年级学生人数为200×45%×0.2=18,故成绩在第1~50名的学生中,高三年级学生最多有32人,C正确;成绩在第51~100名的学生中,高一年级学生人数为200×45%×0.3=27,故成绩在第51~100名的学生中,高二年级学生最多有23人,因此成绩在第51~100名的学生中,高二年级学生人数比高一年级学生人数少,D错误.故选ABC.
探究点二
例2 (1)C (2)C [解析] (1)将这组数据按从小到大的顺序排列为12,14,16,16,18,20,40,40,因为8×25%=2,所以这组数据的下四分位数为=15,故选C.
(2)对于A,估计这100名学生物理成绩的平均数为(45×0.01+55×0.015+65×0.015+75×0.03+85×0.025+95×0.005)×10=71,所以A错误;对于B,因为前三个矩形的面积为(0.01+0.015+0.015)×10=0.4,前四个矩形的面积为(0.01+0.015+0.015+0.03)×10=0.7,所以这100名学生物理成绩的第60百分位数位于[70,80)内,设为x,则x=70+×10≈76.67,所以B错误;对于C,由题图可估计这100名学生物理成绩的众数为=75,所以C正确;对于D,由题图可得这100名学生物理成绩位于[80,100]内的频率为(0.025+0.005)×10=0.3,则100×0.3=30,所以随机选取的这100名学生中只有30名学生物理成绩不低于80分,所以D错误.故选C.
对点演练2 (1)D (2)BD [解析] (1)设图书管理员甲抽取的数据的平均数和方差分别为,;图书管理员乙抽取的数据的平均数和方差分别为,,则新样本数据的平均数为×5+×7=6,新样本数据的方差为×[9+(5-6)2]+×[16+(7-6)2]=13.5.故选D.
(2)对于A,由题图知,3月到4月用电量减少,故A错误;对于B,用电量的极差为79.9-59.2=20.7,故B正确;对于C,数据按从小到大的顺序排列为59.2,60.1,61.6,61.9,64.3,66.4,79.9,又7×75%=5.25,所以这组数据的第75百分位数是第六个数据66.4,故C错误;对于D,1月至3月用电量的极差为66.4-59.2=7.2,4月至6月用电量的极差为64.3-61.6=2.7,显然7.2>2.7,故对应的1月至3月全社会用电量的方差比4月至6月全社会用电量的方差大,故D正确.故选BD.
探究点三
例3 C [解析] 由(0.005+0.01+x+0.03+0.04)×10=1,可得x=0.015,B错误;在被抽取的学生中,成绩在区间[90,100)内的学生有2000×0.04×10=800(人),A错误;由题图及样本估计总体可知,全体学生成绩的80%分位数在区间[90,100)内,设为m,则(100-m)×0.04=0.2,可得m=95,C正确;由题图及样本估计总体可知,全体学生成绩的中位数在区间[80,90)内,设为n,则(90-n)×0.03+0.4=0.5,可得n=,D错误.故选C.
对点演练3 D [解析] 对于A,由题可知,10×(0.005+0.01+2m+0.025+0.030)=1,解得m=0.015,故A错误;对于B,由题图及样本估计总体可知,估计该年级物理成绩的众数是75,故B错误;对于C,由题图及样本估计总体可知,估计该年级物理成绩的平均数是45×0.1+55×0.15+65×0.25+75×0.3+85×0.15+95×0.05=69,故C错误;对于D,由题得适合选报物理的学生此次的成绩即为该组数据的30%分位数,因为(0.01+0.015)×10=0.25,0.25+0.25=0.5,故该组数据的30%分位数位于[60,70)内,设其为x,则(x-60)×0.025+0.25=0.3,解得x=62,故D正确.故选D.

展开更多......

收起↑

资源列表