资源简介 第一节 统计课程标准 考情分析 核心素养1.理解随机抽样及分层抽样的方法. 2.了解分布的意义和作用,会列频率分布表,会画频率分布直方图、频率折线图、茎叶图,理解它们各自的特点. 3.理解样本数据标准差的意义和作用,会计算数据标准差,并给出合理解释. 4.会用样本的频率分布估计总体分布,会用样本的基本数字特征估计总体的基本数字特征,理解用样本估计总体的思想. 2020年新高考未考查统计问题; 2021(Ⅰ)中第9题考查了样本的数字特征; 2021(Ⅱ)中的第9题考查了样本的数字特征. 数据分析 数学运算教材回扣·夯实“四基”基础知识1.简单随机抽样(1)定义:一般地,设一个总体含有N(N为正整数)个个体,从中____抽取n(1≤n(2)常用方法:____法和________法.2.分层随机抽样一般地,按一个或多个变量把总体划分成若干个子总体,每个个体属于且仅属于一个子总体,在每个子总体中独立地进行简单随机抽样,再把所有子总体中抽取的________合在一起作为总样本,这样的抽样方法称为分层随机抽样,每一个子总体称为________.【微点拨】(1)随机数表法抽取的样本必须保证所编号码的位数一致.(2)两种抽样方法的特点、联系及适用范围类别 简单随机抽样 分层随机抽样共同点 抽样过程中每个个体被抽到的可能性相等联系 各层抽样时,采用简单随机抽样适用范围 总体个数较少 总体由差异明显的几部分组成3.频率分布直方图:为了将频率分布表中的结果直观形象地表现出来,常画出频率分布直方图.画图时,应以横轴表示分组、纵轴表示各组频率与组距的比值,以各个组距为底,以各频率除以组距的商为高,画成小长方形,这样得到的直方图就是频率分布直方图.【微点拨】(1)极差为一组数据中最大值与最小值的差.(2)所有小长方形的面积和等于1.(3)每个小长方形的面积表示样本落在该组内的频率.4.总体百分位数的估计(1)第p百分位数的定义一般地,一组数据的第p百分位数是这样一个值,它使得这组数据中至少有________的数据小于或等于这个值,且至少有________的数据大于或等于这个值.(2)计算一组n个数据的第p百分位数的步骤第1步,按从小到大排列原始数据.第2步,计算i=n×p%.第3步,若i不是整数,而大于i的比邻整数为j,则第p百分位数为第j项数据;若i是整数,则第p百分位数为第i项与第(i+1)项数据的平均数.【微点拨】(1)第0百分位数为数据中的最小数,第100百分位数为数据中的最大数;(2)一组数据的百分位数既可能是这组数据中的数,也可能不是这组数据中的数;(3)一组数据的某些百分位数可能是同一个数.5.样本的数字特征(1)众数一组数据中出现次数最多的数据(即频率分布最大值所对应的样本数据)称为这组数据的众数.(2)中位数一组数据按从小到大(或从大到小)的顺序排成一列,处于最中间的一个数据(当数据个数是奇数时)或最中间两个数据的平均数(当数据个数是偶数时)称为这组数据的中位数.(3)平均数一组数据的和与这组数据的个数的商称为这组数据的平均数.数据x1,x2,…,xn的平均数为=.(4)方差与标准差如果有n个数据x1,x2,…,xn,那么平均数为=____________________,标准差为s=,方差为s2=________________________.【微点拨】(1)一组数据中,众数不唯一,一定是这组数据中的数;中位数唯一,不一定是这组数据中的数;平均数唯一,不一定是这组数据中的数.(2)平均数反映了数据取值的平均水平,标准差,方差反映了数据对平均数的波动情况,即标准差、方差越大,数据的离散程度越大,越不稳定;反之离散程度越小,越稳定.[常用结论]1.在频率分布直方图中:(1)最高的小矩形底边中点的横坐标即是众数;(2)中位数左边和右边的所有小矩形的面积和是相等的;(3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小矩形的面积乘小矩形底边中点的横坐标之和.2.平均数、方差的推广(1)若数据x1,x2,…,xn的平均数为,则mx1+a,mx2+a,mx3+a,…,mxn+a的平均数是m+a.(2)若数据x1,x2,…,xn的方差为s2,则数据ax1+b,ax2+b,…,axn+b的方差为a2s2.基本技能、思想、活动经验题组一 思考辨析(正确的打“√”,错误的打“×”)1.在简单随机抽样中,某一个个体被抽到的可能性与第几次抽取有关,第一次被抽到的可能性最大.( )2.在分层随机抽样中,每个个体被抽到的可能性与层数及分层有关.( )3.平均数、众数与中位数从不同的角度描述了一组数据的集中趋势.( )4.在频率分布直方图中,最高的小长方形底边中点的横坐标是众数.( )题组二 教材改编5.某学校有教师100人,不到35岁的有45人,35岁到49岁的有25人,剩下的为50岁以上(包括50岁)的人,用分层随机抽样的方法从中抽取20人,从低到高各年龄段分别抽取的人数为( )A.7,5,8 B.9,5,6C.6,5,9 D.8,5,76.10名工人某天生产同一零件,生产的件数分别是9,10,13,14,15,15,16,17,17,18,那么数据的80%分位数是________.题组三 易错自纠7.从某市参加升学考试的学生中随机抽查1 000名学生的数学成绩进行统计分析,在这个问题中,下列说法正确的是( )A.总体指的是该市参加升学考试的全体学生B.样本是指1 000名学生的数学成绩C.样本容量指的是1 000名学生D.个体指的是1 000名学生中的每一名学生8.某校从参加高二年级学业水平测试的学生中抽出80名学生,其数学成绩(均为整数)的频率分布直方图如图所示,则这次测试数学成绩的众数为________,这次测试数学成绩的中位数为________(精确到0.1),这次测试数学成绩的平均数为________.题型突破·提高“四能”题型一 抽样方法[例1] (1)炎炎夏日,冰淇淋成为青年人的热宠,现用简单随机抽样的方法监测某品牌冰淇淋是否符合食品安全标准,若从21个冰淇淋中逐个抽取一个容量为3的样本,则其中某一个体A“第一次被抽到”的可能性与“第二次被抽到”的可能性分别是( )A. B.C. D.(2)[2022·广东惠州模拟]某工厂利用随机数表对生产的50个零件进行抽样测试,先将50个零件进行编号,编号分别为01,02,…,50,从中抽取5个样本,下面提供随机数表的第1行到第2行:66 67 40 37 14 64 05 71 11 05 65 09 95 86 68 76 83 20 37 9057 16 03 11 63 14 90 84 45 21 75 73 88 05 90 52 23 59 43 10若从表中第1行第9列开始向右依次读取数据,则得到的第4个样本编号是( )A.10 B.09C.71 D.20(3)[2022·北京中关村中学月考]某单位有青年职工160人,中年职工人数是老年职工人数的3倍,老、中、青职工共有440人,为了解职工身体状况,现采用分层抽样方法进行调查,在抽取的样本中有青年职工64人,则该样本中的老年职工人数为________.[听课记录]类题通法1.应用随机数法的两个关键点:2.进行分层抽样的相关计算时,常用到的两个关系:[巩固训练1] (1)[2022·河南安阳模拟]嫦娥五号的成功发射,实现了中国航天史上的五个“首次”,某中学为此举行了“讲好航天故事”演讲比赛.若将报名的30位同学编号为01,02,…,30,利用下面的随机数表来决定他们的出场顺序,选取方法是从随机数表第1行的第5列和第6列数字开始由左到右依次选取两个数字,重复的跳过,则选出来的第7个个体的编号为( )45 67 32 12 12 31 02 01 04 52 15 20 01 12 51 2932 04 92 34 49 35 82 00 36 23 48 69 69 38 74 81A.12 B.20C.29 D.23(2)[2022·天津河东区模拟]某高校甲、乙、丙、丁四个专业分别有150,150,400,300名学生.为了解学生的就业倾向,用分层抽样的方法从该校这四个专业共抽取40名学生进行调查,应在丙专业抽取的学生人数为________.题型二 统计图表的应用角度1 频率分布直方图[例2] 某市政府为了鼓励居民节约用水,计划调整居民生活用水收费方案,拟确定一个合理的月用水量标准x(单位:吨),一位居民的月用水量不超过x的部分按平价收费,超出x的部分按议价收费.为了了解居民用水情况,通过抽样,获得了某年100位居民每人的月均用水量(单位:吨),将数据按照[0,0.5),[0.5,1),…,[4,4.5]分成9组,制成了如图所示的频率分布直方图.(1)求频率分布直方图中a的值;(2)设该市有30万居民,估计全市居民中月均用水量不低于3吨的人数,并说明理由;(3)若该市政府希望使85%的居民每月的用水量不超过标准x(单位:吨),估计x的值,并说明理由.[听课记录]类题通法谨记频率分布直方图的两个关系式[巩固训练2] [2022·辽宁沈阳模拟]某公司计划招收500名新员工,共报名了2 000人,远超计划,故该公司采用笔试的方法进行选拔,并按照笔试成绩择优录取.现采用随机抽样的方法抽取200名报名者的笔试成绩,绘制频率分布直方图如下:则录取分数线可估计为( )A.70.5 B.72.5C.75.5 D.77.5角度2 扇形图[例3] 某地区经过一年的新农村建设,农村的经济收入增加了一倍,实现翻番.为更好地了解该地区农村的经济收入变化情况,统计了该地区新农村建设前后农村的经济收入构成比例,得到如图所示的饼图:则下面结论中不正确的是( )A.新农村建设后,种植收入减少B.新农村建设后,其他收入增加了一倍以上C.新农村建设后,养殖收入增加了一倍D.新农村建设后,养殖收入与第三产业收入的总和超过了经济收入的一半[听课记录]【微点拨】扇形图可以很清楚的表示出各部分数量同总数之间的关系.[巩固训练3] 如图给出的是某小区居民一段时间内访问网站的比例图,则下列选项中不超过21%的为( )A.网易与搜狗的访问量所占比例之和B.腾讯与百度的访问量所占比例之和C.淘宝与论坛的访问量所占比例之和D.新浪与小说的访问量所占比例之和角度3 条形图与折线图[例4] [2022·山东烟台二中月考]人口普查是世界各国所广泛采用的搜集人口资料的一种科学方法,是提供全国基本人口数据的主要来源.根据人口普查的基本情况,可以科学的研究制定社会、经济、科教等各项发展政策,是国家科学决策的重要基础工作,人口普查资料是制定人口政策的依据和前提.截止目前,我国共进行了七次人口普查,下图是这七次普查的全国人口及年均增长率情况,下列说法正确的是( )A.年均增长率逐次减小B.年均增长率的极差是1.08%C.这七次普查的人口数逐次增加,且第四次增幅最小D.第七次普查的人口数最多,且第三次增幅最大[听课记录]类题通法折线图反映了事件的发展趋势,条形图反映了样本的数量分配.注意两种图形的转化.[巩固训练4] [2022·湖北武汉模拟]电力工业是一个国家的经济命脉,它在国民经济和人民生活中占有极其重要的地位.目前开发的电力主要是火电、水电、风电、核电、太阳能发电,其中,水电、风电、太阳能发电属于可再生能源发电,如图所示的是2020年各电力子行业发电量及增幅的统计图,下列说法错误的是( )A.其中火电发电量大约占全行业发电量的71%B.在火电、水电、风电、核电、太阳能发电量中,比上一年增幅最大的是风电C.火电、水电、风电、核电、太阳能发电的发电量的极差是7.28D.以上可再生能源发电量的增幅均跑赢全行业整体增幅题型三 数字特征的计算[例5] (1)[2022·湖南长沙模拟]对某种电子元件使用寿命跟踪调查,所得样本的频率分布直方图如图.由图可知,这一批电子元件中寿命的65%分位数为( )A.500 h B.450 hC.350 h D.550 h(2)某厂研制了一种生产高精产品的设备,为检验新设备生产产品的某项指标有无提高,用一台旧设备和一台新设备各生产了10件产品,得到各件产品该项指标数据如下:旧设备 9.8 10.3 10.0 10.2 9.9 9.8 10.0 10.1 10.2 9.7新设备 10.1 10.4 10.1 10.0 10.1 10.3 10.6 10.5 10.4 10.5旧设备和新设备生产产品的该项指标的样本平均数分别记为和,样本方差分别记为和.①求;②判断新设备生产产品的该项指标的均值较旧设备是否有显著提高(如果≥2,则认为新设备生产产品的该项指标的均值较旧设备有显著提高,否则不认为有显著提高).[听课记录]类题通法1.频率分布直方图中第p百分位数的计算步骤2.求方差、标准差的步骤[巩固训练5] (1)[2022·河北石家庄月考]高一(1)班30名学生的一次数学考试成绩按从小到大排序结果如下:51 54 59 60 64 68 68 70 71 7272 74 75 76 79 80 80 81 82 8385 87 88 90 91 92 93 95 98 100则估计这次数学考试成绩的第75百分位数为( )A.87 B.88C.90 D.87.5(2)[2022·广东潮阳模拟]自疫情爆发以来,由于党和国家对抗疫工作的高度重视,在人民群众的不懈努力下,我国抗疫工作取得阶段性成功,国家经济很快得到复苏.在餐饮业恢复营业后,某快餐店统计了近100天内每日接待的顾客人数,将前50天的数据进行整理得到频率分布表和频率分布直方图.组别 分组 频数 频率第1组 [20,30) 4 0.08第2组 [30,40) a第3组 [40,50) 20 b第4组 [50,60) 0.32第5组 [60,70) 4 0.08合计 50 1.00①求a、b、c的值,并估计该快餐店在前50天内每日接待的顾客人数的平均数;②已知该快餐店在前50天内每日接待的顾客人数的方差为104,在后50天内每日接待的顾客人数的平均数为51、方差为100,估计这家快餐店这100天内每日接待的顾客人数的平均数和方差.(s2==)第十章 统计与成对数据的统计分析第一节 统计教材回扣 夯实“四基”基础知识1.(1)逐个 相等 相等 (2)抽签 随机数2.样本 层4.p% (100-p)%5. (x1+x2+…+xn) [(x1-)2+(x2-)2+…+(xn-)2]基本技能、思想、活动经验1.× 2.× 3.√ 4.√5.解析:因为样本容量与总体的个体数比为,所以在每个层次抽取的个体数依次为:45×=9,25×=5,30×=6.故选B.答案:B6.解析:将10名工人某天生产同一零件个数从小到大排列为9,10,13,14,15,15,16,17,17,18.因为80%×10=8,所以样本数据的80%分位数为第8个和第9个数据的平均数,即17.答案:177.解析:总体指的是该市参加升学考试的全体学生的数学成绩,故A错误;样本是指1 000名学生的数学成绩,故B正确;样本容量是1 000,故C错误; 个体指的是每名学生的成绩,故D错误.故选B.答案:B8.解析:由图知众数为=75.设中位数为x,由于前三个矩形面积之和为0.4,第四个矩形面积为0.3,0.3+0.4>0.5,因此中位数位于第四个矩形内,得0.1=0.03(x-70),所以x≈73.3.由图知这次数学成绩的平均数为:×0.005×10+×0.015×10+×0.02×10+×0.03×10+×0.025×10+×0.005×10=72.答案:75 73.3 72题型突破 提高“四能”例1 解析:(1)在抽样过程中,个体A每一次被抽中的概率是相等的,因为总容量为21,故个体A“第一次被抽到”的可能性与“第二次被抽到”的可能性均为.故选B.(2)从随机数表第1行的第9列数字开始由左向右每次连续读取2个数字,删除超出范围及重复的编号,符合条件的编号有14,05,11,09,所以选出来的第4个个体的编号为09,故选B.解析:(3)设该单位有老年职工人数为x,则中年职工人数为3x,则160+x+3x=440,解得x=70,则该单位有老年职工70人,中年职工210人,青年职工160人,按照分层抽样方法,抽取青年职工64人,抽到的老年职工人数为64×=28人.答案:(1)B (2)B (3)28巩固训练1 解析:(1)依次从数表中读出的有效编号为:12,02,01,04,15,20,01,29,得到选出来的第7个个体的编号为29.故选C.(2)因为高校甲、乙、丙、丁四个专业分别有150,150,400,300名学生,所以本校共有学生1 000名,因为用分层抽样的方法从该校四个专业共抽取40名学生进行调查,所以每个个体被抽到的概率是=,因为丙专业有400人,所以要抽取400×=16人.答案:(1)C (2)16例2 解析:(1)由频率分布直方图知,月均用水量在[0,0.5)内的频率为0.08×0.5=0.04,同理,在[0.5,1),[1.5,2),[2,2.5),[3,3.5),[3.5,4),[4,4.5]内的频率分别为0.08,0.20,0.26,0.06,0.04,0.02.由0.04+0.08+0.5×a+0.20+0.26+0.5×a+0.06+0.04+0.02=1,解得a=0.30.(2)由(1)可知,100位居民中每人月均用水量不低于3吨的频率为0.06+0.04+0.02=0.12.根据样本中的频率,可以估计全市30万居民中月均用水量不低于3吨的人数为300 000×0.12=36 000.(3)因为前6组的频率之和为0.04+0.08+0.15+0.20+0.26+0.15=0.88>0.85,前5组的频率之和为0.04+0.08+0.15+0.20+0.26=0.73<0.85,所以2.5≤x<3.由0.30×(x-2.5)=0.85-0.73,解得x=2.9.所以估计月用水量标准为2.9吨时,85%的居民每月的用水量不超过标准.巩固训练2 解析:=0.25.因此75%的人不能录取.由频率分布直方图得70分以下的频率为(0.004+0.008+0.016+0.032)×10=0.6,80分以下的频率为0.6+0.02×10=0.8,设录取分数线为x,则=,解得x=77.5.故选D.答案:D例3 解析:方法一 设新农村建设前经济收入为a,则新农村建设后经济收入为2a,则由饼图可得新农村建设前种植收入为0.6a,其他收入为0.04a,养殖收入为0.3a.新农村建设后种植收入为0.74a,其他收入为0.1a,养殖收入为0.6a,养殖收入与第三产业收入的总和为1.16a,所以新农村建设后,种植收入减少是错误的.方法二 因为0.6<0.37×2,所以新农村建设后,种植收入增加,而不是减少,所以A是错误的.故选A.答案:A巩固训练3 解析:由访问网站的扇形比例图得,网易与搜狗的访问量所占比例之和为18%,不超过21%;腾讯和百度的访问量所占比例之和为23%,超过21%;淘宝与论坛的访问量所占比例之和为22%,超过21%;新浪与小说的访问量所占比例之和为22%,超过21%.故选A.答案:A例4 解析:对于A选项,由图可知第三次增幅最大,之后增幅减小,所以年增长率是先增后减的,故A错误;对于B选项,极差为2.09%-0.53%=1.56%,故B错误;对于C选项,第七次增幅最小,故C错误;对于D选项,第七次普查的人口数最多,且第三次增幅最大,故正确.故选D.答案:D巩固训练4 解析:对干A,≈0.71,A正确;对于B,由题图可知风电增幅10.50%,是最大增幅,B正确;对于C,火电、水电、风电、核电、太阳能发电的发电量的极差是5.28-0.14=5.14,C错误;对于D,全行业整体增幅为2.7%,而可再生能源发电量的增幅中,增幅最低的水电为5.30%,即可再生能源发电量的增幅均跑赢全行业整体增幅,D正确.答案:C例5 解析:(1)由频率分布直方图得[0,400)的频率为:×100=0.45,[0,500)的频率为:×100=0.85,所以65%分位数位于[400,500)之间,设65%分位数为x,则×100+(x-400)×=0.65,解得x=450,∴由图可知,这一批电子元件中寿命的65%分位数为450 h.故选B.解析:(2)①由表格中的数据易得:=+10.0=10.0,=+10.0=10.3,=×[(9.7-10.0)2+2×(9.8-10.0)2+(9.9-10.0)2+2×(10.0-10.0)2+(10.1-10.0)2+2×(10.2-10.0)2+(10.3-10.0)2]=0.036,=×[(10.0-10.3)2+3×(10.1-10.3)2+(10.3-10.3)2+2×(10.4-10.3)2+2×(10.5-10.3)2+(10.6-10.3)2]=0.04.②由①中数据可得=10.3-10.0=0.3,而2==,显然有成立,所以认为新设备生产产品的该项指标的均值较旧设备有显著提高.答案:(1)B (2)见解析巩固训练5 解析:(1)由30×75%=22.5,可知样本的第75百分位数为第23项数据,据此估计这次数学考试成绩的第75百分位数为88.故选B.解析:(2)①由表可知第4组的频数为50×0.32=16,所以,a=50-4-20-16-4=6,b==0.40,第2组的频率为=0.12,c==0.012,前50天内每日接待的顾客人数的平均数为:25×0.08+35×0.12+45×0.40+55×0.32+65×0.08=47.②设前50天接待的顾客人数分别为x1、x2、…、x50,后50天接待的顾客人数分别为y1、y2、…、y50,则由①知前50天的平均数=47,方差=104,后50天的平均数=51,方差=100,故这100天的平均数为=49,=,同理=,这100天的方差s2=) 由以上三式可得s2=-()2=+-==106.答案:(1)B (2)见解析 展开更多...... 收起↑ 资源预览