2026年浙江省高中数学学考总复习 第22讲统计(课件+练习(含解析))

资源下载
  1. 二一教育资源

2026年浙江省高中数学学考总复习 第22讲统计(课件+练习(含解析))

资源简介

课时作业22 统计
基础巩固
1.用抽签法进行抽样有以下几个步骤:
①将总体中的个体编号;
②把号码写在形状、大小相同的号签上(号签可以用小球、卡片、纸条制作);
③将这些号签放在一个容器内并搅拌均匀;
④从这个容器中逐个不放回地抽取号签,将取出号签所对应的个体作为样本.
这些步骤的先后顺序应为(  )
A.①②③④ B.②③④①
C.①③④② D.①④②③
2.下列问题中,最适合用简单随机抽样法抽样的是(  )
A.某电影院有32排座位,每排有40个座位,座位号是1~40,有一次报告会坐满了听众,报告会结束以后为听取意见,需留下32名听众进行座谈
B.从10台冰箱中抽出3台进行质量检查
C.某学校有在编人员160人,其中行政人员16人,教师112人,后勤人员32人,教育部门为了了解学校机构改革意见,要从中抽取一个容量为20的样本
D.某乡有山地8 000 km2,丘陵12 000 km2,平地24 000 km2,洼地4 000 km2,现抽取480 km2估计全乡农田的平均产量
3.(2025浙江7月学考)已知一组样本数据为“2,2,3,5,6,7,8”,该样本数据的中位数是(  )
A.6 B.5
C.3 D.2
4.(2024新高考Ⅱ卷)某农业研究部门在面积相等的100块稻田上种植一种新型水稻,得到各块稻田的亩产量(单位:kg)并整理下表:
亩产量 [900, 950) [950, 1 000) [1 000, 1 050) [1 050, 1 100) [1 100, 1 150) [1 150, 1 200)
生产数 6 12 18 30 24 10
据表中数据,结论中正确的是(  )
A.100块稻田亩产量中位数小于1 050 kg
B.100块稻田中的亩产量低于1 100 kg的稻田所占比例超过80%
C.100块稻田亩产量的极差介于200 kg至300 kg之间
D.100块稻田亩产量的平均值介于900 kg至1 000 kg之间
5.某城市某年1月到10月中每月空气质量为中度污染的天数分别为1,4,7,9,a,b,13,14,15,17,且9≤a≤b≤13.已知样本的中位数为10,则该样本的方差的最小值为(  )
A.21.4 B.22.6
C.22.9 D.23.5
6.某学校有男生400人,女生600人.为调查该校全体学生每天睡眠时间,采用分层随机抽样的方法抽取样本,计算得男生每天睡眠时间均值为7.5小时,方差为1,女生每天睡眠时间均值为7小时,方差为0.5.若男、女样本量按比例分配,则可估计总体方差为(  )
A.0.45 B.0.62
C.0.7 D.0.76
7.(2025全国Ⅱ卷)样本数据2,8,14,16,20的平均数为(  )
A.8 B.9
C.12 D.18
8.(多选)某公司为检测某型号汽车的质量问题,需对三个批次生产的该型号汽车进行检测,三个批次产量分别为100 000辆、150 000辆和250 000辆,公司质监部门计划从中抽取500辆进行检测,则下列说法正确的有(  )
A.样本容量为500
B.采用简单随机抽样比分层随机抽样合适
C.应采用分层随机抽样,三个批次的汽车被抽到的概率不相等
D.应采用分层随机抽样,三个批次分别抽取100辆、150辆、250辆
9.(多选)某校进行了一次创新作文大赛,共有100名同学参赛,经过评判,这100名参赛者的得分都在区间[40,90]上,其得分的频率分布直方图如图所示,则下列结论正确的有(  )
A.得分在区间[40,60)内的共有40人
B.从这100名参赛者中随机选取1人,其得分在区间[60,80)内的概率为0.5
C.估计得分的众数为55
D.这100名参赛者得分的中位数约为65
10.(多选)PM2.5的监测值是用来评价环境空气质量的指标之一.划分等级为:PM2.5日均值在35 μg/m3以下,空气质量为一级;PM2.5日均值在35~75 μg/m3,空气质量为二级;PM2.5日均值超过75 μg/m3为超标.如图是某地12月1日至10日PM2.5的日均值(单位:μg/m3)变化的折线图,关于PM2.5日均值的说法正确的有(  )
A.这10天的日均值的80%分位数为60
B.前5天的日均值的极差小于后5天的日均值的极差
C.这10天的日均值的中位数为41
D.前5天的日均值的方差小于后5天的日均值的方差
11.(2024浙江杭州高二阶段练习)学校为了解学生身高(单位:cm)情况,采用分层随机抽样的方法从4 000名学生(男、女生人数之比为3∶2)中抽取了一个容量为100的样本.其中,男生平均身高为175,方差为184,女生平均身高为160,方差为179,用样本估计总体,则该学校学生身高的方差为   .
12.若样本a1,a2,a3的方差是2,则样本2a1+3,2a2+3,2a3+3的标准差是    .
13.某校对100名高一学生的某次数学测试成绩进行统计,分成[50,60),[60,70),[70,80),[80,90),[90,100]五组,得到如图所示频率分布直方图.
(1)求图中a的值;
(2)估计该校学生数学成绩的平均数;
(3)估计该校学生数学成绩的第75百分位数.
能力提升
14.(2024浙江余姚月考)某图书馆统计了某个月前8天纸质图书的借阅情况,整理数据得到如下折线图.根据折线图,下列结论正确的是(  )
A.这8天里,每天图书借出数的极差大于50
B.这8天里,每天图书借出数的平均数大于105
C.这8天里,每天图书借出数的中位数大于101
D.前4天图书借出数的方差小于后4天图书借出数的方差
15.(多选)有一组样本数据x1,x2,…,x6,其中x1是最小值,x6是最大值,则(  )
A.x2,x3,x4,x5的平均数等于x1,x2,…,x6的平均数
B.x2,x3,x4,x5的中位数等于x1,x2,…,x6的中位数
C.x2,x3,x4,x5的标准差不小于x1,x2,…,x6的标准差
D.x2,x3,x4,x5的极差不大于x1,x2,…,x6的极差
16.某学校对该校学生每周零花钱的数额进行了随机调查,现将统计数据按区间[0,20),[20,40),…,[120,140]分组后绘成如图所示的频率分布直方图,已知a=3b.
(1)求频率分布直方图中a,b的值;
(2)估计该校学生每周零花钱的第55百分位数;
(3)若按照各组频率的比例采用分层随机抽样的方法从每周零花钱在区间[60,120)内的学生中抽取11人,求在区间[100,120)内抽取的人数.
参考答案
基础巩固
1.A 解析 利用抽签法第一步要进行编号,然后做号签,放入容器,最后按照逐个不放回地抽取号签.故这些步骤的先后顺序应为①②③④.故选A.
2.B 解析 根据总体数据特点分别适用哪种抽样特点,选取适当的抽样方法即可.对于A,数量大,不适合;
对于B,从10台冰箱中抽出3台进行质量检查,适合简单随机抽样;
对于C,D,适合分层随机抽样.故选B.
3.B 解析 样本数据共7个,由中位数定义可知,从小到大排列后,选择第4个数作为中位数,即5.故选B.
4.C 解析 由6+12+18=36<50,6+12+18+30=66>50,得中位数在[1 050,1 100)范围内,故A错误;
亩产量低于1 100 kg的稻田生产数为6+12+18+30=66,=66%<80%,故B错误;
亩产量最大值在[1 150,1 200)范围内,最小值在[900,950)范围内,故极差在(1 150-950,1 200-900)范围内,即200 kg至300 kg之间,故C正确;
取各区间中点估算平均值:925×+975×+1 025×+1 075×+1 125×+1 175×=1 067,大于1 000 kg,故D错误.故选C.
5.B 解析 由题可知,a+b=20,则该组数据的平均数为=10,方差s2=,当且仅当a=b=10时,方差最小,且最小值为s2==22.6.
故选B.
6.D 解析 由题意计算总体样本平均数为x=0.4×7.5+0.6×7=7.2,故所求总体方差s2=0.4×[1+(7.5-7.2)2]+0.6×[0.5+(7-7.2)2]=0.76.
故选D.
7.C 解析 样本数据2,8,14,16,20的平均数为=12.故选C.
8.AD
9.ABC 解析 根据频率和为1,由(a+0.035+0.030+0.020+0.010)×10=1,解得a=0.005,
得分在区间[40,60)内的频率是0.40,得分在区间[40,60)内的有100×0.40=40(人),故A正确;
得分在区间[60,80)内的频率为0.5,可得从这100名参赛者中随机选取一人,得分在区间[60,80)内的概率为0.5,故B正确;
根据频率分布直方图知,最高的小矩形底边中点的横坐标为=55,即估计得分的众数为55,故C正确;
由0.05+0.35=0.4<0.5,知中位数位于区间[60,70)内,所以中位数的估计值为60+≈63.3,故D错误.故选ABC.
10.BD 解析 10个数据为30,32,34,40,41,45,48,60,78,80,10×0.8=8,故80%分位数为=69,故A错误;
前5天的日均值的极差为41-30=11,后5天的日均值的极差为80-45=35,故B正确;
中位数是=43,故C错误;
根据折线图可知,前5天数据波动性小于后5天数据波动性,故D正确.故选BD.
11.236 解析 根据题意,由于男、女生人数之比为3∶2,则样本中男、女生人数之比为3∶2,
其中,男生平均身高为175,方差为184,女生平均身高为160,方差为179,
则样本的平均数×175+×160=169,
样本的方差s2=×[184+(175-169)2]+×[179+(160-169)2]=236,
用样本估计总体,则该学校学生身高的方差为236.
12.2 解析 样本a1,a2,a3的方差是2,设其平均数为,则样本2a1+3,2a2+3,2a3+3的平均数为2+3,方差为s2=[(2a1-2)2+(2a2-2)2+(2a3-2)2]=×4[(a1-)2+(a2-)2+(a3-)2]=4×2=8.
故样本2a1+3,2a2+3,2a3+3的标准差为2.
13.解 (1)由于组距为10,所以有a+0.02+0.025+0.035+a=0.1,从而a=0.01.
(2)平均数为0.1×55+0.2×65+0.35×75+0.25×85+0.1×95=75.5.
(3)第75百分位数为80+×10=84.
能力提升
14.C 解析 对于A,每天图书借出数的极差为130-80=50,故A错误;
对于B,每天图书借出数的平均数为<105,故B错误;
对于C,数据从小到大排序为80,86,97,101,103,108,121,130,则中位数为=102>101,故C正确;
对于D,前4天平均数为=101,则方差为×[(86-101)2+(108-101)2+(80-101)2+(130-101)2]=389,后4天平均数为=105.5,则方差为×[(103-105.5)2+(97-105.5)2+(101-105.5)2+(121-105.5)2]=84.75,
所以前4天图书借出数的方差大于后4天图书借出数的方差,故D错误.故选C.
15.BD 解析 对于A,如1,2,2,2,2,5的平均数不等于2,2,2,2的平均数,故A错误;对于B,不妨设x2≤x3≤x4≤x5,x2,x3,x4,x5的中位数为,x1,x2,…,x6的中位数为,故B正确;对于C,因为x1是最小值,x6是最大值,所以x1,x2,…,x6的数据波动更大,故C错误;对于D,不妨设x2≤x3≤x4≤x5,则x1≤x2≤x3≤x4≤x5≤x6,所以x5-x2≤x6-x1,故D正确.故选BD.
16.解 (1)(a+0.012 5+0.007 5+2b+2×0.002 5)×20=1,又a=3b,得a=0.015,b=0.005.
(2)前3组的频率和为(0.002 5+0.005+0.012 5)×20=0.4,前4组的频率和为(0.002 5+0.005+0.012 5+0.015)×20=0.7,∴第55百分位数位于区间[60,80)内.
∴估计第55百分位数为60+×20=70.
(3)[60,80),[80,100),[100,120)这三组的频率分别为0.015×20=0.3,0.007 5×20=0.15,0.005×20=0.1,比例为6∶3∶2,则从区间[100,120)内抽取的人数为×11=2.(共27张PPT)
第22讲
统计
数 学
目标导航 建网络
教材核心知识 课标要求
获取数据的基本途径及相关概念 能根据实际问题的特点,设计恰当的抽样方法解决问题
简单随机抽样、分层随机抽样
统计图表 从样本数据中提取需要的数字特征,正确运用数据分析的方法解决实际问题
用样本估计总体(集中趋势参数及离散程度参数和取值规律、估计百分位数)
知能构建 强技能
1.抽样调查
(1)在一个调查中,我们把调查对象的全体称为总体;组成总体的每一个调查对象称为个体.
(2)抽样调查:根据一定目的,从总体中抽取一部分个体进行调查,并以此为依据对总体情况作出估计和推断的调查方法,称为抽样调查.
(3)样本:从总体中抽取的那部分个体称为样本.样本量:样本中包含的个
体数.
(4)样本数据:调查样本获得的变量值称为样本的观测数据,简称样本数据.
(5)两种基本的抽样方法:简单随机抽样、分层随机抽样.
2.统计学中的抽样方法
(1)简单随机抽样
①定义:设一个总体含有N(N为正整数)个个体,从中逐个抽取n(1≤n②具体做法:抽签法、随机数法.
③优缺点分析
优点:基本原理比较简单;当总体容量不大时比较方便;抽样误差的计算较方便.
缺点:在实际抽样中,样本量的增大会导致调查的人力、费用、时间等成本的增加.
(2)分层随机抽样
①定义:按一个或多个变量把总体划分成若干个子总体,每个个体属于且仅属于一个子总体,在每个子总体中独立地进行简单随机抽样,再把所有子总体中抽取的样本合在一起作为总样本,这样的抽样方法称为分层随机抽样,每一个子总体称为层.在分层随机抽样中,如果每层样本量都与层的大小成比例,那么称这种样本量的分配方式为比例分配.
②具体做法:第一步:计算每一层个体数与总样本量的比值;
第二步:用总样本量分别乘每一层的比值,得出每层应抽取的样本量;
第三步:用简单随机抽样的方法产生样本.
③优缺点分析
优点:在一定程度上控制了抽样误差.
缺点:总体必须要能分成差别比较大的几层时才能用,局限性比较大.
3.总体均值(总体平均数)
一般地,总体中有N个个体,它们的变量值分别为Y1,Y2,…,YN,则称Yi为总体均值,又称总体平均数.
如果总体的N个变量值中,不同的值共有k(k≤N)个,不妨记为Y1,Y2,…,Yk,其中Yi出现的频数为fi(i=1,2,…,k),则总体均值还可以写成加权平均数的形式fiYi.
4.样本均值(样本平均数)
如果从总体中抽取一个容量为n的样本,它们的变量值分别为y1,y2,…,yn,则称yi为样本均值,又称样本平均数.
在简单随机抽样中,我们常用样本平均数去估计总体平均数.
5.用样本估计总体
(1)制作频率分布表
第一步:求极差;
第二步:决定组距和组数;
第三步:将数据分组;
第四步:列频率分布表.
(2)画频率分布直方图
①小长方形的高=;
②小长方形的面积=组距×=频率;
③各个小长方形的面积总和等于1.
6.中位数、众数、平均数的定义
(1)中位数
将一组数据按大小依次排列,处于最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数.
(2)众数
一组数据中出现次数最多的数据叫做这组数据的众数.
(4)百分位数
一般地,一组数据的第p百分位数是这样一个值,它使得这组数据中至少有p%的数据小于或等于这个值,且至少有(100-p)%的数据大于或等于这个值.
7.总体离散程度的估计
如果有n个数据x1,x2,…,xn,
(1)标准差 s= .
(2)方差 s2=[(x1-)2+(x2-)2+…+(xn-)2] .
8.频率分布直方图中的常见结论
(1)众数的估计值为最高矩形的中点对应的横坐标.
(2)平均数的估计值等于频率分布直方图中每个小矩形的面积与小矩形底边中点的横坐标的乘积之和.
(3)中位数的估计值的左边和右边的小矩形的面积和是相等的.
9.平均数、方差的公式推广
(1)若数据x1,x2,…,xn的平均数为,则mx1+a,mx2+a,mx3+a,…,mxn+a的平均数是m+a.
(2)若数据x1,x2,…,xn的方差为s2,则数据ax1+b,ax2+b,ax3+b,…,axn+b的方差为a2s2.
实战演练 明方向
考向1  随机抽样方法
典例1《西游记》《三国演义》《水浒传》和《红楼梦》是中国古典文学瑰宝,并称为中国古典小说四大名著.某中学为了解本校学生阅读四大名著的情况,随机调查了100位学生,其中阅读过《西游记》或《红楼梦》的学生共有90位,阅读过《红楼梦》的学生共有80位.阅读过《西游记》且阅读过《红楼梦》的学生共有60位,则该校阅读过《西游记》的学生人数与该校学生总数比值的估计值为(  )
A.0.5 B.0.6 C.0.7 D.0.8
C
归纳总结 基本的抽样方法有简单随机抽样和分层随机抽样两种,当个体差异不大时,可选择简单随机抽样,当个体体现出显著性差异时,就要把个体根据差异分层,采用分层随机抽样.两种抽样都有一个要求,即保证每个个体等可能地被抽到.
考向2  样本的数据特征
典例2(2024浙江舟山中学开学考试)在发生某公共卫生事件期间,有专业机构认为该事件在一段时间内没有发生大规模群体感染的标志是“连续10日,每天新增疑似病例不超过7人”.过去10日,甲、乙、丙、丁四地新增疑似病例数据信息如下.
甲地:总体平均数为3,中位数为4;
乙地:总体平均数为1,总体方差大于0;
丙地:中位数为2,众数为3;
丁地:总体平均数为2,总体方差为3.
则甲、乙、丙、丁四地中,一定没有发生大规模群体感染的是(  )
A.甲地 B.乙地 C.丙地 D.丁地
D
解析 对于甲地,若连续10日的数据为0,0,0,0,4,4,4,4,4,10,则满足平均数为3,中位数为4,但不符合没有发生大规模群体感染的标志,故A错误;
对于乙地,若连续10日的数据为0,0,0,0,0,0,0,0,0,10,则满足平均数为1,方差大于0,但不符合没有发生大规模群体感染的标志,故B错误;
对于丙地,若连续10日的数据为0,0,1,1,2,2,3,3,3,10,则满足中位数为2,众数为3,但不符合没有发生大规模群体感染的标志,故C错误;
对于丁地,若总体平均数为2,假设有一天数据为8人,则方差s2> ×(8-2)2=3.6>3,不可能总体方差为3,则不可能有一天数据超过7人,符合没有发生大规模群体感染的标志,故D正确.故选D.
典例3(2025浙江7月学考)某校抽取了100名学生的体育考试的分数,某同学用频率分布直方图表示出来,如图所示,则可以得出分数在区间[70,80)的人数为    .
25
解析 由图可知,(0.005+0.010×2+0.020+x+0.030)×10=1,则x=0.025.从而分数在区间[70,80)的人数为100×0.025×10=25.
典例4(2024浙江7月学考)对某小区抽取100户居民的用电量进行调查,得到如下数据.
(1)求x的值.
(2)已知该小区的居民有800户,则用电量在150 kW·h以下的有多少户
(3)求第50百分位数.
解 (1)由题意可知,每组的频率依次为0.1,0.15,50x,0.3,0.15,0.05,
则0.1+0.15+50x+0.3+0.15+0.05=1,解得x=0.005.
(2)由题意可知,用电量在150 kW·h以下的频率为0.1+0.15=0.25,所以用电量在150 kW·h以下的有0.25×800=200户.
(3)因为0.3+0.15+0.05=0.5,所以第50百分位数为200.
考向3  均值和方差
典例5已知一组样本数据x1,x2,x3,x4,x5的方差为5,且满足x1+x2+x3+x4=4x5,则样本数据x1,x2,x3,x4,x5+5的方差为___________.
9
解析 因为x1+x2+x3+x4=4x5,所以数据x1,x2,x3,x4,x5的平均数(x1+x2+x3+x4+x5)=x5,方差s2=[(x1-)2+(x2-)2+(x3-)2+(x4-)2+(x5-)2],由已知(x1-)2+(x2-)2+(x3-)2+(x4-)2=25.
数据x1,x2,x3,x4,x5+5的平均数'=(x1+x2+x3+x4+x5+5)=x5+1,方差s'2=[(x1--1)2+(x2--1)2+(x3--1)2+(x4--1)2+(x5--4)2]=[(x1-)2-2(x1-)+(x2-)2-2(x2-)+(x3-)2-2(x3-)+(x4-)2-2(x4-)+(x5-)2-8(x5-)+20]=[25-2(x1-)-2(x2-)-2(x3-)-2(x4-)-8(x5-)+20]=[45-2(x1+x2+x3+x4+x5)+10]=9.
考向4  用样本估计总体
典例6以简单随机抽样的方式从某小区抽取100户居民用户进行用电量调查,发现他们的用电量都在50~400 kW·h之间,进行适当分组后(每组为左闭右开的区间),画出频率分布直方图如图所示.
(1)求直方图中x的值;
解 (1)由(0.000 4+0.000 8+2x+0.003 6+0.004 4+0.006)×50=1,得x=0.002 4.
(2)估计该小区居民用电量的平均值和中位数.
解估计该小区居民用电量的平均值为(0.002 4×75+0.003 6×125+0.006×175+0.004 4×225+0.002 4×275+0.000 8×325+0.000 4×375)×50=187.
因为用电量落在区间[50,200)内的频率之和为(0.002 4+0.003 6+0.006)×50=0.6,所以中位数落在区间[150,200)内.
设中位数为a,则0.002 4×50+0.003 6×50+0.006(a-150)=0.5,解得a≈183.3.
故估计该小区居民用电量的平均值为183.3.
归纳总结由频率分布直方图计算中位数、众数、平均数的方法:
众数,最高的小矩形底边中点的横坐标;中位数,先计算频率和为50%所在的组,如典例6确定中位数落在区间[50,200)内,再在该区间按比例确定50%对应的值,即为中位数;平均数是各组区间的中点值与相应频率的乘积之和.
平均数、众数、中位数提供了一组数据集中趋势的信息,方差和标准差则刻画了一组数据的分散程度,方差、标准差越小,数据就越集中,如对射击运动员来说,其射击成绩就越稳定.

展开更多......

收起↑

资源列表