【备战2023】高考一轮学案 第十章专题1:随机抽样、统计图表(学生版+教师版)

资源下载
  1. 二一教育资源

【备战2023】高考一轮学案 第十章专题1:随机抽样、统计图表(学生版+教师版)

资源简介

中小学教育资源及组卷应用平台
第十章 统计与成对数据的统计分析
专题1:随机抽样、统计图表
1.理解随机抽样的必要性和重要性.
2.会用简单随机抽样方法从总体中抽取样本,了解分层随机抽样方法.
3.理解统计图表的含义.
1.简单随机抽样
放回简单随机抽样和不放回简单随机抽样统称为简单随机抽样,除非特殊说明,所学的简单随机抽样指不放回简单随机抽样.
(1)抽取方式:逐个不放回抽取;
(2)特点:每个个体被抽到的概率相等;
(3)常用方法:抽签法和随机数法.
2.总体平均数与样本平均数
名称 定义
总体均 值(总体 平均数) 一般地,总体中有N个个体,它们的变量值分别为Y1,Y2,…,YN,则称==Yi为总体均值,又称总体平均数
如果总体的N个变量值中,不同的值共有k(k≤N)个,不妨记为Y1,Y2,…,Yk,其中Yi出现的频数fi(i=1,2,…,k),则总体均值还可以写成加权平均数的形式=fiYi
样本均 值(样本 平均数) 如果从总体中抽取一个容量为n的样本,它们的变量值分别为y1,y2,…,yn,则称==yi为样本均值,又称样本平均数
说明:(1)在简单随机抽样中,我们常用样本平均数去估计总体平均数; (2)总体平均数是一个确定的数,样本平均数具有随机性(因为样本具有随机性); (3)一般情况下,样本量越大,估计越准确
3.分层随机抽样
(1)分层随机抽样的概念
一般地,按一个或多个变量把总体划分成若干个子总体,每个个体属于且仅属于一个子总体,在每个子总体中独立地进行简单随机抽样,再把所有子总体中抽取的样本合在一起作为总样本,这样的抽样方法称为分层随机抽样,每一个子总体称为层.
(2)分层随机抽样的平均数计算
在分层随机抽样中,以层数是2层为例,如果第1层和第2层包含的个体数分别为M和N,抽取的样本量分别为m和n,第1层和第2层的样本平均数分别为,,样本平均数为,则=+=+.
我们可以用样本平均数估计总体平均数.
4.统计图表
(1)频率分布表、频率分布直方图的制作步骤及意义
(2)频率分布折线图
频率分布折线图:用线段连接频率分布直方图中各个矩形上面一边的中点,就得到频率分布折线图.
(3)其他常见统计图表
统计图表 主要应用
扇形图 直观描述各类数据占总数的比例
条形图 和直方图 直观描述不同类别或分组数据的频数和频率
折线图 描述数据随时间的变化趋势
考点一 简单随机抽样
1.(2023·全国·高三专题练习)某工厂利用随机数表对生产的700个零件进行抽样测试,先将700个零件进行编号,001,002,……,699,700.从中抽取70个样本,下图提供随机数表的第4行到第6行,若从表中第5行第6列开始向右读取数据,则得到的第6个样本编号是( )
3221183429 7864540732 5242064438 1223435677 3578905642
8442125331 3457860736 2530073286 2345788907 2368960804
3256780843 6789535577 3489948375 2253557832 4577892345
A.623 B.328 C.253 D.007
【答案】A
【分析】根据随机数表法依次读数即可.
【详解】解:从第5行第6列开始向又读取数据,
第一个数为253,第二个数是313,第三个数是457,
下一个数是860,不符合要求,下一个数是736,不符合要求,下一个是253,重复,
第四个是007,第五个是328,第六个是623.
故选:A.
2.(2022·全国·高一课时练习)下列抽样中适合用抽签法的是( )
A.从某厂生产的3000件产品中抽取600件进行质量检验
B.从某厂生产的两箱(每箱15件)产品中抽取6件进行质量检验
C.从甲、乙两厂生产的两箱(每箱50件)产品中抽取6件进行质量检验
D.从某厂生产的3000件产品中抽取10件进行质量检验
【答案】B
【分析】由抽签法适用于总体和样本容量少即可判断.
【详解】解:对于选项A、D:由于总体的个体数较多,不适合抽签法,故选项A、D错误;
对于选项C:由于甲、乙两厂生产的产品质量可能差别较大,也不适合抽签法,故选项C错误;
对于选项B:总体容量和样本容量都较小,适合抽签法,故选项B正确.
故选:B.
3.(2022·全国·高一单元测试)已知总体容量为106,若用随机数表法抽取一个容量为10的样本,下面对总体的编号正确的是( )
A.1,2,…,106 B.0,1,2,…,105
C.00,01,…,105 D.000,001,…,105
【答案】D
【分析】根据随机数表法的抽取原则判断即可.
【详解】由随机数表法抽取原则可知对总体的编号为000,001,…,105.
故选:D.
4.(2022·全国·高一课时练习)(多选)下列抽样方法不是简单随机抽样的是( )
A.在机器传送带上抽取30件产品作为样本
B.从平面直角坐标系中抽取5个点作为样本
C.箱子里共有100个零件,今从中选取10个零件进行检验,在抽样操作时,每次任意地拿出1个零件进行质量检验,检验后不再把它放回箱子里,直到抽取10个零件为止
D.某可乐公司从仓库中的1000箱可乐中一次性抽取20箱进行质量检查
【答案】ABD
【分析】根据简单随机抽样的概念即得.
【详解】A不是,因为传送带上的产品数量不确定;
B不是,因为个体的数量无限;
C是,因为满足简单随机抽样的定义;
D不是,因为它不是逐个抽取的.
故选:ABD.
5.(2022·全国·高一课时练习)关于简单随机抽样,下列说法正确的是( )
A.要求被抽取样本的总体的个体数有限 B.从总体中逐个进行抽取
C.一种有放回抽样 D.一种等可能抽样
【答案】ABD
【分析】由简单随机抽样的概念及特征判断.
【详解】解:由简单随机抽样的概念及特征可知ABD正确.
故选:ABD
简单随机抽样的适用范围
简单随机抽样常用抽签法(适用于总体中个体数较少的情况)、随机数法(适用于个体数较多的情况).
考点二 分层随机抽样
求总体或样本容量
1.(2022·全国·高一单元测试)某学校高一年级有1802人,高二年级有1600人,高三年级有1499人,现采用分层抽样从中抽取98名学生参加全国中学生禁毒知识竞赛,则在高一、高二、高三三个年级中抽取的人数分别为( )
A.33,33,30 B.36,32,30 C.36,33,29 D.35,32,31
【答案】B
【分析】根据分层抽样的定义结合题意计算即可.
【详解】先将每个年级的人数凑整,得高一年级有1800人,高二年级有1600人,高三年级有1500人,三个年级的总人数为.
则每个年级人数占总人数的比例分别为,,,
因此,各年级抽取的人数分别为,,,
故选:B.
2.(2022·江苏·金沙中学高一期末)某科研机构由科技人员、行政人员和后勤职工3种不同类型的人员组成,现要抽取一个容量为45的样本进行调查.已知科技人员共有60人,抽入样本的有20人,且行政人员与后勤职工人数之比为,则该科研机构后勤职工人数是( )
A.15 B.30 C.45 D.135
【答案】C
【分析】根据分层抽样等比例抽取的性质,即可容易求得.
【详解】不妨设行政人员有人;后勤职工有人,
根据分层抽样等比例抽取的性质,,解得.
故后勤人员有人.
故选:
3.(2021·吉林·长春市实验中学高二开学考试)从红岭中学高一年级的理科素质考试中,随机抽取70名学生的成绩得到如图所示的频率分布直方图:
(1)请补全频率分布直方图并估计该校高一学生本次考试的平均分;
(2)若用分层抽样的方法从分数在,,中共抽取26人,则,,各抽取多少人?
【答案】(1)频率分布直方图见解析,平均约为67;
(2),,分别抽取人数为16,6,4.
【分析】(1)由频率分布直方图的性质求出分数在上的频率,然后可补全频率分布直方图,由每组数据中点值乘以相应频率再求和得平均分;
(2)由三个区间上的频率按比例计算可得.
(1)由已知分数在的频率为,,
频率分布直方图如下:
平均分约为.
(2)由频率分布直方图知分数在,,的频率分别是,,,
所以分数在上的人数为,
分数在上的人数为
分数在上的人数为.
分层随机抽样及均值
(2023.全国练习题)某企业三个分厂生产同一种电子产品,三个分厂的产量分布如图所示,现在用分层随机抽样方法从三个分厂生产的产品中共抽取100件进行使用寿命的测试,则第一分厂应抽取的件数为________;测试结果为第一、二、三分厂取出的产品的平均使用寿命分别为1 020小时,980小时,1 030小时,估计这个企业生产的产品的平均使用寿命为________小时.
【答案】50 1 015 
【解析】由分层随机抽样可知,第一分厂应抽取100×50%=50(件).
由样本的平均数估计总体的平均数,可知这批电子产品的平均使用寿命约为1 020×50%+980×20%+1 030×30%=1 015(小时).
(2022·全国·专题练习)某学校高一年级在校人数为600人,其中男生320人,女生280人,为了解学生身高发展情况,按分层随机抽样的方法抽取50名男生身高为一个样本,其样本平均数为170.2 cm,抽取50名女生身高为一个样本,其样本平均数为162.0 cm,则该校高一学生的平均身高的估计值为________cm.(结果保留一位有效数字)
【答案】166.4
【解析】由题意可知,=170.2,=162.0,且M=320,N=280,
所以样本平均数=+=×170.2+×162.0≈166.4(cm)
分层随机抽样中有关计算的方法
(1)抽样比==.
(2)在分层随机抽样中,如果第一层的样本量为m,平均值为x;第二层的样本量为n,平均值为y,则样本的平均值为. 
考点三 统计图表
扇形图、条形图
1.(2022·全国·高一专题练习)年月日时分,我国在酒泉卫星发射中心用长征四号丙遥三十八运载火箭,成功发射高分三号星.某高中三个年级学生人数的比例如图所示,现采用分层抽样的办法从高一、高二、高三共抽取人参加“高分三号星”知识竞赛,则应从高二年级抽取高二学生的人数为( )
A. B. C. D.
【答案】B
【分析】将高二学生所占的比例乘以三个年级抽取的总人数,可得结果.
【详解】由题图可知,高二学生所占的比例为,所以应从高二年级抽取的人数为.
故选:B.
2.(2022·河南安阳·高一期末)郑州市某家保险公司的保险产品有以下五种:甲,一年期短险;乙,两全保险;丙,理财类保险;丁,定期寿险;戊,重大疾病保险.各种保险按相关约定进行参保与理赔,该保险公司对五个险种的参保客户进行抽样调查,得到如图所示的统计图,则以下四个说法中正确的是( )
A.42-53周岁客户人数是不低于54周岁的客户人数的4倍多
B.不低于54周岁客户参保总费用最多
C.丁险种人均参保费用最低
D.戊险种参保人都是42-53周岁的客户
【答案】A
【分析】根据条形统计图、扇形统计图和拆线统计图中所反应的数据逐一判断可得选项.
【详解】解:对于A,观察参保人年龄分布的扇形图,42-53周岁客户人数占比33%,不低于54周岁的客户人数占比8%,42-53周岁客户人数是不低于54周岁的客户人数的4倍多,故A正确;
对于B,统计图显示的是人均参保费用,由于人数未知,故不能确定哪个年龄段参保总费用最多,故B错误;
对于C,由参保险种比例,丁险种参保比例最高,但统计图看不出丁险种的人均参保费用,故C错误;
对于D,戊险种的参保人占比33%,42-53周岁客户人数占比33%,但统计图看不出两者相同,故D错误.
故选:A.
3.(2022·全国·高一单元测试)经过中央电视台《魅力中国城》栏目的三轮角逐,黔东南州以三轮竞演总分排名第一名问鼎“最具人气魅力城市”.小明统计了黔东南州从2010年到2017年的旅游总人数(单位:万人次)的变化情况(如图),从一个侧面展示了黔东南州的魅力所在.根据这个统计图,下列给出的黔东南州2010~2017年的旅游总人数的判断中正确的有( )
A.旅游总人数逐年增加
B.2017年的旅游总人数超过2015年和2016年的旅游总人数的和
C.从2010年到2013年旅游总人数增长缓慢
D.从2014年起旅游总人数增长加快
【答案】ACD
【分析】根据给定的统计图表,逐项判定,即可求解.
【详解】对于A中,根据统计图表,可得旅游总人数逐年增加,故A符合题意;
对于B中,2017年的旅游总人数没有超过2015年和2016年的旅游总人数的和,故B不符合题意;
对于C中,从2010年至2013年旅游总人数增长缓慢,故C符合题意;
对于D中,从2014年起旅游总人数增长加快,故D符合题意.
故选:ACD
4.(2022·湖南·衡阳市第六中学高一开学考试)某商场为调查商场内某品牌家电的受欢迎程度,对商场内的顾客进行了问卷调查,并对问卷调查的结果分为“非常喜欢” “比较喜欢” “感觉一般” “不太喜欢”四个等级,分别记作A B C D.根据调查结果绘制出如图所示的扇形统计图和条形统计图,请结合图中所给信息解答下列问题:
(1)将条形统计图补充完整,并标明数据;
(2)若选择“不太喜欢”的人中有一位女士,三位男士,从这四个人中挑选两个人体验使用最新型的家电产品,请用画树状图或列表法,求该女士被选中的概率;
(3)已知选择A B等级的人数需要达到,商场才评定该品牌家电为“优质品牌”.若有四人体验了该品牌在商场展示的最新型的家电产品后,又提交了4份等级为的调查问卷,与之前的调查结果合并在一起,问该品牌家电在此次调查中是否获得商场“优质品牌”评定?
【答案】(1)答案见解析;(2);(3)该品牌家电在此次调查中不能获得商场“优质品牌”评定.
【分析】(1)补全图形即得解;
(2)列表,再利用古典概型的概率计算得解;
(3)计算<80%即得解.
(1)解:补全图形如下所示.
(2)解:列表如下:
女 男1 男2 男3
女 (女,男1) (女,男2) (女,男3)
男1 (女,男1) (男1,男2) (男1,男3)
男2 (女,男2) (男1,男2) (男2,男3)
男3 (女,男3) (男1,男3) (男2,男3)
由表可知,共有12种等可能的结果,其中挑选的人中包含了女士的有6种结果,
∴.
(3)解:由于<80%,
所以该品牌家电在此次调查中不能获得商场“优质品牌”评定.
折线图
1.(2021·四川·双流中学高二开学考试(文))我国新冠肺炎疫情进入常态化,各地有序推进复工复产,下面是某地连续11天复工复产指数折线图,给出下列四个结论:
①第3天至第11天复工复产指数均超过80%;
②这11天期间,复产指数增量大于复工指数的增量;
③第9天至第11天复产指数增量大于复工指数的增量;
④第1天至第3天复工指数的方差大于第2天至第4天复工指数的方差.
其中所有正确结论的序号是( ).
A.①③ B.①②③ C.②③ D.②④
【答案】A
【分析】由折线图结合方差的概念依次判断即可.
【详解】根据折线图知,第3天至11天复工复产指数均超过80%,11天期间,复工指数增量大于复产指数增量,故①正确,②错误;
第9天至第11天复产指数增量大于复工指数增量,故③正确;
对于复工指数来说,第1天至第3天数据波动比第2天至第4天的小,即方差更小,故④错误;
综上所述,①③正确,
故选:A.
2.(2022·新疆·沙湾县第一中学高一期末(理))某市气象部门根据2020年各月的每天最高气温与最低气温的平均数据,绘制如下折线图,那么下列叙述正确的是( )
A.各月的每天最高气温平均值与最低气温平均值总体呈正相关
B.从2020年1月至8月该市每天最高气温平均值与最低气温平均值一直在上升
C.全年中各月最高气温平均值不低于25℃的月份有5个
D.全年中,2月份的最高气温平均值与最低气温平均值的差值最大
【答案】ACD
【分析】观察绘制出的折线图逐项判断即可.
【详解】由绘制出的折线图知,对于A项,各月最高气温平均值与最低气温平均值为正相关,故A正确;
对于B项,1月到2月的最低气温平均值下降,故B不正确;
对于C项,全年中各月最高气温平均值不低于25℃的月份有5月,6月,7月,8月,9月共5个,故C正确;
对于D项,2月的最高气温平均值与最低气温平均值的差值最大,故D正确.
故答案为:ACD.
3.(2023·全国·高三专题练习)为响应“绿色出行”号召,某市先后推出了“共享单车”和“新能源分时租赁汽车”,并计划在甲 乙两个工厂选择一个工厂生产汽车轮胎,现分别从甲 乙两厂各随机选取10个轮胎,将每个轮胎的宽度(单位:mm)记录下来并绘制出如下的折线图:
(1)分别计算甲 乙两厂提供的10个轮胎宽度的平均数;
(2)轮胎的宽度在内,则称这个轮胎是标准轮胎.试比较甲 乙两厂分别提供的10个轮胎中所有标准轮胎宽度的方差的大小,根据两厂的标准轮胎宽度的平均水平及其波动情况,判断这两个工厂哪个工厂会被选择.
【答案】(1)甲厂平均数195,乙厂平均数194
(2)乙厂的轮胎会被选择
【分析】(1)根据提供的数据甲 乙两厂提供的10个轮胎宽度的平均数即可;
(2)先找出是甲 乙两厂标准轮胎的数据,分别计算出他们的平均数和方差,选择方差较小的厂即可.
(1)甲厂提供的10个轮胎宽度的平均数.
乙厂提供的10个轮胎宽度的平均数.
(2)甲厂提供的10个轮胎的宽度在[194,196]内的数据为195,194,196,194,196,195,共6个,标准轮胎宽度的平均数为,
方差为
乙厂提供的10个轮胎的宽度在[194,196]内的数据为195,196,195,194,195,195,共6个,标准轮胎宽度的平均数为.
方差为
由于甲 乙两厂标准轮胎宽度的平均数相等,但乙的方差更小,所以乙厂的轮胎会被选择.
4.(2023·全国·高三专题练习)某校高一年级500名学生全部参加了体育达标测试,现从中随机抽取40名学生的测试成绩,整理并按分数段[40,50),[50,60),[60,70),[70,80),[80,90),[90,100]进行分组,假设同一组中的每个数据可用该组区间的中点值代替,则得到体育成绩的折线图如图:
(1)估计该校高一年级中体育成绩大于或等于70分的学生人数;
(2)现从体育成绩在[60,70)和[80,90)的样本学生中随机抽取2人,求2人体育成绩都在[80,90)的概率.
【答案】(1) (2)
【分析】(1)根据折线图可得体育成绩大于或等于70分的学生人数,即得答案;
(2)确定体育成绩在[60,70)和[80,90)的样本学生人数,列举出随机抽取2人,所有的基本事件,确定2人体育成绩都在[80,90)的的基本事件个数,根据古典概型的概率公式即可求得答案.
(1)根据折线图可以得到体育成绩大于或等于70分的学生人数为,
所以该校高一年级中体育成绩大于或等于70分的学生人数估计为:.
(2)体育成绩在[60,70)和[80,90)的人数分别为2、3,分别记为,
若随机抽取2人,则所有的基本事件为:,
故基本事件的总数为10,其中2人体育成绩都在[80,90)的基本事件的个数有共3个,
设A为:“2人体育成绩都在[80,90)”,则.
频率分布直方图
1.(2022·全国·高一课时练习)某市举行“中学生诗词大赛”,分初赛和复赛两个阶段进行,规定:初赛成绩不小于90分的具有复赛资格.某校有800名学生参加了初赛,所有学生的成绩均在分内,其频率直方图如图所示,则下列结果中正确的有( )
A.初赛成绩在分内的频率为0.015 B.初赛成绩在110分以下的频率为0.65
C.初赛成绩在130分以下的频率为0.9 D.初赛成绩的80百分位数的估计值是122
【答案】BCD
【分析】根据频率和为1可判断A,B,C选项,根据百分位数的定义,可判断D选项
【详解】解:对于A,初赛成绩在分内的频率为,故不正确;
对于B,初赛成绩在110分以下的频率为,故正确;
对于C,初赛成绩在130分以下的频率为,故正确;
对于D,假设初赛成绩的80百分位数为,所以,解得,故正确,
故选:BCD
2.(2022·云南昆明·高三开学考试)为了解某种作物的生长情况,抽取该作物植株高度(单位:cm)的一个随机样本,整理得到样本频率分布直方图如图所示.由此样本估计,该作物植株高度的80%分位数约为______cm.
【答案】78
【分析】根据频率分布直方图,利用分位数的概念求解.
【详解】由图可知,从左到右矩形的面积为:0.2,0.4,0.25,
因为0.2+0.4+0.25=0.85>0.8,所以80%分位数位于第3个矩形,
设80%分位数为x,所以.
故答案为:78.
3.(2023·河南·郑州市第九中学高二阶段练习)某学校1000名学生参加信息技术学分认定考试,用按性别比例分层随机抽样的方法从中抽取了100名学生的成绩,记录他们的分数,并将数据分成8组:[20,30),[30,40)…,[90,100],整理得到如下频率分布直方图:
(1)求图中a的值;
(2)已知样本中分数不低于70的男生占样本中全部男生人数的,且样本中分数不低于70的男生与女生人数之比为4:3,求总体中男生人数和女生人数.
【答案】(1)
(2)总体中男生人,女生人
【分析】(1)利用频率之和为求得.
(2)结合分层抽样的知识求得正确答案.
(1)依题意,,
解得.
(2)样本中,分数不低于的人数为人,
其中男生人,女生人.
所以,样本中男生人数为人,女生为人.
所以总体中,男生人数为人,女生人数为人.
4.(2022·全国·高一单元测试)为了了解某地高一年级学生的体能状况,某校抽取部分学生进行一分钟跳绳次数测试,将所得数据整理后,画出频率直方图(如图),则_____________;估计被抽取的学生跳绳次数的中位数是_____________.
【答案】 0.015 122
【分析】根据频率之和等于1即可求出,根据在频率分布直方图中中位数得计算方法计算即可求出中位数.
【详解】解:,解得,
因为,,
所以中位数在区间中,
设中位数为y,
则,解得,
即中位数为122.
故答案为:0.015;122
几种统计图表的特点及使用方法
(1)通过扇形图可以很清楚地表示出各部分数量同总数之间的关系.
(2)折线图可以显示随时间(根据常用比例放置)而变化的连续数据,因此非常适用于显示在相等时间间隔下数据的趋势.
(3)频率分布直方图的数据特点:
①频率分布直方图中纵轴上的数据是各组的频率除以组距的结果,不要误以为纵轴上的数据是各组的频率,不要和条形图混淆.
②频率分布直方图中各小长方形的面积之和为1,这是解题的关键,常利用频率分布直方图估计总体分布.
1.(2022·北京·高考真题)在北京冬奥会上,国家速滑馆“冰丝带”使用高效环保的二氧化碳跨临界直冷制冰技术,为实现绿色冬奥作出了贡献.如图描述了一定条件下二氧化碳所处的状态与T和的关系,其中T表示温度,单位是K;P表示压强,单位是.下列结论中正确的是( )
A.当,时,二氧化碳处于液态
B.当,时,二氧化碳处于气态
C.当,时,二氧化碳处于超临界状态
D.当,时,二氧化碳处于超临界状态
【答案】D
【分析】根据与的关系图可得正确的选项.
【详解】当,时,,此时二氧化碳处于固态,故A错误.
当,时,,此时二氧化碳处于液态,故B错误.
当,时,与4非常接近,故此时二氧化碳处于固态,
另一方面,时对应的是非超临界状态,故C错误.
当,时,因, 故此时二氧化碳处于超临界状态,故D正确.
故选:D
2.(2022·天津·高考真题)为研究某药品的疗效,选取若干名志愿者进行临床试验,所有志愿者的舒张压数据(单位:)的分组区间为,将其按从左到右的顺序分别编号为第一组,第二组,…,第五组,右图是根据试验数据制成的频率分布直方图.已知第一组与第二组共有20人,第三组中没有疗效的有6人,则第三组中有疗效的人数为( )
A.8 B.12 C.16 D.18
【答案】B
【分析】结合已知条件和频率分布直方图求出志愿者的总人数,进而求出第三组的总人数,从而可以求得结果.
【详解】志愿者的总人数为=50,
所以第三组人数为50×0.36=18,
有疗效的人数为18-6=12.
故选:B.
3.(2021·天津·高考真题)从某网络平台推荐的影视作品中抽取部,统计其评分数据,将所得个评分数据分为组:、、、,并整理得到如下的频率分布直方图,则评分在区间内的影视作品数量是( )
A. B. C. D.
【答案】D
【分析】利用频率分布直方图可计算出评分在区间内的影视作品数量.
【详解】由频率分布直方图可知,评分在区间内的影视作品数量为.
故选:D.
4.(2021·全国·高考真题(文))为了解某地农村经济情况,对该地农户家庭年收入进行抽样调查,将农户家庭年收入的调查数据整理得到如下频率分布直方图:
根据此频率分布直方图,下面结论中不正确的是( )
A.该地农户家庭年收入低于4.5万元的农户比率估计为6%
B.该地农户家庭年收入不低于10.5万元的农户比率估计为10%
C.估计该地农户家庭年收入的平均值不超过6.5万元
D.估计该地有一半以上的农户,其家庭年收入介于4.5万元至8.5万元之间
【答案】C
【分析】根据直方图的意义直接计算相应范围内的频率,即可判定ABD,以各组的中间值作为代表乘以相应的频率,然后求和即得到样本的平均数的估计值,也就是总体平均值的估计值,计算后即可判定C.
【详解】因为频率直方图中的组距为1,所以各组的直方图的高度等于频率.样本频率直方图中的频率即可作为总体的相应比率的估计值.
该地农户家庭年收入低于4.5万元的农户的比率估计值为,故A正确;
该地农户家庭年收入不低于10.5万元的农户比率估计值为,故B正确;
该地农户家庭年收入介于4.5万元至8.5万元之间的比例估计值为,故D正确;
该地农户家庭年收入的平均值的估计值为(万元),超过6.5万元,故C错误.
综上,给出结论中不正确的是C.
故选:C.
5.(2020·海南·高考真题)我国新冠肺炎疫情进入常态化,各地有序推进复工复产,下面是某地连续11天复工复产指数折线图,下列说法正确的是
A.这11天复工指数和复产指数均逐日增加;
B.这11天期间,复产指数增量大于复工指数的增量;
C.第3天至第11天复工复产指数均超过80%;
D.第9天至第11天复产指数增量大于复工指数的增量;
【答案】CD
【分析】注意到折线图中有递减部分,可判定A错误;注意考查第1天和第11天的复工复产指数的差的大小,可判定B错误;根据图象,结合复工复产指数的意义和增量的意义可以判定CD正确.
【详解】由图可知,第1天到第2天复工指数减少,第7天到第8天复工指数减少,第10天到第11复工指数减少,第8天到第9天复产指数减少,故A错误;
由图可知,第一天的复产指标与复工指标的差大于第11天的复产指标与复工指标的差,所以这11天期间,复产指数增量小于复工指数的增量,故B错误;
由图可知,第3天至第11天复工复产指数均超过80%,故C正确;
由图可知,第9天至第11天复产指数增量大于复工指数的增量,故D正确.
一、单选题
1.现要完成下列两项抽样调查:①从20罐奶粉中抽取4罐进行食品安全卫生检查;②从某社区100户高收入家庭,270户中等收入家庭,80户低收入家庭中选出45户进行消费水平调查.较为合理的抽样方法是(  )
A.①简单随机抽样,②简单随机抽样 
B.①分层随机抽样,②分层随机抽样
C.①分层随机抽样,②简单随机抽样 
D.①简单随机抽样,②分层随机抽样
【答案】D 
【解析】①中个体数量较少,且个体间无明显差异,故采用简单随机抽样;
②中高收入家庭、中等收入家庭和低收入家庭的消费水平差异明显,故采用分层随机抽样.故选D.
2.目前正开展新冠疫苗接种,接种重点人群是年龄在18-59岁的健康人员.某单位300名职工的年龄分布情况如图所示,现要从中抽取30名职工作为样本了解新冠疫苗的接种情况,则40岁以下年龄段应抽取(  )
A.6人 B.9人
C.15人 D.20人
【答案】C 
【解析】根据题意可知,40岁以下年龄段应抽取30×50%=15人.故选C.
3.为了调查城市PM2.5的情况,按地域把48个城市分成大型、中型、小型三组,相应的城市数分别为8,16,24.若用分层随机抽样的方法抽取12个城市,则应抽取的中型城市数为(  )
A.3 B.4
C.5 D.6
【答案】B 
【解析】根据分层随机抽样特点可知,抽样比为=,则应抽取的中型城市数为16×=4.
4.从某网络平台推荐的影视作品中抽取400部,统计其评分数据,将所得400个评分数据分为8组:[66,70),[70,74),…,[94,98),并整理得到如下的频率分布直方图,则评分在区间[82,86)内的影视作品数量是(  )
A.20 B.40
C.64 D.80
【答案】D 
【解析】由频率分布直方图知,评分在区间[82,86)内的影视作品的频率为(86-82)×0.05=0.2,故评分在区间[82,86)内的影视作品数量是400×0.2=80,故选D.
5. 某中学高一年级有20个班,每班50人;高二年级有30个班,每班45人.甲就读于高一,乙就读于高二.学校计划从这两个年级中共抽取235人进行视力调查,下列说法中不正确的有(  )
A.应该采用分层随机抽样法
B.高一、高二年级应分别抽取100人和135人
C.乙被抽到的可能性比甲大
D.该问题中的总体是高一、高二年级的全体学生的视力
【答案】C 
【解析】由于各年级的年龄段不一样,因此应采用分层随机抽样法.由于比例为=,因此高一年级1 000人中应抽取100人,高二年级1 350人中应抽取135人,甲、乙被抽到的可能性都是,因此只有C不正确,故应选C.
6.据2020年8月12日国家邮政局网站消息,1~7月份邮政行业业务总量完成10 497.9亿元,同比增长23.79%;业务收入完成5 909.5亿元,增长11.77%.其中,快递业务量完成408.2亿件,同比增长23.66%,超过2017年全年业务量400.6亿件;快递业务收入完成4 547.1亿元,增长13.53%.某省邮政局统计了该省1~7月份快递业务量,并绘制了如图所示的统计图,根据此图,下列结论不正确的是(  )
A.2月份城市地区和农村地区快递业务总量比1月份有明显下降
B.从2月份起,农村地区快递业务量逐月增长
C.3~7月份,城市地区快递业务量平均增长量高于农村地区
D.从2月份起,农村地区快递业务量增长幅度最大的是3月份
【答案】C 
【解析】对于A,2月份快递业务总量显然低于1月份的,所以A正确;
对于B,从2月份起,农村地区快递业务量逐月增长,所以B正确;
对于C,3~7月份,农村地区快递业务量平均增长量要高于城市地区,所以C错误;
对于D,从2月份起,3月份农村地区快递业务量增长幅度几乎为100%,而其他月份的增长幅度均比3月份的增长幅度要小很多,所以D正确.故选C.
二、多选题
7.为了了解市民对各种垃圾进行分类的情况,加强垃圾分类宣传的针对性,指导市民尽快掌握垃圾分类的方法,某市垃圾处理厂连续8周对有害垃圾错误分类情况进行了调查.经整理绘制了如图所示的有害垃圾错误分类重量累积统计图,图中横轴表示时间(单位:周),纵轴表示有害垃圾错误分类的累积重量(单位:吨).根据统计图分析,下列结论正确的是(  )
A.当x∈[0,2)时有害垃圾错误分类的重量加速增长
B.当x∈[2,4)时有害垃圾错误分类的重量匀速增长
C.当x∈[4,6)时有害垃圾错误分类的重量相对于当x∈[2,4)时增长了30%
D.当x∈[6,8]时有害垃圾错误分类的重量相对于当x∈[0,2)时减少了0.6吨
【答案】AB 
【解析】由统计图可知,第2周增长数量比第1周增长数量明显要多,所以是加速增长,所以选项A正确;
当x∈[2,4)时图象是线段,所以是匀速增长,所以选项B正确;
当x∈[4,6)时增长数量比当x∈[2,4)时增长数量要少,所以是减少,所以选项C错误;
当x∈[0,2)时共增长2.4吨,当x∈[6,8]时共增长0.6吨,所以减少了1.8吨,所以选项D错误.故选AB.
8.下表是某电器销售公司2021年度各类电器营业收入占比和净利润占比统计表:
空调类 冰箱类 小家电类 其他类
营业收入占比 90.10% 4.98% 3.82% 1.10%
净利润占比 95.80% -0.48% 3.82% 0.86%
则下列判断中正确的是(  )
A.该公司2021年度冰箱类电器销售亏损
B.该公司2021年度小家电类电器营业收入和净利润相同
C.该公司2021年度净利润主要由空调类电器销售提供
D.剔除冰箱类电器销售数据后,该公司2021年度空调类电器销售净利润占比将会降低
【答案】ACD 
【解析】根据表中数据知,该公司2021年度冰箱类电器销售净利润占比为-0.48%,是亏损的,A正确;小家电类电器营业收入占比和净利润占比是相同的,但收入与净利润不一定相同,B错误;该公司2021年度空调类电器净利润占比为95.80%,是主要利润来源,C正确;剔除冰箱类电器销售数据后,该公司2021年度空调类电器销售净利润占比将会降低,D正确.故选ACD.
9.某鱼业养殖场新进1 000尾鱼苗,测量其体长(单位:毫米),将所得数据分成6组,其分组及频数情况如下表:
分组(单 位:毫米) [70,75) [75,80) [80,85) [85,90) [90,95) [95,100]
频数 100 100 m 350 150 n
已知在按以上6个分组作出的频率分布直方图中,[95,100]分组对应小矩形的高为0.01,则下列说法正确的是(  )
A.m=250
B.鱼苗体长在[90,100]上的频率为0.16
C.鱼苗体长的中位数一定落在区间[85,90)内
D.从这批鱼苗中有放回地连续抽取50次,每次一条,则所抽取鱼苗体长落在区间[80,90)上的次数的期望为30
【答案】ACD 
【解析】因为[95,100]分组对应小矩形的高为0.01,组距为5,所以[95,100]分组对应的频率为0.01×5=0.05,n=1 000×0.05=50,则m=1 000-100-100-350-150-50=250,A正确;
鱼苗体长在[90,100]上的频率为=0.2,B错误;
因为鱼的总数为1 000,100+100+250=450,100+100+250+350=800,所以鱼苗体长的中位数一定落在区间[85,90)内,C正确;由表中数据易知,鱼苗体长落在区间[80,90)上的概率P==0.6,
设所抽取鱼苗体长落在区间[80,90)上的次数为X,
则X服从二项分布,即X~B,
则E=50×0.6=30,D正确,故选ACD.
10.校委会在全校学生范围内,组织了一次传染病及个人卫生相关知识有奖竞赛(满分100分)竞赛奖励规则如下,得分在[70,80)内的学生获三等奖,得分在[80,90)内的学生获二等奖,得分在[90,100]内的学生获一等奖,其他学生不得奖.教务处随机抽取了100名学生的竞赛成绩,并以此为样本绘制了如下样本频率分布直方图.下列说法正确的有(  )
A.抽取的100名学生中获奖的人数为30人
B.用样本估计总体,若所有参赛学生中获得一等奖的同学有720人,则参赛学生总数约为16 000人
C.从样本中随机抽取两名学生的竞赛成绩,这两名学生中恰有一名学生获奖的概率为
D.用频率代替概率,若从所有参赛学生中(参赛学生数大于10 000)随机抽取3名学生进行座读,设其中竞赛成绩在70分以上的学生数为ξ,则随机变量ξ的方差为
【答案】ACD 
【解析】由频率分布直方图可知,得分在[70,80)的频率为0.016×10=0.16,得分在[80,90)的频率为0.008×10=0.08,得分在[90,100]的频率为0.006×10=0.06,故获奖的频率为0.16+0.08+0.06=0.3,所以抽取的100名学生中获奖的人数为100×0.3=30人,故A正确;
对于B:样本中获得一等奖的频率为0.06,所以参赛学生总数720÷0.06=12 000(人),故B错误;
对于C:从样本中随机抽取两名学生的竞赛成绩,这两名学生中恰有一名学生获奖的概率P==,故C正确;对于D:依题意ξ~B,所以D=3×0.3×=,故D正确.故选ACD.
三、填空题
11.某市新上了一批便民公共自行车,有绿色和橙黄色两种颜色,且绿色公共自行车和橙黄色公共自行车的数量比为2∶1.现在按照分层随机抽样的方法抽取36辆这样的公共自行车放在某校门口,则其中绿色公共自行车有________辆.
【答案】24 
【解析】设放在该校门口的绿色公共自行车的辆数是x,则=,解得x=24.
12.分层随机抽样中,总体共分为2层,第1层的样本量为20,样本平均数为3,第2层的样本量为30,样本平均数为8,则该样本的平均数为________.
【答案】6 
【解析】=×3+×8=6.
13.某班的数学老师要对该班一模考试的数学成绩进行分析,利用随机数法抽取样本时,先将该班70名同学按00,01,02,…,69进行编号,然后从随机数表第9行第9列的数开始向右读,则选出的10个样本中第8个样本的编号是________.
(注:以下是随机数表的第8行和第9行)
第8行:63 01 63 78 59 16 95 55 67 19 98 10 50 71 75 12 86 73 58 07 44 39 52 38 79
第9行:33 21 12 34 29 78 64 56 07 82 52  42 07 44 38 15 51 00 13 42 99 66 02 79 54
【答案】38 
【解析】由随机数表知选出的10个样本依次是29,64,56,07,52,42,44,38,15,51,第8个样本编号是38.
14.对某市“四城同创”活动中800名志愿者的年龄抽样调查统计后得到频率分布直方图(如图),但是年龄组为[25,30)的数据不慎丢失,则依据此图可得:
(1)[25,30)年龄组对应小矩形的高度为________;
(2)据此估计该市“四城同创”活动中志愿者年龄在[25,35)的人数为________.
【答案】(1)0.04 (2)440 
【解析】(1)设[25,30)年龄组对应小矩形的高度为h,则5×(0.01+h+0.07+0.06+0.02)=1,解得h=0.04.(2)志愿者年龄在[25,35)年龄组的频率为5×(0.04+0.07)=0.55,故志愿者年龄在[25,35)年龄组的人数为0.55×800=440.
15.垃圾分类,人人有责.2020年12月1日,天津市正式实施《天津市生活垃圾管理条例》,根据条例,市民要把生活垃圾分类后方能够投放.已知滨海新区某校高一、高二、高三3个年级学生的环保社团志愿者人数分别为30,15,15.现按年级进行分层,采用比例分配的分层随机抽样的方法从中抽取4名同学参加垃圾分类知识交流活动.
(1)应从高一、高二、高三3个年级的环保社团志愿者中分别抽取多少人?
(2)设抽出的4名同学分别用A,B,C,D表示,现从中随机抽取2名同学分别在上午和下午作交流发言.
(i)写出这个试验的样本空间;
(ii)设事件M=“抽取的2名同学来自不同年级”,求事件M发生的概率.
【解析】(1)设抽取高一、高二、高三3个年级的环保社团志愿者人数分别为x,y,z,
由分层随机抽样,得====,
解得x=2,y=1,z=1,
∴应从高一、高二、高三3个年级的环保社团志愿者中分别抽取2人、1人、1人.
(2)(i)样本空间为:
Ω={(A,B),(A,C),(A,D),(B,A),(B,C),(B,D),(C,A),(C,B),(C,D),(D,A),(D,B),(D,C)},
共有12个样本点,每个样本点都是等可能发生的;
(ii)由(1),不妨设抽出的4名同学中,来自高一年级的是A,B,来自高二年级的是C,来自高三年级的是D,
∵M={(A,C),(A,D),(B,C),(B,D),(C,A),(C,B),(C,D),(D,A),(D,B),(D,C)},
∴n(M)=10,
∴事件M发生的概率P===.中小学教育资源及组卷应用平台
第十章 统计与成对数据的统计分析
专题1:随机抽样、统计图表
1.理解随机抽样的必要性和重要性.
2.会用简单随机抽样方法从总体中抽取样本,了解分层随机抽样方法.
3.理解统计图表的含义.
1.简单随机抽样
放回简单随机抽样和不放回简单随机抽样统称为简单随机抽样,除非特殊说明,所学的简单随机抽样指不放回简单随机抽样.
(1)抽取方式:逐个不放回抽取;
(2)特点:每个个体被抽到的概率 ;
(3)常用方法:抽签法和 .
2.总体平均数与样本平均数
名称 定义
总体均 值(总体 平均数) 一般地,总体中有N个个体,它们的变量值分别为Y1,Y2,…,YN,则称==Yi为 ,又称总体平均数
如果总体的N个变量值中,不同的值共有k(k≤N)个,不妨记为Y1,Y2,…,Yk,其中Yi出现的频数fi(i=1,2,…,k),则总体均值还可以写成加权平均数的形式=fiYi
样本均 值(样本 平均数) 如果从总体中抽取一个容量为n的样本,它们的变量值分别为y1,y2,…,yn,则称==yi为 ,又称样本平均数
说明:(1)在简单随机抽样中,我们常用样本平均数去估计总体平均数; (2)总体平均数是一个确定的数,样本平均数具有随机性(因为样本具有随机性); (3)一般情况下,样本量越大,估计越准确
3.分层随机抽样
(1)分层随机抽样的概念
一般地,按一个或多个变量把总体划分成若干个子总体,每个个体属于且仅属于一个子总体,在每个子总体中独立地进行 抽样,再把所有子总体中抽取的样本 作为总样本,这样的抽样方法称为分层随机抽样,每一个子总体称为 .
(2)分层随机抽样的平均数计算
在分层随机抽样中,以层数是2层为例,如果第1层和第2层包含的个体数分别为M和N,抽取的样本量分别为m和n,第1层和第2层的样本平均数分别为,,样本平均数为,则= .
我们可以用样本平均数估计总体平均数.
4.统计图表
(1)频率分布表、频率分布直方图的制作步骤及意义
(2)频率分布折线图
频率分布折线图:用线段连接频率分布直方图中各个矩形上面一边的 ,就得到频率分布折线图.
(3)其他常见统计图表
统计图表 主要应用
扇形图 直观描述各类数据占总数的
条形图 和直方图 直观描述不同类别或分组数据的频数和频率
折线图 描述数据随 的变化趋势
考点一 简单随机抽样
1.(2023·全国·高三专题练习)某工厂利用随机数表对生产的700个零件进行抽样测试,先将700个零件进行编号,001,002,……,699,700.从中抽取70个样本,下图提供随机数表的第4行到第6行,若从表中第5行第6列开始向右读取数据,则得到的第6个样本编号是( )
3221183429 7864540732 5242064438 1223435677 3578905642
8442125331 3457860736 2530073286 2345788907 2368960804
3256780843 6789535577 3489948375 2253557832 4577892345
A.623 B.328 C.253 D.007
【答案】A
【分析】根据随机数表法依次读数即可.
【详解】解:从第5行第6列开始向又读取数据,
第一个数为253,第二个数是313,第三个数是457,
下一个数是860,不符合要求,下一个数是736,不符合要求,下一个是253,重复,
第四个是007,第五个是328,第六个是623.
故选:A.
2.(2022·全国·高一课时练习)下列抽样中适合用抽签法的是( )
A.从某厂生产的3000件产品中抽取600件进行质量检验
B.从某厂生产的两箱(每箱15件)产品中抽取6件进行质量检验
C.从甲、乙两厂生产的两箱(每箱50件)产品中抽取6件进行质量检验
D.从某厂生产的3000件产品中抽取10件进行质量检验
【答案】B
【分析】由抽签法适用于总体和样本容量少即可判断.
【详解】解:对于选项A、D:由于总体的个体数较多,不适合抽签法,故选项A、D错误;
对于选项C:由于甲、乙两厂生产的产品质量可能差别较大,也不适合抽签法,故选项C错误;
对于选项B:总体容量和样本容量都较小,适合抽签法,故选项B正确.
故选:B.
3.(2022·全国·高一单元测试)已知总体容量为106,若用随机数表法抽取一个容量为10的样本,下面对总体的编号正确的是( )
A.1,2,…,106 B.0,1,2,…,105
C.00,01,…,105 D.000,001,…,105
【答案】D
【分析】根据随机数表法的抽取原则判断即可.
【详解】由随机数表法抽取原则可知对总体的编号为000,001,…,105.
故选:D.
4.(2022·全国·高一课时练习)(多选)下列抽样方法不是简单随机抽样的是( )
A.在机器传送带上抽取30件产品作为样本
B.从平面直角坐标系中抽取5个点作为样本
C.箱子里共有100个零件,今从中选取10个零件进行检验,在抽样操作时,每次任意地拿出1个零件进行质量检验,检验后不再把它放回箱子里,直到抽取10个零件为止
D.某可乐公司从仓库中的1000箱可乐中一次性抽取20箱进行质量检查
【答案】ABD
【分析】根据简单随机抽样的概念即得.
【详解】A不是,因为传送带上的产品数量不确定;
B不是,因为个体的数量无限;
C是,因为满足简单随机抽样的定义;
D不是,因为它不是逐个抽取的.
故选:ABD.
5.(2022·全国·高一课时练习)关于简单随机抽样,下列说法正确的是( )
A.要求被抽取样本的总体的个体数有限 B.从总体中逐个进行抽取
C.一种有放回抽样 D.一种等可能抽样
【答案】ABD
【分析】由简单随机抽样的概念及特征判断.
【详解】解:由简单随机抽样的概念及特征可知ABD正确.
故选:ABD
简单随机抽样的适用范围
简单随机抽样常用抽签法(适用于总体中个体数较少的情况)、随机数法(适用于个体数较多的情况).
考点二 分层随机抽样
求总体或样本容量
1.(2022·全国·高一单元测试)某学校高一年级有1802人,高二年级有1600人,高三年级有1499人,现采用分层抽样从中抽取98名学生参加全国中学生禁毒知识竞赛,则在高一、高二、高三三个年级中抽取的人数分别为( )
A.33,33,30 B.36,32,30 C.36,33,29 D.35,32,31
【答案】B
【分析】根据分层抽样的定义结合题意计算即可.
【详解】先将每个年级的人数凑整,得高一年级有1800人,高二年级有1600人,高三年级有1500人,三个年级的总人数为.
则每个年级人数占总人数的比例分别为,,,
因此,各年级抽取的人数分别为,,,
故选:B.
2.(2022·江苏·金沙中学高一期末)某科研机构由科技人员、行政人员和后勤职工3种不同类型的人员组成,现要抽取一个容量为45的样本进行调查.已知科技人员共有60人,抽入样本的有20人,且行政人员与后勤职工人数之比为,则该科研机构后勤职工人数是( )
A.15 B.30 C.45 D.135
【答案】C
【分析】根据分层抽样等比例抽取的性质,即可容易求得.
【详解】不妨设行政人员有人;后勤职工有人,
根据分层抽样等比例抽取的性质,,解得.
故后勤人员有人.
故选:
3.(2021·吉林·长春市实验中学高二开学考试)从红岭中学高一年级的理科素质考试中,随机抽取70名学生的成绩得到如图所示的频率分布直方图:
(1)请补全频率分布直方图并估计该校高一学生本次考试的平均分;
(2)若用分层抽样的方法从分数在,,中共抽取26人,则,,各抽取多少人?
【答案】(1)频率分布直方图见解析,平均约为67;
(2),,分别抽取人数为16,6,4.
【分析】(1)由频率分布直方图的性质求出分数在上的频率,然后可补全频率分布直方图,由每组数据中点值乘以相应频率再求和得平均分;
(2)由三个区间上的频率按比例计算可得.
(1)由已知分数在的频率为,,
频率分布直方图如下:
平均分约为.
(2)由频率分布直方图知分数在,,的频率分别是,,,
所以分数在上的人数为,
分数在上的人数为
分数在上的人数为.
分层随机抽样及均值
(2023.全国练习题)某企业三个分厂生产同一种电子产品,三个分厂的产量分布如图所示,现在用分层随机抽样方法从三个分厂生产的产品中共抽取100件进行使用寿命的测试,则第一分厂应抽取的件数为________;测试结果为第一、二、三分厂取出的产品的平均使用寿命分别为1 020小时,980小时,1 030小时,估计这个企业生产的产品的平均使用寿命为________小时.
【答案】50 1 015 
【解析】由分层随机抽样可知,第一分厂应抽取100×50%=50(件).
由样本的平均数估计总体的平均数,可知这批电子产品的平均使用寿命约为1 020×50%+980×20%+1 030×30%=1 015(小时).
(2022·全国·专题练习)某学校高一年级在校人数为600人,其中男生320人,女生280人,为了解学生身高发展情况,按分层随机抽样的方法抽取50名男生身高为一个样本,其样本平均数为170.2 cm,抽取50名女生身高为一个样本,其样本平均数为162.0 cm,则该校高一学生的平均身高的估计值为________cm.(结果保留一位有效数字)
【答案】166.4
【解析】由题意可知,=170.2,=162.0,且M=320,N=280,
所以样本平均数=+=×170.2+×162.0≈166.4(cm)
分层随机抽样中有关计算的方法
(1)抽样比==.
(2)在分层随机抽样中,如果第一层的样本量为m,平均值为x;第二层的样本量为n,平均值为y,则样本的平均值为. 
考点三 统计图表
扇形图、条形图
1.(2022·全国·高一专题练习)年月日时分,我国在酒泉卫星发射中心用长征四号丙遥三十八运载火箭,成功发射高分三号星.某高中三个年级学生人数的比例如图所示,现采用分层抽样的办法从高一、高二、高三共抽取人参加“高分三号星”知识竞赛,则应从高二年级抽取高二学生的人数为( )
A. B. C. D.
【答案】B
【分析】将高二学生所占的比例乘以三个年级抽取的总人数,可得结果.
【详解】由题图可知,高二学生所占的比例为,所以应从高二年级抽取的人数为.
故选:B.
2.(2022·河南安阳·高一期末)郑州市某家保险公司的保险产品有以下五种:甲,一年期短险;乙,两全保险;丙,理财类保险;丁,定期寿险;戊,重大疾病保险.各种保险按相关约定进行参保与理赔,该保险公司对五个险种的参保客户进行抽样调查,得到如图所示的统计图,则以下四个说法中正确的是( )
A.42-53周岁客户人数是不低于54周岁的客户人数的4倍多
B.不低于54周岁客户参保总费用最多
C.丁险种人均参保费用最低
D.戊险种参保人都是42-53周岁的客户
【答案】A
【分析】根据条形统计图、扇形统计图和拆线统计图中所反应的数据逐一判断可得选项.
【详解】解:对于A,观察参保人年龄分布的扇形图,42-53周岁客户人数占比33%,不低于54周岁的客户人数占比8%,42-53周岁客户人数是不低于54周岁的客户人数的4倍多,故A正确;
对于B,统计图显示的是人均参保费用,由于人数未知,故不能确定哪个年龄段参保总费用最多,故B错误;
对于C,由参保险种比例,丁险种参保比例最高,但统计图看不出丁险种的人均参保费用,故C错误;
对于D,戊险种的参保人占比33%,42-53周岁客户人数占比33%,但统计图看不出两者相同,故D错误.
故选:A.
3.(2022·全国·高一单元测试)经过中央电视台《魅力中国城》栏目的三轮角逐,黔东南州以三轮竞演总分排名第一名问鼎“最具人气魅力城市”.小明统计了黔东南州从2010年到2017年的旅游总人数(单位:万人次)的变化情况(如图),从一个侧面展示了黔东南州的魅力所在.根据这个统计图,下列给出的黔东南州2010~2017年的旅游总人数的判断中正确的有( )
A.旅游总人数逐年增加
B.2017年的旅游总人数超过2015年和2016年的旅游总人数的和
C.从2010年到2013年旅游总人数增长缓慢
D.从2014年起旅游总人数增长加快
【答案】ACD
【分析】根据给定的统计图表,逐项判定,即可求解.
【详解】对于A中,根据统计图表,可得旅游总人数逐年增加,故A符合题意;
对于B中,2017年的旅游总人数没有超过2015年和2016年的旅游总人数的和,故B不符合题意;
对于C中,从2010年至2013年旅游总人数增长缓慢,故C符合题意;
对于D中,从2014年起旅游总人数增长加快,故D符合题意.
故选:ACD
4.(2022·湖南·衡阳市第六中学高一开学考试)某商场为调查商场内某品牌家电的受欢迎程度,对商场内的顾客进行了问卷调查,并对问卷调查的结果分为“非常喜欢” “比较喜欢” “感觉一般” “不太喜欢”四个等级,分别记作A B C D.根据调查结果绘制出如图所示的扇形统计图和条形统计图,请结合图中所给信息解答下列问题:
(1)将条形统计图补充完整,并标明数据;
(2)若选择“不太喜欢”的人中有一位女士,三位男士,从这四个人中挑选两个人体验使用最新型的家电产品,请用画树状图或列表法,求该女士被选中的概率;
(3)已知选择A B等级的人数需要达到,商场才评定该品牌家电为“优质品牌”.若有四人体验了该品牌在商场展示的最新型的家电产品后,又提交了4份等级为的调查问卷,与之前的调查结果合并在一起,问该品牌家电在此次调查中是否获得商场“优质品牌”评定?
【答案】(1)答案见解析;(2);(3)该品牌家电在此次调查中不能获得商场“优质品牌”评定.
【分析】(1)补全图形即得解;
(2)列表,再利用古典概型的概率计算得解;
(3)计算<80%即得解.
(1)解:补全图形如下所示.
(2)解:列表如下:
女 男1 男2 男3
女 (女,男1) (女,男2) (女,男3)
男1 (女,男1) (男1,男2) (男1,男3)
男2 (女,男2) (男1,男2) (男2,男3)
男3 (女,男3) (男1,男3) (男2,男3)
由表可知,共有12种等可能的结果,其中挑选的人中包含了女士的有6种结果,
∴.
(3)解:由于<80%,
所以该品牌家电在此次调查中不能获得商场“优质品牌”评定.
折线图
1.(2021·四川·双流中学高二开学考试(文))我国新冠肺炎疫情进入常态化,各地有序推进复工复产,下面是某地连续11天复工复产指数折线图,给出下列四个结论:
①第3天至第11天复工复产指数均超过80%;
②这11天期间,复产指数增量大于复工指数的增量;
③第9天至第11天复产指数增量大于复工指数的增量;
④第1天至第3天复工指数的方差大于第2天至第4天复工指数的方差.
其中所有正确结论的序号是( ).
A.①③ B.①②③ C.②③ D.②④
【答案】A
【分析】由折线图结合方差的概念依次判断即可.
【详解】根据折线图知,第3天至11天复工复产指数均超过80%,11天期间,复工指数增量大于复产指数增量,故①正确,②错误;
第9天至第11天复产指数增量大于复工指数增量,故③正确;
对于复工指数来说,第1天至第3天数据波动比第2天至第4天的小,即方差更小,故④错误;
综上所述,①③正确,
故选:A.
2.(2022·新疆·沙湾县第一中学高一期末(理))某市气象部门根据2020年各月的每天最高气温与最低气温的平均数据,绘制如下折线图,那么下列叙述正确的是( )
A.各月的每天最高气温平均值与最低气温平均值总体呈正相关
B.从2020年1月至8月该市每天最高气温平均值与最低气温平均值一直在上升
C.全年中各月最高气温平均值不低于25℃的月份有5个
D.全年中,2月份的最高气温平均值与最低气温平均值的差值最大
【答案】ACD
【分析】观察绘制出的折线图逐项判断即可.
【详解】由绘制出的折线图知,对于A项,各月最高气温平均值与最低气温平均值为正相关,故A正确;
对于B项,1月到2月的最低气温平均值下降,故B不正确;
对于C项,全年中各月最高气温平均值不低于25℃的月份有5月,6月,7月,8月,9月共5个,故C正确;
对于D项,2月的最高气温平均值与最低气温平均值的差值最大,故D正确.
故答案为:ACD.
3.(2023·全国·高三专题练习)为响应“绿色出行”号召,某市先后推出了“共享单车”和“新能源分时租赁汽车”,并计划在甲 乙两个工厂选择一个工厂生产汽车轮胎,现分别从甲 乙两厂各随机选取10个轮胎,将每个轮胎的宽度(单位:mm)记录下来并绘制出如下的折线图:
(1)分别计算甲 乙两厂提供的10个轮胎宽度的平均数;
(2)轮胎的宽度在内,则称这个轮胎是标准轮胎.试比较甲 乙两厂分别提供的10个轮胎中所有标准轮胎宽度的方差的大小,根据两厂的标准轮胎宽度的平均水平及其波动情况,判断这两个工厂哪个工厂会被选择.
【答案】(1)甲厂平均数195,乙厂平均数194
(2)乙厂的轮胎会被选择
【分析】(1)根据提供的数据甲 乙两厂提供的10个轮胎宽度的平均数即可;
(2)先找出是甲 乙两厂标准轮胎的数据,分别计算出他们的平均数和方差,选择方差较小的厂即可.
(1)甲厂提供的10个轮胎宽度的平均数.
乙厂提供的10个轮胎宽度的平均数.
(2)甲厂提供的10个轮胎的宽度在[194,196]内的数据为195,194,196,194,196,195,共6个,标准轮胎宽度的平均数为,
方差为
乙厂提供的10个轮胎的宽度在[194,196]内的数据为195,196,195,194,195,195,共6个,标准轮胎宽度的平均数为.
方差为
由于甲 乙两厂标准轮胎宽度的平均数相等,但乙的方差更小,所以乙厂的轮胎会被选择.
4.(2023·全国·高三专题练习)某校高一年级500名学生全部参加了体育达标测试,现从中随机抽取40名学生的测试成绩,整理并按分数段[40,50),[50,60),[60,70),[70,80),[80,90),[90,100]进行分组,假设同一组中的每个数据可用该组区间的中点值代替,则得到体育成绩的折线图如图:
(1)估计该校高一年级中体育成绩大于或等于70分的学生人数;
(2)现从体育成绩在[60,70)和[80,90)的样本学生中随机抽取2人,求2人体育成绩都在[80,90)的概率.
【答案】(1) (2)
【分析】(1)根据折线图可得体育成绩大于或等于70分的学生人数,即得答案;
(2)确定体育成绩在[60,70)和[80,90)的样本学生人数,列举出随机抽取2人,所有的基本事件,确定2人体育成绩都在[80,90)的的基本事件个数,根据古典概型的概率公式即可求得答案.
(1)根据折线图可以得到体育成绩大于或等于70分的学生人数为,
所以该校高一年级中体育成绩大于或等于70分的学生人数估计为:.
(2)体育成绩在[60,70)和[80,90)的人数分别为2、3,分别记为,
若随机抽取2人,则所有的基本事件为:,
故基本事件的总数为10,其中2人体育成绩都在[80,90)的基本事件的个数有共3个,
设A为:“2人体育成绩都在[80,90)”,则.
频率分布直方图
1.(2022·全国·高一课时练习)某市举行“中学生诗词大赛”,分初赛和复赛两个阶段进行,规定:初赛成绩不小于90分的具有复赛资格.某校有800名学生参加了初赛,所有学生的成绩均在分内,其频率直方图如图所示,则下列结果中正确的有( )
A.初赛成绩在分内的频率为0.015 B.初赛成绩在110分以下的频率为0.65
C.初赛成绩在130分以下的频率为0.9 D.初赛成绩的80百分位数的估计值是122
【答案】BCD
【分析】根据频率和为1可判断A,B,C选项,根据百分位数的定义,可判断D选项
【详解】解:对于A,初赛成绩在分内的频率为,故不正确;
对于B,初赛成绩在110分以下的频率为,故正确;
对于C,初赛成绩在130分以下的频率为,故正确;
对于D,假设初赛成绩的80百分位数为,所以,解得,故正确,
故选:BCD
2.(2022·云南昆明·高三开学考试)为了解某种作物的生长情况,抽取该作物植株高度(单位:cm)的一个随机样本,整理得到样本频率分布直方图如图所示.由此样本估计,该作物植株高度的80%分位数约为______cm.
【答案】78
【分析】根据频率分布直方图,利用分位数的概念求解.
【详解】由图可知,从左到右矩形的面积为:0.2,0.4,0.25,
因为0.2+0.4+0.25=0.85>0.8,所以80%分位数位于第3个矩形,
设80%分位数为x,所以.
故答案为:78.
3.(2023·河南·郑州市第九中学高二阶段练习)某学校1000名学生参加信息技术学分认定考试,用按性别比例分层随机抽样的方法从中抽取了100名学生的成绩,记录他们的分数,并将数据分成8组:[20,30),[30,40)…,[90,100],整理得到如下频率分布直方图:
(1)求图中a的值;
(2)已知样本中分数不低于70的男生占样本中全部男生人数的,且样本中分数不低于70的男生与女生人数之比为4:3,求总体中男生人数和女生人数.
【答案】(1)
(2)总体中男生人,女生人
【分析】(1)利用频率之和为求得.
(2)结合分层抽样的知识求得正确答案.
(1)依题意,,
解得.
(2)样本中,分数不低于的人数为人,
其中男生人,女生人.
所以,样本中男生人数为人,女生为人.
所以总体中,男生人数为人,女生人数为人.
4.(2022·全国·高一单元测试)为了了解某地高一年级学生的体能状况,某校抽取部分学生进行一分钟跳绳次数测试,将所得数据整理后,画出频率直方图(如图),则_____________;估计被抽取的学生跳绳次数的中位数是_____________.
【答案】 0.015 122
【分析】根据频率之和等于1即可求出,根据在频率分布直方图中中位数得计算方法计算即可求出中位数.
【详解】解:,解得,
因为,,
所以中位数在区间中,
设中位数为y,
则,解得,
即中位数为122.
故答案为:0.015;122
几种统计图表的特点及使用方法
(1)通过扇形图可以很清楚地表示出各部分数量同总数之间的关系.
(2)折线图可以显示随时间(根据常用比例放置)而变化的连续数据,因此非常适用于显示在相等时间间隔下数据的趋势.
(3)频率分布直方图的数据特点:
①频率分布直方图中纵轴上的数据是各组的频率除以组距的结果,不要误以为纵轴上的数据是各组的频率,不要和条形图混淆.
②频率分布直方图中各小长方形的面积之和为1,这是解题的关键,常利用频率分布直方图估计总体分布.
1.(2022·北京·高考真题)在北京冬奥会上,国家速滑馆“冰丝带”使用高效环保的二氧化碳跨临界直冷制冰技术,为实现绿色冬奥作出了贡献.如图描述了一定条件下二氧化碳所处的状态与T和的关系,其中T表示温度,单位是K;P表示压强,单位是.下列结论中正确的是( )
A.当,时,二氧化碳处于液态
B.当,时,二氧化碳处于气态
C.当,时,二氧化碳处于超临界状态
D.当,时,二氧化碳处于超临界状态
2.(2022·天津·高考真题)为研究某药品的疗效,选取若干名志愿者进行临床试验,所有志愿者的舒张压数据(单位:)的分组区间为,将其按从左到右的顺序分别编号为第一组,第二组,…,第五组,右图是根据试验数据制成的频率分布直方图.已知第一组与第二组共有20人,第三组中没有疗效的有6人,则第三组中有疗效的人数为( )
A.8 B.12 C.16 D.18
3.(2021·天津·高考真题)从某网络平台推荐的影视作品中抽取部,统计其评分数据,将所得个评分数据分为组:、、、,并整理得到如下的频率分布直方图,则评分在区间内的影视作品数量是( )
A. B. C. D.
4.(2021·全国·高考真题(文))为了解某地农村经济情况,对该地农户家庭年收入进行抽样调查,将农户家庭年收入的调查数据整理得到如下频率分布直方图:
根据此频率分布直方图,下面结论中不正确的是( )
A.该地农户家庭年收入低于4.5万元的农户比率估计为6%
B.该地农户家庭年收入不低于10.5万元的农户比率估计为10%
C.估计该地农户家庭年收入的平均值不超过6.5万元
D.估计该地有一半以上的农户,其家庭年收入介于4.5万元至8.5万元之间
5.(2020·海南·高考真题)我国新冠肺炎疫情进入常态化,各地有序推进复工复产,下面是某地连续11天复工复产指数折线图,下列说法正确的是
A.这11天复工指数和复产指数均逐日增加;
B.这11天期间,复产指数增量大于复工指数的增量;
C.第3天至第11天复工复产指数均超过80%;
D.第9天至第11天复产指数增量大于复工指数的增量;
一、单选题
1.现要完成下列两项抽样调查:①从20罐奶粉中抽取4罐进行食品安全卫生检查;②从某社区100户高收入家庭,270户中等收入家庭,80户低收入家庭中选出45户进行消费水平调查.较为合理的抽样方法是(  )
A.①简单随机抽样,②简单随机抽样 
B.①分层随机抽样,②分层随机抽样
C.①分层随机抽样,②简单随机抽样 
D.①简单随机抽样,②分层随机抽样
 
2.目前正开展新冠疫苗接种,接种重点人群是年龄在18-59岁的健康人员.某单位300名职工的年龄分布情况如图所示,现要从中抽取30名职工作为样本了解新冠疫苗的接种情况,则40岁以下年龄段应抽取(  )
A.6人 B.9人
C.15人 D.20人
 
3.为了调查城市PM2.5的情况,按地域把48个城市分成大型、中型、小型三组,相应的城市数分别为8,16,24.若用分层随机抽样的方法抽取12个城市,则应抽取的中型城市数为(  )
A.3 B.4
C.5 D.6
 
4.从某网络平台推荐的影视作品中抽取400部,统计其评分数据,将所得400个评分数据分为8组:[66,70),[70,74),…,[94,98),并整理得到如下的频率分布直方图,则评分在区间[82,86)内的影视作品数量是(  )
A.20 B.40
C.64 D.80
5. 某中学高一年级有20个班,每班50人;高二年级有30个班,每班45人.甲就读于高一,乙就读于高二.学校计划从这两个年级中共抽取235人进行视力调查,下列说法中不正确的有(  )
A.应该采用分层随机抽样法
B.高一、高二年级应分别抽取100人和135人
C.乙被抽到的可能性比甲大
D.该问题中的总体是高一、高二年级的全体学生的视力
 
6.据2020年8月12日国家邮政局网站消息,1~7月份邮政行业业务总量完成10 497.9亿元,同比增长23.79%;业务收入完成5 909.5亿元,增长11.77%.其中,快递业务量完成408.2亿件,同比增长23.66%,超过2017年全年业务量400.6亿件;快递业务收入完成4 547.1亿元,增长13.53%.某省邮政局统计了该省1~7月份快递业务量,并绘制了如图所示的统计图,根据此图,下列结论不正确的是(  )
A.2月份城市地区和农村地区快递业务总量比1月份有明显下降
B.从2月份起,农村地区快递业务量逐月增长
C.3~7月份,城市地区快递业务量平均增长量高于农村地区
D.从2月份起,农村地区快递业务量增长幅度最大的是3月份
二、多选题
7.为了了解市民对各种垃圾进行分类的情况,加强垃圾分类宣传的针对性,指导市民尽快掌握垃圾分类的方法,某市垃圾处理厂连续8周对有害垃圾错误分类情况进行了调查.经整理绘制了如图所示的有害垃圾错误分类重量累积统计图,图中横轴表示时间(单位:周),纵轴表示有害垃圾错误分类的累积重量(单位:吨).根据统计图分析,下列结论正确的是(  )
A.当x∈[0,2)时有害垃圾错误分类的重量加速增长
B.当x∈[2,4)时有害垃圾错误分类的重量匀速增长
C.当x∈[4,6)时有害垃圾错误分类的重量相对于当x∈[2,4)时增长了30%
D.当x∈[6,8]时有害垃圾错误分类的重量相对于当x∈[0,2)时减少了0.6吨
 
8.下表是某电器销售公司2021年度各类电器营业收入占比和净利润占比统计表:
空调类 冰箱类 小家电类 其他类
营业收入占比 90.10% 4.98% 3.82% 1.10%
净利润占比 95.80% -0.48% 3.82% 0.86%
则下列判断中正确的是(  )
A.该公司2021年度冰箱类电器销售亏损
B.该公司2021年度小家电类电器营业收入和净利润相同
C.该公司2021年度净利润主要由空调类电器销售提供
D.剔除冰箱类电器销售数据后,该公司2021年度空调类电器销售净利润占比将会降低
 
9.某鱼业养殖场新进1 000尾鱼苗,测量其体长(单位:毫米),将所得数据分成6组,其分组及频数情况如下表:
分组(单 位:毫米) [70,75) [75,80) [80,85) [85,90) [90,95) [95,100]
频数 100 100 m 350 150 n
已知在按以上6个分组作出的频率分布直方图中,[95,100]分组对应小矩形的高为0.01,则下列说法正确的是(  )
A.m=250
B.鱼苗体长在[90,100]上的频率为0.16
C.鱼苗体长的中位数一定落在区间[85,90)内
D.从这批鱼苗中有放回地连续抽取50次,每次一条,则所抽取鱼苗体长落在区间[80,90)上的次数的期望为30
 
10.校委会在全校学生范围内,组织了一次传染病及个人卫生相关知识有奖竞赛(满分100分)竞赛奖励规则如下,得分在[70,80)内的学生获三等奖,得分在[80,90)内的学生获二等奖,得分在[90,100]内的学生获一等奖,其他学生不得奖.教务处随机抽取了100名学生的竞赛成绩,并以此为样本绘制了如下样本频率分布直方图.下列说法正确的有(  )
A.抽取的100名学生中获奖的人数为30人
B.用样本估计总体,若所有参赛学生中获得一等奖的同学有720人,则参赛学生总数约为16 000人
C.从样本中随机抽取两名学生的竞赛成绩,这两名学生中恰有一名学生获奖的概率为
D.用频率代替概率,若从所有参赛学生中(参赛学生数大于10 000)随机抽取3名学生进行座读,设其中竞赛成绩在70分以上的学生数为ξ,则随机变量ξ的方差为
三、填空题
11.某市新上了一批便民公共自行车,有绿色和橙黄色两种颜色,且绿色公共自行车和橙黄色公共自行车的数量比为2∶1.现在按照分层随机抽样的方法抽取36辆这样的公共自行车放在某校门口,则其中绿色公共自行车有________辆.
12.分层随机抽样中,总体共分为2层,第1层的样本量为20,样本平均数为3,第2层的样本量为30,样本平均数为8,则该样本的平均数为________.
13.某班的数学老师要对该班一模考试的数学成绩进行分析,利用随机数法抽取样本时,先将该班70名同学按00,01,02,…,69进行编号,然后从随机数表第9行第9列的数开始向右读,则选出的10个样本中第8个样本的编号是________.
(注:以下是随机数表的第8行和第9行)
第8行:63 01 63 78 59 16 95 55 67 19 98 10 50 71 75 12 86 73 58 07 44 39 52 38 79
第9行:33 21 12 34 29 78 64 56 07 82 52  42 07 44 38 15 51 00 13 42 99 66 02 79 54
 
14.对某市“四城同创”活动中800名志愿者的年龄抽样调查统计后得到频率分布直方图(如图),但是年龄组为[25,30)的数据不慎丢失,则依据此图可得:
(1)[25,30)年龄组对应小矩形的高度为________;
(2)据此估计该市“四城同创”活动中志愿者年龄在[25,35)的人数为________.
15.垃圾分类,人人有责.2020年12月1日,天津市正式实施《天津市生活垃圾管理条例》,根据条例,市民要把生活垃圾分类后方能够投放.已知滨海新区某校高一、高二、高三3个年级学生的环保社团志愿者人数分别为30,15,15.现按年级进行分层,采用比例分配的分层随机抽样的方法从中抽取4名同学参加垃圾分类知识交流活动.
(1)应从高一、高二、高三3个年级的环保社团志愿者中分别抽取多少人?
(2)设抽出的4名同学分别用A,B,C,D表示,现从中随机抽取2名同学分别在上午和下午作交流发言.
(i)写出这个试验的样本空间;
(ii)设事件M=“抽取的2名同学来自不同年级”,求事件M发生的概率.

展开更多......

收起↑

资源列表