2025届高中数学一轮复习:第九章9.1 随机抽样、统计图表(课件+讲义+练习四份打包)

资源下载
  1. 二一教育资源

2025届高中数学一轮复习:第九章9.1 随机抽样、统计图表(课件+讲义+练习四份打包)

资源简介

(共86张PPT)
第九章
§9.1 随机抽样、统计图表
课标要求
1.了解获取数据的基本途径.
2.会用简单随机抽样的方法从总体中抽取样本,了解分层随机抽样.
3.能根据实际问题的特点选择恰当的统计图表,体会使用统计图表的重要性.
内容索引
第一部分 落实主干知识
第二部分 探究核心题型
课时精练
第一部分
落实主干知识
1.总体、个体、样本
调查对象的全体(或调查对象的某些指标的全体)称为 ,组成总体的每一个调查对象(或每一个调查对象的相应指标)称为 ,在抽样调查中,从总体中抽取的那部分个体称为 ,样本中包含的个体数称为_____
,简称样本量.
2.简单随机抽样
和 是比较常用的两种方法.
总体
个体
样本
样本
容量
抽签法
随机数法
3.分层随机抽样
一般地,按一个或多个变量把总体划分成若干个子总体,每个个体属于且仅属于一个子总体,在每个子总体中独立地进行简单随机抽样,再把所有子总体中抽取的样本合在一起作为总样本,这样的抽样方法称为
,每一个子总体称为 .
4.统计图表
(1)常见的统计图表有 、 、 、 等.
分层随机抽样

条形图
扇形图
折线图
频率分布直方图
(2)作频率分布直方图的步骤
①求 ;
②决定 与 ;
③将 分组;
④列频率分布表;
⑤画频率分布直方图.
极差
组距
组数
数据
1.利用按比例分配的分层随机抽样要注意按比例抽取,若各层应抽取的个体数不都是整数,可以进行一定的技术处理,比如将结果取成整数等.
3.频率分布直方图中纵轴上的数据是各组的频率除以组距,不要和条形图混淆.
1.判断下列结论是否正确.(请在括号中打“√”或“×”)
(1)在简单随机抽样中,每个个体被抽到的机会与先后顺序有关.(  )
(2)抽签法和随机数法都是简单随机抽样.(  )
(3)在按比例分配的分层随机抽样中,每个个体被抽到的可能性与层数及分层有关.(  )
(4)在频率分布直方图中,小长方形的面积越大,表示样本数据落在该区间的频率越大.(  )
×

×

2.从某年级500名学生中抽取60名学生进行体重的统计分析,就这个问题来说,下列说法不正确的是
A.500名学生的体重是总体
B.每名被抽取的学生的体重是个体
C.抽取的60名学生的体重是一个样本
D.抽取的60名学生的体重是样本容量

由题可知,从某年级500名学生中抽取60名学生进行体重的统计分析,
其中总体是该年级500名学生的体重,个体是每名被抽取的学生的体重,
样本是抽取的60名学生的体重,样本容量是60,故只有D不正确.
3.“中国天眼”为500米口径球面射电望远镜,是具有我国自主知识产权、世界最大单口径、最灵敏的射电望远镜.建造“中国天眼”的目的是
A.通过调查获取数据 B.通过试验获取数据
C.通过观察获取数据 D.通过查询获得数据

“中国天眼”主要是通过观察获取数据.
4.(2023·宝鸡模拟)从某校随机抽取某次数学考试100分以上(含100分,满分150分)的学生成绩,将他们的分数数据绘制成如图所示的频率分布直方图.若共抽取了100名学生的成绩,则分数在[120,130)内的人数为______.
30
因为频率分布直方图中所有的小矩形面积和为1,
所以(0.005+0.035+a+0.020+0.010)×10=1,解得a=0.030,
所以分数在[120,130)内的人数为100×0.030
×10=30.
返回
第二部分
探究核心题型
题型一 抽样方法
例1 (1)某工厂利用随机数法对生产的700个零件进行抽样测试,先将700个零件进行编号,001,002,…,699,700.从中抽取70个样本,下面提供了随机数表的第5行到第6行数据,若从随机数表中第5行第6列开始向右读取数据,则得到的第6个样本编号是
8442125331 3457860736 2530073286
2345788907 2368960804
3256780843 6789535577 3489948375
2253557832 4577892345
A.623   B.328   C.253   D.007

从第5行第6列开始向右读取数据,第一个数为253,第二个数是313,第三个数是457,下一个数是860,不符合要求,下一个数是736,不符合要求,下一个是253,重复,则第四个数是007,第五个数是328,第六个数是623.
(2)某小学三年级共有学生500名,随机抽查100名学生并提问中国古代四大发明,能说出两种发明的有45人,能说出三种及以上发明的有32人,据此估计该校三年级500名学生中,对四大发明只能说出一种或一种也说不出的有
A.69人   B.84人   C.108人   D.115人

(1)简单随机抽样需满足:①被抽取的样本总体的个体数有限;②等可能抽取.
跟踪训练1 (1)下列抽样方法是简单随机抽样的是
A.某医院从200名医生中,挑选出50名最优秀的医生去参加培训
B.从10部手机中逐个不放回地随机抽取2部进行质量检验
C.从空间直角坐标系中抽取10个点作为样本
D.饮料公司从仓库中的500箱饮料中一次性抽取前10箱进行质量检查

A选项中,挑选出50名最优秀的医生去参加培训,每个人被抽到的概率不相等,故A错误;
B选项中,从10部手机中逐个不放回地随机抽取2部进行质量检验,是简单随机抽样,故B正确;
C选项中,由于被抽取的样本的总体个数是无限的,所以不是简单随机抽样,故C错误;
D选项中,一次性抽取前10箱,每箱被抽到的概率不相等,所以不是简单随机抽样,故D错误.
(2)(2023·枣庄模拟)杭州亚运会共有3.76万“小青荷”志愿者参与服务.据统计某高校共有本科生1 600人、硕士生600人、博士生200人申请报名做志愿者,现用按比例分配的分层随机抽样方法从中抽取博士生30人,则该高校抽取的志愿者总人数为
A.300   B.320   C.340   D.360

题型二 统计图表
例2 (1)(多选)新式茶饮是指以上等茶叶的萃取浓缩液为底,再根据消费者偏好,添加牛奶、坚果、柠檬等小料调制而成的饮料.如图为2023年我国消费者购买新式茶饮的频次扇形图及月均消费新式茶饮金额的条形图.
题型二 统计图表
根据所给统计图,下列结论中正确的是
A.每周都消费新式茶饮的消费者占比不到90%
B.每天都消费新式茶饮的消费者占比超过20%
C.月均消费新式茶饮50~200元的消费者占比
 超过50%
D.月均消费新式茶饮超过100元的消费者占比
 超过60%


每周都消费新式茶饮的消费者占比为1-9.1%>90%,A错误;
每天都消费新式茶饮的消费者占比为5.4%+16.4%>20%,B正确;
月均消费新式茶饮50~200元的消费者占比为30.5%+25.6%>50%,C正确;
月均消费新式茶饮超过100元的消费者占比为1-14.5%-30.5%<60%,D错误.
(2)(多选)(2024·合肥模拟)为了解我国农业、农村、农民的基本情况,将全国第三次农业普查的部分数据整理得到如下的柱状图(单位:%),则
A.东北地区的四项数据均比中部地区高
B.西部地区的四项数据均比其他三个
 地区低
C.中部地区的发展情况相较于西部地
 区的发展较好
D.东部地区的发展情况相较于其他三个地区的发展较好


东北地区通电的村、通宽带互联网的村、有电子商务配送站点的村的占比高于中部地区,但通天然气的村的占比低于中部地区,故A错误;
西部地区通电的村、通宽带互联网的村、有电子商务配送站点的村的占比低于其他三个地区,但通天然气的村的占比高于其他三个地区,故B错误;
中部地区除通天然气的村的占比低于西部地区,其他三项数据均不低于西部地区,故中部地区的发展情况相较于西部地区较好,故C正确;
东部地区除通天然气的村的占比低于西部地区,其他三项数据均不低于其他三个地区,故东部地区的发展情况相较于其他三个地区较好,故D正确.
统计图表的主要应用
(1)扇形图:直观描述各类数据占总数的比例.
(2)折线图:描述数据随时间的变化趋势.
(3)条形图和直方图:直观描述不同类别或分组数据的频数和频率.
跟踪训练2 (1)已知全国农产品批发价格
200指数月度变化情况如图所示,下列选
项正确的是
A.全国农产品夏季价格比冬季低
B.全国农产品批发价格200指数2022年
每个月逐渐增加
C.2022年“菜篮子”产品批发价格指数与农产品批发价格200指数趋势基本
保持一致
D.2022年2月农产品批发价格200指数大于135

图中给的是批发价格200指数,所以并不能确定农产品的价格变化,故A错误;
全国农产品批发价格200指数2022年4~6月呈下降趋势,并未增加,故B错误;
根据图中曲线的变化趋势可发现2022年“菜篮子”产品批发价格指数与农产品批发价格200指数趋势基本保持一致,故C正确;
由图知2022年2月农产品批发价格200指数小于135,故D错误.
(2)(多选)(2023·潍坊模拟)新能源汽车包括纯电动汽车、增程式电动汽车、混合动力汽车、燃料电池电动汽车、氢发动机汽车等.我国的新能源汽车发展开始于21世纪初,近年来发展迅速,连续8年产销量位居世界第一.右面两图分别是2017年至2022年我国新能源汽车年产量和占比(占我国汽车年总产量的比例)情况,则
A.2017~2022年我国新能源汽车年产量逐
年增加
B.2017~2022年我国新能源汽车年产量的
极差为626.4万辆
C.2022年我国汽车年总产量超过2 700万辆
D.2019年我国汽车年总产量不低于2018年
我国汽车年总产量


由图可知,从2018年到2019年,我国新能源汽车年产量在下降,故A错;
2017~2022年我国新能源汽车年产量的极差为705.8-79.4=626.4(万辆),故B对;
所以2019年我国汽车年总产量低于2018年我国汽车年总产量,故D错.
题型三 频率分布直方图
例3 某市某月30天对空气污染指数的监测数据如下(主要污染物为可吸入颗粒物):
61 76 70 56 81 91 92 91 75 81
88 67 101 103 95 91 77 86 81 83
82 82 64 79 86 85 75 71 49 45
(1)完成频率分布表;
分组 频数 频率
[41,51)
[51,61)
[61,71)
[71,81)
[81,91)
[91,101)
[101,111]
频率分布表如表所示.
(2)作出频率分布直方图;
作出频率分布直方图,如图所示.
(3)根据国家标准,污染指数在0~50之间时,空气质量为优;在51~100之间时,空气质量为良;在101~150之间时,空气质量为轻度污染;在151~200之间时,空气质量为中度污染.请你依据所给数据和上述标准,对该市的空气质量给出一个简短评价.
答对下述两条中的一条即可.
频率分布直方图的相关结论
(1)频率分布直方图中各小长方形的面积之和为1.
(3)频率分布直方图中每组样本的频数为频率×总数.
跟踪训练3 某校为了解学生学习的效果,进行了一次摸底考试,从中选取60名学生的成绩,分成[40,50),[50,60),[60,70),[70,80),[80,90),[90,100]六组后,得到不完整的频率分布直方图如图所示,观察图形,回答下列问题:
(1)求分数在区间[70,80)内的频率,并补全这个频率分布直方图;
设分数在[70,80)内的频率为x,
根据频率分布直方图,可得(0.01+0.015+0.02+0.025+0.005)×10+x=1,解得x=0.25,
所以分数在[70,80)内的频率为0.25,
补全这个频率分布直方图,如图所示.
(2)根据评奖规则,排名在前10%的学生可以获奖,请你估计获奖的学生至少需要多少分?
因为分数在区间[80,90)内的频率为0.25,在区间[90,100]内的频率为0.05,
而0.05<10%<0.25+0.05,
设排名前10%的分界点为90-a,则0.025a+0.005×10=10%,解得a=2,
所以排名前10%的分界点为88分,即获奖的学生至少需要88分.
返回
课时精练
1
2
3
4
5
6
7
8
9
10
11
12
13
14
一、单项选择题
1.下列调查方式合适的是
A.为了了解一批炮弹的杀伤半径,采用普查的方式
B.为了了解一批玉米种子的发芽率,采用普查的方式
C.为了了解一条河流的水质,采用抽样调查的方式
D.为了了解一个寝室的学生(共5个人)每周体育锻炼的时间,采用抽样
调查的方式

1
2
3
4
5
6
7
8
9
10
11
12
13
14
A项,采用普查的方式测试炮弹杀伤半径,成本较高,不适合,故错误;
B项,采用普查的方式测试玉米的发芽率,较为烦琐且工作量较大,不适合,故错误;
C项,抽样调查了解河流水质是正确的;
D项,了解5个人的锻炼时间,适合采用普查,故错误.
2.在“世界读书日”前夕,为了了解某地5 000名居民某天的阅读时间,从中抽取了200名居民的阅读时间进行统计分析.在这个问题中,5 000名居民的阅读时间的全体是
A.总体 B.个体
C.样本容量 D.从总体中抽取的一个样本

1
2
3
4
5
6
7
8
9
10
11
12
13
14
样本容量是200,抽取的200名居民的阅读时间是一个样本,每个居民的阅读时间就是一个个体,5 000名居民的阅读时间的全体是总体.
3.(2023·西安模拟)为了解某校今年报考飞行员的学生的体重情况.将所得的数据整理后,作出了频率分布直方图(如图).已知图中从左到右的前3个小组的频率之比为1∶2∶3,第1小组的频数为4,则某校报考飞行员的学生总人数是
A.40   B.32   C.28   D.24

1
2
3
4
5
6
7
8
9
10
11
12
13
14
由图可知后两个组频率为(0.013+0.037)×5=0.25,又因为从左到右的前3个小组的频率之比为1∶2∶3,
又因为第1小组的频数为4,所以报考飞行员的学生人数是4÷0.125=32.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
4.(2023·蚌埠质检)已知某地区中小学生人数如图①所示,为了解该地区中小学生的近视情况,卫生部门根据当地中小学生人数,用按比例分配的分层随机抽样的方法抽取了10%的学生进行调查,调查数据如图②所示,则估计该地区中小学生的平均近视率为
A.50%   B.32%   C.30%   D.27%

1
2
3
4
5
6
7
8
9
10
11
12
13
14
根据题意,抽取的样本容量为(3 500+4 500+2 000)×10%=1 000,其中小学生、初中生、高中生抽取人数分别为350,450,200,根据图②知抽取的小学生、初中生、高中生中,近视的人数分别为35,135,100,
1
2
3
4
5
6
7
8
9
10
11
12
13
14
5.(2024·拉萨模拟)在统计学中,同比增长率一般是指和上年同期相比较的增长率.如图为我国2021年2月至12月及2022年3月至12月的原油产量同比增长率,则下列叙述正确的是
A.2022年8月的原油产量低于2021年
 8月的原油产量
B.2021年9月至2021年12月的原油产
 量呈逐月下降趋势
C.2022年3月至2022年11月,原油产量同比增长率最高的月份是6月
D.2022年3月至2022年11月的原油产量同比增长率的平均数不超过2.5%

1
2
3
4
5
6
7
8
9
10
11
12
13
14
1
2
3
4
5
6
7
8
9
10
11
12
13
14
2022年8月的原油产量同比增长率为负数,
说明2022年8月原油产量低于2021年8月,故A正确;
2021年9月至2021年12月的原油产量的同比增长率呈逐月下降趋势,但均大于0,则原油产量依然可能会增加,故B错误;
2022年4月的原油产量同比增长率最高,故C错误;
所以2022年3月至2022年11月的原油产量同比增长率的平均数超过2.5%,故D错误.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
1
2
3
4
5
6
7
8
9
10
11
12
13
14
6.中国古代数学专著《算法统宗》中有这样的记载:毛诗春秋周易书,九十四册共无余,毛诗一册三人读,春秋一册四人呼,周易五人读一本.意思为现有《毛诗》《春秋》《周易》3种书共94册,若干人读这些书,要求每个人都要读到这3种书,若3人共读一本《毛诗》,4人共读一本《春秋》,5人共读一本《周易》,则刚好没有剩余.现要用按比例分配的分层随机抽样的方法从中抽取47册,则要从《毛诗》中抽取的册数为
A.12   B.14   C.18   D.20

设《毛诗》有x册,《春秋》有y册,《周易》有z册,学生人数为m,
因此,用按比例分配的分层随机抽样的方法从中抽取47册,
1
2
3
4
5
6
7
8
9
10
11
12
13
14
二、多项选择题
7.(2023·柳州、南宁联考)某高中高一学生从物化生政史地六科中选三科组合,其中选物化生组合的学生有600人,选物化地组合的学生有400人,选政史地组合的学生有250人,其他组合均无人选.现从高一学生中选取25人作样本调研情况.为保证调研结果相对准确,下列判断正确的是
A.用按比例分配的分层随机抽样的方法抽取物化生组合的学生12人
B.用按比例分配的分层随机抽样的方法抽取政史地组合的学生5人
C.物化生组合学生小张被选中的概率比物化地组合学生小王被选中的概率大
D.政史地组合学生小刘被选中的概率为



1
2
3
4
5
6
7
8
9
10
11
12
13
14
1
2
3
4
5
6
7
8
9
10
11
12
13
14
1
2
3
4
5
6
7
8
9
10
11
12
13
14
8.(2024·武汉模拟)某市2022年经过招商引资后,经济收入较前一年增加了一倍,实现翻番,为更好地了解该市的经济收入的变化情况,统计了该市招商引资前后年经济收入构成比例,得到如下扇形图,则下列结论中正确的是
A.招商引资后,工资净收入较前
一年增加
B.招商引资后,转移净收入是前
一年的1.25倍
C.招商引资后,转移净收入与财产净收入的总和超过了该年经济收入的
D.招商引资后,经营净收入较前一年增加了一倍
1
2
3
4
5
6
7
8
9
10
11
12
13
14


设招商引资前经济收入为M,而招商引资后经济收入为2M,则
招商引资前工资净收入为M×60%=0.6M,而招商引资后工资净收入为2M×37%=0.74M,所以工资净收入增加了,故A正确;
招商引资前转移净收入为M×4%=0.04M,招商引资后转移净收入为2M
×5%=0.1M,所以招商引资后,转移净收入是前一年的2.5倍,故B错误;
1
2
3
4
5
6
7
8
9
10
11
12
13
14
1
2
3
4
5
6
7
8
9
10
11
12
13
14
1
2
3
4
5
6
7
8
9
10
11
12
13
14
招商引资前经营净收入为M×30%=0.3M,招商引资后经营净收入为2M×30%=0.6M,所以招商引资后,经营净收入较前一年增加了一倍,故D正确.
三、填空题
9.某公司有大量客户,且不同年龄段客户对其服务的评价有较大差异.为了解客户的评价,该公司准备进行抽样调查,可供选择的抽样方法有简单随机抽样和按比例分配的分层随机抽样,则最合适的抽样方法是___________________________.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
按比例分配的分层随机抽样
由于从不同年龄段客户中抽取,故采用按比例分配的分层随机抽样.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
10.(2023·马鞍山诊断)某学校为调查学生参加课外体育锻炼的时间,将该校某班的40名学生进行编号,分别为00,01,02,…,39,现从中抽取一个容量为10的样本进行调查,选取方法是从下面的随机数表的第1行第11列开始向右读取数据,直到取足样本,则抽取样本的第6个号码为______.
90 84 60 79 80 24 36 59 87 38 82
07 53 89 35 96 35 23 79 18 05 98
90 07 35 46 40 62 98 80 54 97 20
56 95 15 74 80 08 32 16 46 70 50
80 67 72 16 42 75
23
1
2
3
4
5
6
7
8
9
10
11
12
13
14
重复的号码只能算作一个,抽取样本号码是24,36,38,07,35,23,18,05,
20,15,所以抽取样本的第6个号码为23.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
11.(2023·咸阳质检)某高中有300名学生参加数学竞赛,其中有三分之一的学生成绩不低于100分,将不低于100分的学生成绩制成频率分布直方图(如图),分组区间是[100,110),[110,120),[120,130),[130,140),[140,150],
现用按比例分配的分层随机抽样的方法从这300名学生中随机进行抽取若干人,若成绩在[120,140)之间的抽取5人,那么应从成绩在[100,110)间的学生中抽取的人数为______.
2
1
2
3
4
5
6
7
8
9
10
11
12
13
14
在[120,130)之间的学生人数为100×10×0.030=30,在[130,140)之间的学生人数为 100×10×0.020=20,在[120,140)之间的学生人数为50,
1
2
3
4
5
6
7
8
9
10
11
12
13
14
12.某地各项事业取得令人瞩目的成就,以2022年为例,社会固定资产总投资约为3 730亿元,其中包括中央项目、省属项目、地(市)属项目、县(市)属项目和其他项目.图1、图2分别是这五个项目的投资额不完整的条形图和扇形图,请完成下列问题.
(1)地(市)属项目投资额为______亿元;
830
1
2
3
4
5
6
7
8
9
10
11
12
13
14
因为该地社会固定资产总投资约为3 730亿元,
所以地(市)属项目投资额为3 730-(200+530+670+1 500)=830(亿元).
(2)在图2中,县(市)属项目部分所占百分比为m%,对应的圆心角为β,则m=_____,β=______度(m,β均取整数).
18
65
由条形图可以看出县(市)属项目部分总投资为670亿元,
即m=18,对应的圆心角β≈360×0.18≈65(度).
1
2
3
4
5
6
7
8
9
10
11
12
13
14
四、解答题
13.某手机店根据手机销售的相关数据绘制了两幅统计图.来自该店财务部的数据报告表明,该手机店1~4月的手机销售总额是290万元.请根据图1、图2解答下列问题:
(1)该手机店3月份的销售额为多少万元?
图1
由已知及图1得,3月份手机销售额为290-(85+80+65)=60(万元).
1
2
3
4
5
6
7
8
9
10
11
12
13
14
图2
1
2
3
4
5
6
7
8
9
10
11
12
13
14
(2)该店1月份音乐手机的销售额为多少万元?
图1
图2
由图1及图2得,1月份音乐手机销售额为85×23%=19.55(万元).
1
2
3
4
5
6
7
8
9
10
11
12
13
14
(3)小刚观察图2后,认为4月份音乐手机的销售额比3月份减少了,你同意他的看法吗?请说明理由.
图1
图2
不同意.由图1及图2知,3月份音乐手机销售额为60×18%=10.8(万元),
4月份音乐手机销售额为65×17%=11.05(万元),
11.05>10.8,所以4月份音乐手机销售额比3月份音乐手机销售额增加了,所以不同意小刚的看法.
14.(2023·新高考全国Ⅱ)某研究小组经过研究发现某种疾病的患病者与未患病者的某项医学指标有明显差异,经过大量调查,得到如右的患病者和未患病者该指标的频率分布直方图:
利用该指标制定一个检测标准,需要确定临界值c,将该指标大于c的人判定为阳性,小于或等于c的人判定为阴性.此检测标准的漏诊率是将患病者判定为阴性的概率,记为p(c);误诊率是将未患病者判定为阳性的概率,记为q(c).假设数据在组内均匀分布,以事件发生的频率作为相应事件发生的概率.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
(1)当漏诊率p(c)=0.5%时,求临界值c和误诊率q(c);
1
2
3
4
5
6
7
8
9
10
11
12
13
14
依题可知,患病者该指标的频率分布直方图中第一个小矩形的面积为5×0.002=0.01=1%>0.5%,所以95所以(c-95)×0.002=0.5%,
解得c=97.5,
q(c)=0.01×(100-97.5)+5×0.002=0.035=3.5%.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
(2)设函数f(c)=p(c)+q(c),当c∈[95,105]时,求f(c)的解析式,并求f(c)在区间[95,105]的最小值.
当c∈[95,100]时,
f(c)=p(c)+q(c)=(c-95)×0.002+(100-c)×0.01+5×0.002=-0.008c+0.82≥0.02;
当c∈(100,105]时,
f(c)=p(c)+q(c)=5×0.002+(c-100)×0.012+(105-c)×0.002=0.01c-0.98>0.02,
所以f(c)在区间[95,105]的最小值为0.02.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
返回§9.1 随机抽样、统计图表
课标要求 1.了解获取数据的基本途径.2.会用简单随机抽样的方法从总体中抽取样本,了解分层随机抽样.3.能根据实际问题的特点选择恰当的统计图表,体会使用统计图表的重要性.
知识梳理
1.总体、个体、样本
调查对象的全体(或调查对象的某些指标的全体)称为总体,组成总体的每一个调查对象(或每一个调查对象的相应指标)称为个体,在抽样调查中,从总体中抽取的那部分个体称为样本,样本中包含的个体数称为样本容量,简称样本量.
2.简单随机抽样
抽签法和随机数法是比较常用的两种方法.
3.分层随机抽样
一般地,按一个或多个变量把总体划分成若干个子总体,每个个体属于且仅属于一个子总体,在每个子总体中独立地进行简单随机抽样,再把所有子总体中抽取的样本合在一起作为总样本,这样的抽样方法称为分层随机抽样,每一个子总体称为层.
4.统计图表
(1)常见的统计图表有条形图、扇形图、折线图、频率分布直方图等.
(2)作频率分布直方图的步骤
①求极差;
②决定组距与组数;
③将数据分组;
④列频率分布表;
⑤画频率分布直方图.
常用结论
1.利用按比例分配的分层随机抽样要注意按比例抽取,若各层应抽取的个体数不都是整数,可以进行一定的技术处理,比如将结果取成整数等.
2.在按比例分配的分层随机抽样中,以层数是2层为例,如果第1层和第2层包含的个体数分别为M和N,抽取的样本量分别为m和n,第1层和第2层的样本平均数分别为,,样本平均数为,则=+=+.
3.频率分布直方图中纵轴上的数据是各组的频率除以组距,不要和条形图混淆.
自主诊断
1.判断下列结论是否正确.(请在括号中打“√”或“×”)
(1)在简单随机抽样中,每个个体被抽到的机会与先后顺序有关.( × )
(2)抽签法和随机数法都是简单随机抽样.( √ )
(3)在按比例分配的分层随机抽样中,每个个体被抽到的可能性与层数及分层有关.( × )
(4)在频率分布直方图中,小长方形的面积越大,表示样本数据落在该区间的频率越大.
( √ )
2.从某年级500名学生中抽取60名学生进行体重的统计分析,就这个问题来说,下列说法不正确的是(  )
A.500名学生的体重是总体
B.每名被抽取的学生的体重是个体
C.抽取的60名学生的体重是一个样本
D.抽取的60名学生的体重是样本容量
答案 D
解析 由题可知,从某年级500名学生中抽取60名学生进行体重的统计分析,
其中总体是该年级500名学生的体重,个体是每名被抽取的学生的体重,
样本是抽取的60名学生的体重,样本容量是60,故只有D不正确.
3.“中国天眼”为500米口径球面射电望远镜,是具有我国自主知识产权、世界最大单口径、最灵敏的射电望远镜.建造“中国天眼”的目的是(  )
A.通过调查获取数据 B.通过试验获取数据
C.通过观察获取数据 D.通过查询获得数据
答案 C
解析 “中国天眼”主要是通过观察获取数据.
4.(2023·宝鸡模拟)从某校随机抽取某次数学考试100分以上(含100分,满分150分)的学生成绩,将他们的分数数据绘制成如图所示的频率分布直方图.若共抽取了100名学生的成绩,则分数在[120,130)内的人数为________.
答案 30
解析 因为频率分布直方图中所有的小矩形面积和为1,
所以(0.005+0.035+a+0.020+0.010)×10=1,解得a=0.030,
所以分数在[120,130)内的人数为100×0.030×10=30.
题型一 抽样方法
例1 (1)某工厂利用随机数法对生产的700个零件进行抽样测试,先将700个零件进行编号,001,002,…,699,700.从中抽取70个样本,下面提供了随机数表的第5行到第6行数据,若从随机数表中第5行第6列开始向右读取数据,则得到的第6个样本编号是(  )
8442125331 3457860736 2530073286
2345788907 2368960804
3256780843 6789535577 3489948375
2253557832 4577892345
A.623 B.328 C.253 D.007
答案 A
解析 从第5行第6列开始向右读取数据,第一个数为253,第二个数是313,第三个数是457,下一个数是860,不符合要求,下一个数是736,不符合要求,下一个是253,重复,则第四个数是007,第五个数是328,第六个数是623.
(2)某小学三年级共有学生500名,随机抽查100名学生并提问中国古代四大发明,能说出两种发明的有45人,能说出三种及以上发明的有32人,据此估计该校三年级500名学生中,对四大发明只能说出一种或一种也说不出的有(  )
A.69人 B.84人
C.108人 D.115人
答案 D
解析 在这100名学生中,只能说出一种或一种也说不出的有100-45-32=23(人),设该校三年级中对四大发明只能说出一种或一种也说不出的有x人,则=,解得x=115.
思维升华 (1)简单随机抽样需满足:①被抽取的样本总体的个体数有限;②等可能抽取.
(2)在按比例分配的分层随机抽样中,抽样比==.
跟踪训练1 (1)下列抽样方法是简单随机抽样的是(  )
A.某医院从200名医生中,挑选出50名最优秀的医生去参加培训
B.从10部手机中逐个不放回地随机抽取2部进行质量检验
C.从空间直角坐标系中抽取10个点作为样本
D.饮料公司从仓库中的500箱饮料中一次性抽取前10箱进行质量检查
答案 B
解析 A选项中,挑选出50名最优秀的医生去参加培训,每个人被抽到的概率不相等,故A错误;
B选项中,从10部手机中逐个不放回地随机抽取2部进行质量检验,是简单随机抽样,故B正确;
C选项中,由于被抽取的样本的总体个数是无限的,所以不是简单随机抽样,故C错误;
D选项中,一次性抽取前10箱,每箱被抽到的概率不相等,所以不是简单随机抽样,故D错误.
(2)(2023·枣庄模拟)杭州亚运会共有3.76万“小青荷”志愿者参与服务.据统计某高校共有本科生1 600人、硕士生600人、博士生200人申请报名做志愿者,现用按比例分配的分层随机抽样方法从中抽取博士生30人,则该高校抽取的志愿者总人数为(  )
A.300 B.320 C.340 D.360
答案 D
解析 根据题意知,按比例分配的分层随机抽样的比例为 =,
所以该高校抽取的志愿者总人数为(1 600+600+200)×=360.
题型二 统计图表
例2 (1)(多选)新式茶饮是指以上等茶叶的萃取浓缩液为底,再根据消费者偏好,添加牛奶、坚果、柠檬等小料调制而成的饮料.如图为2023年我国消费者购买新式茶饮的频次扇形图及月均消费新式茶饮金额的条形图.
根据所给统计图,下列结论中正确的是(  )
A.每周都消费新式茶饮的消费者占比不到90%
B.每天都消费新式茶饮的消费者占比超过20%
C.月均消费新式茶饮50~200元的消费者占比超过50%
D.月均消费新式茶饮超过100元的消费者占比超过60%
答案 BC
解析 每周都消费新式茶饮的消费者占比为1-9.1%>90%,A错误;
每天都消费新式茶饮的消费者占比为5.4%+16.4%>20%,B正确;
月均消费新式茶饮50~200元的消费者占比为30.5%+25.6%>50%,C正确;
月均消费新式茶饮超过100元的消费者占比为1-14.5%-30.5%<60%,D错误.
(2)(多选)(2024·合肥模拟)为了解我国农业、农村、农民的基本情况,将全国第三次农业普查的部分数据整理得到如下的柱状图(单位:%),则(  )
A.东北地区的四项数据均比中部地区高
B.西部地区的四项数据均比其他三个地区低
C.中部地区的发展情况相较于西部地区的发展较好
D.东部地区的发展情况相较于其他三个地区的发展较好
答案 CD
解析 东北地区通电的村、通宽带互联网的村、有电子商务配送站点的村的占比高于中部地区,但通天然气的村的占比低于中部地区,故A错误;
西部地区通电的村、通宽带互联网的村、有电子商务配送站点的村的占比低于其他三个地区,但通天然气的村的占比高于其他三个地区,故B错误;
中部地区除通天然气的村的占比低于西部地区,其他三项数据均不低于西部地区,故中部地区的发展情况相较于西部地区较好,故C正确;
东部地区除通天然气的村的占比低于西部地区,其他三项数据均不低于其他三个地区,故东部地区的发展情况相较于其他三个地区较好,故D正确.
思维升华 统计图表的主要应用
(1)扇形图:直观描述各类数据占总数的比例.
(2)折线图:描述数据随时间的变化趋势.
(3)条形图和直方图:直观描述不同类别或分组数据的频数和频率.
跟踪训练2 (1)已知全国农产品批发价格200指数月度变化情况如图所示,下列选项正确的是(  )
A.全国农产品夏季价格比冬季低
B.全国农产品批发价格200指数2022年每个月逐渐增加
C.2022年“菜篮子”产品批发价格指数与农产品批发价格200指数趋势基本保持一致
D.2022年2月农产品批发价格200指数大于135
答案 C
解析 图中给的是批发价格200指数,所以并不能确定农产品的价格变化,故A错误;全国农产品批发价格200指数2022年4~6月呈下降趋势,并未增加,故B错误;根据图中曲线的变化趋势可发现2022年“菜篮子”产品批发价格指数与农产品批发价格200指数趋势基本保持一致,故C正确;由图知2022年2月农产品批发价格200指数小于135,故D错误.
(2)(多选)(2023·潍坊模拟)新能源汽车包括纯电动汽车、增程式电动汽车、混合动力汽车、燃料电池电动汽车、氢发动机汽车等.我国的新能源汽车发展开始于21世纪初,近年来发展迅速,连续8年产销量位居世界第一.下面两图分别是2017年至2022年我国新能源汽车年产量和占比(占我国汽车年总产量的比例)情况,则(  )
A.2017~2022年我国新能源汽车年产量逐年增加
B.2017~2022年我国新能源汽车年产量的极差为626.4万辆
C.2022年我国汽车年总产量超过2 700万辆
D.2019年我国汽车年总产量不低于2018年我国汽车年总产量
答案 BC
解析 由图可知,从2018年到2019年,我国新能源汽车年产量在下降,故A错;
2017~2022年我国新能源汽车年产量的极差为705.8-79.4=626.4(万辆),故B对;
2022年我国汽车年总产量为≈2 757.03(万辆),故C对;
2019年我国汽车年总产量为=2 587.5(万辆),
2018年我国汽车年总产量为≈2 822.22(万辆),
所以2019年我国汽车年总产量低于2018年我国汽车年总产量,故D错.
题型三 频率分布直方图
例3 某市某月30天对空气污染指数的监测数据如下(主要污染物为可吸入颗粒物):
61 76 70 56 81 91 92 91 75 81
88 67 101 103 95 91 77 86 81 83
82 82 64 79 86 85 75 71 49 45
(1)完成频率分布表;
分组 频数 频率
[41,51)
[51,61)
[61,71)
[71,81)
[81,91)
[91,101)
[101,111]
(2)作出频率分布直方图;
(3)根据国家标准,污染指数在0~50之间时,空气质量为优;在51~100之间时,空气质量为良;在101~150之间时,空气质量为轻度污染;在151~200之间时,空气质量为中度污染.请你依据所给数据和上述标准,对该市的空气质量给出一个简短评价.
解 (1)频率分布表如表所示.
分组 频数 频率
[41,51) 2
[51,61) 1
[61,71) 4
[71,81) 6
[81,91) 10
[91,101) 5
[101,111] 2
(2)作出频率分布直方图,如图所示.
(3)答对下述两条中的一条即可.
一:该市一个月中空气污染指数有2天处于优的水平,占当月天数的,有26天处于良的水平,占当月天数的,处于优或良的天数共有28天,占当月天数的,说明该市空气质量基本良好.
二:轻度污染有2天,占当月天数的,污染指数在80以上的接近轻度污染的天数有15天,加上处于轻度污染的天数,共有17天,占当月天数的,超过50%,说明该市空气质量有待进一步改善.
思维升华 频率分布直方图的相关结论
(1)频率分布直方图中各小长方形的面积之和为1.
(2)频率分布直方图中纵轴表示,每组样本的频率为组距×,即小长方形的面积.
(3)频率分布直方图中每组样本的频数为频率×总数.
跟踪训练3 某校为了解学生学习的效果,进行了一次摸底考试,从中选取60名学生的成绩,分成[40,50),[50,60),[60,70),[70,80),[80,90),[90,100]六组后,得到不完整的频率分布直方图如图所示,观察图形,回答下列问题:
(1)求分数在区间[70,80)内的频率,并补全这个频率分布直方图;
(2)根据评奖规则,排名在前10%的学生可以获奖,请你估计获奖的学生至少需要多少分?
解 (1)设分数在[70,80)内的频率为x,
根据频率分布直方图,可得(0.01+0.015+0.02+0.025+0.005)×10+x=1,解得x=0.25,
所以分数在[70,80)内的频率为0.25,
补全这个频率分布直方图,如图所示.
(2)因为分数在区间[80,90)内的频率为0.25,在区间[90,100]内的频率为0.05,
而0.05<10%<0.25+0.05,
设排名前10%的分界点为90-a,则0.025a+0.005×10=10%,解得a=2,
所以排名前10%的分界点为88分,即获奖的学生至少需要88分.
课时精练
一、单项选择题
1.下列调查方式合适的是(  )
A.为了了解一批炮弹的杀伤半径,采用普查的方式
B.为了了解一批玉米种子的发芽率,采用普查的方式
C.为了了解一条河流的水质,采用抽样调查的方式
D.为了了解一个寝室的学生(共5个人)每周体育锻炼的时间,采用抽样调查的方式
答案 C
解析 A项,采用普查的方式测试炮弹杀伤半径,成本较高,不适合,故错误;B项,采用普查的方式测试玉米的发芽率,较为烦琐且工作量较大,不适合,故错误;C项,抽样调查了解河流水质是正确的;D项,了解5个人的锻炼时间,适合采用普查,故错误.
2.在“世界读书日”前夕,为了了解某地5 000名居民某天的阅读时间,从中抽取了200名居民的阅读时间进行统计分析.在这个问题中,5 000名居民的阅读时间的全体是(  )
A.总体 B.个体
C.样本容量 D.从总体中抽取的一个样本
答案 A
解析 样本容量是200,抽取的200名居民的阅读时间是一个样本,每个居民的阅读时间就是一个个体,5 000名居民的阅读时间的全体是总体.
3.(2023·西安模拟)为了解某校今年报考飞行员的学生的体重情况.将所得的数据整理后,作出了频率分布直方图(如图).已知图中从左到右的前3个小组的频率之比为1∶2∶3,第1小组的频数为4,则某校报考飞行员的学生总人数是(  )
A.40 B.32 C.28 D.24
答案 B
解析 由图可知后两个组频率为(0.013+0.037)×5=0.25,又因为从左到右的前3个小组的频率之比为1∶2∶3,所以第1小组的频率为(1-0.25)×=0.125,又因为第1小组的频数为4,所以报考飞行员的学生人数是4÷0.125=32.
4.(2023·蚌埠质检)已知某地区中小学生人数如图①所示,为了解该地区中小学生的近视情况,卫生部门根据当地中小学生人数,用按比例分配的分层随机抽样的方法抽取了10%的学生进行调查,调查数据如图②所示,则估计该地区中小学生的平均近视率为(  )
A.50% B.32% C.30% D.27%
答案 D
解析 根据题意,抽取的样本容量为(3 500+4 500+2 000)×10%=1 000,其中小学生、初中生、高中生抽取人数分别为350,450,200,根据图②知抽取的小学生、初中生、高中生中,近视的人数分别为35,135,100,所以估计该地区学生的平均近视率为×100%=27%.
5.(2024·拉萨模拟)在统计学中,同比增长率一般是指和上年同期相比较的增长率.如图为我国2021年2月至12月及2022年3月至12月的原油产量同比增长率,则下列叙述正确的是(  )
A.2022年8月的原油产量低于2021年8月的原油产量
B.2021年9月至2021年12月的原油产量呈逐月下降趋势
C.2022年3月至2022年11月,原油产量同比增长率最高的月份是6月
D.2022年3月至2022年11月的原油产量同比增长率的平均数不超过2.5%
答案 A
解析 2022年8月的原油产量同比增长率为负数,
说明2022年8月原油产量低于2021年8月,故A正确;
2021年9月至2021年12月的原油产量的同比增长率呈逐月下降趋势,但均大于0,则原油产量依然可能会增加,故B错误;
2022年4月的原油产量同比增长率最高,故C错误;
因为≈2.7>2.5,
所以2022年3月至2022年11月的原油产量同比增长率的平均数超过2.5%,故D错误.
6.中国古代数学专著《算法统宗》中有这样的记载:毛诗春秋周易书,九十四册共无余,毛诗一册三人读,春秋一册四人呼,周易五人读一本.意思为现有《毛诗》《春秋》《周易》3种书共94册,若干人读这些书,要求每个人都要读到这3种书,若3人共读一本《毛诗》,4人共读一本《春秋》,5人共读一本《周易》,则刚好没有剩余.现要用按比例分配的分层随机抽样的方法从中抽取47册,则要从《毛诗》中抽取的册数为(  )
A.12 B.14 C.18 D.20
答案 D
解析 设《毛诗》有x册,《春秋》有y册,《周易》有z册,学生人数为m,
则解得
因此,用按比例分配的分层随机抽样的方法从中抽取47册,则要从《毛诗》中抽取的册数为47×=20.
二、多项选择题
7.(2023·柳州、南宁联考)某高中高一学生从物化生政史地六科中选三科组合,其中选物化生组合的学生有600人,选物化地组合的学生有400人,选政史地组合的学生有250人,其他组合均无人选.现从高一学生中选取25人作样本调研情况.为保证调研结果相对准确,下列判断正确的是(  )
A.用按比例分配的分层随机抽样的方法抽取物化生组合的学生12人
B.用按比例分配的分层随机抽样的方法抽取政史地组合的学生5人
C.物化生组合学生小张被选中的概率比物化地组合学生小王被选中的概率大
D.政史地组合学生小刘被选中的概率为
答案 ABD
解析 用按比例分配的分层随机抽样的方法抽取物化生组合的学生为 25×=12(人),故A正确;
用按比例分配的分层随机抽样的方法抽取政史地组合的学生为25×=5(人),故B正确;
根据按比例分配的分层随机抽样的特征知,每位同学被选中的概率相等,均为=,故C错误;
由C知,每位同学被选中的概率均为,故D正确.
8.(2024·武汉模拟)某市2022年经过招商引资后,经济收入较前一年增加了一倍,实现翻番,为更好地了解该市的经济收入的变化情况,统计了该市招商引资前后年经济收入构成比例,得到如下扇形图,则下列结论中正确的是(  )
A.招商引资后,工资净收入较前一年增加
B.招商引资后,转移净收入是前一年的1.25倍
C.招商引资后,转移净收入与财产净收入的总和超过了该年经济收入的
D.招商引资后,经营净收入较前一年增加了一倍
答案 AD
解析 设招商引资前经济收入为M,而招商引资后经济收入为2M,则
招商引资前工资净收入为M×60%=0.6M,而招商引资后工资净收入为2M×37%=0.74M,所以工资净收入增加了,故A正确;
招商引资前转移净收入为M×4%=0.04M,招商引资后转移净收入为2M×5%=0.1M,所以招商引资后,转移净收入是前一年的2.5倍,故B错误;
招商引资后,转移净收入与财产净收入的总和为0.1M+0.56M=0.66M<×2M=0.8M,所以招商引资后,转移净收入与财产净收入的总和低于该年经济收入的,故C错误;
招商引资前经营净收入为M×30%=0.3M,招商引资后经营净收入为2M×30%=0.6M,所以招商引资后,经营净收入较前一年增加了一倍,故D正确.
三、填空题
9.某公司有大量客户,且不同年龄段客户对其服务的评价有较大差异.为了解客户的评价,该公司准备进行抽样调查,可供选择的抽样方法有简单随机抽样和按比例分配的分层随机抽样,则最合适的抽样方法是________________________.
答案 按比例分配的分层随机抽样
解析 由于从不同年龄段客户中抽取,故采用按比例分配的分层随机抽样.
10.(2023·马鞍山诊断)某学校为调查学生参加课外体育锻炼的时间,将该校某班的40名学生进行编号,分别为00,01,02,…,39,现从中抽取一个容量为10的样本进行调查,选取方法是从下面的随机数表的第1行第11列开始向右读取数据,直到取足样本,则抽取样本的第6个号码为________.
90 84 60 79 80 24 36 59 87 38 82
07 53 89 35 96 35 23 79 18 05 98
90 07 35 46 40 62 98 80 54 97 20
56 95 15 74 80 08 32 16 46 70 50
80 67 72 16 42 75
答案 23
解析 重复的号码只能算作一个,抽取样本号码是24,36,38,07,35,23,18,05,20,15,所以抽取样本的第6个号码为23.
11.(2023·咸阳质检)某高中有300名学生参加数学竞赛,其中有三分之一的学生成绩不低于100分,将不低于100分的学生成绩制成频率分布直方图(如图),分组区间是[100,110),[110,120),[120,130),[130,140),[140,150],现用按比例分配的分层随机抽样的方法从这300名学生中随机进行抽取若干人,若成绩在[120,140)之间的抽取5人,那么应从成绩在[100,110)间的学生中抽取的人数为________.
答案 2
解析 在[120,130)之间的学生人数为100×10×0.030=30,在[130,140)之间的学生人数为 100×10×0.020=20,在[120,140)之间的学生人数为50,
又用按比例分配的分层随机抽样的方法在[120,140)之间的50名学生中抽取5人,即抽取比例为,
所以应从成绩在[100,110)间的学生中抽取的人数为100×0.2×=2.
12.某地各项事业取得令人瞩目的成就,以2022年为例,社会固定资产总投资约为3 730亿元,其中包括中央项目、省属项目、地(市)属项目、县(市)属项目和其他项目.图1、图2分别是这五个项目的投资额不完整的条形图和扇形图,请完成下列问题.
(1)地(市)属项目投资额为________亿元;
(2)在图2中,县(市)属项目部分所占百分比为m%,对应的圆心角为β,则m=________,β=________度(m,β均取整数).
答案 (1)830 (2)18 65
解析 (1)因为该地社会固定资产总投资约为3 730亿元,
所以地(市)属项目投资额为3 730-(200+530+670+1 500)=830(亿元).
(2)由条形图可以看出县(市)属项目部分总投资为670亿元,
所以县(市)属项目部分所占百分比为m%=×100%≈18%,
即m=18,对应的圆心角β≈360×0.18≈65(度).
四、解答题
13.某手机店根据手机销售的相关数据绘制了两幅统计图.来自该店财务部的数据报告表明,该手机店 1~4 月的手机销售总额是290万元.请根据图1、图2解答下列问题:
图1
图2
(1)该手机店3月份的销售额为多少万元?
(2)该店1月份音乐手机的销售额为多少万元?
(3)小刚观察图2后,认为4月份音乐手机的销售额比3月份减少了,你同意他的看法吗?请说明理由.
解 (1)由已知及图1得,3月份手机销售额为290-(85+80+65)=60(万元).
(2)由图1及图2得,1月份音乐手机销售额为85×23%=19.55(万元).
(3)不同意.由图1及图2知,3月份音乐手机销售额为60×18%=10.8(万元),
4月份音乐手机销售额为65×17%=11.05(万元),
11.05>10.8,所以4月份音乐手机销售额比3月份音乐手机销售额增加了,所以不同意小刚的看法.
14.(2023·新高考全国Ⅱ)某研究小组经过研究发现某种疾病的患病者与未患病者的某项医学指标有明显差异,经过大量调查,得到如下的患病者和未患病者该指标的频率分布直方图:
利用该指标制定一个检测标准,需要确定临界值c,将该指标大于c的人判定为阳性,小于或等于c的人判定为阴性.此检测标准的漏诊率是将患病者判定为阴性的概率,记为p(c);误诊率是将未患病者判定为阳性的概率,记为q(c).假设数据在组内均匀分布,以事件发生的频率作为相应事件发生的概率.
(1)当漏诊率p(c)=0.5%时,求临界值c和误诊率q(c);
(2)设函数f(c)=p(c)+q(c),当c∈[95,105]时,求f(c)的解析式,并求f(c)在区间[95,105]的最小值.
解 (1)依题可知,患病者该指标的频率分布直方图中第一个小矩形的面积为5×0.002=0.01=1%>0.5%,
所以95所以(c-95)×0.002=0.5%,
解得c=97.5,
q(c)=0.01×(100-97.5)+5×0.002=0.035=3.5%.
(2)当c∈[95,100]时,
f(c)=p(c)+q(c)=(c-95)×0.002+(100-c)×0.01+5×0.002=-0.008c+0.82≥0.02;
当c∈(100,105]时,
f(c)=p(c)+q(c)=5×0.002+(c-100)×0.012+(105-c)×0.002=0.01c-0.98>0.02,
故f(c)=
所以f(c)在区间[95,105]的最小值为0.02.§9.1 随机抽样、统计图表
课标要求 1.了解获取数据的基本途径.2.会用简单随机抽样的方法从总体中抽取样本,了解分层随机抽样.3.能根据实际问题的特点选择恰当的统计图表,体会使用统计图表的重要性.
知识梳理
1.总体、个体、样本
调查对象的全体(或调查对象的某些指标的全体)称为________________,组成总体的每一个调查对象(或每一个调查对象的相应指标)称为________,在抽样调查中,从总体中抽取的那部分个体称为________,样本中包含的个体数称为____________,简称样本量.
2.简单随机抽样
__________和____________是比较常用的两种方法.
3.分层随机抽样
一般地,按一个或多个变量把总体划分成若干个子总体,每个个体属于且仅属于一个子总体,在每个子总体中独立地进行简单随机抽样,再把所有子总体中抽取的样本合在一起作为总样本,这样的抽样方法称为________________,每一个子总体称为________.
4.统计图表
(1)常见的统计图表有________、__________、________、__________________等.
(2)作频率分布直方图的步骤
①求________;
②决定________与________;
③将________分组;
④列频率分布表;
⑤画频率分布直方图.
常用结论
1.利用按比例分配的分层随机抽样要注意按比例抽取,若各层应抽取的个体数不都是整数,可以进行一定的技术处理,比如将结果取成整数等.
2.在按比例分配的分层随机抽样中,以层数是2层为例,如果第1层和第2层包含的个体数分别为M和N,抽取的样本量分别为m和n,第1层和第2层的样本平均数分别为,,样本平均数为,则=+=+.
3.频率分布直方图中纵轴上的数据是各组的频率除以组距,不要和条形图混淆.
自主诊断
1.判断下列结论是否正确.(请在括号中打“√”或“×”)
(1)在简单随机抽样中,每个个体被抽到的机会与先后顺序有关.(  )
(2)抽签法和随机数法都是简单随机抽样.(  )
(3)在按比例分配的分层随机抽样中,每个个体被抽到的可能性与层数及分层有关.(  )
(4)在频率分布直方图中,小长方形的面积越大,表示样本数据落在该区间的频率越大.(  )
2.从某年级500名学生中抽取60名学生进行体重的统计分析,就这个问题来说,下列说法不正确的是(  )
A.500名学生的体重是总体
B.每名被抽取的学生的体重是个体
C.抽取的60名学生的体重是一个样本
D.抽取的60名学生的体重是样本容量
3.“中国天眼”为500米口径球面射电望远镜,是具有我国自主知识产权、世界最大单口径、最灵敏的射电望远镜.建造“中国天眼”的目的是(  )
A.通过调查获取数据
B.通过试验获取数据
C.通过观察获取数据
D.通过查询获得数据
4.(2023·宝鸡模拟)从某校随机抽取某次数学考试100分以上(含100分,满分150分)的学生成绩,将他们的分数数据绘制成如图所示的频率分布直方图.若共抽取了100名学生的成绩,则分数在[120,130)内的人数为________.
题型一 抽样方法
例1 (1)某工厂利用随机数法对生产的700个零件进行抽样测试,先将700个零件进行编号,001,002,…,699,700.从中抽取70个样本,下面提供了随机数表的第5行到第6行数据,若从随机数表中第5行第6列开始向右读取数据,则得到的第6个样本编号是(  )
8442125331 3457860736 2530073286
2345788907 2368960804
3256780843 6789535577 3489948375
2253557832 4577892345
A.623 B.328 C.253 D.007
(2)某小学三年级共有学生500名,随机抽查100名学生并提问中国古代四大发明,能说出两种发明的有45人,能说出三种及以上发明的有32人,据此估计该校三年级500名学生中,对四大发明只能说出一种或一种也说不出的有(  )
A.69人 B.84人
C.108人 D.115人
跟踪训练1 (1)下列抽样方法是简单随机抽样的是(  )
A.某医院从200名医生中,挑选出50名最优秀的医生去参加培训
B.从10部手机中逐个不放回地随机抽取2部进行质量检验
C.从空间直角坐标系中抽取10个点作为样本
D.饮料公司从仓库中的500箱饮料中一次性抽取前10箱进行质量检查
(2)(2023·枣庄模拟)杭州亚运会共有3.76万“小青荷”志愿者参与服务.据统计某高校共有本科生1 600人、硕士生600人、博士生200人申请报名做志愿者,现用按比例分配的分层随机抽样方法从中抽取博士生30人,则该高校抽取的志愿者总人数为(  )
A.300 B.320 C.340 D.360
题型二 统计图表
例2 (1)(多选)新式茶饮是指以上等茶叶的萃取浓缩液为底,再根据消费者偏好,添加牛奶、坚果、柠檬等小料调制而成的饮料.如图为2023年我国消费者购买新式茶饮的频次扇形图及月均消费新式茶饮金额的条形图.
根据所给统计图,下列结论中正确的是(  )
A.每周都消费新式茶饮的消费者占比不到90%
B.每天都消费新式茶饮的消费者占比超过20%
C.月均消费新式茶饮50~200元的消费者占比超过50%
D.月均消费新式茶饮超过100元的消费者占比超过60%
(2)(多选)(2024·合肥模拟)为了解我国农业、农村、农民的基本情况,将全国第三次农业普查的部分数据整理得到如下的柱状图(单位:%),则(  )
A.东北地区的四项数据均比中部地区高
B.西部地区的四项数据均比其他三个地区低
C.中部地区的发展情况相较于西部地区的发展较好
D.东部地区的发展情况相较于其他三个地区的发展较好
思维升华 统计图表的主要应用
(1)扇形图:直观描述各类数据占总数的比例.
(2)折线图:描述数据随时间的变化趋势.
(3)条形图和直方图:直观描述不同类别或分组数据的频数和频率.
跟踪训练2 (1)已知全国农产品批发价格200指数月度变化情况如图所示,下列选项正确的是(  )
A.全国农产品夏季价格比冬季低
B.全国农产品批发价格200指数2022年每个月逐渐增加
C.2022年“菜篮子”产品批发价格指数与农产品批发价格200指数趋势基本保持一致
D.2022年2月农产品批发价格200指数大于135
(2)(多选)(2023·潍坊模拟)新能源汽车包括纯电动汽车、增程式电动汽车、混合动力汽车、燃料电池电动汽车、氢发动机汽车等.我国的新能源汽车发展开始于21世纪初,近年来发展迅速,连续8年产销量位居世界第一.下面两图分别是2017年至2022年我国新能源汽车年产量和占比(占我国汽车年总产量的比例)情况,则(  )
A.2017~2022年我国新能源汽车年产量逐年增加
B.2017~2022年我国新能源汽车年产量的极差为626.4万辆
C.2022年我国汽车年总产量超过2 700万辆
D.2019年我国汽车年总产量不低于2018年我国汽车年总产量
题型三 频率分布直方图
例3 某市某月30天对空气污染指数的监测数据如下(主要污染物为可吸入颗粒物):
61 76 70 56 81 91 92 91 75 81
88 67 101 103 95 91 77 86 81 83
82 82 64 79 86 85 75 71 49 45
(1)完成频率分布表;
分组 频数 频率
[41,51)
[51,61)
[61,71)
[71,81)
[81,91)
[91,101)
[101,111]
(2)作出频率分布直方图;
(3)根据国家标准,污染指数在0~50之间时,空气质量为优;在51~100之间时,空气质量为良;在101~150之间时,空气质量为轻度污染;在151~200之间时,空气质量为中度污染.请你依据所给数据和上述标准,对该市的空气质量给出一个简短评价.
________________________________________________________________________
________________________________________________________________________
________________________________________________________________________
________________________________________________________________________
________________________________________________________________________
跟踪训练3 某校为了解学生学习的效果,进行了一次摸底考试,从中选取60名学生的成绩,分成[40,50),[50,60),[60,70),[70,80),[80,90),[90,100]六组后,得到不完整的频率分布直方图如图所示,观察图形,回答下列问题:
(1)求分数在区间[70,80)内的频率,并补全这个频率分布直方图;
________________________________________________________________________
________________________________________________________________________
________________________________________________________________________
________________________________________________________________________
(2)根据评奖规则,排名在前10%的学生可以获奖,请你估计获奖的学生至少需要多少分?
________________________________________________________________________
________________________________________________________________________
________________________________________________________________________
________________________________________________________________________
________________________________________________________________________一、单项选择题
1.下列调查方式合适的是(  )
A.为了了解一批炮弹的杀伤半径,采用普查的方式
B.为了了解一批玉米种子的发芽率,采用普查的方式
C.为了了解一条河流的水质,采用抽样调查的方式
D.为了了解一个寝室的学生(共5个人)每周体育锻炼的时间,采用抽样调查的方式
2.在“世界读书日”前夕,为了了解某地5 000名居民某天的阅读时间,从中抽取了200名居民的阅读时间进行统计分析.在这个问题中,5 000名居民的阅读时间的全体是(  )
A.总体 B.个体
C.样本容量 D.从总体中抽取的一个样本
3.(2023·西安模拟)为了解某校今年报考飞行员的学生的体重情况.将所得的数据整理后,作出了频率分布直方图(如图).已知图中从左到右的前3个小组的频率之比为1∶2∶3,第1小组的频数为4,则某校报考飞行员的学生总人数是(  )
A.40 B.32 C.28 D.24
4.(2023·蚌埠质检)已知某地区中小学生人数如图①所示,为了解该地区中小学生的近视情况,卫生部门根据当地中小学生人数,用按比例分配的分层随机抽样的方法抽取了10%的学生进行调查,调查数据如图②所示,则估计该地区中小学生的平均近视率为(  )
A.50% B.32% C.30% D.27%
5.(2024·拉萨模拟)在统计学中,同比增长率一般是指和上年同期相比较的增长率.如图为我国2021年2月至12月及2022年3月至12月的原油产量同比增长率,则下列叙述正确的是(  )
A.2022年8月的原油产量低于2021年8月的原油产量
B.2021年9月至2021年12月的原油产量呈逐月下降趋势
C.2022年3月至2022年11月,原油产量同比增长率最高的月份是6月
D.2022年3月至2022年11月的原油产量同比增长率的平均数不超过2.5%
6.中国古代数学专著《算法统宗》中有这样的记载:毛诗春秋周易书,九十四册共无余,毛诗一册三人读,春秋一册四人呼,周易五人读一本.意思为现有《毛诗》《春秋》《周易》3种书共94册,若干人读这些书,要求每个人都要读到这3种书,若3人共读一本《毛诗》,4人共读一本《春秋》,5人共读一本《周易》,则刚好没有剩余.现要用按比例分配的分层随机抽样的方法从中抽取47册,则要从《毛诗》中抽取的册数为(  )
A.12 B.14 C.18 D.20
二、多项选择题
7.(2023·柳州、南宁联考)某高中高一学生从物化生政史地六科中选三科组合,其中选物化生组合的学生有600人,选物化地组合的学生有400人,选政史地组合的学生有250人,其他组合均无人选.现从高一学生中选取25人作样本调研情况.为保证调研结果相对准确,下列判断正确的是(  )
A.用按比例分配的分层随机抽样的方法抽取物化生组合的学生12人
B.用按比例分配的分层随机抽样的方法抽取政史地组合的学生5人
C.物化生组合学生小张被选中的概率比物化地组合学生小王被选中的概率大
D.政史地组合学生小刘被选中的概率为
8.(2024·武汉模拟)某市2022年经过招商引资后,经济收入较前一年增加了一倍,实现翻番,为更好地了解该市的经济收入的变化情况,统计了该市招商引资前后年经济收入构成比例,得到如下扇形图,则下列结论中正确的是(  )
A.招商引资后,工资净收入较前一年增加
B.招商引资后,转移净收入是前一年的1.25倍
C.招商引资后,转移净收入与财产净收入的总和超过了该年经济收入的
D.招商引资后,经营净收入较前一年增加了一倍
三、填空题
9.某公司有大量客户,且不同年龄段客户对其服务的评价有较大差异.为了解客户的评价,该公司准备进行抽样调查,可供选择的抽样方法有简单随机抽样和按比例分配的分层随机抽样,则最合适的抽样方法是________________________.
10.(2023·马鞍山诊断)某学校为调查学生参加课外体育锻炼的时间,将该校某班的40名学生进行编号,分别为00,01,02,…,39,现从中抽取一个容量为10的样本进行调查,选取方法是从下面的随机数表的第1行第11列开始向右读取数据,直到取足样本,则抽取样本的第6个号码为________.
90 84 60 79 80 24 36 59 87 38 82
07 53 89 35 96 35 23 79 18 05 98
90 07 35 46 40 62 98 80 54 97 20
56 95 15 74 80 08 32 16 46 70 50
80 67 72 16 42 75
11.(2023·咸阳质检)某高中有300名学生参加数学竞赛,其中有三分之一的学生成绩不低于100分,将不低于100分的学生成绩制成频率分布直方图(如图),分组区间是[100,110),[110,120),[120,130),[130,140),[140,150],现用按比例分配的分层随机抽样的方法从这300名学生中随机进行抽取若干人,若成绩在[120,140)之间的抽取5人,那么应从成绩在[100,110)间的学生中抽取的人数为________.
12.某地各项事业取得令人瞩目的成就,以2022年为例,社会固定资产总投资约为3 730亿元,其中包括中央项目、省属项目、地(市)属项目、县(市)属项目和其他项目.图1、图2分别是这五个项目的投资额不完整的条形图和扇形图,请完成下列问题.
(1)地(市)属项目投资额为________亿元;
(2)在图2中,县(市)属项目部分所占百分比为m%,对应的圆心角为β,则m=________,β=________度(m,β均取整数).
四、解答题
13.某手机店根据手机销售的相关数据绘制了两幅统计图.来自该店财务部的数据报告表明,该手机店 1~4 月的手机销售总额是290万元.请根据图1、图2解答下列问题:
图1
图2
(1)该手机店3月份的销售额为多少万元?
(2)该店1月份音乐手机的销售额为多少万元?
(3)小刚观察图2后,认为4月份音乐手机的销售额比3月份减少了,你同意他的看法吗?请说明理由.
14.(2023·新高考全国Ⅱ)某研究小组经过研究发现某种疾病的患病者与未患病者的某项医学指标有明显差异,经过大量调查,得到如下的患病者和未患病者该指标的频率分布直方图:
利用该指标制定一个检测标准,需要确定临界值c,将该指标大于c的人判定为阳性,小于或等于c的人判定为阴性.此检测标准的漏诊率是将患病者判定为阴性的概率,记为p(c);误诊率是将未患病者判定为阳性的概率,记为q(c).假设数据在组内均匀分布,以事件发生的频率作为相应事件发生的概率.
(1)当漏诊率p(c)=0.5%时,求临界值c和误诊率q(c);
(2)设函数f(c)=p(c)+q(c),当c∈[95,105]时,求f(c)的解析式,并求f(c)在区间[95,105]的最小值.
§9.1 随机抽样、统计图表
1.C 2.A 3.B 4.D 5.A 6.D
7.ABD 
8.AD [设招商引资前经济收入为M,而招商引资后经济收入为2M,则
招商引资前工资净收入为M×60%=0.6M,而招商引资后工资净收入为2M×37%=0.74M,所以工资净收入增加了,故A正确;
招商引资前转移净收入为M×4%=0.04M,招商引资后转移净收入为2M×5%=0.1M,所以招商引资后,转移净收入是前一年的2.5倍,故B错误;
招商引资后,转移净收入与财产净收入的总和为0.1M+0.56M=0.66M<×2M=0.8M,所以招商引资后,转移净收入与财产净收入的总和低于该年经济收入的,故C错误;
招商引资前经营净收入为M×30%=0.3M,招商引资后经营净收入为2M×30%=0.6M,所以招商引资后,经营净收入较前一年增加了一倍,故D正确.]
9.按比例分配的分层随机抽样
10.23 11.2
12.(1)830 (2)18 65
13.解 (1)由已知及图1得,3月份手机销售额为290-(85+80+65)=60(万元).
(2)由图1及图2得,1月份音乐手机销售额为85×23%=19.55(万元).
(3)不同意.由图1及图2知,3月份音乐手机销售额为60×18%=10.8(万元),
4月份音乐手机销售额为65×17%=11.05(万元),
11.05>10.8,所以4月份音乐手机销售额比3月份音乐手机销售额增加了,所以不同意小刚的看法.
14.解 (1)依题可知,患病者该指标的频率分布直方图中第一个小矩形的面积为5×0.002=0.01=1%>0.5%,
所以95所以(c-95)×0.002=0.5%,
解得c=97.5,
q(c)=0.01×(100-97.5)+5×0.002=0.035=3.5%.
(2)当c∈[95,100]时,
f(c)=p(c)+q(c)=(c-95)×0.002+(100-c)×0.01+5×0.002=-0.008c+0.82≥0.02;
当c∈(100,105]时,
f(c)=p(c)+q(c)=5×0.002+(c-100)×0.012+(105-c)×0.002=0.01c-0.98>0.02,
故f(c)=
所以f(c)在区间[95,105]的最小值为0.02.

展开更多......

收起↑

资源列表