人教B版高中数学必修第二册第五章统计与概率章末总结课件+课时学案+微评

资源下载
  1. 二一教育资源

人教B版高中数学必修第二册第五章统计与概率章末总结课件+课时学案+微评

资源简介

(共35张PPT)
第五章 统计与概率
章末总结
体系整体构建 知识宏观把握
核心专题研究 要点纵横链接
2门世2有
3厚
总体与样本
概念
简单随机抽样
特点
抽签法
抽样方法
数据的收集
随机数表法
概念
特点
分层抽样
步骤
分层抽样的公平性
平均数、方差、标准
众数
差的计算方法
表示数据集
百分位数
中位数
中趋势的量
用样本的数字特征估
平均数
计总体的数字特征
极差
表示数据离
平均数与标准差在估
散程度的量
方差
计总体的应用
标准差
用样本估计总体
扇形图(饼图或饼形图)
统计的基本思想
频率分布表
用样本的分布来
频数分布直方图与频率分布直方图
估计总体的分布
折线图
茎叶图
柱形图
列举图
列表图
样本点和样本空间
树形图法
分类写法
样本空间与事件
必然事件:P(2)=1
事件的分类
不可能事件:P(=1
随机事件
概率的定义
概率的意义
事件的包含与相等
事件的和(并)
事件之间的
关系与运算
事件的积(交)
互斥事件的概率加法公式:
推广:P(A1+A2+…+A)=
P(A+B)=P(A)+P(B)
事件的互斥与对应
P(A1)+P(A2)+…+P(A)
事件的混合运算
对应事件:P④=1-P(A)
有限性
古典概型的特征
等可能性
古典概型
古典概型的的概率公式
P()=
古典概型的应用
频率与概率
用频率估计概率
区别与联系
随机事件的独立性:P(AB)=P(A)P(B)
推广:P(A1A2…An)=P(A1)P(A2)…P(A)第五章 统计与概率
5.1 统 计
5.1.1 数据的收集
第1课时 总体与样本、简单随机抽样
[新课程标准] [新学法解读]
1.了解收集数据的两类方法:直接收集数据与间接收集数据. 2.了解总体、样本、样本容量、普查与抽样调查的概念,了解普查与抽样调查的局限性. 3.理解简单随机抽样的含义;掌握简单随机抽样的两种方法:抽签法和随机数表法. 1.引导学生从实际问题出发,进一步理解总体、样本、样本容量等概念,提升学生数据分析的核心素养. 2.通过学习抽签法和随机数表法抽取样本,体会抽样的必要性和重要性,提升学生的逻辑推理和数学抽象素养.
笔记  教材
1.总体、个体、样本与样本容量
考察问题涉及的对象全体是总体,总体中每个对象是个体,抽取的部分对象组成总体的一个样本,一个样本中包含的个体数目是样本容量.
2.普查与抽样调查
(1)普查(全面调查)
定义:一般地,对总体中每个个体都进行考察的方法称为普查(也称为全面调查).
优点:普查能够了解总体中每个个体的情况,从而能准确地掌握总体的特征.
适用条件:在总体包含的个体总数不大,或有特殊需要的情况下,可以采用普查的方法.
(2)抽样调查
定义:只抽取样本进行考察的方法称为抽样调查.
适用条件:普查的方法有时会因为各种原因而无法实施,例如成本太高、时间上不容许、考察方法具有破坏性等,此时抽样调查就成了不二选择.
3.简单随机抽样
(1)定义:一般地,简单随机抽样(也称为纯随机抽样)就是从总体中不加任何分组、划类、排队等,完全随机地抽取个体.
(2)适用条件:当总体中的个体之间差异程度较小和总体中个体数目较少时,通常采用这种方法.
(3)两种方法
①抽签法
先把总体中的N个个体编号,并把编号依次分别写在形状、大小相同的签上(签可以是纸条、卡片或小球等),然后将这些号签放在同一个容器中,搅拌均匀后,每次随机地从中抽取一个,然后将箱中余下的号签搅拌均匀,再进行下一次抽取.如此下去,直至抽到预先设定的样本容量.
②随机数表法
用随机数表进行简单随机抽样的一般步骤为:
a.对总体进行编号.
b.在随机数表中任意指定一个开始选取的位置.位置的确定可以闭着眼用手指随机确定,也可用其他方式随机确定.
c.按照一定规则选取编号.例如,若编号是两位,规则可以是每次从左往右选取两个数字,也可以是每次只选取每一组的前两个数字,还可以是每次只选取下面一行同一位置对应的两个数字,等等.规则一经确定,就不能更改.在选取过程中,遇到超过编号范围或已经选取了的数字,应该舍弃.
d.按照得到的编号找出对应的个体.
自我  排查
1.判断正误.(正确的打“√”,错误的打“?”)
(1)某校期末考试后,为了分析该校高一年级1 000名学生的学习成绩,从中随机抽取了100名学生的成绩单,判断下列说法的正误.
①1 000名学生是总体.(  )
②每名学生是个体. (  )
③每名学生的成绩是所抽取的一个样本.(  )
④样本的容量是100.(  )
提示:1 000名学生的成绩是统计中的总体,每个学生的成绩是个体,被抽取的100名学生的成绩是一个样本,其样本的容量为100.
答案:①? ②? ③? ④√
(2)判断下列抽样方法是否属于简单随机抽样.
①运动员从8个跑道中随机抽取一个跑道. (  )
②从20个零件中一次性拿出3个来检验质量.(  )
③某班有50名学生,指定其中成绩优异的2名学生参加一次学科竞赛.(  )
④为了保证食品安全,从某厂提供的一批月饼中,拿出一个检查后放回,再拿一个检查,反复5次,拿了5个月饼进行检查. (  )
提示:②错,因为不是逐个抽样;③错,因为不是等可能抽样;④错,由于它是有放回抽样.
答案:①√ ②? ③? ④?
2.对于简单随机抽样,每个个体每次被抽到的机会都 (  )
A.不等 B.相等
C.有时相等 D.不确定
答案:B
3.用随机数表法进行抽样有以下几个步骤:①将总体中的个体编号;②获取样本号码;③选定开始的数字,按照一定的方向读数,这些步骤的先后顺序应为________.
解析:用随机数表法进行抽样,步骤如下:①将总体中的个体编号;②选定开始的数字,按照一定的方向读数;③获取样本号码.所以排序为①③②.
答案:①③② 
研习1 抽样调查与普查
[典例1] 下列调查中哪些是用普查方式,哪些是用抽查方式收集数据的?
(1)为了了解我们班级的每个学生穿几号鞋,向全班同学做调查;
(2)为了了解我们学校高一年级学生穿几号鞋,向我们所在班的全体同学做调查;
(3)为了了解我们班的同学们每天的睡眠时间,在每个小组中各选取2名学生做调查;
(4)为了了解我们班的同学们每天的睡眠时间,选取班级中学号为双数的所有学生做调查.
解:(1)因为调查的是班级的每个学生,所以用的是普查.
(2)通过调查我们班的全体同学穿几号鞋来了解学校高一年级学生穿几号鞋,这是抽样调查,样本是我们班的全体同学所穿的鞋号,总体是学校高一年级学生所穿的鞋号.
(3)、(4)也都是抽样调查,样本分别是每小组中选取的2名学生的睡眠时间、学号为双数的所有学生的睡眠时间;总体是我们班的同学每天的睡眠时间.
巧归纳
1.在抽样调查中要注意以下事项
(1)样本抽取具有随机性:即在抽取样本时总体的每个个体被抽到的可能性相等.
(2)样本抽取具有代表性:当总体数目较大且个体有明显差异时,要特别注意样本的代表性. 
2.普查与抽样调查的特点
方式 抽样调查 普查
特 点 节省人力、物力和财力 需要大量的人力、物力和财力
可以用于带有破坏性的检查 不能用于带有破坏性的检查
结果与实际情况之间有误差 在操作正确的情况下,能得到准确结果
[练习1] 一些期刊杂志社经常会请一些曾经高考落榜而在某方面的事业上取得成就的著名专家、学者,谈他们对高考落榜的看法,这些名人所讲的都是大同小异,不外乎“我也有过落榜的沮丧,但从长远看,它有益于我的人生”,“我是因祸得福,落榜使我走了另一条成功之路”等等.小明据此得出一条结论:上大学不如高考落榜,他的结论正确吗?
解:小明的结论是错误的.在众多的高考落榜生中,走出另外一条成功之路的是少数,小明通过研究一些期刊杂志社报道过的一些成功人士就得出结论是片面的,因为他的样本不具有代表性.
研习 抽签法的应用
[典例2] 要从某汽车厂生产的30辆汽车中随机抽取3辆进行测试,请选择合适的抽样方法,并写出抽样过程.
解:本题中总体容量较小,样本的容量也小,故可选用抽签法来抽取含3个个体的样本,其抽样过程如下:
第一步,将30辆汽车进行编号,所编号码是01,02,…,30.
第二步,将号码分别写在大小、外观相同的纸条上,揉成团,制成号签.
第三步,将全部号签放入一个袋子中,并搅拌均匀.
第四步,每次从袋子中不放回地抽取1个号签,并记录上面的编号,连续抽取三次.
第五步,所得号码对应的3辆汽车就是要抽取的对象.
巧归纳
抽签法的一般步骤
[练习2] 某校高一年级有43名足球运动员,要从中抽出5人抽查学习负担情况,用抽签法设计一个抽样方案.
解:第一步:编号,把43名运动员编号为1~43;
第二步:制签,做好大小、形状相同的号签,分别写上这43个数;
第三步:搅拌,将这些号签放在暗箱中,进行均匀搅拌.
第四步:抽签入样,每次从中抽取一个号签,连续抽取5次(不放回抽取),从而得到容量为5的入选样本.
研习 随机数表法的应用
[典例3] (1)要研究某种品牌的850颗种子的发芽率,从中抽取50颗种子进行实验,利用随机数表法抽取种子,先将850颗种子按001,002,…,850进行编号,如果从随机数表第3行第6列的数开始向右读,请依次写出最先检验的4颗种子的编号____________(下面抽取了随机数表的第1行至第5行).
03 47 43 73 86 36 96 47 36 61 46 98 63 71 62 33 26 16 80 45 60 11 14 10 95
97 74 24 67 62 42 81 14 57 20 42 53 32 37 32 27 07 36 07 51 24 51 79 89 73
16 76 62 27 66 56 50 26 71 07 32 90 79 78 53 13 55 38 58 59 88 97 54 14 10
12 56 85 99 26 96 96 68 27 31 05 03 72 93 15 57 12 10 14 21 88 26 49 81 76
55 59 56 35 64 38 54 82 46 22 31 62 43 09 90 06 18 44 32 53 23 83 01 30 30
(2)假设我们要考察某公司生产的500克袋装牛奶的质量是否达标,现从800袋牛奶中抽取60袋进行检验,利用随机数表抽取样本时,应如何操作?
(1)解析:由随机数表的第3行第6列得4颗种子的编号依次为:227,665,650,267.
答案:(1)227,665,650,267 
(2)解:第一步,将800袋牛奶编号为000,001,…,799.
第二步,在随机数表中任选一个数作为起始数(例如选取第8行第7列的数).
第三步,从选定的数开始依次向右读,每次读三位(读数的方向也可以是向左、向上、向下等),将编号范围内的数取出,编号范围外或重复的数去掉,直到取满60个号码为止,就得到一个容量为60的样本.
[变式探究1] (变条件)在典例3(1)的条件下,若从第4行第5列开始向右读,则最先检验的4颗种子的编号为________,________,________,________.
解析:从第4行第5列向右开始读依次为:668,273,105,037.
答案:668 273 105 037 
[变式探究2] (变问法)在典例3(1)中若将“850颗种子”改为“1 850颗种子”,又如何编号?
解:可将1 850颗种子按0 001,0 002,…,1 850进行编号.
巧归纳
随机数表法抽样的步骤
(1)编号:这里所谓的编号,实际上是新编数字号码,编号位数相等. 
(2)确定读数方向:为了保证选取数字的随机性,应在面对随机数表之前就指出开始数字的纵、横位置,然后确定读数方向.
(3)获取样本:读数在总体编号内的取出,而读数不在总体编号内的和已取出的不再取出,依次下去,直至得到容量为n的样本. 
[练习3] 某工厂为了对40个零件进行抽样调查,将其编号为00,01,…,38,39.现要从中选出5个.利用下面的随机数表,从第一行第3列开始,由左至右依次读取,选出来的第5个零件编号是(  )
0647 4373 8636 9647 3661 4698 6371 6233 2616
8045 6011 1410 9577 7424 6762 4281 1457 2042
5332 3732 2707 3607 5124 5179
A.36 B.16
C.11 D.14
解析:利用随机数表,从第一行第3列开始,由左至右依次读取,即从47开始读取,将在编号范围内的提取出来,可得36,33,26,16,11,则选出来的第5个零件编号是11.故选C.
答案:C 
1.医生要检验病人血液中血脂的含量,采取的调查方法应该是 (  )
A.普查
B.抽样调查
C.既不能普查也不能抽样调查
D.普查与抽样调查都可以
解析:医生在检验病人血液中血脂的含量时,通常抽取少量的血样进行检验,故选B.
答案:B 
2.有如下抽取样本的方式:
①从无限多个个体中抽取100个个体;
②盒子中有80个零件,从中选出5个零件进行质量检验,在抽样操作时,从中任意拿出一个零件进行质量检验后再把它放回盒子里;
③某班45名同学,指定个子最高的5人参加某活动;
④从50名大学生中,抽取5人调查其晚间休息质量.
其中属于简单随机抽样的是________(只填序号).
解析:①不是简单随机抽样,由于被抽取的总体的个体数是无限的.
②不是简单随机抽样,由于它是有放回抽样.
③不是简单随机抽样,因为不是等可能抽样.
④是简单随机抽样.
答案:④ 
3.学校举办元旦晚会,需要从每班选10名男生,8名女生参加合唱节目,某班有男生32名,女生28名,用抽签法确定该班参加合唱的同学.
解:第一步,将32名男生从00到31进行编号;
第二步,用相同的纸条制成32个号签,在每个号签上写上这些编号;
第三步,将写好的号签放在一个容器内摇匀,不放回地逐个从中抽出10个号签;
第四步,相应编号的男生参加合唱;
第五步,用相同的办法从28名女生中选出8名,则此8名女生参加合唱.
课时作业(十三) 总体与样本、简单随机抽样
1.为抽查汽车排放尾气的合格率,某环保局在一路口随机抽查,这种抽查是(  )
A.简单随机抽样
B.抽签法抽样
C.随机数表法抽样
D.有放回抽样
答案:A
2.从某批零件中抽取50个,然后再从50个中抽出40个进行合格检查,发现合格品有36个,则该批产品的合格率为(  )
A.36% B.72%
C.90% D.25%
解析:×100%=90%.故选C.
答案:C 
3.从总数为N的一批零件中抽取一个容量为30的样本,若每个零件被抽取的可能性为25%,则N为(  )
A.150 B.200
C.100 D.120
解析:N==120.故选D.
答案:D 
4.在对101个人进行一次抽样时,先采用抽签法从中剔除一个人,再在剩余的100个人中随机抽取10个人,那么下列说法正确的是(  )
A.这种抽样方法对于被剔除的个体是不公平的,因为他失去了被抽到的机会
B.每个人整个抽样过程中被抽到的机会均等,因为每个人被剔除的可能性相等,那么,不被剔除的机会也是均等的
C.由于采用了两步进行抽样,所以无法判断每个人被抽到的可能性是多少
D.每个人被抽到的可能性不相等
解析:由于第一次剔除时采用抽签法,对每个人来说可能性相等,然后随机抽取10人对每个人的机会也是均等的,所以总的来说每个人的机会都是均等的,被抽到的可能性都是相等的.故选B.
答案:B 
5.总体由编号01,02,…,49,50的50个个体组成.利用下面的随机数表选取5个个体,选取方法是从随机数表第1行的第5列和第6列数字开始由左到右依次选取两个数字,则选出来的第5个个体的编号为(  )
50 44 66 44 21  22 66 22 15 86
66 06 58 05 62  26 63 75 41 99
61 65 54 35 02  58 42 36 72 24
42 35 48 96 32  58 37 52 18 51
14 52 41 52 48  03 37 18 39 11
A.22 B.21
C.06 D.05
解析:随机数表第1行的第5列和第6列数字为6,6,所以从这两个数字开始,由左向右依次选取两个数字如下:66,44,21,22,66,22,15,86,66,06,58,05,…其中落在编号01,02,…,49,50内的有:44,21,22,15,06,05…故第5个编号为06.故选C.
答案:C 
6.(多选)为了了解参加运动会的2 000名运动员的年龄情况,从中抽取了20名运动员的年龄进行统计分析.就这个问题,下列说法中正确的有(  )
A.2 000名运动员是总体
B.所抽取的20名运动员是一个样本
C.样本容量为20
D.每个运动员被抽到的机会相等
解析:由已知可得,2 000名运动员的年龄是总体,20名运动员的年龄是样本,总体容量为2 000,样本容量为20,在整个抽样过程中每个运动员被抽到的机会均为,所以A、B错误,C、D正确.故选CD.
答案:CD 
7.假设要抽查某企业生产的某种品牌的袋装牛奶的质量是否达标,现从800袋牛奶中抽取50袋进行检验.利用随机数表抽取样本时,先将800袋牛奶按000,001,……,799进行编号,如果从随机数表第3行第1列数开始向右读,最先读到的6袋牛奶的编号614,593,379,242,203,722,请你以此方式继续向右读数,随后读出的2袋牛奶的编号是________、________.(下面摘取了随机数表第1行至第5行)
78226 85384 40527 48987 60602 16085 29971 61279
43021 92980 27768 26916 27783 84572 78483 39820
61459 39073 79242 20372 21048 87088 34600 74636
63171 58247 12907 50303 28814 40422 97895 61421
42372 53183 51546 90385 12120 64042 51320 22983
解析:最先读到的6袋牛奶的编号是614,593,379,242,203,722,向右读下一个数是104,再下一个数是887,887大于850,故舍去,再下一个数是088.
答案:104 088 
8.一个学生在一次知识竞赛中要回答的8道题是这样产生的:从15道历史题中随机抽出3道,从20道地理题中随机抽出3道,从12道生物题中随机抽出2道.用抽签法确定这个学生所要回答的三门学科的题的序号.(历史题编号分别为1~15,地理题编号分别为16~35,生物题编号分别为36~47)
解:将1~15号签放在同一盒子里,搅拌均匀,每次抽出一个号签不放回,连抽3次;
将16~35号签放在同一盒子里,搅拌均匀,每次抽出一个号签不放回,连抽3次;
将36~47号签放在同一盒子里,搅拌均匀,每次抽出一个号签不放回,连抽2次.
将所得的号签对应的题目抽出来即可.
9.某市为了支援西部教育事业,现从报名的18名志愿者中选取6人组成志愿小组.若用随机数表法,怎样设计抽样方案?
解:随机数表法的抽样过程:
①将18名志愿者编号:00,01,02,…,17.
②在随机数表中随机抽取某一行某一列.如从第9行第5列开始,横向依次读取两个数字.
③根据上述原则,依次从随机数表中抽取样本号码,凡是抽到编号范围内的号码,就是样本的号码,并剔除相同的号码,直至抽满为止.
第2课时 分层抽样
[新课程标准] [新学法解读]
1.通过实例,理解分层抽样的特点和使用范围. 2.了解分层抽样的必要性,掌握各层样本量按比例分配的方法. 3.理解简单随机抽样与分层抽样方法的区别与联系. 通过分层抽样的学习,提升学生的数学运算、逻辑推理和数学抽象素养.
笔记  教材
分层抽样
1.定义
一般地,如果相对于要考察的问题来说,总体可以分成有明显差别的、互不重叠的几部分时,每一部分可称为层,在各层中按层在总体中所占比例进行随机抽样的方法称为分层随机抽样(简称为分层抽样).
2.适用范围:当总体是由差异明显的几类个体构成,并且知道某一类个体在总体中所占的百分比时,通常采用分层抽样.
自我  排查
1.分层抽样,即将相似的个体归入一类(层),然后每层各抽若干个个体构成样本,所以分层随机抽样为保证每个个体等可能入样,判断下列说法的正误.(正确的打“√”,错误的打“?”)
(1)每层内等可能抽样.(  )
(2)每层内不等可能抽样.(  )
(3)所有层用同一抽样比.(  )
(4)所有层抽同样多样本.(  )
提示:由分层抽样的概念知,所有层抽样比相同,且保证等可能入样.
答案:(1)√ (2)? (3)√ (4)?
2.为调查某班学生的平均身高,从50名学生中抽取5名,抽样方法是________;如果男生的身高和女生的身高有显著不同(男生30人,女生20人),抽样方法是________.
答案:简单随机抽样 分层抽样
3.一个工厂有若干车间,今采用分层抽样的方法从全厂某天生产的2 048件产品中抽取一个容量为128的样本进行质量检查.若某一车间这一天生产了256件产品,则从该车间抽取的产品件数为________.
答案:16
研习 分层抽样概念的理解
[典例1] 下列问题中最适合用分层抽样抽取样本的是(  )
A.从10名同学中抽取3人参加座谈会
B.某社区有500个家庭,其中高收入的家庭125个,中等收入的家庭280个,低收入的家庭95个.为了了解生活购买力的某项指标,要从中抽取一个容量为100的样本
C.从1 000名工人中,抽取100名调查上班途中所用的时间
D.从生产流水线上,抽取样本检查产品质量
解析:B中的总体是由差异明显的几部分组成的,最适合用分层抽样.
答案:B 
巧归纳
分层抽样的依据
(1)适用于总体由差异明显的几部分组成的情况;
(2)样本能更充分地反映总体的情况;
(3)等可能抽样,每个个体被抽到的可能性都相等. 
[练习1] 某高校大一新生中,来自东部地区的学生有2 400人,中部地区学生有1 600人、西部地区学生有1 000人.从中选取100人作样本,调研饮食习惯.为保证调研结果相对准确,下列判断正确的有(  )
①用分层抽样的方法分别抽取东部地区学生48人、中部地区学生32人、西部地区学生20人;②用简单随机抽样的方法从新生中选出100人;③西部地区学生小刘被选中的概率为;④东部地区学生小张被选中的概率比中部地区的学生小王被选中的概率大.
A.①④ B.①③
C.①③④ D.②③
解析:由题意得,应该选择分层抽样,故②错误;若采用分层抽样,则抽样比为=,则分别抽取东部地区学生2 400×=48(人),中部地区学生1 600×=32(人),西部地区学生1 000×=20(人),故①正确;而采用分层抽样时,每个个体被选中的概率一样,都为,故③正确,④错误.故选B.
答案:B 
研习 分层抽样中的相关计算
[典例2] (1)某市有大型超市200家,中型超市400家,小型超市1 400家.为掌握各类超市的营业情况,现按分层抽样的方法抽取一个容量为100的样本,则应抽取中型超市________家.
(2)某单位共有老、中、青职工430人,其中有青年职工160人,中年职工人数是老年职工人数的2倍.为了解职工的身体状况,现采用分层抽样方法进行调查,在抽取的样本中有青年职工32人,则该样本中的老年职工人数为________.
(1)解析:根据题意,可得抽样比为=,故应抽取中型超市400×=20(家).
答案:20 
(2)解析:设该单位老年职工人数为x,由题意得3x=430-160,解得x=90.则样本中的老年职工人数为90×=18.
答案:18 
巧归纳
分层抽样中每层抽取的个体数的确定方法
(1)已知总体容量、样本容量及各层的个体数时,首先确定抽样比,其中N为总体容量,n为样本容量;然后确定每层抽取的个体的个数ni=Ni×,其中Ni为第i(i=1,2,…,k)层的个体数,ni为第i层应抽取的个体数.
(2)已知各层个体数之比为m1∶m2∶…∶mk,样本容量为n时,每层抽取的个体数为ni=n×(i=1,2,…,k). 
[练习2] (1)某单位有业务员和管理人员构成的职工160人,现用分层抽样方法从中抽取一个容量为20的样本,若样本中管理人员有7人,则该单位的职工中业务员有(  )
A.32人 B.56人
C.104人 D.112
(2)某企业三月中旬生产A,B,C三种产品共3 000件,根据分层随机抽样的结果,该企业统计员制作了如下的统计表:
由于不小心,表格中A,C产品的有关数据已被污染,导致看不清楚,统计员记得A产品的样本容量比C产品的样本容量多10,则C产品的数量是________件.
(1)解析:样本中业务员的人数为20-7=13,设该单位的业务员人数为n,由题意可得=,解得n==104.故该单位的职工中业务员的人数为104人.故选C.
答案:C 
(2)解析:设C产品的数量为x件,则A产品的数量为3 000-1 300-x=(1 700-x)件.设C产品的样本容量为a,则A产品的样本容量为10+a,由分层随机抽样的定义可知==,解得x=800.
答案:800 
研习 分层抽样的设计
[典例3] 某政府机关有在编人员100人,其中副处级以上干部10人,一般干部70人,工人20人,上级机关为了了解该政府机构的改革意见,要从中抽取一个容量为20的样本,试确定用何种方法抽取,并具体实施操作.
解:因为个体差异明显,为体现调查的公平性,应该采用分层抽样.
因为=,
所以从副处级以上干部中抽取10×=2(人),
从一般干部中抽取70×=14(人),
从工人中抽取20×=4(人).
因为副处级以上干部与工人人数都较少,可分别按1~10编号与1~20编号,然后采用抽签法分别抽取2人和4人.
一般干部有70人,人数较多,首先按00,01,…,69编号,然后利用随机数表法抽取14人.
巧归纳
分层抽样的步骤
[练习3] 某市的3个区共有高中学生20 000人,且3个区的高中学生人数之比为2∶3∶5,各区高中学生的视力有明显差异,现要从所有学生中抽取一个容量为200的样本,调查该市高中学生的视力情况,试写出抽样过程.
解:①由于该市各区高中学生的视力有明显差异,故按3个区分成三层,用分层抽样来抽取样本.
②确定每层抽取个体的个数.因为在3个区分别抽取的学生人数之比是2∶3∶5,所以抽取的学生人数分别是200×=40;200×=60;200×=100.
③在各层分别抽取样本.
④综合每层抽样,组成容量为200的样本.
1.分层抽样适合的总体是 (  )
A.总体容量较多
B.样本容量较多
C.总体中个体有差异
D.任何总体
解析:根据分层随机抽样的特点可知选C.
答案:C 
2.某单位有职工1 500人,其中青年职工700人,中年职工500人,老年职工300人.为了了解该单位职工的健康状况,用分层抽样的方法从中抽取样本,若样本中的青年职工为14人,则样本容量为(  )
A.14 B.30
C.50 D.70
解析:设样本容量为N,由题意得=,解得N=30.
答案:B 
3.某校做了一次关于“感恩父母”的问卷调查,从8~10岁,11~12岁,13~14岁,15~16岁四个年龄段回收的问卷依次为:120份,180份,240份,x份.因调查需要,从回收的问卷中按年龄段分层抽取容量为300的样本,其中在11~12岁学生问卷中抽取60份,则在15~16岁学生中抽取的问卷份数为________.
解析:由题意可得=,解得x=360,故在15~16岁学生中抽取的问卷份数为360×=120.
答案:120 
4.为了了解高一、高二、高三年级学生的身体状况,现用分层随机抽样的方法抽取一个容量为1 200的样本,三个年级学生人数之比依次为k∶5∶3.已知高一年级共抽取了240人,则高三年级抽取的人数为________人.
解析:由已知高一年级抽取的比例为=,所以=,得k=2,故高三年级抽取的人数为1 200×=360.
答案:360 
5.某学校高一、高二、高三年级的学生人数之比为3∶3∶4,现用分层抽样的方法从该校高中三个年级的学生中抽取容量为50的样本,求应从高二年级抽取的学生人数.
解:设应从高二年级抽取x名学生,则x∶50=3∶10.
解得x=15.故应从高二年级抽取15名学生.
课时作业(十四) 分层抽样
1.从10个篮球中任取一个检验其质量,则该抽样是(  )
A.简单随机抽样 B.不等可能抽样
C.分层随机抽样 D.有放回抽样
答案:A
2.某班有50人,其中30名男生,20名女生,现调查平均身高,已知男、女生身高明显不同,现抽取一个容量为10的样本,则抽出的男、女生人数之差为(  )
A.5 B.4
C.3 D.2
解析:由题意可得,抽样的比例为30∶20=3∶2.则从30名男生中抽取6人,20名女生中抽取4人,故男、女生人数之差为2.故选D.
答案:D 
3.某单位有老年人27人,中年人54人,青年人81人,为了调查他们的身体状况的某项指标,需从他们中间抽取一个容量为42的样本,则老年人、中年人、青年人分别应抽取的人数是   (  )
A.7,11,18 B.6,12,18
C.6,13,17 D.7,14,21
解析:由题意,老年人、中年人、青年人的比例为1∶2∶3.由分层随机抽样的规则知,老年人应抽取的人数为×42=7,中年人应抽取的人数为×42=14,青年人应抽取的人数为×42=21.
答案:D 
4.某商场有四类食品,其中粮食类、植物油类、动物性食品类及果蔬类分别有40种、10种、30种、20种,现从中抽取一个容量为20的样本进行食品安全检测,若采用分层随机抽样的方法抽取样本,则抽取的植物油类与果蔬类食品种数之和是(  )
A.4 B.5
C.6 D.7
解析:抽样比为=,则抽取的植物油类种数是10×=2,果蔬类食品种数是20×=4,所以抽取的植物油类与果蔬类食品种数之和是2+4=6.
答案:C 
5.用样本估计总体的统计思想在我国古代数学名著《数书九章》中就有记载,其中有道“米谷粒分”题:粮仓开仓收粮,有人送来一批米, 验得米内夹谷,抽样取米, 数得250粒内夹谷25粒,若这批米内夹谷有160石,则这一批米约有________石.
解析:设这批米共有x石,由题意可得,=,解得x=1 600.
答案:1 600 
6.某设施从开始设计到建成完工,历时仅十天.完工后,新华社记者要对部分参与人员采访,决定从600名机械车操控人员,320 名管理人员和n名工人中按照分层抽样的方法抽取35人,若从工人中抽取的人数为7,则n=________.
解析:根据分层抽样可知,工人所占比为,所以×35=7,解得n=230(人).
答案:230 
7.某工厂生产A,B,C三种不同型号的产品,某月生产这三种产品的数量之比依次为2∶a∶3,现用分层抽样方法抽取一个容量为120的样本,已知B种型号产品抽取了60件,则a=________.
解析:由题意,=,解得a=5.
答案:5 
8.一支田径队有男运动员49人,女运动员42人,用分层抽样的方法从全体运动员中抽出一个容量为13的样本. 则应抽取男运动员________人,女运动员________人.
解析:抽样比为=,所以抽取男运动员49×=7(人),女运动员42×=6(人).
答案:7 6 
9.某单位最近组织了一次健身活动,活动分为登山组和游泳组,且每个职工至多参加其中一组,在参加活动的职工中,青年人占42.5%,中年人占47.5%,老年人占10%.登山组的职工占参加活动总人数的,且该组中,青年人占50%,中年人占40%,老年人占10%.为了了解各组不同年龄层次的职工对本次活动的满意程度,现用分层随机抽样方法从参加活动的全体职工抽取一个容量为200的样本,求:
(1)游泳组中,青年人、中年人、老年人分别所占的比例;
(2)游泳组中,青年人、中年人、老年人分别应抽取的人数.
解:(1)设登山组人数为x,则游泳组人数为3x,游泳组中青年人、中年人、老年人各占比例分别为a,b,c,则有=47.5%,=10%,解得b=50%,c=10%.
故a=100%-50%-10%=40%,即游泳组中,青年人、中年人、老年人各占比例分别为40%,50%,10%.
(2)游泳组中,抽取的青年人为200××40%=60(人);
抽取的中年人为200××50%=75(人);
抽取的老年人为200××10%=15(人).
故游泳组中,青年人、中年人、老年人应分别抽取60人,75人,15人.
10.某羽绒服厂的三个车间在2022年8月份共生产男女羽绒服3 000件,如表所示:
第一车间 第二车间 第三车间
女羽绒服 490 x y
男羽绒服 485 525 z
现从这些羽绒服中随机抽取一件进行检验,已知抽到第二车间女羽绒服的可能性是0.18.
(1)求x的值;
(2)现用分层随机抽样的方法在生产的这些羽绒服中随机抽取75件进行检验,问应在第三车间中抽取多少件?
解:(1)因为=0.18,所以x=540.
(2)第三车间生产的件数为y+z=3 000-(490+485+525+540)=960,现用分层随机抽样的方法在这3 000件羽绒服中抽取75件,应在第三车间中抽取的件数为×960=24.
11.有以下两个案例:
案例一:从同一批次同类型号的10袋牛奶中抽取3袋检测其三聚氰胺含量;
案例二:某公司有员工800人.其中高级职称有160人,中级职称有320人,初级职称有200人,其余人员有120人,从中抽取容量为40的样本,了解该公司职工收入情况.
(1)你认为这些案例应采用怎样的抽样方式较为合适?
(2)在你使用的分层随机抽样案例中写出抽样过程.
解:(1)案例一中,因为总体个数较少,所以用简单随机抽样;
案例二中,因为总体按职称特征分为四个层次,所以用分层随机抽样.
(2)①分层,将总体分为高级职称、中级职称、初级职称及其余人员四层;
②确定抽样比例q==;
③按上述比例确定各层样本数分别为8人、16人、10人、6人;
④按简单随机抽样方法在各层抽取相应的样本;
⑤汇总构成一个容量为40的样本.
12.厂家生产的一批产品是由三台机器生产的,共1 200件,其中甲机器生产240件,乙机器生产360件,丙机器生产600件,现用分层随机抽样的方法,从中抽取一个容量为30的样本检查这批产品的合格率,说明这种抽样方法是公平的.
解:因为三台机器生产的产品数量之比是240∶360∶600=2∶3∶5,所以应该从甲、乙、丙机器生产的产品中抽取的件数分别是30×=6(件),30×=9(件),30×=15(件),则甲、乙、丙三台机器生产的产品被抽取的可能性分别是=,=,=,综上可知,采用分层随机抽样的方法抽取样本,一是能反映不同机器生产的产品的数量的不同,减少抽取产品合格率的误差;二是分层随机抽样后,每个个体被抽到的可能性都是,所以分层随机抽样的方法是公平的.
5.1.2 数据的数字特征
第1课时 最值、平均数、中位数、百分位数、众数
[新课程标准] [新学法解读]
1.理解数据的最值、平均数、中位数、百分位数、众数的意义和作用. 2.会计算数据的这些数字特征,并能解决有关实际问题. 通过本节课的学习,提高学生的数据分析和数学运算素养.
笔记  教材
1.最值
一组数据的最值指的是其中的最大值与最小值,最值反映的是这组数最极端的情况.一般地,最大值用max表示,最小值用min表示.
2.平均数
(1)定义:如果给定的一组数是x1,x2,…,xn,则这组数的平均数为=(x1+x2+…+xn).
这一公式在数学中常简记为=i,
其中的符号“∑”表示求和,读作“西格玛”,∑右边式子中的i表示求和的范围,其最小值与最大值分别写在∑的下面与上面.
求和符号∑具有以下性质:
①(xi+yi)=i+i;
②(kxi)=ki;
③=nt.
(2)性质:一般地,利用平均数的计算公式可知,如果x1,x2,…,xn的平均数为,且a,b为常数,则ax1+b,ax2+b,…,axn+b的平均数为a+b.
3.中位数、百分位数
(1)中位数
一般地,如果一组数有奇数个数,且按照从小到大排列后为x1,x2,…,x2n+1,则称xn+1为这组数的中位数;如果一组数有偶数个数,且按照从小到大排列后为x1,x2,…,x2n,则称为这组数的中位数.
(2)百分位数
定义:一组数的p%(p∈(0,100))分位数指的是满足下列条件的一个数值:至少有p%的数据不大于该值,且至少有(100-p)%的数据不小于该值.
直观理解:一组数的p%分位数指的是,将这组数按照从小到大的顺序排列后,处于p%位置的数.
确定方法:设一组数按照从小到大排列后为x1,x2,…,xn,计算i=np%的值,如果i不是整数,设i0为大于i的最小整数,取xi0为p%分位数;如果i是整数,取为p%分位数.特别地,规定:0分位数是x1(即最小值),100%分位数是xn(即最大值).
4.众数
一组数据中,某个数据出现的次数称为这个数据的频数,出现次数最多的数据称为这组数据的众数.
自我  排查
1.(1)对于数据3,3,2,3,6,3,10,3,6,3,2,判断下列说法的正误.(正确的打“√”,错误的打“?”)
①这组数据的众数是3.(  )
②这组数据的众数与中位数的数值不相等.(  )
③这组数据的中位数与平均数的数值相等.(  )
④这组数据的平均数与众数的数值相等.(  )
提示:在这11个数中,数3出现了6次,频率最高,故众数是3;将这11个数按从小到大顺序排列得2,2,3,3,3,3,3,3,6,6,10,中间数据是3,故中位数是3;而平均数==4.故只有①正确.
答案:①√ ②? ③? ④?
(2)判断正误.(正确的打“√”,错误的打“?”)
①描述一组数据极端情况的数字特征是最值.(√)
②描述一组数据中心位置的数字特征可以是平均数、中位数和众数.(√)
③百分位数可用于了解数据的分布特点.(√)
2.高一(18)班十位同学的数学测试成绩分别为:82,91,73,84,98,99,101,118,98,110,则该组数据的中位数是________.
解析:把这组数据由小到大排列为73,82,84,91,98,98,99,101,110,118,可知中位数为=98.
答案:98 
3.若一组数据8,9,11,12,x的平均数为10,则实数x=________.
解析:由=10,得x=10.
答案:10 
4.已知一组数据为-3,5,7,x,11,且这组数据的众数为5,那么该组数据的中位数是________.
解析:由这组数据的众数为5,可知x=5.把这组数据由小到大排列为-3,5,5,7,11,则可知中位数为5.
答案:5 
5.某居委会有1 000户家庭,每户家庭的人口数如下表:
每户家庭 人口数 1 2 3 4 5 6 7
户数 156 181 320 236 69 24 14
则该居委会每户家庭平均人口数为________.(精确到0.01)
解析:由已知=
=3.009≈3.01,
则该居委会每户家庭平均人口数为3.01.
答案:3.01 
研习 最值、众数的确定
[典例1] 确定数据:68,69,71,63,70,68,69,71,69,72的最值和众数.
解:把所给数据从小到大排列为63,68,68,69,69,69,70,71,71,72,则最大值为72,最小值为63,众数为69.
巧归纳
1.把数据从小到大排列.
2.根据定义即可确定最值和众数. 
[练习1] 确定数据:9.4,8.4,9.4,9.9,9.6,9.7的最值和众数.
解:把数据从小到大排列为8.4,9.4,9.4,9.6,9.7,9.9,则最大值为9.9,最小值为8.4,众数为9.4.
研习 中位数、百分位数的确定
[典例2] 确定数据:1,2,2,2,2,3,3,3,5,5,6,6,8,8,9,10,10,12,13,13的中位数,78%分位数.
解:因为所给数据已从小到大排列,共20个,
而且i1=20×50%=10为整数,
i2=20×78%=15.6不为整数,
所以这组数据的中位数为==5.5,
78%分位数为x16=10.
巧归纳
1.把数据从小到大排列为x1,x2,…,xn.
2.若i=np%为整数,则p%分位数为;若i=np%不是整数,取i0为大于i的最小整数,则xi0即为p%分位数. 
[练习2] (1)据统计,某市2022年各月的平均气温(℃)如下:9,8,15,18,20,23,31,32,28,23,20,12,则这组数据的中位数为________,众数为________.
(2)确定数据0,0,0,0,1,1,2,3,4,5,6,6,7,7,10,14,14,14,14,15的28%分位数和75%分位数.
(1)解析:将数据按从小到大排列为8,9,12,15,18,20,20,23,23,28,31,32,中间两个数为20,20,故中位数为20.出现次数最多的为20和23,故众数为20和23.
答案:20 20和23 
(2)解:因为数据已从小到大排列,共20个.
而且i1=20×28%=5.6,不为整数,
i2=20×75%=15是整数,
因此,此数据的28%分位数为x6=1,75%分位数为==12.
研均数的计算
[典例3] 求数据18.9,19.5,19.5,19.2,19,18.8,19.5的平均数.
解:解法一:(用定义)这组数据的平均数为×(18.9+3×19.5+19.2+19+18.8)=19.2.
解法二:(用性质)将每一个数乘以10,再减去190,可得-1,5,5,2,0,-2,5.
这组新数的平均数为×(-1+5+5+2+0-2+5)=2.故所求平均数为19.2.
巧归纳
(1)用定义式;
(2)用平均数的性质;
(3)在容量为n的一组数据中,若数据x1有n1个,x2有n2个,…,xk有nk个,且n=n1+n2+…+nk,则这组数据的平均数为(n1x1+n2x2+…+nkxk)=x1+x2+…+xk. 
[练习3] 在一次中学生田径运动会上,参加男子跳高的17名运动员的成绩如表所示:
成绩 (单位:m) 1.50 1.60 1.65 1.70 1.75 1.80 1.85 1.90
人数 2 3 2 3 4 1 1 1
分别求这些运动员成绩的众数、中位数与平均数.(保留两位小数)
解:在17个数据中,1.75出现了4次,出现的次数最多,即这组数据的众数是1.75.表里的17个数据可看成是按从小到大的顺序排列的,其中第9个数据1.70是最中间的一个数据,即这组数据的中位数是1.70;这组数据的平均数是=×(1.50×2+1.60×3+…+1.90×1)=≈1.69(m).
1.一个样本数据按从小到大的顺序排列为13,14,19,x,23,27,28,31,若中位数为22,则x等于(  )
A.21 B.22
C.23 D.19
解析:因为一共8个数,所以中位数为中间两数的平均数,即=22,x=21,故选A.
答案:A 
2.一组观察值4,3,5,6出现的次数分别为3,2,4,2,则样本平均值约为(  )
A.4.55 B.4.5
C.12.5 D.1.64
解析:由条件得=×(4×3+3×2+5×4+6×2)≈4.55.
答案:A 
3.某产品售后服务中心随机选取了10个工作日,分别记录了每个工作日接到的客户售后服务电话的数量(单位:次):
63 38 25 42 56 48 53 39 28 47
则上述数据的50%分位数为________.
解析:把这组数据从小到大排序:25,28,38,39,42,47,48,53,56,63,则10×50%=5.
所以50%分位数为==44.5.
答案:44.5 
4.已知x1,x2,…,xn的平均数为,计算(xi-)的值.
解:(xi-)=(x1+x2+…+xn)-n
=(x1+x2+…+xn)-n·(x1+x2+…+xn)=0.
第2课时 极差、方差与标准差
[新课程标准] [新学法解读]
1.理解极差、方差和标准差的意义和作用. 2.会计算样本数据的这些数字特征,并能解答有关实际问题. 通过极差、方差和标准差的求解及应用,提高学生的数据分析、逻辑推理和数学运算素养.
笔记  教材
极差、方差与标准差
1.极差:一组数的极差指的是这组数的最大值减去最小值所得的差.极差反映了一组数的变化范围.
2.方差
定义:如果x1,x2,…,xn的平均数为,则方差可用求和符号表示为s2=(xi-)2=-2.
性质:如果a,b为常数,则ax1+b,ax2+b,…,axn+b的方差为a2s2.
3.标准差
定义:方差的算术平方根称为标准差.一般用s表示,即样本数据x1,x2,…,xn的标准差为s=.
性质:如果a,b为常数,则ax1+b,ax2+b,…,axn+b的标准差为|a|s.
自我  排查
1.判断正误.(正确的打“√”,错误的打“?”)
(1)如果一组数中,各数据值都相等,则标准差为0,表明数据没有波动,数据没有离散性,反之也成立. (√)
(2)若各数据的值与平均数的差的绝对值较大,则标准差也较大,表明数据的波动幅度也较大,数据的离散程度较高.(√)
(3)标准差是样本数据到平均数的一种平均距离. (√)
2.设一组样本数据a1,a2,…an的方差为0.1,则数据3a1,3a2,…,3an的方差为(  )
A.0.3 B.0.9
C.3 D.9
解析:∵样本数据a1,a2,…,an的方差为0.1,∴数据3a1,3a2,…,3an的方差为32×0.1=0.9.故选B.
答案:B 
3.已知数据6,7,8,8,9,10,则该组数据的方差是________.
解析:这组数据的平均数为8,故方差为s2=×[(6-8)2+(7-8)2+(8-8)2+(8-8)2+(9-8)2+(10-8)2]=.
答案: 
4.从某项综合能力测试中抽取100人的成绩,统计如下表所示.
分数 5 4 3 2 1
人数 20 10 30 30 10
则这100人成绩的标准差为________.
解析:∵==3,
∴s2=×(20×22+10×12+30×02+30×12+10×22)==,∴s=.
答案: 
5.甲、乙、丙、丁四人参加某运动会射击项目选拔赛,四人的平均成绩和方差如下表所示:
甲 乙 丙 丁
平均环数 8.3 8.8 8.8 8.7
方差s2 3.5 3.6 2.2 5.4
若要从这四人中选择一人去参加该运动会射击项目比赛,最佳人选是________(填“甲”“乙”“丙”“丁”中的一个).
解析:分析题中表格数据可知,乙与丙的平均环数最大,又丙的方差比乙小,说明丙成绩发挥得较为稳定,所以最佳人选为丙.
答案:丙 
研习 极差、方差、标准差的计算
[典例1] 已知一组数据:2,2,2,3,3,3,3,4,4,4,4,4,5,5,5,5,5,5,6,6.求:
(1)极差;(2)方差;(3)标准差.
解:(1)因为最大值为6,最小值为2,所以极差为4.
(2)可将数据整理为
x 2 3 4 5 6
频数 3 4 5 6 2
每一个数都减去4可得
x-4 -2 -1 0 1 2
频数 3 4 5 6 2
这组数的平均数与方差分别为
×[(-2)×3+(-1)×4+0×5+1×6+2×2]=0,
×[(-2)2×3+(-1)2×4+02×5+12×6+22×2]=.
因此,所求平均数为4,方差为.
(3)由(2)知,标准差为.
巧归纳
求方差的基本方法
(1)先求平均数,再代入公式s2=(xi-)2,或s2=-2;
(2)用性质;
(3)当一组数据重复数据较多时,可先整理出频数表,再计算s2. 
[练习1] (1)如果x1,x2…xn的方差为2,则2x1+1,2x2+1,…,2xn+1的方差为(  )
A.2 B.4
C.8 D.16
(2)若样本数据x1,x2,…,x10的标准差为8,则数据2x1-1,2x2-1,…,2x10-1的标准差为 (  )
A.8 B.15
C.16 D.32
解析:(1)设原数据的平均数为,则新数据的平均数为2+1,原数据的方差为×[(x1-)2+(x2-)2+…+(xn-)2]=2,则新数据的方差为[(2x1+1-2-1)2+(2x2+1-2-1)2+…+(2xn+1-2-1)2]=4×[(x1-)2+(x2-)2+…+(xn-)2]=4×2=8.故选C.
(2)因为样本数据x1,x2,…,x10的标准差s=8,则样本数据2x1-1,2x2-1,…,2x10-1的标准差s′=2×8=16.
答案:(1)C (2)C 
研习 分层抽样的方差
[典例2] 甲、乙两班学生参加了同一考试,其中甲班50人,乙班40人.甲班的平均成绩为80.5分,方差为500;乙班的平均成绩为85分,方差为360.那么甲、乙两班全部90名学生的平均成绩和方差分别是多少?
解:设甲班50名学生的成绩分别是a1,a2,…,a50,那么甲班的平均成绩和方差分别为
甲==80.5(分),
s==500.
设乙班40名学生的成绩分别是b1,b2,…,b40,那么乙班的平均成绩和方差分别为
乙==85(分),
s==360.
故全部90名学生的平均成绩应为
===82.5(分),
方差s2=

=≈442.78.
巧归纳
若样本中有两层,第一层有m个数,分别为x1,x2,…,xm,平均数为,方差为s2;第二层有n个数,分别为y1,y2,…,yn,平均数为,方差为t2,则样本的均值为=,方差为.
[练习2] 在考察某中学学生身高时,采用分层抽样的方法得到了20名男生身高的平均值为170,方差为16;15名女生的身高的平均值为165,方差为25,计算这35名学生的方差.
解:由题意知,男=170,s=16,女=165,
s=25,则=≈167.86,s2=
≈25.98.
研习 数字特征的应用
[典例3] 在一次科技知识竞赛中,两组学生的成绩如表所示:
分数(分) 50 60 70 80 90 100
人数 (人) 甲组 2 5 10 13 14 6
乙组 4 4 16 2 12 12
已经计算得知两个组成绩的平均数都是80分,请根据你所学过的统计知识,进一步判断这两个组在这次竞赛中的成绩谁优谁次,说明理由.
解:①甲组成绩的众数为90分,乙组成绩的众数为70分,从成绩的众数比较看,甲组的成绩好一些.
②s=[2×(50-80)2+5×(60-80)2+10×(70-80)2+13×(80-80)2+14×(90-80)2+6×(100-80)2]=172,
s=[4×(50-80)2+4×(60-80)2+16×(70-80)2+2×(80-80)2+12×(90-80)2+12×(100-80)2]=256.
因为s所以甲组的成绩比乙组的成绩稳定,故甲组好些.
③甲、乙两组成绩的中位数、平均数都是80分,其中,甲组成绩不低于80分的有33人,乙组成绩不低于80分的有26人,从这一角度来看甲组的成绩较好.
④从成绩统计表来看,甲组的成绩不低于90分的有20人,乙组的成绩不低于90分的有24人,所以乙组成绩集中在高分段的人数多.同时乙组得满分的人数比甲组得满分的人数多6,从这一些角度来看,乙组的成绩较好.
巧归纳
在实际问题中,仅靠平均数不能完全反映问题,还要研究其偏离平均值的离散程度(即方差或标准差).标准差越大,说明数据的离散性越大;标准差越小,说明数据的离散性越小或数据越集中、稳定. 
[练习3] 为了考察甲、乙两种小麦的长势,分别从甲、乙两种麦苗中各抽10株,测得它们的株高分别为(单位:cm):
甲:25 41 40 37 22 14 19 39 21 42
乙:27 16 44 27 44 16 40 40 16 40
(1)哪种小麦的苗长得高?
(2)哪种小麦的苗长得齐?
解:(1)甲=×(25+41+40+37+22+14+19+39+21+42)=×300=30(cm).
乙=×(27+16+44+27+44+16+40+40+16+40)
=×310=31(cm).
显然甲<乙,所以乙种小麦的苗长得高.
(2)s=×[(25-30)2+(41-30)2+(40-30)2+(37-30)2+(22-30)2+(14-30)2+(19-30)2+(39-30)2+(21-30)2+(42-30)2]
=×(25+121+100+49+64+256+121+81+81+144)=×1 042=104.2.
s=×[(27-31)2+(16-31)2+(44-31)2+(27-31)2+(44-31)2+(16-31)2+(40-31)2+(40-31)2+(16-31)2+(40-31)2]
=×(16+225+169+16+169+225+81+81+225+81)=×1 288=128.8.
显然s1.已知数据:2,4,4,6,6,6,8,8,8,8,则这10个数的标准差为 (  )
A.1 B.2
C.3 D.4
解析:因为这10个数的平均数=×(2+4×2+6×3+8×4)=6,所以方差s2=×[(2-6)2+(4-6)2×2+(6-6)2×3+(8-6)2×4]=4,则标准差为2.
答案:B 
2.样本中共有五个个体,其值分别为a,0,1,2,3.若该样本的平均数为1,则样本方差为 (  )
A. B.
C. D.2
解析:∵样本的平均数为1,∴×(a+0+1+2+3)=1,∴a=-1,∴样本方差s2=×[(-1-1)2+(0-1)2+(1-1)2+(2-1)2+(3-1)2]=2.
答案:D 
3.(2021·全国卷)设一组样本数据x1,x2,…,xn的方差为0.01,则数据10x1,10x2,…,10xn的方差为(  )
A.0.01 B.0.1
C.1 D.10
解析:因为数据axi+b,(i=1,2,…,n)的方差是数据xi(i=1,2,…,n)的方差的a2倍,所以所求数据方差为102×0.01=1.故选C.
答案:C 
4.已知一组数据1,2,2,x,5,10的平均数是4,则该组数据的方差为________.
解析:依题意=4,解得x=4,所以方差为×[(1-4)2+(2-4)2+(2-4)2+(4-4)2+(5-4)2+(10-4)2]=×(9+4+4+1+36)=9.
答案:9 
5.一组数据中的每一个数据都乘2,再减去80,得到一组新数据,若求得新数据的平均数是1.2,方差是4.4,求原来数据的平均数和方差.
解:设原数据的平均数为,方差为s2,则新数据的平均数为2-80,方差为4s2,由题意得2-80=1.2,4s2=4.4,所以=40.6,s2=1.1.
课时作业(十五) 数据的数字特征
1.一组数据101,98,102,100,99的标准差为(  )
A. B.0
C.1 D.2
解析:样本平均数=×(101+98+102+100+99)=100,方差s2=×[(101-100)2+(98-100)2+(102-100)2+(100-100)2+(99-100)2]=2.
∴标准差s=.故选A.
答案:A 
2.某市在抗旱期间一手抓抗旱,一手抓经济发展,下表是“利群超市”5月份一周的利润情况记录:
日期 12日 13日 14日 15日 16日 17日 18日
当日利润/万元 0.20 0.17 0.23 0.21 0.23 0.18 0.25
根据上表,估计利群超市今年五月份的总利润是(  )
A.6.51万元 B.6.4万元
C.1.47万元 D.5.88万元
解析:从题表中一周的利润可得一天的平均利润为
==0.21(万元),又∵五月份共31天,
∴五月份的总利润约为0.21×31=6.51(万元).故选A.
答案:A 
3.某班学生体检中检查视力的结果如下表,从表中可以看出,全班视力数据的众数是(  )
视力 0.5以下 0.7 0.8 0.9 1.0 1.0以上
占全班人数 的百分比 2% 6% 3% 20% 65% 4%
A.0.9 B.1.0
C.20% D.65%
解析:一组数据中,出现次数最多的数叫作这组数据的众数.从上表可看出,视力为1.0的人数占百分比最大,所以众数为1.0.故选B.
答案:B 
4.已知一个样本的数据为x,1,y,5,其中x,y是方程组的解(x<y),则这个样本的标准差是(  )
A.2 B.
C.5 D.
解析:解方程组
得或∵x<y,∴
∴这组数据为-1,1,3,5,
∴==2,
∴方差s2==5,
∴标准差s=.故选D.
答案:D 
5.下列各组数中方差最小的是(  )
A.1,2,3,4,5 B.2,2,2,4,5
C.3,3,3,3,3 D.2,3,2,3,2
解析:C选项中,数据均是3,方差为0,显然最小.故选C.
答案:C 
6.某班40名学生,在一次考试中统计平均分为80分,方差为70,后来发现有两名同学的成绩有误,甲实得80分却记为60分,乙实得70分,却记为90分,则更正后的方差为(  )
A.60 B.70
C.75 D.80
解析:因为甲实得80分却记为60分,少记20分;乙实得70分,却记为90分,多记20分,所以总分没有变化,因此更正前后平均分没有变化,都是80分,
设甲、乙之外其他同学的成绩分别为a3,a4…,a40.因为更正前的方差为70,所以(60-80)2+(90-80)2+(a3-80)2+…+(a40-80)2=70×40.
可得(a3-80)2+…+(a40-80)2=2 300.更正后的方差s2=[(80-80)2+(70-80)2+(a3-80)2+…+(a40-80)2]=[100+(a3-80)2+…+(a40-80)2]=×[100+2 300]=60.故选A.
答案:A 
7.“幸福感指数”是指某个人主观地评价他对自己目前生活状态的满意程度的指标.常用区间[0,10]内的一个数来表示, 该数越接近10表示满意度越高.甲、乙两位同学分别随机抽取10位本地市民调查他们的幸福感指数,甲得到十位市民的幸福感指数为5,6,6,7,7,7,7,8,8,9,乙得到十位市民的幸福感指数的平均数为8,方差为2,则这20位市民幸福感指数的方差为(  )
A.1.75 B.1.85
C.1.90 D.1.95
解析:设甲得到的十位市民的幸福感指数分别为x1,x2,…,x10,乙得到十位市民的幸福感指数分别为x11,x12,…,x20,故这20位市民的幸福感指数的方差为(x+x+…+x+x+…+x)-2,因为乙得到十位市民的幸福感指数的平均数为8,方差为2,则x11+x12+…+x20=8×10=80,故==7.5,而(x+…+x)-64=2,故x+…+x=660,
而x+x+…+x=52+62+62+4×72+2×82+92=502,
故所求的方差为×(502+660)-7.52=1.85,故选B.
答案:B 
8.若某同学连续3次考试的名次(3次考试均没有出现并列名次的情况)不低于第3名,则称该同学为班级的尖子生.根据甲、乙、丙、丁四位同学过去连续 3次考试名次的数据, 推断一定是尖子生的是(  )
A.甲同学:平均数为2,方差小于1
B.乙同学:平均数为2,众数为1
C.丙同学:中位数为2,众数为2
D.丁同学:众数为2,方差大于1
解析:对于甲同学,平均数为2,方差小于1,设甲同学三次考试的名次分别为x1,x2,x3,若x1,x2,x3中至少有一个大于等于4,则方差为s2=[(x1-2)2+(x2-2)2+(x3-2)2]≥,与已知条件矛盾,所以x1,x2,x3均不大于3,满足题意;对于乙同学,平均数为2,众数为1,则三次考试的成绩的名次为1,1,4,即必有一次考试为第4名,不满足题意;对于丙同学,中位数为2,众数为2,可举反例:2,2,4,不满足题意;对于丁同学,众数为2,方差大于1,可举特例:2,2,5,则平均数为3,方差为s2=×[2×(2-3)2+(5-3)2]=2>1,不满足条件.故选A.
答案:A 
9.甲、乙两同学在高考前各做5次立定跳远测试,测得甲的成绩如下(单位:米):2.20,2.30,2.30,2.40,2.30.若甲、乙两人的平均成绩相同,乙的成绩的方差是0.005,那么甲、乙两人成绩较稳定的是________.
解析:求得甲的平均成绩为2.3,方差是0.004.由已知得甲、乙平均成绩相同,但甲的成绩的方差比乙的小,∴甲的成绩较稳定.
答案:甲 
10.一组数据按从小到大的顺序排列为10,12,13,x,17,19,21,24,其中位数为16,则x=________.
解析:由中位数的意义知,=16.∴x=15.
答案:15 
11.在一次数学测验中,某学习小组10位同学的得分情况如下表,则该小组成绩的众数是________;平均数是________.
分数 95 90 85 80 75
人数 1 2 4 2 1
解析:因为分数为85的人数最多,所以众数为85,又=85,所以平均数为85.
答案:85 85 
12.已知一组样本数据x1,x2,…,x10,且x+x+…+x=2 020,平均数=11,则该组数据的标准差为________.
解析:根据题意,该组样本数据x1,x2x,…,x10,且x+x+…+x=2 020,
平均数=11,则其方差s2=[(x1-)2+(x2-)2+…+(x10-)2]=(x+x+…+x-102)=×(2 020-10×112)=81,则其标准差s==9.
答案:9 
13.若一组数据为82,81,79,78,95,88,92,84,则该组数据的75%分位数是________.
解析:将该组数据按由小到大的顺序排列为78,79,81,82,84,88,92,95,又8×75%=6,则该组数据的75%分位数为=90.
答案:90 
14.已知某7个数的平均数为4,方差为2,现加入一个新数据4,此时8个数的平均数为,方差为s2,则·s2=________.
解析:该7个数的平均数为4,方差为2,则这8个数的平均数为=×(7×4+4)=4,方差为s2=×[7×2+(4-4)2]=,则·s2=4×=7.
答案:7 
15.(2023·广东江门鹤山一中高一检测)某果园试种了A,B两个品种的桃树各10棵,并在桃树成熟挂果后统计了这20棵桃树的产量如下表,记A,B两个品种各10棵的产量的平均数分别为和,方差分别为s和s.
A(单位:kg) 60 50 40 60 70 80 80 80 90 90
B(单位:kg) 40 60 60 80 80 50 80 80 70 100
(1)分别求这两个品种产量的极差和中位数;
(2)求,,s,s;
(3)果园要大面积种植这两种桃树中的一种,依据以上计算结果分析选种哪个品种更合适,并说明理由.
解:(1)A品种10棵产量由小到大排列为40,50,60,60,70,80,80,80,90,90,
则A品种产量的极差为50,中位数为75;
B品种10棵产量由小到大排列为40,50,60,60,70,80,80,80,80,100,则B品种产量的极差为60,中位数为75.
(2)=(40+50+60+60+70+80+80+80+90+90)=70,
s=(302+202+2×102+02+3×102+2×202)=260,
=(40+50+60+60+70+80+80+80+80+100)=70,
s=(302+202+2×102+02+4×102+302)=280.
(3)由==70可得A,B两个品种平均产量相等,
又s5.1.3 数据的直观表示
第1课时 柱形图、折线图、扇形图和茎叶图
[新课程标准] [新学法解读]
1.了解统计图表的作用与意义,能根据所给数据和需要作出统计图. 2.能根据统计图提供的信息,解决实际问题. 通过对各种统计图的认识与应用,提升学生的数据分析素养.
笔记  教材
1.柱形图
柱形图(也称为条形图)中,一条轴上显示的是所关注的数据类型,另一条轴上对应的是数量、个数或者比例,柱形图中每一矩形都是等宽的.
2.折线图
一般地,如果数据是随时间变化的,想了解数据的变化情况,可将数据用折线图来表示.当然,折线图也可以用在其他合适的情形中.
3.扇形图
扇形图可以形象地表示出各部分数据在全部数据中所占的比例情况.扇形图中,每一个扇形的圆心角以及弧长,都与这一部分表示的数据大小成正比.
4.茎叶图
一般来说,茎叶图中,所有的茎都竖直排列,而叶沿水平方向排列.茎叶图也可以只表示一组数.
将一组数整理成茎叶图后,如果每一行的数都是按从大到小(或从小到大)顺序排列,则从中可以方便地看出这组数的最值、中位数等数字特征.
(1)从茎叶图中还可以看出一组数的分布情况,从而可能得到一些额外的信息.
(2)可以估计出一组数据的平均数所在区间.
(3)还可以估计出两组数据平均数及方差的相对大小.
自我  排查
1.判断正误.(正确的打“√”,错误的打“?”)
(1)柱形(条形)图中,每一矩形都是等宽的,小矩形间的距离一般相等.(√)
(2)由柱形图,可以作出折线图.(√)
(3)扇形图与半径大小有关. (?)
提示:扇形图与半径无关.
(4)茎叶图的茎可能是一位数字,也可能是多位数字. (√)
2.如图所示,样本A和B分别取自两个不同的总体,它们的样本平均数分别为A和B,样本标准差分别为sA和sB,则(  )
 
A.A>B,sA>sB     B.AsB
C.A>B,sA解析:因为A中的数据都不大于B中的数据,所以AsB.
答案:B 
3.某校为了了解学生的睡眠情况,随机调查了50名学生,得到他们在某一天各自的睡眠时间的数据,结果如图所示.根据此条形图可得这50名学生这一天平均每人的睡眠时间为________h.
解析:根据条形图得,平均每人的睡眠时间t=5.5×0.1+6×0.3+6.5×0.4+7×0.1+7.5×0.1=6.4(h).
答案:6.4 
4.如图是某中学高二年级举办的演讲比赛上,七位评委为某选手打出的分数的茎叶统计图,去掉一个最高分和一个最低分后,所剩数据的中位数为________.
解析:由茎叶图,去掉最高分93,最低分79,剩余5个数从小到大为84,84,85,86,87,所以所剩数据的中位数为85.
答案:85 
研习 柱形图与折线图
[典例1] (2023·南宁模拟)电动工具已成为人们生产和生活中常备的作业工具.数据显示,全球电动工具零部件市场规模由2016年的58亿美元增长至2020年的72亿美元,复合年均增长率达5.55%,2022年全球电动工具零部件市场规模达到80亿美元.根据下图,下列说法中正确的是(  )
A.2016~2022年全球电动工具零部件市场规模逐步减少
B.2016~2022年全球电动工具零部件市场规模增长速度逐年增长
C.2021年全球电动工具零部件市场规模大于2020年全球电动工具零部件市场规模
D.2018~2019年全球电动工具零部件市场规模增速的差值最大
解析:对于A,2016~2022年全球电动工具零部件市场规模逐步增大,A错误;对于B,2016~2020年全球电动工具零部件市场规模增长速度逐年减小,B错误;对于C,2021年全球电动工具零部件市场规模为76亿美元,2020年全球电动工具零部件市场规模为72亿美元,则2021年全球电动工具零部件市场规模大于2020年全球电动工具零部件市场规模,C正确;对于D,2017~2018年全球电动工具零部件市场规模增速的差值最大,D错误.故选C.
答案:C 
巧归纳
(1)柱形图中,各小矩形宽相等;
(2)注意横、纵轴的意义;
(3)由柱形图可以作出折线图:取各小矩形上边的中点,再用线段连接,取各小矩形下边的中点并标注上数字,要说明标注数字所对应的数据类型.
[练习1] (1)(多选)下面是某地洪涝灾害后连续11天复工复产指数折线图,下列说法正确的是(  )
A.这11天复工指数和复产指数均逐日增加
B.这11天期间,复产指数增量大于复工指数的增量
C.第3天至第11天复工复产指数均超过80%
D.第9天至第11天复产指数增量大于复工指数的增量
(2)(2023·抚州模拟)随着工业自动化和计算机技术的发展,中国机器人进入大量生产和实际应用阶段,如图为2022年中国服务机器人各行业渗透率调查情况.根据该图,下列结论错误的是(  )
A.物流仓储业是目前服务行业中服务机器人已应用占比最高的行业
B.教育业目前在大力筹备应用服务机器人
C.未计划使用服务机器人占比最高的是政务服务业
D.图中八大服务业中服务机器人已应用占比的中位数是33.3%
(1)解析:由题图可知,第1天到第2天复工指数减少,第7天到第8天复工指数减少,第10天到第11天复工指数减少,第8天到第9天复产指数减少,故A错误;由题图可知,第1天的复产指数与复工指数的差大于第11天的复产指数与复工指数的差,所以这11天期间,复产指数增量小于复工指数的增量,故B错误;由题图可知,第3天至第11天复工复产指数均超过80%,故C正确;由题图可知,第9天至第11天复产指数增量大于复工指数的增量,故D正确.
答案:CD 
(2)解析:对于A,由图易知,物流仓储业在目前服务行业中服务机器人已应用占比最高,A正确;对于B,由图易知,教育业在目前服务行业中服务机器人筹备中占比最高,B正确;对于C,由图易知,政务服务业在目前服务行业中服务机器人未计划占比最高,C正确;对于D,由图易知,八大服务业中服务机器人已应用占比已按由大到小的顺序排列,故中位数是×(33.3%+27.3%)=30.3%,D错误.故选D.
答案:D 
研习 扇形图
[典例2] 某企业三个分厂生产同一种电子产品,三个分厂的产量分布如图所示,现在用分层随机抽样方法从三个分厂生产的产品中共抽取100件进行使用寿命的测试,则第一分厂应抽取的件数为________;第一、二、三分厂取出的产品的平均使用寿命分别为1 020小时,980小时,1 030小时,估计这个企业生产的产品的平均使用寿命为________小时.
解析:由分层随机抽样可知,第一分厂应抽取100×50%=50(件),该产品的平均使用寿命为=1 015(小时).
答案:50 1 015 
巧归纳
在扇形图中,部分数据在全部数据中的比例等于对应扇形的圆心角度数与360°之比,等于对应扇形的弧长与周长之比,也等于对应扇形面积与圆面积之比. 
[练习2] 某高中为了解学生课外知识的积累情况,随机抽取200名同学参加课外知识测试,测试共5道题,每答对一题得20分,答错得0分.已知每名同学至少能答对2道题,得分不少于60分记为及格,不少于80分记为优秀,测试成绩百分比分布图如图所示,现有下列四个结论:
①该次课外知识测试及格率为92%
②该次课外知识测试得满分的同学有30名;
③该次测试成绩的中位数大于测试成绩的平均数;
④若该校共有3 000名学生,则课外知识测试成绩能得优秀的同学大约有1 440名.
其中所有正确结论的序号是________.
解析:由题图可知,及格率=1-8%=92%,故①正确;该次课外知识测试满分同学的百分比=1-8%-32%-48%=12%,又12%×200=24(名),故②错误;中位数为80分,平均数=40×8%+60×32%+80×48%+100×12%=72.8(分),故③正确;3 000×(48%+12%)=1 800,故④错误.
答案:①③ 
研习 茎叶图
[典例3] 某中学高二(2)班甲、乙两名学生自进入高中以来,每次数学考试成绩情况如下:
甲:95,81,75,91,86,89,71,65,76,88,94,110,107;
乙:83,86,93,99,88,103,98,114,98,79,78,106,101.
画出两人数学成绩的茎叶图,并根据茎叶图对两人的成绩进行比较.
解:甲、乙两人数学成绩的茎叶图如下图所示.
从这个茎叶图上可以看出,乙同学的得分情况是大致对称的,叶主要集中在8,9,10的茎上;甲同学的得分情况也是大致对称,叶主要集中在7,8,9的茎上.由此得出乙同学的成绩总体情况比甲同学好.
巧归纳
茎叶图的画法步骤
(1)将每个数据分为茎(高位)和叶(低位)两部分.
(2)将最小的茎和最大的茎之间的数按从小到大的顺序从上到下列出,茎相同者共用一个茎,再画上竖线作为分界线.
(3)将各个数据的叶写在其茎右(左)侧. 
[练习3] (1)从甲、乙两个城市分别随机抽取16台自动售货机,对其销售额进行统计,统计数据用茎叶图表示(如图所示),设甲、乙两组数据的平均数分别为甲,乙,中位数分别为m甲,m乙,则 (  )
A.甲<乙,m甲>m乙 B.甲<乙,m甲C.甲>乙,m甲>m乙 D.甲>乙,m甲(2)(多选)国家为了实现经济“双循环”大战略,对东部和西部地区的多个县市的某一类经济指标进行调查, 得出东部,西部两组数据的茎叶图如图所示,则下列结论正确的是(  )
A.西部的平均数为13.3
B.东部的极差小于西部的极差
C.东部的30%分位数是11.6
D.东部的众数比西部的众数小
(1)解析:由茎叶图知,甲的平均数为(5+6+8+10+10+14+18+18+22+25+27+30+30+38+41+43)÷16=21.562 5,乙的平均数为(10+12+18+20+22+23+23+27+31+32+34+34+38+42+43+48)÷16=28.562 5,
所以甲<乙.
甲的中位数为(18+22)÷2=20,乙的中位数为(27+31)÷2=29,所以m甲答案:B 
(2)解析:对于A,(11.2+11.5+12.4+12.5+13.1+13.1+13.6+13.6+13.7+13.9+14.4+14.9+15.0)÷13=13.3,即西部的平均数为13.3,故A正确;对于B,东部的最大值为15.1,最小值为10.8,极差为15.1-10.8=4.3; 西部的最大值为15.0,最小值为11.2,极差为15.0-11.2=3.8<4.3,故B错误;对于C,东部共13个数据,13×30%=3.9,即从小到大的第4个数为东部的30%分位数,所以东部的30%分位数是11.6,故C正确;对于D,东部的众数为11.3,西部的众数为13.1和13.6,均大于11.3,故D正确.故选ACD.
答案:ACD 
1.若某校高一年级8个班参加合唱比赛的得分茎叶图如图所示,则这组数据的中位数和平均数分别是(  )
A.91.5和91.5
B.91.5和92
C.91和91.5
D.92和92
解析:将这组数据从小到大排列,得87,89,90,91,92,93,94,96.
故平均数==91.5,
中位数为=91.5,故选A.
答案:A 
2.为了普及环保知识,增强环保意识,某大学随机抽取30名学生参加环保知识测试,得分(十分制)如图所示,假设得分值的中位数为me,众数为m0,平均数为,则(  )
A.me=m0= B.me=m0<
C.me<m0< D.m0解析:将30个数从小到大排列,其中第15个数是5,第16个数是6,故中位数me==5.5,众数m0=5,平均数=×(3×2+4×3+5×10+6×6+7×3+8×2+9×2+10×2)=,所以m0答案:D 
3.(多选)2021年1月18日,国家统计局公布了2020年度居民人均消费支出的情况,并绘制了饼图,已知2020年度和2019年度居民在“其他用品及服务”中人均消费支出大约分别为462元和524元,现结合2019年度居民人均消费支出情况,下列结论中正确的是(  )
A.2020年度居民在“食品烟酒”项目的人均消费支出所占总额的百分率比2019年度的高
B.2019 年度居民人均消费支出约为21 833元
C.2019 年度和2020年度居民在“生活用品及服务”项目上的人均消费支出相等
D.2020年度居民人均消费支出比2019年度居民人均消费支出有所降低
解析:2020年度居民在“食品烟酒”项目的人均消费支出所占总额的百分率为30.2%,2019 年度居民在“食品烟酒”项目的人均消费支出所占总额的百分率为28.2%<30.2%,即A选项正确; 2019 年度居民人均消费支出约为≈21 833(元),即B选项正确; 2019 年度居民在“生活用品及服务”项目上的消费约为×5.9%≈1 288(元),2020年度居民在“生活用品及服务”项目上的消费约为×5.9%=1 239≠1 288(元),即C选项错误; 2020年度居民人均消费支出为=21 000(元),结合B项知,D选项正确.故选ABD.
答案:ABD 
4.某超市对6个时间段内使用A, B两种移动支付方式的次数用茎叶图作了统计,如图所示,使用支付方式A的次数的极差为________;若使用支付方式B的次数的中位数为17,则m=________.
解析:由茎叶图可知,使用支付方式A的次数的极差为25-2=23;∵使用支付方式B的次数的中位数为17,易知m≤9,∴=17,解得m=8.
答案:23 8 
5.汽车的“燃油效率”是指汽车每消耗1升汽油行驶的里程,下图描述了甲、乙、丙三辆汽车在不同速度下的燃油效率情况.下列叙述正确的是________.
①消耗1升汽油,乙车最多可行驶5千米;
②以相同速度行驶相同路程,三辆车中,甲车消耗汽油最多;
③甲车以80千米/小时的速度行驶1小时,消耗10升汽油;
④某城市机动车最高限速80千米/小时,相同条件下,在该市用丙车比用乙车更省油.
解析:对于①,由图象可知,当速度大于40 km/h时,乙车的燃油效率大于5 km/L,∴当速度大于40 km/h时,消耗1升汽油,乙车的行驶距离大于5 km,故①错误;对于②,由图象可知,当速度相同时,甲车的燃油效率最高,即当速度相同时,消耗1升汽油,甲车的行驶路程最远,∴以相同速度行驶相同路程,三辆车中,甲车消耗汽油最少,故②错误;对于③,由图象可知,当速度为80 km/h时,甲车的燃油效率为10 km/L,即甲车行驶10 km时,耗油1升,故行驶1小时,路程为80 km,燃油为8升,故③错误;对于④,由图象可知,当速度小于80 km/h时,丙车的燃油效率大于乙车的燃油效率,∴用丙车比用乙车更省油,故④正确.
答案:④ 
第2课时 频数分布直方图与频率分布直方图
[新课程标准] [新学法解读]
1.了解频数与频率的关系. 2.会列频数、频率分布表,会画频数分布直方图、频率分布直方图及其折线图. 3.能利用有关直方图估计数据的数字特征. 通过对样本的频数、频率分布直方图及其频率折线图的学习,提升学生的数据分析、逻辑推理素养.
笔记  教材
1.频数与频率
(1)频数:在一组数据中,数据出现的次数称为频数,某个区间内的数据的个数称为区间对应的频数.
(2)频率:在一组数据中,数据的频数与这组数据总个数的比称为频率,区间对应的频数与这组数据总个数的比称为区间对应的频率.
2.频数、频率分布直方图及其折线图
自我  排查
1.判断正误.(正确的打“√”,错误的打“?”)
(1)在频率分布直方图中,=样本容量.(√)
(2)在频数或频率分布折线图中,折线图与横轴的左右两个交点没有实际意义.(√)
(3)频率分布直方图图中矩形的高是这一组的频率.(?)
2.频率分布直方图中,小长方形的面积等于 (  )
A.组距 B.频率
C.组数 D.频数
解析:根据小长方形的宽及高的意义,可知小长方形的面积为一组样本数据的频率.
答案:B 
3.如图所示的是一容量为100的样本的频率分布直方图,则由图中数据可知,样本落在[15,20]内的频数为(  )
A.20 B.30
C.40 D.50
解析:样本数据落在[15,20]内的频数为100×[1-5×(0.04+0.1)]=30.
答案:B 
4.为了解学生课外阅读的情况,随机统计了n名学生的课外阅读时间,所得数据都在[50,150]内,其频率分布直方图如图所示.已知在[50,75)内的频数为100,则n的值是   (  )
A.500 B.1 000
C.10 000 D.25 000
解析:由图可得,在[50,75)内的频率为0.004×25=0.1,所以n==1 000,故选B.
答案:B 
5.某校为了解高二学生寒假期间学习情况,抽查了500名同学,统计他们每天的平均学习时间,绘成频率分布直方图(如图).则这500名同学中学习时间在6至10小时之间的人数为________.
解析:由直方图知,(0.04 +0.12+0.14+x+0.05)×2=1,所以x=0.15,∴这500名同学中学习时间在6至10小时之间的人数为500×2×(0.14+0.15)= 290.
答案:290 
研习 频数与频率
[典例1] 将容量为100的样本数据分为8个组,如下表:
组号 1 2 3 4 5 6 7 8
频数 10 13 x 14 15 13 12 9
则第3组的频率为(  )
A.0.03 B.0.07
C.0.14 D.0.21
解析:由题意得,x=100-(10+13+14+15+13+12+9)=14,所以第3组的频率为=0.14.
答案:C 
巧归纳
对于频数与频率的问题,首先要明确几个关系,即各组的频数之和等于样本容量,各组的频率之和为1,频率=.在解题过程中,要明确频数、频率以及样本容量之间的关系,弄清楚已知和所求,选择合适的公式解题. 
[练习1] 一个频数分布表(样本容量为30)不小心被损坏了一部分,若样本中数据在[20,60)内的频率为0.8,则估计样本在[40,50),[50,60)内的数据个数共为 (  )
A.15 B.16
C.17 D.19
解析:由题意得样本在[40,50),[50,60)内的数据个数共为30×0.8-4-5=15.
答案:A 
研习 频数、频率分布直方图及其绘制
[典例2] 为了了解一大片经济林的生长情况,人们随机测量其中的100株树木的底部周长(单位:cm),得到如下数据:
135 98 102 110 99 121 110 96 100 103
125 97 117 113 110 92 102 109 104 112
105 124 87 131 97 102 123 104 104 128
109 123 111 103 105 92 114 108 104 102
129 126 97 100 115 111 106 117 104 109
111 89 110 121 80 120 121 104 108 118
129 99 90 99 121 123 107 111 91 100
99 101 116 97 102 108 101 95 107 101
102 108 117 99 118 106 119 97 126 108
123 119 98 121 101 113 102 103 104 108
绘制频率分布直方图、频率分布折线图.
解:从数据中可以看出,这组数据的最大值为135,最小值为80,故极差为55,可将其分为11组,组距为5.列表如下:
分组 频数 频率
[80,85) 1 0.01
[85,90) 2 0.02
[90,95) 4 0.04
[95,100) 14 0.14
[100,105) 24 0.24
[105,110) 15 0.15
[110,115) 12 0.12
[115,120) 9 0.09
[120,125) 11 0.11
[125,130) 6 0.06
[130,135] 2 0.02
合计 100 1.00
画频率分布直方图、频率分布折线图如下图所示.
巧归纳
绘制频率分布直方图的注意点
(1)各组频率的和等于1,因此,各小矩形的面积的和也等于1;
(2)频率分布直方图比频率分布表更直观、形象地反映了样本的分布规律;
(3)在xOy坐标平面内画频率分布直方图时,x=样本数据,y=,这样每一组的频率可以用该组的组距为底、为高的小矩形的面积来表示.其中,矩形的高==×频数;
(4)同样一组数据,如果组距不同,横轴、纵轴单位不同,得到的频率分布直方图的形状也会不同;
(5)同一个总体,由于抽样的随机性,如果随机抽取另外一个容量为100的样本,所形成的样本频率分布直方图一般会与前一个样本频率分布直方图有所不同,但它们都可以近似地看作总体的分布. 
[练习2] 美国历届总统中,就任时年龄最小的是罗斯福,他于1901年就任,当时年仅42岁;就任时年龄最大的是特朗普,他于2016年就任,当时70岁.下面按时间顺序(从1789年的华盛顿到2016年的特朗普,共45任)给出了历届美国总统就任时的年龄:
57,61,57,57,58,57,61,54,68,
51,49,64,50,48,65,52,56,46,
54,49,51,47,55,55,54,42,51,
56,55,51,54,51,60,62,43,55,
56,61,52,69,64,46,54,47,70.
(1)将数据进行适当的分组,并画出相应的频率分布直方图和频率分布折线图;
(2)用自己的语言描述一下历届美国总统就任时年龄的分布情况.
解:(1)以4为组距,列频率分布表如下:
分组 频数 频率
[42,46) 2 0.044 4
[46,50) 7 0.155 5
[50,54) 8 0.177 8
[54,58) 16 0.355 6
[58,62) 5 0.111 1
[62,66) 4 0.088 9
[66,70] 3 0.066 7
合计 45 1.000 0
画出相应的频率分布直方图和频率分布折线图,
(2)从频率分布表中可以看出,将近60%的美国总统就任时的年龄在50岁至60岁之间,45岁及45岁以下和65岁以上就任的总统所占的比例相对较小.
研习 频率分布直方图在样本中的应用
[典例3] 某中学举行电脑知识竞赛,现将高一两个班参赛学生的成绩进行整理后分成5组,绘制成如图所示的频率分布直方图.已知图中从左到右的第一、第二、第三、第四、第五小组的频率分别是0.30,0.40,0.15,0.10,x,第五组小矩形高度为y.
(1)求x,y的值;
(2)估计参赛学生成绩的众数和中位数;
(3)估计参赛学生的平均成绩;
(4)若第5组频数为2,求高一两个班参赛学生的人数.
解:(1)∵0.30+0.40+0.15+0.10+x=1,
∴x=0.05.y==0.005.
(2)由于第二组频率最大,估计众数为第二组中间值65.设中位数为z,则0.03×10+(z-60)×0.04=0.5,解得z=65.
(3)估计参赛学生的平均成绩为
55×0.3+65×0.4+75×0.15+85×0.1+95×0.05=67.
(4)设高一两个班参赛学生的人数为n,则2=0.05n,
∴n=40,即高一两个班参赛人数为40人.
巧归纳
频率分布直方图在样本中的应用
(1)求参数、样本容量、在某个区间内的频数;
(2)估计样本数据的众数、中位数(百分位数)、平均数、方差、标准差等.
众数估计值为频率最大组的中点(横坐标),中位数的两侧面积相等(p%分位数使左边面积等于p%),平均数在频率分布表中等于组中值与对应的频率之积的和,方差=i(i-)2(其中n为组数,为估计平均值,pi,i分别为第i组的频率和中点值). 
[练习3] (1)(多选)某学校为了调查高二年级学生周末阅读时间情况,随机选取了100名学生,绘制了如图所示频率分布直方图,则(  )
A.众数的估计值为35
B.中位数的估计值为35
C.平均数的估计值为29.2
D.样本中有25名同学阅读时间不低于40分钟
(2)从高三年级中抽出50名学生参加数学竞赛,由成绩得到如图的频率分布直方图.由于一些数据丢失,利用频率分布直方图估计:
①这50名学生成绩的众数与中位数;
②这50名学生的平均成绩.
(1)解析:由频率分布直方图知,[30,40]的频率最大,因此众数的估计值为35,A正确;由于[0,30]的频率为0.1+0.18+0.22=0.5,因此中位数是30,B错误;平均数的估计值为5×0.1+15×0.18+25×0.22+35×0.25+45×0.2+55×0.05=29.2,C正确;不低于40分钟的人数为100×(0.2+0.05)=25,D正确.故选ACD.
答案:ACD 
(2)解:①由众数的概念可知,众数是出现次数最多的数.在直方图中高度最高的小长方形的底边中点的横坐标即为所求,所以众数估计值为75.
由于中位数是所有数据的中间值,故在频率分布直方图中体现的是中位数的左右两边频数应相等,即频率也相等,从而使中位数左右两边的小矩形的面积和相等,
因为0.004×10+0.006×10+0.02×10=0.04+0.06+0.2=0.3,
所以前三个小矩形面积的和为0.3.而第四个小矩形面积为0.03×10=0.3,0.3+0.3>0.5,
所以中位数应位于第四个小矩形内.
设其底边为x,高为0.03,所以令0.03x=0.2,得x≈6.7,故中位数应约为70+6.7=76.7.
②平均成绩为45×(0.004×10)+55×(0.006×10)+65×(0.02×10)+75×(0.03×10)+85×(0.021×10)+95×(0.016×10)=73.65.
1.若容量为20的样本数据,分组后的频数如下表:
分组 [10,20) [20,30) [30,40) [40,50) [50,60) [60,70]
频数 2 3 4 5 4 2
则样本数据落在区间[10,40)内的频率为(  )
A.0.35 B.0.45
C.0.55 D.0.65
解析:由表得样本数据落在区间[10,40)内的频率为=0.45.
答案:B 
2.200辆汽车经过某一雷达地区,时速的频率分布直方图如图所示,则时速超过60 km/h的汽车数量为(  )
A.65辆 B.76辆
C.88辆 D.95辆
解析:由频率分布直方图可得,数据落在(60,80)内的频率是(0.028+0.010)×10=0.38,故时速超过60 km/h的汽车数量为200×0.38=76(辆).
答案:B 
3.(2020·天津卷)从一批零件中抽取80个,测量其直径(单位:mm),将所得数据分为9组:[5.31,5.33),[5.33,5.35),…,[5.45,5.47),[5.47,5.49],并整理得到如下频率分布直方图,则在被抽取的零件中,直径落在区间[5.43,5.47)内的个数为(  )
A.10 B.18
C.20 D.36
解析:根据频率分布直方图,直径落在区间[5.43,5.47)之间的零件频率为(6.25+5.00)×0.02=0.225,则落在区间[5.43,5.47)内的零件个数为80×0.225=18.故选B.
答案:B 
4.为了调查某厂工人生产某种产品的能力,随机抽查了20位工人某天生产该产品的数量,得到频率分布直方图如图,则这20名工人中一天生产该产品数量的中位数为________.
解析:设中位数为x,则0.2+(x-55)×0.04=0.5,解得x=62.5.
答案:62.5 
5.已知一个容量是40的样本,把它分成六组,第一组到第四组的频数分别是5,6,7,10,第五组的频率是0.2,求第六组的频数和频率.
解:频数=频率×样本容量,因为第五组的频率是0.2,样本容量是40,所以频数是0.2×40=8,所以第六组的频数是40-(5+6+7+10+8)=4,频率是=0.1.
课时作业(十六) 数据的直观表示
1.某城市为了解游客人数的变化规律,提高旅游服务质量,收集并整理了2015年1月至2017年12月期间月接待游客量(单位:万人)的数据,绘制了下面的折线图.
根据该折线图,下列结论错误的是(  )
A.年接待游客量逐年增加
B.各年的月接待游客量高峰期在8月
C.2015年1月至12月月接待游客量的中位数为30万人
D.各年1月至6月的月接待游客量相对于7月至12月,波动性更小,变化比较平稳
解析:A:通过折线图可知,年接待游客量逐年增加,所以本选项结论正确;B:通过折线图可知,各年的月接待游客量高峰期在8月,所以本选项结论正确;C:2015年1月至12月月接待游客量在1月、2月、3月、4月、5月、6月、11月、12月都不超过30万人,因此2015年1月至12月月接待游客量的中位数不超过30万人,所以本选项结论错误;D:根据折线图可知,各年1月至6月的月接待游客量相对于7月至12月,波动性更小,变化比较平稳,所以本选项说法正确.故选C.
答案:C 
2.某地区经过一年的新农村建设,农村的经济收入增加了一倍,实现翻番.为更好地了解该地区农村的经济收入变化情况,统计了该地区新农村建设前后农村的经济收入构成比例,得到如下扇形统计图:
则下面结论中不正确的是(  )
A.新农村建设后,种植收入略有增加
B.新农村建设后,其他收入增加了一倍以上
C.新农村建设后,养殖收入不变
D.新农村建设后,种植收入在经济收入中所占比重大幅下降
解析:因为该地区经过一年的新农村建设,农村的经济收入增加了一倍,不妨设建设前的经济收入为m,则建设后的经济收入为2m.A选项,从扇形统计图中可以看到新农村建设后,种植收入比建设前增加2m×37%-m×60%=m×14%,故A正确;B选项,新农村建设后,其他收入比建设前增加2m×5%-m×4%=m×6%>m×4%,即增加了一倍以上,故B正确;C选项,养殖收入的比重在新农村建设前与建设后相同,但建设后总收入为建设前的2倍,所以建设后的养殖收入也是建设前的2倍,故C错误;D选项,新农村建设后,种植收入在经济收入中所占比重由建设前的60%降为37%,故D正确.故选C.
答案:C 
3.新高考采用“3+1+2”模式,普通高中学生在高一面临选择物理还是历史问题.重庆市A,B,C三所重点高中人数及选择物理的情况分布如图(1)和图(2)所示.为了解三所学校学生选课原因,市教科院决定采用分层抽样的方法抽取总人数20%的学生进行调研,则C学校抽取的学生人数为(  )
A.10 B.20
C.30 D.40
解析:三所学校的总人数为350+450+200=1 000(人),若采用分层抽样的方法抽取总人数的20%的学生,则为1 000×20%=200(人),所以C学校抽取200×=40(人).故选D.
答案:D 
4.对甲、乙两名高中生一年内每次数学考试成绩进行统计,得到如下的茎叶图,则下列判断正确的是(  )
A.甲数学成绩的众数为98,乙数学成绩的众数为109
B.甲数学成绩的平均数大于乙数学成绩的平均数
C.甲数学成绩中位数是105,乙数学成绩的中位数是95
D.甲数学成绩的方差与乙数学成绩的方差相等
解析:由茎叶图可知,甲数学成绩的众数为98,105,故A错误;甲数学成绩的平均数为==104.7,乙数学成绩的平均数为==100.1,故B正确;甲数学成绩的中位数为105,乙数学成绩的中位数为=101,故C错误;甲数学成绩主要集中在90至100与110与120之间,乙数学成绩主要集中在90至100之间,甲的成绩更分散,所以甲数学成绩的方差大于乙数学成绩的方差,故D错误.故选B.
答案:B 
5.某校100名学生的数学测试成绩的频率分布直方图如图所示,(共44张PPT)
综合微评(二)
时间:120分钟 满分:150分
2门世2有
3厚

展开更多......

收起↑

资源列表