高中数学人教B版必修第二册 5.1.2 数据的数字特征(2课时打包)(课件+学案)

资源下载
  1. 二一教育资源

高中数学人教B版必修第二册 5.1.2 数据的数字特征(2课时打包)(课件+学案)

资源简介

(共74张PPT)
第1课时
最值、平均数、中位数、百分位数、众数
第五章 5.1.2 数据的数字特征
<<<
1.理解数据的最值、平均数、中位数、百分位数、众数的意义和作用.
2.会计算数据的这些数字特征,并能解决有关实际问题.
学习目标
某酒店打出的招聘宣传语是“本酒店待遇丰厚,平均工资是每周800元”,小强入职后工作了一段时间,发现上当了,前去质问经理:“您宣传工资一周是800元是欺诈行为,我问过其他员工了,没有一个人每周的工资超过800元.”而经理说:“我当时说的是平均周工资800元,我的周工资是
3 000元,3名副经理的周工资都是1 000元,5名领班的周工资是700元,
10名服务员的周工资是600元,1名清洁工的周工资是500元.”小强一听,
哭笑不得.你能从数学的角度解释这种现象吗?
导 语
一、最值与平均数
二、中位数与众数
课时对点练
三、百分位数
随堂演练
内容索引
最值与平均数

提示 ==91.5;最高分是96;最低分是87.
若某校高一年级8个班参加合唱比赛的得分分别为89,91,90,92,87,93,96,94,则平均数是多少?最高分是多少?最低分是多少?
问题1
1.一组数据的最值指的是其中的最大值与最小值,最值反映的是这组数
的情况.一般地,最大值用 表示,最小值用 表示.
2.平均数
(1)如果给定的一组数是x1,x2,…,xn,则这组数的平均数为=
_______________,简记为=xi.
最极端
max
min
(x1+x2+…+xn)
(2)求和符号∑具有以下性质:
①t= .
(3)性质:一般地,如果x1,x2,…,xn的平均数为,且a,b为常数,则ax1+b,ax2+b,…,axn+b的平均数为 .
nt
a+b
(1)求平均数时要注意数据的个数,不要重计或漏计.
(2)数据同时增加或减少相同的数,平均数也随之增加或减少相同的数.
注 意 点
<<<
  (1)求一组数据:68,69,71,63,70,68,69,71,69,72的最值、平均数.
例 1
把所给数据从小到大排列为63,68,68,69,69,69,70,71,71,72,
则最大值为72,最小值为63.平均数为
=69.

(2)某学习小组在一次数学测验中,得100分的有1人,得95分的有1人,得90分的有2人,得85分的有4人,得80分和75分的各1人,则该小组数学成绩的平均数为
A.85 B.86 C.87 D.88
平均数为
=87.
解析

求平均数的方法
(1)用定义式;
(2)用平均数的性质;
(3)在容量为n的一组数据中,若数据x1有n1个,x2有n2个,…,xk有nk个,且n=n1+n2+…+nk,则这组数据的平均数为(n1x1+n2x2+…+nkxk)=x1+x2+…+xk.




 (1)设一组数据x1,x2,…,xn的平均数为1,则数据3x1+1,3x2+1,…,3xn+1的平均数为
A.1 B.3
C.4 D.9
跟踪训练 1

记数据x1,x2,…,xn的平均数为,
数据ax1+b,ax2+b,…,axn+b的平均数为',
则'=
=
==a+b,
故数据3x1+1,3x2+1,…,3xn+1的平均数为3+1=3×1+1=4.
解析
(2)已知样本数据x1,x2,…,x10,其中x1,x2,x3的平均数为a;x4,x5,…,x10的平均数为b,则样本数据的平均数为
A. B.
C. D.

∵x1,x2,x3的平均数为a,∴x1,x2,x3的和为3a.
∵x4,x5,…,x10的平均数为b,∴x4,x5,…,x10的和为7b.
∴样本数据的和为3a+7b,
∴样本数据的平均数为.
解析

中位数与众数
提示 87,89,90,91,92,92,96; 91;92.
若某校高二年级7个班参加合唱比赛的得分分别为89,91,90,92,87,92,96,你能把数据从小到大排列吗?正中间的数据是多少?出现次数最多的数据是多少?
问题2
1.中位数
如果一组数有奇数个数,且按照从小到大排列后为x1,x2,…,x2n+1,则称 为这组数的中位数;如果一组数有偶数个数,且按照从小到大
排列后为x1,x2,…,x2n,则称_________为这组数的中位数.
2.众数
一组数据中,某个数据出现的次数称为这个数据的频数,出现次数_____
的数据称为这组数据的众数,一组数据的众数可以是 ,也可以是 .
xn+1
最多
一个
多个
(1)求中位数时一定要先对数据按从小到大排序,若最中间有两个数据,则中位数是这两个数据的平均数.中位数不一定是数据中的数.
(2)若有两个或两个以上的数据出现得最多,且出现的次数都一样,则这些数据都叫众数;若一组数据中每个数据出现的次数都一样多,则没有众数.
注 意 点
<<<
“杂交水稻之父”袁隆平培育的超级杂交水稻在全世界推广种植.某种植户为了考察所种植的杂交水稻苗的长势,从稻田中随机抽取7株水稻苗,测得苗高(单位:cm)分别是23,24,23,25,26,23,25.则这组数据的众数和中位数分别是
A.24,25 B.23,23
C.23,24 D.24,24
例 2

苗高由小到大排列为23,23,23,24,25,25,26,所以这组数据的众数和中位数分别是23,24.
解析
(1)众数、中位数的计算方法
计算众数、中位数时,可先将这组数据按从小到大或从大到小的顺序排列,再根据各自的定义计算.
(2)众数、中位数、平均数的意义
①样本的众数、中位数和平均数常用来表示样本数据的“中心值”,其中众数和中位数容易计算,不受少数几个极端值的影响,但只能表达样本数据中的少量信息,平均数代表了样本数据中更多的信息,但受样本中每个数据的影响,越极端的数据对平均数的影响也越大.




②当一组数据中有不少数据重复出现时,其众数往往更能反映问题,当一组数据中个别数据较大时,可用中位数描述其集中趋势.




 某小区广场上有甲、乙两群市民正在进行晨练,两群市民的年龄如下(单位:岁):
甲群 13,13,14,15,15,15,15,16,17,17;
乙群 54,3,4,4,5,5,6,6,6,57.
(1)甲群市民年龄的平均数、中位数和众数各是多少岁?其中哪个统计量能较好地反映甲群市民的年龄特征?
跟踪训练2
甲群市民年龄的平均数为
=15(岁),
中位数为15岁,众数为15岁.平均数、中位数和众数相等,因此它们都能较好地反映甲群市民的年龄特征.

(2)乙群市民年龄的平均数、中位数和众数各是多少岁?其中哪个统计量能较好地反映乙群市民的年龄特征?
乙群市民年龄的平均数为
=15(岁),
中位数为5.5岁,众数为6岁.
由于乙群市民大多数是儿童,所以中位数和众数能较好地反映乙群市民的年龄特征,而平均数的可靠性较差.

百分位数

提示 87,89,90,91,92,93,94,96;8×25%=2.
某校高一年级8个班参加合唱比赛的得分分别为89,91,90,92,87,93,96,94,你能把数据从小到大排列吗?这组数据个数的25%是多少?
问题3
1.百分位数
一组数的p%分位数指的是,将这组数按照从小到大的顺序排列后,处于
位置的数.
2.如何确定p%分位数
设一组数按照从小到大排列后为x1,x2,…,xn,计算i=np%的值,如果i不是整数,设i0为大于i的 ,取为p%分位数;如果i是整数,取为p%分位数.
p%
最小整数
3.规定:0分位数是x1(即最小值),100%分位数是 (即最大值).
4.一般地,一组数的p%(p∈(0,100))分位数指的是满足下列条件的一个数值:至少有 的数据不大于该值,且至少有 的数据不小于该值.
xn
p%
(100-p)%
(1)中位数相当于是50%分位数.除了中位数外,常用的分位数还有25%分位数,75%分位数.25%分位数也称为第一四分位数,75%分位数也称为第三四分位数.
(2)百分位数可能不唯一,也可能不是数据中的数.
注 意 点
<<<
(课本例1)根据表中数据,计算甲、乙两组数的75%分位数.
例 3
序号 1 2 3 4 5 6 7 8 9 10
甲组 1 2 2 2 2 3 3 3 5 5
乙组 0 0 0 0 1 1 2 3 4 5
序号 11 12 13 14 15 16 17 18 19 20
甲组 6 6 8 8 9 10 10 12 13 13
乙组 6 6 7 7 10 14 14 14 14 15
因为数据个数为20,而且20×75%=15,
所以甲组数的75%分位数为=9.5;
乙组数的75%分位数为=12.

确定数据:1,2,2,2,2,3,3,3,5,5,6,6,8,8,9,10,10,12,13,13的中位数,78%分位数.
例 3
因为所给数据已从小到大排列,共20个,
而且i1=20×50%=10为整数,
i2=20×78%=15.6不为整数,
所以这组数据的中位数为==5.5,78%分位数为x16=10.

(1)百分位数是用于衡量数据的位置的度量,但它所衡量的不一定是中心位置.百分位数提供了有关数据项如何在最小值与最大值之间分布的信息.
(2)中位数、百分位数都不一定是数据中的数.




从某公司生产的产品中,任意抽取12件,得到它们的质量(单位:kg)如下:
7.9,9.0,8.9,8.6,8.4,8.5,8.5,8.5,9.9,7.8,8.3,8.0,
分别求出这组数据的25%,75%,95%分位数.
跟踪训练3
将所有数据从小到大排列,得
7.8,7.9,8.0,8.3,8.4,8.5,8.5,8.5,8.6,8.9,9.0,9.9,
因为共有12个数据,
所以12×25%=3,12×75%=9,12×95%=11.4,
则25%分位数是=8.15,
75%分位数是=8.75,
95%分位数是第12个数据为9.9.

1.知识清单:
(1)数据的最值、平均数、中位数、百分位数、众数.
(2)数据的数字特征的计算方法.
(3)数据的数字特征的应用.
2.方法归纳:数据分析.
3.常见误区:利用平均数、中位数、百分位数、众数对数据的分析不准确.
随堂演练

1
2
3
4
1.2024年某高一学生下学期政治考试成绩为
79 79 84 84 86 84 87 90 90 97
则该生政治考试成绩的平均数和众数依次为
A.85 84 B.84 85 C.86 84 D.84 86
由题意可知,平均数
==86,
众数为84.
解析

1
2
3
4
2.某地铁运行过程中,10个车站上车的人数统计如下:70,60,60,50,60,40,40,30,30,10,则这组数据的众数与中位数之和为
A.120 B.105 C.110 D.100
这组数据的众数是60.将数据从大到小排成一列为70,60,60,60,50,40,40,30,30,10,则中位数为=45,所以众数与中位数之和为60+45=105.
解析

1
2
3
4
3.计算(2i+1)等于
A.6 B.9
C.10 D.15
(2i+1)=(2×1+1)+(2×2+1)+(2×3+1)=3+5+7=15.
解析

1
2
3
4
4.某歌手电视大奖赛中,七位评委对某选手打出如下分数:7.9,8.1,8.4,8.5,8.5,8.7,9.9,则其50%分位数为  .
∵7×50%=3.5,
∴其50%分位数是第4个数据为8.5.
解析
课时对点练

对一对
答案
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
题号 1 2 3 4 5 6 7 8
答案 C B B C C D 3 a+b
题号 11 12 13 14 15   答案 A ABC 96 115.5 A
9.
答案
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
平均数=×(2×6+3×16+4×15+5×13)==3.7.
众数是3,中位数是4.
10.
答案
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
(1)由题意得甲厂数据的平均数为==8,众数为6,中位数为=8;
乙厂数据的平均数为==8.5,众数为7,中位数为=8;
丙厂数据的平均数为==8.5,众数为8,中位数为=8.5.
10.
答案
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
(2)甲厂利用了平均数或中位数;乙厂利用了平均数或中位数;丙厂利用了平均数或众数或中位数.
(3)选丙厂的节能灯.因为无论从哪种统计量来看,与其他两个厂家相比,丙厂水平都比较高或持平.
基础巩固
1.从某中学抽取10名同学,得到他们的数学成绩(单位:分)如下:82,85,88,90,92,92,92,96,96,98,则可得这10名同学数学成绩的中位数为
A.88 B.90 C.92 D.96
答案
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
本题中所给数据已按照从小到大的顺序排列,中间两个数据的平均数是(92+92)÷2=92.故中位数是92.
解析

2.已知一组数据从小到大排列为-1,0,4,x,6,15,且这组数据的中位数是5,那么这组数据的众数为
A.5 B.6
C.4 D.5.5
答案
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
由题意得(4+x)=5,得x=6.故众数为6.
解析

3. 若数据x1,x2,…,xn的平均数为a,数据y1=2+x1,y2=2+x2,…,yn=2+xn,则数据y1,y2,…,yn的平均数为
A.a B.2+a
C.2 D.2a
答案
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
由题意得数据yi=2+xi,i=1,2…,n,
数据x1,x2,…,xn的平均数为a,由平均数的性质可知数据y1,y2,…,yn的平均数为2+a.
解析

4.有13名同学参加百米竞赛,预赛成绩各不相同,要取前6名参加决赛,小明同学已经知道了自己的成绩,为了判断自己是否能进入决赛,他还需要知道13名同学成绩的
A.平均数 B.众数
C.中位数 D.百分位数
答案
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
把13名同学成绩按由大到小排列,取成绩靠前的6个成绩进入决赛,即最中间一个数之前的6个成绩进入决赛,13个成绩按由大到小排列时,最中间一个数即是中位数.
解析

5.从某学校高二年级随机抽取10名学生进行数学能力测试,测试成绩为68,81,79,81,90,86,74,84,69,78,设学生测试成绩的平均数、中位数、众数分别为a,b,c,则
A.a=bC.a答案
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15

答案
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
将数据从小到大排序为68,69,74,78,79,81,81,84,86,90,
平均数a==79,
根据数据从小到大排列,第5个数为79,第6个数为81,所以中位数b==80,
根据数据可知,众数c=81,所以a解析
6.将10个数据按照从小到大的顺序进行排列,第四个数据被墨水污染,2,4,5,□,10,14,15,39,41,50,已知40%分位数是8.5,则第四个数据是
A.5 B.7.5
C.8 D.7
答案
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15

答案
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
设第四个数据为x,因为一共有10个数据,10×40%=4,为整数,根据百分位数的定义可得=8.5,解得x=7.
解析
7.已知一组数据1,2,3,3,5,1,6,8,这组数据的60%分位数是 .
将这组数据由小到大排序为1,1,2,3,3,5,6,8,共8个数,
因为8×60%=4.8,因此,这组数据的60%分位数是3.
解析
答案
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
3
8.是x1,x2,…,x100的平均数,a是x1,x2,…,x40的平均数,b是x41,x42,…,x100的平均数,则=    (用含a,b的式子表示).
因为a是x1,x2,…,x40的平均数,
所以x1+x2+…+x40=40a,
同理x41+x42+…+x100=60b,
则有==a+b.
解析
答案
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
a+b
9.为了了解市民的环保意识,某校高一(1)班50名学生在6月5日(世界环境日)这一天调查了各自家庭丢弃旧塑料袋的情况,有关数据如表所示:
答案
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
每天丢弃旧塑料袋个数 2 3 4 5
户数 6 16 15 13
求这50户居民每天丢弃旧塑料袋数量的平均数、众数和中位数.
平均数=×(2×6+3×16+4×15+5×13)==3.7.
众数是3,中位数是4.

10.甲、乙、丙三个家电厂家在广告中都声称,他们的某品牌节能灯在正确使用的情况下,使用寿命都不低于8年.后来质量检测部门对他们的产品进行抽样调查,抽样调查的甲、乙、丙各8个产品使用寿命的统计结果如下(单位:年):
甲厂:6,6,6,8,8,9,9,12;
乙厂:6,7,7,7,9,10,10,12;
丙厂:6,8,8,8,9,9,10,10.
(1)分别求出以上三组数据的平均数、众数、中位数;
答案
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
答案
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
由题意得甲厂数据的平均数为==8,众数为6,中位数为=8;
乙厂数据的平均数为==8.5,众数为7,中位数为
=8;
丙厂数据的平均数为==8.5,众数为8,中位数为
=8.5.

(2)估计这三个厂家的推销广告分别利用了哪一种统计量;
答案
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
甲厂利用了平均数或中位数;乙厂利用了平均数或中位数;丙厂利用了平均数或众数或中位数.

(3)如果你是顾客,应该选哪个厂家的节能灯?为什么?
答案
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
选丙厂的节能灯.因为无论从哪种统计量来看,与其他两个厂家相比,丙厂水平都比较高或持平.

11.已知2a,a2,|a|,2a+2的中位数为-,则a等于
A.-3 B.-2
C.-1 D.1
综合运用
答案
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15

答案
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
∵2a,a2,|a|,2a+2共四个数,
中位数为-<0,a2≥0,|a|≥0,
∴∴a<-1,
∴2a<2a+2<|a|∴==-,解得a=-3.
解析
12.(多选)某学校准备组织部分同学去研学旅行,为了便于识别,他们准备定做一批容量一致的双肩包,为此,活动负责人征求了参加的同学的意向,得到了如下数据:
答案
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
容量/L 22 25 28 31 34 37
频数 4 1 5 21 2 2
对于表中数据,下列说法正确的是
A.众数为31 B.第一四分位数为28
C.平均数大于28 D.中位数为30



答案
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
对于A,31的频数最大,因此众数为31,A正确;
对于B,由(4+1+5+21+2+2)×25%=8.75,得第一四分位数为从小到大排列的第9个数,为28,B正确;
对于C,平均数==>28,C正确;
对于D,共35个数据,中位数为从小到大排列的第18个数,为31,D错误.
解析
13.某校年级组长为了解本校高三学生某次考试的数学成绩(单位:分),随机抽取30名学生的数学成绩,如下所示:
110 144 125 63 89 121 145 123 74 96
97 142 115 68 83 116 139 124 85 98
132 147 128 133 99 117 107 113 96 141
估计该校高三学生此次考试数学成绩的25%分位数为    ,50%分位数为    .
答案
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
96
115.5
答案
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
把这30名学生此次考试的数学成绩按从小到大的顺序排列为63,68,74,83,85,89,96,96,97,98,99,107,110,113,115,116,117,121,123,124,125,128,132,133,139,141,142,144,145,147.因为25%×30=7.5,50%×30=15,所以这30名学生数学成绩的25%分位数为96,50%分位数为=115.5.据此可以估计本校高三学生此次考试数学成绩的25%分位数为96,50%分位数为115.5.
解析
14.一组数据共有50个数,按从小到大排列,其中7个数在中位数和平均数之间,如果这组数据的中位数和平均数都不在这50个数中,且平均数大于中位数,那么这组数据中小于平均数的数据占这50个数据的百分比是    .
答案
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
小于平均数的数有25+7=32(个),占这50个数据的×100%=64%.
解析
15.已知x是1,2,3,x,5,6,7这七个数据的中位数,且1,3,x2,-y这四个数据的平均数为1,那么y-的最小值是
A. B.
C. D.不存在
拓广探究
答案
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15

答案
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
∵x是1,2,3,x,5,6,7这七个数据的中位数,则3≤x≤5.
又∵1,3,x2,-y这四个数据的平均数为1,
∴1+3+x2-y=4,∴x2=y,
∴y-=x2-,
令f(x)=x2-,x∈[3,5],
∴f(x)在[3,5]上单调递增,
∴f(x)的最小值是f(3)=9-=.
解析
第五章 5.1.2 数据的数字特征
<<<(共86张PPT)
第2课时
极差、方差与标准差
第五章 5.1.2 数据的数字特征
<<<
1.理解样本数据的极差、方差、标准差的意义和作用,学会计算数据的极差、方差、标准差.
2.能根据实际问题的需要合理地选取样本,从样本数据中提取基本的数字特征(如平均数、极差、方差、标准差),并做出合理的解释.
学习目标
平均数、中位数和众数为我们提供了一组数据的集中趋势的信息,这是概括一组数据的特征的有效方法.但仅知道集中趋势的信息,很多时候还不能使我们做出有效决策.这节课我们共同来研究总体离散趋势的有关知识.
导 语
一、极值、方差与标准差的计算
二、方差、标准差的性质
课时对点练
三、数据的数字特征的应用
随堂演练
内容索引
极值、方差与标准差的计算

提示 经计算得=×(7+8+7+9+5+4+9+10+7+4)=7,同理可得=7.
有两位射击运动员在一次射击测试中各射靶10次,每次命中的环数如下:
甲:7 8 7 9 5 4 9 10 7 4
乙:9 5 7 8 7 6 8 6  7 7
甲、乙两人本次射击的平均成绩分别为多少环?
问题1
提示 直观上看,还是有差异的.如:甲成绩比较分散,乙成绩相对集中.
观察下图中两人成绩的频率分布条形图,你能说明其水平差异在哪里吗?
问题2
提示 还经常用甲、乙命中环数的极差与平均数一起比较说明数据的分散程度.甲的环数极差为10-4=6,乙的环数极差为9-5=4.它们在一定程度上表明了样本数据的分散程度,与平均数一起,可以给我们许多关于样本数据的信息.显然,极差对极端值非常敏感,注意到这一点,我们可以得到一种“去掉一个最高分,去掉一个最低分”的统计策略.
对于甲、乙两人的射击成绩除了画出频率分布条形图比较外,还有没有其他方法来说明两组数据的分散程度?
问题3
1.极差
一组数的极差指的是这组数的 .
2.方差
如果x1,x2,…,xn的平均数为,则方差可用求和符号表示为
s2=_______________=-.
最大值减去最小值所得的差
(xi-)2
3.标准差
方差的算术平方根称为标准差.标准差描述了数据相对于平均数的离散程度,一般用s表示.
s=.
(1)数据的离散程度可以通过极差、方差或标准差来描述,极差反映了一组数据变化的最大幅度,它对一组数据中的极端值极为敏感,一般情况下,极差大,则数据波动性大;极差小,则数据波动性小.极差只需考虑两个极端值,便于计算,但没有考虑中间的数据,可靠性较差.
注 意 点
<<<
(2)标准差和方差则反映了一组数据围绕平均数波动的大小,方差、标准差的运算量较大.因为方差与原始数据单位不同,且平方后可能夸大了偏差程度,所以虽然标准差与方差在体现数据离散程度上是一样的,但解决问题时一般用标准差.
注 意 点
<<<
 (课本例2)计算下列各组数的平均数与方差:
(1)18.9,19.5,19.5,19.2,19,18.8,19.5;
例 1
将每一个数乘以10,再减去190,可得-1,5,5,2,0,-2,5.
这组新数的平均数为×(-1+5+5+2+0-2+5)=2,
方差为×[(-1-2)2+(5-2)2+(5-2)2+(2-2)2+(0-2)2+(-2-2)2+(5-2)2]=8.
由此可知,所求平均数为19.2,方差为8×=0.08.

(2)2,2,2,3,3,3,3,4,4,4,4,4,5,5,5,5,5,5,6,6.
可将数据整理为

每一个数都减去4可得
这组数的平均数与方差分别为
×[(-2)×3+(-1)×4+0×5+1×6+2×2]=0,
x 2 3 4 5 6
频数 3 4 5 6 2
x-4 -2 -1 0 1 2
频数 3 4 5 6 2

×[(-2)2×3+(-1)2×4+02×5+12×6+22×2]=.
因此,所求平均数为4,方差为.
 甲、乙两机床同时加工直径为100 mm的零件,为检验质量,各从中抽取6件测量,得到如下数据:
甲:99 100 98 100 100 103
乙:99 100 102 99 100 100
分别计算两组数据的平均数及方差.
例 1
=×(99+100+98+100+100+103)=100,
=×(99+100+102+99+100+100)=100.
=×[(99-100)2+(100-100)2+(98-100)2+(100-100)2+(100-100)2+(103-100)2]=,
=×[(99-100)2+(100-100)2+(102-100)2+(99-100)2+(100-100)2+(100-100)2]=1.

求方差的基本方法
(1)先求平均值,再代入公式s2=(xi-)2或s2=-.
(2)当一组数据重复数据较多时,可先整理出频数表,再计算s2.




 某班20位女同学平均分为甲、乙两组,她们的劳动技术课考试成绩如下(单位:分):
甲组:60,90,85,75,65,70,80,90,95,80;
乙组:85,95,75,70,85,80,85,65,90,85.
试分别计算两组数据的极差、方差和标准差.
跟踪训练 1
甲组:最高分为95分,最低分为60分,极差为95-60=35(分),
平均分=×(60+90+85+75+65+70+80+90+95+80)=79(分),
方差=×[(60-79)2+(90-79)2+(85-79)2+(75-79)2+(65-79)2+(70-79)2+
(80-79)2+(90-79)2+(95-79)2+(80-79)2]=119,
标准差s甲==≈10.91.
乙组:最高分为95分,最低分为65分,
极差为95-65=30(分),

平均分=×(85+95+75+70+85+80+85+65+90+85)=81.5(分),
方差=×[(85-81.5)2+(95-81.5)2+(75-81.5)2+(70-81.5)2+(85-81.5)2+
(80-81.5)2+(85-81.5)2+(65-81.5)2+(90-81.5)2+(85-81.5)2]=75.25,
标准差s乙==≈8.67.


方差、标准差的性质
方差、标准差的性质:如果a,b为常数,则ax1+b,ax2+b,…,axn+b的方差为 、标准差为|a|s.
a2s2
(1)方差、标准差的取值范围为[0,+∞).
(2)方差、标准差为0时,样本各数据全相等,表明数据没有波动,数据没有离散性.
注 意 点
<<<
已知样本数据x1,x2,…,x100的平均数和标准差均为4,则数据
-x1-1,-x2-1,…,-x100-1的平均数与方差分别为
A.-5,16 B.-5,4
C.4,16 D.4,4
例 2

设样本数据x1,x2,…,x100的平均数为,方差为s2,则ax1+b,ax2+b,…,ax100+b的平均数为a+b,方差为a2s2,
故数据-x1-1,-x2-2,…,-x100-1的平均数为-4-1=-5,方差为(-1)2×42=16.
解析
若样本数据x1,x2,…,xn的平均数为,方差为s2,则yi=axi+b,i=1,2,…,n的平均数为a+b,方差为a2s2,标准差为|a|s.




 若样本数据x1,x2,…,x10的标准差为8,则数据2x1-1,2x2-1,
…,2x10-1的标准差为
A.8 B.15
C.16 D.32
跟踪训练2

样本数据x1,x2,…,x10的标准差s=8,则样本数据2x1-1,2x2-1,…,2x10-1的标准差s'=2×8=16.
解析
数据的数字特征的应用

为了考察甲、乙两种小麦的长势,分别从甲、乙两种麦苗中各抽10株,测得它们的株高分别为(单位:cm):
甲:25 41 40 37 22 14 19 39 21 42
乙:27 16 44 27 44 16 40 40 16 40
(1)哪种小麦的苗长得高?
例 3
=×(25+41+40+37+22+14+19+39+21+42)=×300=30(cm).
=×(27+16+44+27+44+16+40+40+16+40)=×310=31(cm).
显然<,所以乙种小麦的苗长得高.

(2)哪种小麦的苗长得齐?
=×[(25-30)2+(41-30)2+(40-30)2+(37-30)2+(22-30)2+(14-30)2+(19-30)2+(39-30)2+(21-30)2+(42-30)2]=×(25+121+100+49+64+256+121+81+81+144)
=×1 042=104.2.
=×[(27-31)2+(16-31)2+(44-31)2+(27-31)2+(44-31)2+(16-31)2+(40-31)2+
(40-31)2+(16-31)2+(40-31)2]=×(16+225+169+16+169+225+81+81+225+81)
=×1 288=128.8.
显然<,所以甲种小麦的苗长得齐.

用样本估计总体时,样本的平均数、标准差只是总体的平均数、标准差的近似值,实际应用中,需先分析平均水平,再计算标准差(方差)分析稳定情况.




甲、乙两名运动员参加射击选拔赛,两人在相同条件下各射击100次,组委会从两人的成绩中各随机抽取5次成绩(单位:分,满分10分),如表所示:
跟踪训练3
甲射击成绩 10 7 8 10 10
乙射击成绩 10 6 10 10 9
(1)分别求出甲、乙两名运动员5次射击成绩的平均数与方差;
甲运动员5次射击成绩的平均数为
=×(10+7+8+10+10)=9,
乙运动员5次射击成绩的平均数为
=×(10+6+10+10+9)=9,
甲运动员5次射击成绩的方差为
=×[3×(10-9)2+(7-9)2+(8-9)2]=,
乙运动员5次射击成绩的方差为
=×[3×(10-9)2+(6-9)2+(9-9)2]=.

(2)判断哪位运动员的射击成绩更好?
∵甲、乙两名运动员的平均成绩相同,方差<,
∴甲运动员的射击成绩更稳定,即甲运动员的射击成绩更好.

1.知识清单:
(1)极差、标准差、方差的计算方法.
(2)方差、标准差的性质.
(3)数据的数字特征的应用.
2.方法归纳:数据分析.
3.常见误区:
(1)数据同时增加或减少相同的数,平均数变化,方差不变.
(2)方差、标准差的计算.
(3)在计算方差或标准差时,当数据的重复数据较多时,要先把数据整理为频数表再用公式或性质计算.
随堂演练

1
2
3
4
1.下列说法中正确的是
A.在两组数据中,平均数较大的一组方差较大
B.平均数反映数据的集中趋势,方差则反映数据离平均数的波动大小
C.求出各个数据与平均数的差的平方后再相加,所得的和就是方差
D.众数能反映一组数据的离散程度
由平均数、众数、方差的定义及意义可知选B.
解析

1
2
3
4
2.某同学5天上学途中所花的时间(单位:分钟)分别为12,8,10,9,11,则这组数据的方差为
A.4 B.2 C.9 D.3
由题意可得==10,
由方差公式可得s2=×[(12-10)2+(8-10)2+(10-10)2+(9-10)2+(11-10)2]=2.
解析

1
2
3
4
3.一组数据6,7,8,a,12的平均数为7,则此组数据的极差为  .
由这组数据的平均数为=7,解得a=2,
所以此组数据的极差为12-2=10.
解析
10
1
2
3
4
4.国家射击队要从甲、乙、丙、丁四名队员中选出一名选手去参加射击比赛,四人的平均成绩和方差如表所示:
甲 乙 丙 丁
平均成绩 8.5 8.8 8.8 8
方差s2 3.5 3.5 2.1 8.7
则应派    参赛最为合适.
由表可知,丙的平均成绩较高,且发挥比较稳定,应派丙去参赛最合适.
解析
课时对点练

对一对
答案
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
题号 1 2 3 4 5 6 7 答案 B B C C D B 0.061 5 3.154 7 题号 8 11 12 13 14 15
答案 70 50 A ABC 1.6 AB
9.
答案
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
(1)甲的平均数为= (68+69+71+72+74+78+83+85)÷8=75,中位数为(72+74)÷2=73,
乙的平均数为=(65+70+70+73+75+80+82+85)÷8=75,中位数为(73+75)÷2=74.
9.
答案
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
(2)甲的方差为=[(68-75)2+(69-75)2+(71-75)2+ (72-75)2+(74-75)2+(78-75)2+(83-75)2+(85-75)2]÷8=35.5,
乙的方差为=[(65-75)2+(70-75)2+(70-75)2+(73-75)2+(75-75)2+(80-75)2+(82-75)2+(85-75)2] ÷8=41,
∵<,
∴甲成绩更稳定,派甲参加比较合适.
10.
答案
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
(1)由题意可得,A组数据的众数为47,将B组数据按从小到大排列为36,42,46,47,49,55,58,62,66,68,70,73,故B组数据的中位数为=56.5.
10.
答案
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
(2)A,B两组数据的平均数分别为
=×(42+42+44+45+46+47+47+47+49+50+50+55)==47,
=×(36+42+46+47+49+55+58+62+66+68+70+73)==56.
A,B两组数据的方差分别为
=×[(42-47)2+(42-47)2+…+(55-47)2]=×(25+25+9+4+1+4+9+9+
64)=12.5,
10.
答案
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
=×[(36-56)2+(42-56)2+…+(73-56)2]=×(400+196+100+81+49+
1+4+36+100+144+196+289)=133.
因为<,<,所以A组成员对同一选手打分的相似程度高,由于专业人士给分更符合专业规则,所以对同一选手打分的相似程度应该高,因此小组A更像是由专业人士组成的.
基础巩固
1.某演讲比赛8位参赛选手的最终得分分别为92,88,95,93,91,97,94,96,其中位数和极差分别为
A.92,8 B.93.5,9
C.93,9 D.93.5,8
答案
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
把这八个数据从小到大排列为88,91,92,93,94,95,96,97,
中位数为=93.5,
极差为97-88=9.
解析

2.已知数据:2,4,4,6,6,6,8,8,8,8,则这10个数的标准差为
A.1 B.2
C.3 D.4
答案
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
这10个数的平均数=×(2+4×2+6×3+8×4)=6,
方差s2=[(2-6)2+(4-6)2×2+(6-6)2×3+(8-6)2×4]=4,
则标准差为2.
解析

3.若一组数据a,3,5,7的平均数是b,且a,b是方程x2-5x+4=0的两根,则这组数据的方差是
A.3 B.4
C.5 D.6
答案
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
x2-5x+4=0的两根是1,4.当a=1时,a,3,5,7的平均数是4;当a=4时,a,3,5,7的平均数不是1.所以a=1,b=4,则方差为s2=×[(1-4)2+(3-4)2+
(5-4)2+(7-4)2]=5.
解析

4.某创业公司共有36名职工,为了了解该公司职工的年龄构成情况,随机采访了9位代表,得到的数据分别为36,36,37,37,40,43,43,44,44,若用样本估计总体,年龄在(-s,+s)内的人数占公司人数的百分比是(其中是平均数,s为标准差,结果精确到1%)
A.14% B.25%
C.56% D.67%
答案
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15

答案
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
因为==40,s2=×(16+16+9+9+0+9+9+16+16)=,即s=.
年龄在(-s,+s)内,即内的人数有5人,所以百分比为≈
56%.
解析
5.有两位射击运动员在一次射击测试中各射靶7次,每次命中的环数如下:
甲:7 8 10 9 8 8 6
乙:9 10 7 8 7 7 8
则下列判断正确的是
A.甲射击的平均成绩比乙好
B.甲射击的成绩的众数小于乙射击的成绩的众数
C.乙射击的平均成绩比甲好
D.甲射击的成绩的极差大于乙射击的成绩的极差
答案
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15

答案
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
甲命中的环数的平均数为
=×(7+8+10+9+8+8+6)=8,
乙命中的环数的平均数为
=×(9+10+7+8+7+7+8)=8,
所以甲、乙射击的平均成绩相等,故A,C均错误;
甲射击的成绩的众数是8,乙射击的成绩的众数是7,所以甲射击的成绩的众数大于乙射击的成绩的众数,故B错误;
解析
答案
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
甲射击的成绩的极差为10-6=4,乙射击的成绩的极差为10-7=3,所以甲射击的成绩的极差大于乙射击的成绩的极差,故D正确.
解析
6.在2024年巴黎奥运会上,中国跳水队表现卓越,成功包揽了全部8枚跳水金牌,这一成绩不仅创造了历史,也再次证明了“梦之队”的实力.跳水比赛计分规则如下:针对运动员每次跳水,共有7个裁判评分,去掉一个最高分与一个最低分,剩下的分数相加后乘以难度分,即可得出最终得分.下列说法正确的是
A.去掉一个最高分与一个最低分前后,两组数据的中位数一定改变
B.去掉一个最高分与一个最低分前后,两组数据的方差可能不变
C.去掉一个最高分与一个最低分前后,两组数据的平均数一定不变
D.去掉一个最高分与一个最低分前后,两组数据的众数一定不变
答案
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15

答案
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
若7个裁判的评分分别为10,10,9.9,9.9,9.9,9.8,9.7,中位数为9.9,平均数为=×(10+10+9.9+9.9+9.9+9.8+9.7)≈9.89,
去掉一个最高分与一个最低分后评分为10,9.9,9.9,9.9,9.8,中位数为9.9,平均数为'=×(10+9.9+9.9+9.9+9.8)=9.9,即去掉一个最高分和一个最低分前后中位数不变,平均数可能改变,故A,C错误;
若7个裁判的评分分别为10,10,10,9.9,9.9,9.9,9.8,众数为10和9.9,去掉一个最高分与一个最低分后评分为10,10,9.9,9.9,9.9,众数为9.9,即去掉一个最高分和一个最低分前后众数可能改变,故D错误;
解析
答案
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
若7个裁判的评分为10,10,10,10,10,10,10,则去掉一个最高分和一个最低分前后平均数都为10,方差都为0,即两组数据方差可能不变,故B正确.
解析
7.新莽铜嘉量是由新莽时期刘歆等人设计制造的量器标准器,它包括了龠、合、升、斗、斛这五个容量单位.每一个量又有详细的分铭,可测量各器的径、深、底面积和容积.现根据铭文计算,当时制造容器时所用的圆周率分别为3.154 7,3.199 2,3.149 8,3.203 1,比《周髀算经》的“径一而周三”前进了一大步,则上面4个数据与祖冲之给出的约率3.142 9、密率3.141 6这6个数据的极差为     ,60%分位数为
    .
答案
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
0.061 5
3.154 7
根据题意,所给的6个数据从小到大排列依次为3.141 6,3.142 9,3.149 8,3.154 7,3.199 2,3.203 1,
所以这6个数据的极差为3.203 1-3.141 6=0.061 5,
因为6×60%=3.6,所以60%分位数为3.154 7.
解析
答案
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
8.某班有48名学生,在一次考试中统计出平均分数为70,方差为75,后来发现有2名同学的成绩有误,甲实得80分却记为50分,乙实得70分却记为100分,则更正后平均分和方差分别是   ,   .
甲少记30分,乙多记30分,则总分不变,由此平均分不发生变化;原方差s2=++…++502+1002-48×702)=75,更正后方差s'2=++…++802+702-48×702)=++…++502+1002-48×702-1 200)=s2-×1 200=50.
解析
答案
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
70
50
9.为了展示中华汉字的无穷魅力,传递传统文化,提高学习热情,某校开展“中国汉字听写大会”的活动.为响应学校号召,高二9班组建了兴趣班,其中甲、乙两人近期8次成绩所得数据分别为
甲:68,69,71,72,74,78,83,85;
乙:65,70,70,73,75,80,82,85.
(1)求甲、乙两人成绩的平均数和中位数;
答案
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
答案
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
甲的平均数为= (68+69+71+72+74+78+83+85)÷8=75,中位数为(72+74)÷2=73,
乙的平均数为=(65+70+70+73+75+80+82+85)÷8=75,中位数为(73+75)÷2=74.

(2)现要从甲、乙两人中选派一人参加比赛,从统计学的角度你认为派哪位学生参加比较合适?
答案
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
答案
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
甲的方差为=[(68-75)2+(69-75)2+(71-75)2+ (72-75)2+(74-75)2+(78-75)2
+(83-75)2+(85-75)2]÷8=35.5,
乙的方差为=[(65-75)2+(70-75)2+(70-75)2+(73-75)2+(75-75)2+(80-75)2
+(82-75)2+(85-75)2] ÷8=41,
∵<,
∴甲成绩更稳定,派甲参加比较合适.

10.在一个文艺比赛中,12名专业人士和12名观众代表各组成一个评判小组,给参赛选手打分.如下是两个评判组对同一选手打分的情况.
A:49,50,47,50,47,47,46,55,45,44,42,42
B:42,49,47,46,58,62,68,66,55,73,70,36
(1)求A组数据的众数和B组数据的中位数;
答案
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
答案
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
由题意可得,A组数据的众数为47,将B组数据按从小到大排列为36,42,46,47,49,55,58,62,66,68,70,73,故B组数据的中位数为=56.5.

(2)对每一组计算用于衡量相似性的数值,回答:小组A与小组B哪一个更像是由专业人士组成的?并说明理由.
答案
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
答案
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
A,B两组数据的平均数分别为
=×(42+42+44+45+46+47+47+47+49+50+50+55)==47,
=×(36+42+46+47+49+55+58+62+66+68+70+73)==56.
A,B两组数据的方差分别为
=×[(42-47)2+(42-47)2+…+(55-47)2]=×(25+25+9+4+1+4+9+9+64)
=12.5,

答案
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
=×[(36-56)2+(42-56)2+…+(73-56)2]=×(400+196+100+81+49+1+
4+36+100+144+196+289)=133.
因为<,<,所以A组成员对同一选手打分的相似程度高,由于专业人士给分更符合专业规则,所以对同一选手打分的相似程度应该高,因此小组A更像是由专业人士组成的.

11.某人5次上班途中所花的时间(单位:分钟)分别为x,y,10,11,9,
(x,y∈N),已知这组数据的平均数为10,方差为2,则|x-y|的值为
A.4 B.3
C.2 D.1
综合运用
答案
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15

由这组数据的平均数为10,方差为2可得x+y=20,(x-10)2+(y-10)2=8,设x=10+t,y=10-t,由(x-10)2+(y-10)2=8得t2=4,所以|x-y|=2|t|=4.
解析
12.(多选)已知一组数据x1,x2,…,xn的极差为m,平均数为a,方差为b,另外一组数据ax1+b,ax2+b,…,axn+b的极差为9,平均数为11,方差为13,则
A.am=9 B.a2+b=11
C.a2b+b=13 D.|a2-b|=
答案
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15


答案
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
假设x1最小,xn最大,则xn-x1=m,
若a<0,则另外一组数据axn+b最小,ax1+b最大,
此时极差为(ax1+b)-(axn+b)=a(x1-xn)=-am=9,A错误;
易得所以|a2-b|==,B,D正确,C错误.
解析
13.(多选)甲、乙两班举行电脑汉字录入比赛,参加学生每分钟录入汉字的个数经统计计算后填入下表:
答案
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
班级 参加人数 中位数 方差 平均数
甲 55 149 191 135
乙 55 151 110 135
答案
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
下列结论中,正确的是
A.甲、乙两班学生成绩的平均水平相同
B.乙班优秀的人数多于甲班优秀的人数(每分钟输入汉字数≥150个为优秀)
C.甲班的成绩比乙班的成绩波动大
D.甲班成绩的众数小于乙班成绩的众数



答案
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
甲、乙两班成绩的平均数都是135,故两班成绩的平均水平相同,所以A正确;
=191>110=,所以甲班成绩不如乙班稳定,即甲班成绩波动较大,所以C正确;
甲、乙两班人数相同,但甲班成绩的中位数为149,乙班成绩的中位数为151,从而易知乙班每分钟输入汉字数≥150个的人数要多于甲班,所以B正确;
由题表看不出两班学生成绩的众数,所以D错误.
解析
14.A工厂年前加紧手套生产,设该工厂连续5天生产的手套数(单位:万只)依次为x1,x2,x3,x4,x5,若这组数据的方差为1.44,且,,,,的平均数为4,则该工厂这5天平均每天生产手套    万只.
答案
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
答案
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
依题意得++++=20,
设x1,x2,x3,x4,x5的平均数为,
根据方差的计算公式有
[(x1-)2+(x2-)2+(x3-)2+(x4-)2+(x5-)2]=1.44,
∴(++++)-2(x1+x2+x3+x4+x5)+5=7.2,
即20-10+5=7.2,又>0,∴=1.6.
解析
15.(多选)安徽师范大学在建校96周年之际,为回馈师生,学校安排专业人员驾船于校内花津湖中打捞“花津鱼”,为师生们筹备了一场为期三天的春日鱼宴.为调查该活动中同学们的参与情况,调查部门认为该活动大部分同学参与的标志为“连续调查10次,每次未参与的人数不超过7”.在过去的10次调查中,甲、乙、丙、丁四个调查小组调查的未参与人数的信息如下,一定符合该活动大部分同学参与的标志的是
A.甲组:中位数为2,极差为5
B.乙组:总体平均数为2,总体方差为3
C.丙组:总体平均数为1,总体方差大于0
D.丁组:总体平均数为2,众数为2
拓广探究
答案
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15


答案
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
对于A,设每次未参与的人数最少为x,而中位数为2,故x≤2,
因为极差为5,所以x+5≤7,即每次未参与的人数最多不超过7,故符合情况,故A正确;
对于B,假设有1个数据不小于8,方差为s2,
则s2>×(8-2)2=3.6>3,
故假设不成立,故此时符合情况,故B正确;
对于C,假设数据为1,9,0,0,0,0,0,0,0,0,此时总体平均数为1,总体方差大于0,
解析
答案
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
但不满足每次未参与的人数不超过7,故C错误;
对于D,假设数据为8,2,2,2,2,2,2,0,0,0,满足总体平均数为2,众数为2,
但不满足每次未参与的人数不超过7,故D错误.
解析
第五章 5.1.2 数据的数字特征
<<<第2课时 极差、方差与标准差
学习目标 1.理解样本数据的极差、方差、标准差的意义和作用,学会计算数据的极差、方差、标准差.2.能根据实际问题的需要合理地选取样本,从样本数据中提取基本的数字特征(如平均数、极差、方差、标准差),并做出合理的解释.
导语
平均数、中位数和众数为我们提供了一组数据的集中趋势的信息,这是概括一组数据的特征的有效方法.但仅知道集中趋势的信息,很多时候还不能使我们做出有效决策.这节课我们共同来研究总体离散趋势的有关知识.
一、极值、方差与标准差的计算
问题1 有两位射击运动员在一次射击测试中各射靶10次,每次命中的环数如下:
甲:7 8 7 9 5 4 9 10 7 4
乙:9 5 7 8 7 6 8 6  7 7
甲、乙两人本次射击的平均成绩分别为多少环?
提示 经计算得=×(7+8+7+9+5+4+9+10+7+4)=7,同理可得=7.
问题2 观察下图中两人成绩的频率分布条形图,你能说明其水平差异在哪里吗?
提示 直观上看,还是有差异的.如:甲成绩比较分散,乙成绩相对集中.
问题3 对于甲、乙两人的射击成绩除了画出频率分布条形图比较外,还有没有其他方法来说明两组数据的分散程度?
提示 还经常用甲、乙命中环数的极差与平均数一起比较说明数据的分散程度.甲的环数极差为10-4=6,乙的环数极差为9-5=4.它们在一定程度上表明了样本数据的分散程度,与平均数一起,可以给我们许多关于样本数据的信息.显然,极差对极端值非常敏感,注意到这一点,我们可以得到一种“去掉一个最高分,去掉一个最低分”的统计策略.
知识梳理
1.极差
一组数的极差指的是这组数的最大值减去最小值所得的差.
2.方差
如果x1,x2,…,xn的平均数为,则方差可用求和符号表示为
s2=(xi-)2=-.
3.标准差
方差的算术平方根称为标准差.标准差描述了数据相对于平均数的离散程度,一般用s表示.
s=.
注意点:
(1)数据的离散程度可以通过极差、方差或标准差来描述,极差反映了一组数据变化的最大幅度,它对一组数据中的极端值极为敏感,一般情况下,极差大,则数据波动性大;极差小,则数据波动性小.极差只需考虑两个极端值,便于计算,但没有考虑中间的数据,可靠性较差.
(2)标准差和方差则反映了一组数据围绕平均数波动的大小,方差、标准差的运算量较大.因为方差与原始数据单位不同,且平方后可能夸大了偏差程度,所以虽然标准差与方差在体现数据离散程度上是一样的,但解决问题时一般用标准差.
例1 (课本例2)计算下列各组数的平均数与方差:
(1)18.9,19.5,19.5,19.2,19,18.8,19.5;
(2)2,2,2,3,3,3,3,4,4,4,4,4,5,5,5,5,5,5,6,6.
解 (1)将每一个数乘以10,再减去190,可得-1,5,5,2,0,-2,5.
这组新数的平均数为×(-1+5+5+2+0-2+5)=2,
方差为×[(-1-2)2+(5-2)2+(5-2)2+(2-2)2+(0-2)2+(-2-2)2+(5-2)2]=8.
由此可知,所求平均数为19.2,方差为8×=0.08.
(2)可将数据整理为
x 2 3 4 5 6
频数 3 4 5 6 2
每一个数都减去4可得
x-4 -2 -1 0 1 2
频数 3 4 5 6 2
这组数的平均数与方差分别为
×[(-2)×3+(-1)×4+0×5+1×6+2×2]=0,
×[(-2)2×3+(-1)2×4+02×5+12×6+22×2]=.
因此,所求平均数为4,方差为.
例1 甲、乙两机床同时加工直径为100 mm的零件,为检验质量,各从中抽取6件测量,得到如下数据:
甲:99 100 98 100 100 103
乙:99 100 102 99 100 100
分别计算两组数据的平均数及方差.
解 =×(99+100+98+100+100+103)=100,
=×(99+100+102+99+100+100)=100.
=×[(99-100)2+(100-100)2+(98-100)2+(100-100)2+(100-100)2+(103-100)2]=,
=×[(99-100)2+(100-100)2+(102-100)2+(99-100)2+(100-100)2+(100-100)2]=1.
反思感悟 求方差的基本方法
(1)先求平均值,再代入公式s2=(xi-)2或s2=-.
(2)当一组数据重复数据较多时,可先整理出频数表,再计算s2.
跟踪训练1 某班20位女同学平均分为甲、乙两组,她们的劳动技术课考试成绩如下(单位:分):
甲组:60,90,85,75,65,70,80,90,95,80;
乙组:85,95,75,70,85,80,85,65,90,85.
试分别计算两组数据的极差、方差和标准差.
解 甲组:最高分为95分,最低分为60分,极差为95-60=35(分),
平均分=×(60+90+85+75+65+70+80+90+95+80)=79(分),
方差=×[(60-79)2+(90-79)2+(85-79)2+(75-79)2+(65-79)2+(70-79)2+(80-79)2+(90-79)2+(95-79)2+(80-79)2]=119,
标准差s甲==≈10.91.
乙组:最高分为95分,最低分为65分,
极差为95-65=30(分),
平均分=×(85+95+75+70+85+80+85+65+90+85)=81.5(分),
方差=×[(85-81.5)2+(95-81.5)2+(75-81.5)2+(70-81.5)2+(85-81.5)2+(80-81.5)2+(85-81.5)2+(65-81.5)2+(90-81.5)2+(85-81.5)2]=75.25,
标准差s乙==≈8.67.
二、方差、标准差的性质
方差、标准差的性质:如果a,b为常数,则ax1+b,ax2+b,…,axn+b的方差为a2s2、标准差为|a|s.
注意点:
(1)方差、标准差的取值范围为[0,+∞).
(2)方差、标准差为0时,样本各数据全相等,表明数据没有波动,数据没有离散性.
例2 已知样本数据x1,x2,…,x100的平均数和标准差均为4,则数据-x1-1,-x2-1,…,-x100-1的平均数与方差分别为(  )
A.-5,16 B.-5,4
C.4,16 D.4,4
答案 A
解析 设样本数据x1,x2,…,x100的平均数为,方差为s2,则ax1+b,ax2+b,…,ax100+b的平均数为a+b,方差为a2s2,
故数据-x1-1,-x2-2,…,-x100-1的平均数为-4-1=-5,方差为(-1)2×42=16.
反思感悟 若样本数据x1,x2,…,xn的平均数为,方差为s2,则yi=axi+b,i=1,2,…,n的平均数为a+b,方差为a2s2,标准差为|a|s.
跟踪训练2 若样本数据x1,x2,…,x10的标准差为8,则数据2x1-1,2x2-1,…,2x10-1的标准差为(  )
A.8 B.15 C.16 D.32
答案 C
解析 样本数据x1,x2,…,x10的标准差s=8,则样本数据2x1-1,2x2-1,…,2x10-1的标准差s'=2×8=16.
三、数据的数字特征的应用
例3 为了考察甲、乙两种小麦的长势,分别从甲、乙两种麦苗中各抽10株,测得它们的株高分别为(单位:cm):
甲:25 41 40 37 22 14 19 39 21 42
乙:27 16 44 27 44 16 40 40 16 40
(1)哪种小麦的苗长得高?
(2)哪种小麦的苗长得齐?
解 (1)=×(25+41+40+37+22+14+19+39+21+42)=×300=30(cm).
=×(27+16+44+27+44+16+40+40+16+40)=×310=31(cm).
显然<,所以乙种小麦的苗长得高.
(2)=×[(25-30)2+(41-30)2+(40-30)2+(37-30)2+(22-30)2+(14-30)2+(19-30)2+(39-30)2+(21-30)2+(42-30)2]=×(25+121+100+49+64+256+121+81+81+144)
=×1 042=104.2.
=×[(27-31)2+(16-31)2+(44-31)2+(27-31)2+(44-31)2+(16-31)2+(40-31)2+(40-31)2+(16-31)2+(40-31)2]=×(16+225+169+16+169+225+81+81+225+81)
=×1 288=128.8.
显然<,所以甲种小麦的苗长得齐.
反思感悟 用样本估计总体时,样本的平均数、标准差只是总体的平均数、标准差的近似值,实际应用中,需先分析平均水平,再计算标准差(方差)分析稳定情况.
跟踪训练3 甲、乙两名运动员参加射击选拔赛,两人在相同条件下各射击100次,组委会从两人的成绩中各随机抽取5次成绩(单位:分,满分10分),如表所示:
甲射击成绩 10 7 8 10 10
乙射击成绩 10 6 10 10 9
(1)分别求出甲、乙两名运动员5次射击成绩的平均数与方差;
(2)判断哪位运动员的射击成绩更好?
解 (1)甲运动员5次射击成绩的平均数为
=×(10+7+8+10+10)=9,
乙运动员5次射击成绩的平均数为
=×(10+6+10+10+9)=9,
甲运动员5次射击成绩的方差为
=×[3×(10-9)2+(7-9)2+(8-9)2]=,
乙运动员5次射击成绩的方差为
=×[3×(10-9)2+(6-9)2+(9-9)2]=.
(2)∵甲、乙两名运动员的平均成绩相同,方差<,
∴甲运动员的射击成绩更稳定,即甲运动员的射击成绩更好.
1.知识清单:
(1)极差、标准差、方差的计算方法.
(2)方差、标准差的性质.
(3)数据的数字特征的应用.
2.方法归纳:数据分析.
3.常见误区:
(1)数据同时增加或减少相同的数,平均数变化,方差不变.
(2)方差、标准差的计算.
(3)在计算方差或标准差时,当数据的重复数据较多时,要先把数据整理为频数表再用公式或性质计算.
1.下列说法中正确的是(  )
A.在两组数据中,平均数较大的一组方差较大
B.平均数反映数据的集中趋势,方差则反映数据离平均数的波动大小
C.求出各个数据与平均数的差的平方后再相加,所得的和就是方差
D.众数能反映一组数据的离散程度
答案 B
解析 由平均数、众数、方差的定义及意义可知选B.
2.某同学5天上学途中所花的时间(单位:分钟)分别为12,8,10,9,11,则这组数据的方差为(  )
A.4 B.2 C.9 D.3
答案 B
解析 由题意可得==10,
由方差公式可得s2=×[(12-10)2+(8-10)2+(10-10)2+(9-10)2+(11-10)2]=2.
3.一组数据6,7,8,a,12的平均数为7,则此组数据的极差为    .
答案 10
解析 由这组数据的平均数为=7,解得a=2,
所以此组数据的极差为12-2=10.
4.国家射击队要从甲、乙、丙、丁四名队员中选出一名选手去参加射击比赛,四人的平均成绩和方差如表所示:
甲 乙 丙 丁
平均成绩 8.5 8.8 8.8 8
方差s2 3.5 3.5 2.1 8.7
则应派    参赛最为合适.
答案 丙
解析 由表可知,丙的平均成绩较高,且发挥比较稳定,应派丙去参赛最合适.
课时对点练
[分值:90分]
单选题每小题5分,共35分;多选题每小题6分,共18分
1.某演讲比赛8位参赛选手的最终得分分别为92,88,95,93,91,97,94,96,其中位数和极差分别为(  )
A.92,8 B.93.5,9
C.93,9 D.93.5,8
答案 B
解析 把这八个数据从小到大排列为88,91,92,93,94,95,96,97,
中位数为=93.5,
极差为97-88=9.
2.已知数据:2,4,4,6,6,6,8,8,8,8,则这10个数的标准差为(  )
A.1 B.2 C.3 D.4
答案 B
解析 这10个数的平均数=×(2+4×2+6×3+8×4)=6,
方差s2=[(2-6)2+(4-6)2×2+(6-6)2×3+(8-6)2×4]=4,
则标准差为2.
3.若一组数据a,3,5,7的平均数是b,且a,b是方程x2-5x+4=0的两根,则这组数据的方差是(  )
A.3 B.4 C.5 D.6
答案 C
解析 x2-5x+4=0的两根是1,4.当a=1时,a,3,5,7的平均数是4;当a=4时,a,3,5,7的平均数不是1.所以a=1,b=4,则方差为s2=×[(1-4)2+(3-4)2+(5-4)2+(7-4)2]=5.
4.某创业公司共有36名职工,为了了解该公司职工的年龄构成情况,随机采访了9位代表,得到的数据分别为36,36,37,37,40,43,43,44,44,若用样本估计总体,年龄在(-s,+s)内的人数占公司人数的百分比是(其中是平均数,s为标准差,结果精确到1%)(  )
A.14% B.25% C.56% D.67%
答案 C
解析 因为=
=40,s2=×(16+16+9+9+0+9+9+16+16)=,即s=.
年龄在(-s,+s)内,即内的人数有5人,所以百分比为≈56%.
5.有两位射击运动员在一次射击测试中各射靶7次,每次命中的环数如下:
甲:7 8 10 9 8 8 6
乙:9 10 7 8 7 7 8
则下列判断正确的是(  )
A.甲射击的平均成绩比乙好
B.甲射击的成绩的众数小于乙射击的成绩的众数
C.乙射击的平均成绩比甲好
D.甲射击的成绩的极差大于乙射击的成绩的极差
答案 D
解析 甲命中的环数的平均数为
=×(7+8+10+9+8+8+6)=8,
乙命中的环数的平均数为
=×(9+10+7+8+7+7+8)=8,
所以甲、乙射击的平均成绩相等,故A,C均错误;甲射击的成绩的众数是8,乙射击的成绩的众数是7,所以甲射击的成绩的众数大于乙射击的成绩的众数,故B错误;甲射击的成绩的极差为10-6=4,乙射击的成绩的极差为10-7=3,所以甲射击的成绩的极差大于乙射击的成绩的极差,故D正确.
6.在2024年巴黎奥运会上,中国跳水队表现卓越,成功包揽了全部8枚跳水金牌,这一成绩不仅创造了历史,也再次证明了“梦之队”的实力.跳水比赛计分规则如下:针对运动员每次跳水,共有7个裁判评分,去掉一个最高分与一个最低分,剩下的分数相加后乘以难度分,即可得出最终得分.下列说法正确的是(  )
A.去掉一个最高分与一个最低分前后,两组数据的中位数一定改变
B.去掉一个最高分与一个最低分前后,两组数据的方差可能不变
C.去掉一个最高分与一个最低分前后,两组数据的平均数一定不变
D.去掉一个最高分与一个最低分前后,两组数据的众数一定不变
答案 B
解析 若7个裁判的评分分别为10,10,9.9,9.9,9.9,9.8,9.7,中位数为9.9,平均数为=×(10+10+9.9+9.9+9.9+9.8+9.7)≈9.89,
去掉一个最高分与一个最低分后评分为10,9.9,9.9,9.9,9.8,中位数为9.9,平均数为'=×(10+9.9+9.9+9.9+9.8)=9.9,即去掉一个最高分和一个最低分前后中位数不变,平均数可能改变,故A,C错误;
若7个裁判的评分分别为10,10,10,9.9,9.9,9.9,9.8,众数为10和9.9,
去掉一个最高分与一个最低分后评分为10,10,9.9,9.9,9.9,众数为9.9,即去掉一个最高分和一个最低分前后众数可能改变,故D错误;
若7个裁判的评分为10,10,10,10,10,10,10,则去掉一个最高分和一个最低分前后平均数都为10,方差都为0,即两组数据方差可能不变,故B正确.
7.(5分)新莽铜嘉量是由新莽时期刘歆等人设计制造的量器标准器,它包括了龠、合、升、斗、斛这五个容量单位.每一个量又有详细的分铭,可测量各器的径、深、底面积和容积.现根据铭文计算,当时制造容器时所用的圆周率分别为3.154 7,3.199 2,3.149 8,3.203 1,比《周髀算经》的“径一而周三”前进了一大步,则上面4个数据与祖冲之给出的约率3.142 9、密率3.141 6这6个数据的极差为   ,60%分位数为   .
答案 0.061 5 3.154 7
解析 根据题意,所给的6个数据从小到大排列依次为3.141 6,3.142 9,3.149 8,3.154 7,3.199 2,3.203 1,
所以这6个数据的极差为3.203 1-3.141 6=0.061 5,
因为6×60%=3.6,所以60%分位数为3.154 7.
8.(5分)某班有48名学生,在一次考试中统计出平均分数为70,方差为75,后来发现有2名同学的成绩有误,甲实得80分却记为50分,乙实得70分却记为100分,则更正后平均分和方差分别是   ,   .
答案 70 50
解析 甲少记30分,乙多记30分,则总分不变,由此平均分不发生变化;原方差s2=++…++502+1002-48×702)=75,更正后方差s'2=++…++802+702-48×702)=++…++502+1002-48×702-1 200)=s2-×1 200=50.
9.(10分)为了展示中华汉字的无穷魅力,传递传统文化,提高学习热情,某校开展“中国汉字听写大会”的活动.为响应学校号召,高二9班组建了兴趣班,其中甲、乙两人近期8次成绩所得数据分别为
甲:68,69,71,72,74,78,83,85;
乙:65,70,70,73,75,80,82,85.
(1)求甲、乙两人成绩的平均数和中位数;(4分)
(2)现要从甲、乙两人中选派一人参加比赛,从统计学的角度你认为派哪位学生参加比较合适?(6分)
解 (1)甲的平均数为= (68+69+71+72+74+78+83+85)÷8=75,中位数为(72+74)÷2=73,
乙的平均数为=(65+70+70+73+75+80+82+85)÷8=75,中位数为(73+75)÷2=74.
(2)甲的方差为=[(68-75)2+(69-75)2+(71-75)2+ (72-75)2+(74-75)2+(78-75)2+(83-75)2+(85-75)2]÷8=35.5,
乙的方差为=[(65-75)2+(70-75)2+(70-75)2+(73-75)2+(75-75)2+(80-75)2+(82-75)2+(85-75)2] ÷8=41,
∵<,
∴甲成绩更稳定,派甲参加比较合适.
10.(12分)在一个文艺比赛中,12名专业人士和12名观众代表各组成一个评判小组,给参赛选手打分.如下是两个评判组对同一选手打分的情况.
A:49,50,47,50,47,47,46,55,45,44,42,42
B:42,49,47,46,58,62,68,66,55,73,70,36
(1)求A组数据的众数和B组数据的中位数;(4分)
(2)对每一组计算用于衡量相似性的数值,回答:小组A与小组B哪一个更像是由专业人士组成的?并说明理由.(8分)
解 (1)由题意可得,A组数据的众数为47,将B组数据按从小到大排列为36,42,46,47,49,55,58,62,66,68,70,73,故B组数据的中位数为=56.5.
(2)A,B两组数据的平均数分别为
=×(42+42+44+45+46+47+47+47+49+50+50+55)==47,
=×(36+42+46+47+49+55+58+62+66+68+70+73)==56.
A,B两组数据的方差分别为
=×[(42-47)2+(42-47)2+…+(55-47)2]=×(25+25+9+4+1+4+9+9+64)=12.5,
=×[(36-56)2+(42-56)2+…+(73-56)2]=×(400+196+100+81+49+1+4+36+100+144+196+289)=133.
因为<,<,所以A组成员对同一选手打分的相似程度高,由于专业人士给分更符合专业规则,所以对同一选手打分的相似程度应该高,因此小组A更像是由专业人士组成的.
11.某人5次上班途中所花的时间(单位:分钟)分别为x,y,10,11,9,(x,y∈N),已知这组数据的平均数为10,方差为2,则|x-y|的值为(  )
A.4 B.3 C.2 D.1
答案 A
解析 由这组数据的平均数为10,方差为2可得x+y=20,(x-10)2+(y-10)2=8,设x=10+t,y=10-t,由(x-10)2+(y-10)2=8得t2=4,所以|x-y|=2|t|=4.
12.(多选)已知一组数据x1,x2,…,xn的极差为m,平均数为a,方差为b,另外一组数据ax1+b,ax2+b,…,axn+b的极差为9,平均数为11,方差为13,则(  )
A.am=9 B.a2+b=11
C.a2b+b=13 D.|a2-b|=
答案 BD
解析 假设x1最小,xn最大,则xn-x1=m,
若a<0,则另外一组数据axn+b最小,ax1+b最大,
此时极差为(ax1+b)-(axn+b)=a(x1-xn)=-am=9,A错误;
易得所以|a2-b|==,B,D正确,C错误.
13.(多选)甲、乙两班举行电脑汉字录入比赛,参加学生每分钟录入汉字的个数经统计计算后填入下表:
班级 参加人数 中位数 方差 平均数
甲 55 149 191 135
乙 55 151 110 135
下列结论中,正确的是(  )
A.甲、乙两班学生成绩的平均水平相同
B.乙班优秀的人数多于甲班优秀的人数(每分钟输入汉字数≥150个为优秀)
C.甲班的成绩比乙班的成绩波动大
D.甲班成绩的众数小于乙班成绩的众数
答案 ABC
解析 甲、乙两班成绩的平均数都是135,故两班成绩的平均水平相同,所以A正确;=191>110=,所以甲班成绩不如乙班稳定,即甲班成绩波动较大,所以C正确;甲、乙两班人数相同,但甲班成绩的中位数为149,乙班成绩的中位数为151,从而易知乙班每分钟输入汉字数≥150个的人数要多于甲班,所以B正确;由题表看不出两班学生成绩的众数,所以D错误.
14.(5分)A工厂年前加紧手套生产,设该工厂连续5天生产的手套数(单位:万只)依次为x1,x2,x3,x4,x5,若这组数据的方差为1.44,且,,,,的平均数为4,则该工厂这5天平均每天生产手套    万只.
答案 1.6
解析 依题意得++++=20,
设x1,x2,x3,x4,x5的平均数为,
根据方差的计算公式有
[(x1-)2+(x2-)2+(x3-)2+(x4-)2+(x5-)2]=1.44,
∴(++++)-2(x1+x2+x3+x4+x5)+5=7.2,
即20-10+5=7.2,又>0,∴=1.6.
15.(多选)安徽师范大学在建校96周年之际,为回馈师生,学校安排专业人员驾船于校内花津湖中打捞“花津鱼”,为师生们筹备了一场为期三天的春日鱼宴.为调查该活动中同学们的参与情况,调查部门认为该活动大部分同学参与的标志为“连续调查10次,每次未参与的人数不超过7”.在过去的10次调查中,甲、乙、丙、丁四个调查小组调查的未参与人数的信息如下,一定符合该活动大部分同学参与的标志的是(  )
A.甲组:中位数为2,极差为5
B.乙组:总体平均数为2,总体方差为3
C.丙组:总体平均数为1,总体方差大于0
D.丁组:总体平均数为2,众数为2
答案 AB
解析 对于A,设每次未参与的人数最少为x,而中位数为2,故x≤2,
因为极差为5,所以x+5≤7,即每次未参与的人数最多不超过7,故符合情况,故A正确;
对于B,假设有1个数据不小于8,方差为s2,
则s2>×(8-2)2=3.6>3,
故假设不成立,故此时符合情况,故B正确;
对于C,假设数据为1,9,0,0,0,0,0,0,0,0,此时总体平均数为1,总体方差大于0,
但不满足每次未参与的人数不超过7,故C错误;
对于D,假设数据为8,2,2,2,2,2,2,0,0,0,满足总体平均数为2,众数为2,
但不满足每次未参与的人数不超过7,故D错误.5.1.2 数据的数字特征
第1课时  最值、平均数、中位数、百分位数、众数
学习目标 1.理解数据的最值、平均数、中位数、百分位数、众数的意义和作用.2.会计算数据的这些数字特征,并能解决有关实际问题.
导语
某酒店打出的招聘宣传语是“本酒店待遇丰厚,平均工资是每周800元”,小强入职后工作了一段时间,发现上当了,前去质问经理:“您宣传工资一周是800元是欺诈行为,我问过其他员工了,没有一个人每周的工资超过800元.”而经理说:“我当时说的是平均周工资800元,我的周工资是3 000元,3名副经理的周工资都是1 000元,5名领班的周工资是700元,10名服务员的周工资是600元,1名清洁工的周工资是500元.”小强一听,哭笑不得.你能从数学的角度解释这种现象吗?
一、最值与平均数
问题1 若某校高一年级8个班参加合唱比赛的得分分别为89,91,90,92,87,93,96,94,则平均数是多少?最高分是多少?最低分是多少?
提示 ==91.5;最高分是96;最低分是87.
知识梳理
1.一组数据的最值指的是其中的最大值与最小值,最值反映的是这组数最极端的情况.一般地,最大值用max表示,最小值用min表示.
2.平均数
(1)如果给定的一组数是x1,x2,…,xn,则这组数的平均数为=(x1+x2+…+xn),简记为=xi.
(2)求和符号∑具有以下性质:
①(xi+yi)=xi+yi;② (kxi)=kxi;③t=nt.
(3)性质:一般地,如果x1,x2,…,xn的平均数为,且a,b为常数,则ax1+b,ax2+b,…,axn+b的平均数为a+b.
注意点:
(1)求平均数时要注意数据的个数,不要重计或漏计.
(2)数据同时增加或减少相同的数,平均数也随之增加或减少相同的数.
例1 (1)求一组数据:68,69,71,63,70,68,69,71,69,72的最值、平均数.
解 把所给数据从小到大排列为63,68,68,69,69,69,70,71,71,72,
则最大值为72,最小值为63.平均数为
=69.
(2)某学习小组在一次数学测验中,得100分的有1人,得95分的有1人,得90分的有2人,得85分的有4人,得80分和75分的各1人,则该小组数学成绩的平均数为(  )
A.85 B.86 C.87 D.88
答案 C
解析 平均数为
=87.
反思感悟 求平均数的方法
(1)用定义式;
(2)用平均数的性质;
(3)在容量为n的一组数据中,若数据x1有n1个,x2有n2个,…,xk有nk个,且n=n1+n2+…+nk,则这组数据的平均数为(n1x1+n2x2+…+nkxk)=x1+x2+…+xk.
跟踪训练1 (1)设一组数据x1,x2,…,xn的平均数为1,则数据3x1+1,3x2+1,…,3xn+1的平均数为(  )
A.1 B.3 C.4 D.9
答案 C
解析 记数据x1,x2,…,xn的平均数为,
数据ax1+b,ax2+b,…,axn+b的平均数为',
则'=
=
==a+b,
故数据3x1+1,3x2+1,…,3xn+1的平均数为3+1=3×1+1=4.
(2)已知样本数据x1,x2,…,x10,其中x1,x2,x3的平均数为a;x4,x5,…,x10的平均数为b,则样本数据的平均数为(  )
A. B. C. D.
答案 A
解析 ∵x1,x2,x3的平均数为a,∴x1,x2,x3的和为3a.
∵x4,x5,…,x10的平均数为b,∴x4,x5,…,x10的和为7b.
∴样本数据的和为3a+7b,
∴样本数据的平均数为.
二、中位数与众数
问题2 若某校高二年级7个班参加合唱比赛的得分分别为89,91,90,92,87,92,96,你能把数据从小到大排列吗?正中间的数据是多少?出现次数最多的数据是多少?
提示 87,89,90,91,92,92,96; 91;92.
知识梳理
1.中位数
如果一组数有奇数个数,且按照从小到大排列后为x1,x2,…,x2n+1,则称xn+1为这组数的中位数;如果一组数有偶数个数,且按照从小到大排列后为x1,x2,…,x2n,则称为这组数的中位数.
2.众数
一组数据中,某个数据出现的次数称为这个数据的频数,出现次数最多的数据称为这组数据的众数,一组数据的众数可以是一个,也可以是多个.
注意点:
(1)求中位数时一定要先对数据按从小到大排序,若最中间有两个数据,则中位数是这两个数据的平均数.中位数不一定是数据中的数.
(2)若有两个或两个以上的数据出现得最多,且出现的次数都一样,则这些数据都叫众数;若一组数据中每个数据出现的次数都一样多,则没有众数.
例2 “杂交水稻之父”袁隆平培育的超级杂交水稻在全世界推广种植.某种植户为了考察所种植的杂交水稻苗的长势,从稻田中随机抽取7株水稻苗,测得苗高(单位:cm)分别是23,24,23,25,26,23,25.则这组数据的众数和中位数分别是(  )
A.24,25 B.23,23
C.23,24 D.24,24
答案 C
解析 苗高由小到大排列为23,23,23,24,25,25,26,所以这组数据的众数和中位数分别是23,24.
反思感悟 (1)众数、中位数的计算方法
计算众数、中位数时,可先将这组数据按从小到大或从大到小的顺序排列,再根据各自的定义计算.
(2)众数、中位数、平均数的意义
①样本的众数、中位数和平均数常用来表示样本数据的“中心值”,其中众数和中位数容易计算,不受少数几个极端值的影响,但只能表达样本数据中的少量信息,平均数代表了样本数据中更多的信息,但受样本中每个数据的影响,越极端的数据对平均数的影响也越大.
②当一组数据中有不少数据重复出现时,其众数往往更能反映问题,当一组数据中个别数据较大时,可用中位数描述其集中趋势.
跟踪训练2 某小区广场上有甲、乙两群市民正在进行晨练,两群市民的年龄如下(单位:岁):
甲群 13,13,14,15,15,15,15,16,17,17;
乙群 54,3,4,4,5,5,6,6,6,57.
(1)甲群市民年龄的平均数、中位数和众数各是多少岁?其中哪个统计量能较好地反映甲群市民的年龄特征?
(2)乙群市民年龄的平均数、中位数和众数各是多少岁?其中哪个统计量能较好地反映乙群市民的年龄特征?
解 (1)甲群市民年龄的平均数为
=15(岁),
中位数为15岁,众数为15岁.平均数、中位数和众数相等,因此它们都能较好地反映甲群市民的年龄特征.
(2)乙群市民年龄的平均数为
=15(岁),
中位数为5.5岁,众数为6岁.
由于乙群市民大多数是儿童,所以中位数和众数能较好地反映乙群市民的年龄特征,而平均数的可靠性较差.
三、百分位数
问题3 某校高一年级8个班参加合唱比赛的得分分别为89,91,90,92,87,93,96,94,你能把数据从小到大排列吗?这组数据个数的25%是多少?
提示 87,89,90,91,92,93,94,96;8×25%=2.
知识梳理
1.百分位数
一组数的p%分位数指的是,将这组数按照从小到大的顺序排列后,处于p%位置的数.
2.如何确定p%分位数
设一组数按照从小到大排列后为x1,x2,…,xn,计算i=np%的值,如果i不是整数,设i0为大于i的最小整数,取为p%分位数;如果i是整数,取为p%分位数.
3.规定:0分位数是x1(即最小值),100%分位数是xn(即最大值).
4.一般地,一组数的p%(p∈(0,100))分位数指的是满足下列条件的一个数值:至少有p%的数据不大于该值,且至少有(100-p)%的数据不小于该值.
注意点:
(1)中位数相当于是50%分位数.除了中位数外,常用的分位数还有25%分位数,75%分位数.25%分位数也称为第一四分位数,75%分位数也称为第三四分位数.
(2)百分位数可能不唯一,也可能不是数据中的数.
例3 (课本例1)根据表中数据,计算甲、乙两组数的75%分位数.
序号 1 2 3 4 5 6 7 8 9 10
甲组 1 2 2 2 2 3 3 3 5 5
乙组 0 0 0 0 1 1 2 3 4 5
序号 11 12 13 14 15 16 17 18 19 20
甲组 6 6 8 8 9 10 10 12 13 13
乙组 6 6 7 7 10 14 14 14 14 15
解 因为数据个数为20,而且20×75%=15,
所以甲组数的75%分位数为==9.5;
乙组数的75%分位数为==12.
例3 确定数据:1,2,2,2,2,3,3,3,5,5,6,6,8,8,9,10,10,12,13,13的中位数,78%分位数.
解 因为所给数据已从小到大排列,共20个,
而且i1=20×50%=10为整数,
i2=20×78%=15.6不为整数,
所以这组数据的中位数为==5.5,78%分位数为x16=10.
反思感悟 (1)百分位数是用于衡量数据的位置的度量,但它所衡量的不一定是中心位置.百分位数提供了有关数据项如何在最小值与最大值之间分布的信息.
(2)中位数、百分位数都不一定是数据中的数.
跟踪训练3 从某公司生产的产品中,任意抽取12件,得到它们的质量(单位:kg)如下:
7.9,9.0,8.9,8.6,8.4,8.5,8.5,8.5,9.9,7.8,8.3,8.0,
分别求出这组数据的25%,75%,95%分位数.
解 将所有数据从小到大排列,得
7.8,7.9,8.0,8.3,8.4,8.5,8.5,8.5,8.6,8.9,9.0,9.9,
因为共有12个数据,
所以12×25%=3,12×75%=9,12×95%=11.4,
则25%分位数是=8.15,
75%分位数是=8.75,
95%分位数是第12个数据为9.9.
1.知识清单:
(1)数据的最值、平均数、中位数、百分位数、众数.
(2)数据的数字特征的计算方法.
(3)数据的数字特征的应用.
2.方法归纳:数据分析.
3.常见误区:利用平均数、中位数、百分位数、众数对数据的分析不准确.
                
1.2024年某高一学生下学期政治考试成绩为
79 79 84 84 86 84 87 90 90 97
则该生政治考试成绩的平均数和众数依次为(  )
A.85 84 B.84 85 C.86 84 D.84 86
答案 C
解析 由题意可知,平均数
==86,
众数为84.
2.某地铁运行过程中,10个车站上车的人数统计如下:70,60,60,50,60,40,40,30,30,10,则这组数据的众数与中位数之和为(  )
A.120 B.105 C.110 D.100
答案 B
解析 这组数据的众数是60.将数据从大到小排成一列为70,60,60,60,50,40,40,30,30,10,则中位数为=45,所以众数与中位数之和为60+45=105.
3.计算(2i+1)等于(  )
A.6 B.9 C.10 D.15
答案 D
解析 (2i+1)=(2×1+1)+(2×2+1)+(2×3+1)=3+5+7=15.
4.某歌手电视大奖赛中,七位评委对某选手打出如下分数:7.9,8.1,8.4,8.5,8.5,8.7,9.9,则其50%分位数为    .
答案 8.5
解析 ∵7×50%=3.5,
∴其50%分位数是第4个数据为8.5.
课时对点练
[分值:90分]
单选题每小题5分,共40分;多选题每小题6分,共6分
1.从某中学抽取10名同学,得到他们的数学成绩(单位:分)如下:82,85,88,90,92,92,92,96,96,98,则可得这10名同学数学成绩的中位数为(  )
A.88 B.90 C.92 D.96
答案 C
解析 本题中所给数据已按照从小到大的顺序排列,中间两个数据的平均数是(92+92)÷2=92.故中位数是92.
2.已知一组数据从小到大排列为-1,0,4,x,6,15,且这组数据的中位数是5,那么这组数据的众数为(  )
A.5 B.6 C.4 D.5.5
答案 B
解析 由题意得(4+x)=5,得x=6.故众数为6.
3. 若数据x1,x2,…,xn的平均数为a,数据y1=2+x1,y2=2+x2,…,yn=2+xn,则数据y1,y2,…,yn的平均数为(  )
A.a B.2+a C.2 D.2a
答案 B
解析 由题意得数据yi=2+xi,i=1,2…,n,
数据x1,x2,…,xn的平均数为a,由平均数的性质可知数据y1,y2,…,yn的平均数为2+a.
4.有13名同学参加百米竞赛,预赛成绩各不相同,要取前6名参加决赛,小明同学已经知道了自己的成绩,为了判断自己是否能进入决赛,他还需要知道13名同学成绩的(  )
A.平均数 B.众数
C.中位数 D.百分位数
答案 C
解析 把13名同学成绩按由大到小排列,取成绩靠前的6个成绩进入决赛,即最中间一个数之前的6个成绩进入决赛,13个成绩按由大到小排列时,最中间一个数即是中位数.
5.从某学校高二年级随机抽取10名学生进行数学能力测试,测试成绩为68,81,79,81,90,86,74,84,69,78,设学生测试成绩的平均数、中位数、众数分别为a,b,c,则(  )
A.a=bC.a答案 C
解析 将数据从小到大排序为68,69,74,78,79,81,81,84,86,90,
平均数a=
=79,
根据数据从小到大排列,第5个数为79,第6个数为81,所以中位数b==80,
根据数据可知,众数c=81,所以a6.将10个数据按照从小到大的顺序进行排列,第四个数据被墨水污染,2,4,5,□,10,14,15,39,41,50,已知40%分位数是8.5,则第四个数据是(  )
A.5 B.7.5 C.8 D.7
答案 D
解析 设第四个数据为x,因为一共有10个数据,10×40%=4,为整数,根据百分位数的定义可得=8.5,解得x=7.
7.(5分)已知一组数据1,2,3,3,5,1,6,8,这组数据的60%分位数是    .
答案 3
解析 将这组数据由小到大排序为1,1,2,3,3,5,6,8,共8个数,
因为8×60%=4.8,因此,这组数据的60%分位数是3.
8.(5分)是x1,x2,…,x100的平均数,a是x1,x2,…,x40的平均数,b是x41,x42,…,x100的平均数,则=    (用含a,b的式子表示).
答案 a+b
解析 因为a是x1,x2,…,x40的平均数,
所以x1+x2+…+x40=40a,
同理x41+x42+…+x100=60b,
则有==a+b.
9.(12分)为了了解市民的环保意识,某校高一(1)班50名学生在6月5日(世界环境日)这一天调查了各自家庭丢弃旧塑料袋的情况,有关数据如表所示:
每天丢弃旧塑料袋个数 2 3 4 5
户数 6 16 15 13
求这50户居民每天丢弃旧塑料袋数量的平均数、众数和中位数.
解 平均数=×(2×6+3×16+4×15+5×13)==3.7.
众数是3,中位数是4.
10.(12分)甲、乙、丙三个家电厂家在广告中都声称,他们的某品牌节能灯在正确使用的情况下,使用寿命都不低于8年.后来质量检测部门对他们的产品进行抽样调查,抽样调查的甲、乙、丙各8个产品使用寿命的统计结果如下(单位:年):
甲厂:6,6,6,8,8,9,9,12;
乙厂:6,7,7,7,9,10,10,12;
丙厂:6,8,8,8,9,9,10,10.
(1)分别求出以上三组数据的平均数、众数、中位数;(4分)
(2)估计这三个厂家的推销广告分别利用了哪一种统计量;(4分)
(3)如果你是顾客,应该选哪个厂家的节能灯?为什么?(4分)
解 (1)由题意得甲厂数据的平均数为==8,众数为6,中位数为=8;
乙厂数据的平均数为==8.5,众数为7,中位数为=8;
丙厂数据的平均数为==8.5,众数为8,中位数为=8.5.
(2)甲厂利用了平均数或中位数;乙厂利用了平均数或中位数;丙厂利用了平均数或众数或中位数.
(3)选丙厂的节能灯.因为无论从哪种统计量来看,与其他两个厂家相比,丙厂水平都比较高或持平.
11.已知2a,a2,|a|,2a+2的中位数为-,则a等于(  )
A.-3 B.-2 C.-1 D.1
答案 A
解析 ∵2a,a2,|a|,2a+2共四个数,
中位数为-<0,a2≥0,|a|≥0,
∴∴a<-1,
∴2a<2a+2<|a|∴==-,解得a=-3.
12.(多选)某学校准备组织部分同学去研学旅行,为了便于识别,他们准备定做一批容量一致的双肩包,为此,活动负责人征求了参加的同学的意向,得到了如下数据:
容量/L 22 25 28 31 34 37
频数 4 1 5 21 2 2
对于表中数据,下列说法正确的是(  )
A.众数为31 B.第一四分位数为28
C.平均数大于28 D.中位数为30
答案 ABC
解析 对于A,31的频数最大,因此众数为31,A正确;
对于B,由(4+1+5+21+2+2)×25%=8.75,得第一四分位数为从小到大排列的第9个数,为28,B正确;
对于C,平均数=
=>28,C正确;
对于D,共35个数据,中位数为从小到大排列的第18个数,为31,D错误.
13.(5分)某校年级组长为了解本校高三学生某次考试的数学成绩(单位:分),随机抽取30名学生的数学成绩,如下所示:
110 144 125 63 89 121 145 123 74 96
97 142 115 68 83 116 139 124 85 98
132 147 128 133 99 117 107 113 96 141
估计该校高三学生此次考试数学成绩的25%分位数为    ,50%分位数为    .
答案 96 115.5
解析 把这30名学生此次考试的数学成绩按从小到大的顺序排列为63,68,74,83,85,89,96,96,97,98,99,107,110,113,115,116,117,121,123,124,125,128,132,133,139,141,142,144,145,147.因为25%×30=7.5,50%×30=15,所以这30名学生数学成绩的25%分位数为96,50%分位数为=115.5.据此可以估计本校高三学生此次考试数学成绩的25%分位数为96,50%分位数为115.5.
14.(5分)一组数据共有50个数,按从小到大排列,其中7个数在中位数和平均数之间,如果这组数据的中位数和平均数都不在这50个数中,且平均数大于中位数,那么这组数据中小于平均数的数据占这50个数据的百分比是    .
答案 64%
解析 小于平均数的数有25+7=32(个),占这50个数据的×100%=64%.
15.已知x是1,2,3,x,5,6,7这七个数据的中位数,且1,3,x2,-y这四个数据的平均数为1,那么y-的最小值是(  )
A. B. C. D.不存在
答案 A
解析 ∵x是1,2,3,x,5,6,7这七个数据的中位数,则3≤x≤5.
又∵1,3,x2,-y这四个数据的平均数为1,
∴1+3+x2-y=4,
∴x2=y,
∴y-=x2-,
令f(x)=x2-,x∈[3,5],
∴f(x)在[3,5]上单调递增,
∴f(x)的最小值是f(3)=9-=.

展开更多......

收起↑

资源列表