19.3 借助箱线图描述数据的分布 课件 (共28张PPT) 华东师大版数学八年级下册

资源下载
  1. 二一教育资源

19.3 借助箱线图描述数据的分布 课件 (共28张PPT) 华东师大版数学八年级下册

资源简介

(共28张PPT)
借助箱线图描述数据的分布
数据的分析
问题 1 某市去年 4 月 30 天的空气质量指数(AQI)如下:
60, 39, 65,82,60,89, 109,81,73,69,
103,156,62,41,55,123,164,73,45,90,
64, 54, 70, 59, 73,86, 91, 58, 63, 82.
你认为该市去年 4 月空气质量怎么样?
根据学过的知识,你认为用什么来描述空气质量?
平均数反映空气质量的好坏.
方差反映空气质量的稳定性.
60, 39, 65,82,60,89, 109,81,73,69,
103,156,62,41,55,123,164,73,45,90,
64, 54, 70, 59, 73,86, 91, 58, 63, 82.
该市去年4月 AQI 的平均数和方差分别为
x ≈ 77.97,
σ2 ≈ 839.63.
AQI AQI级别 AQI类别及表示颜色 0~50 一级 优 绿色
51~100 二级 良 黄色
101~150 三级 轻度污染 橙色
151~200 四级 中度污染 红色
201~300 五级 重度污染 紫色
>300 六级 严重污染 褐红色
怎样描述该市
去年 4 月 AQI
的分布情况呢?
60, 39, 65,82,60,89, 109,81,73,69,
103,156,62,41,55,123,164,73,45,90,
64, 54, 70, 59, 73,86, 91, 58, 63, 82.
某市去年 4月AQI 的频数分布表
某市去年 4月AQI 的频数分布直方图
用频数分布表和频数分布直方图描述 AQI 的分布情况:
说一说你发现了什么?
AQI (x) 25 < x ≤ 50 50 < x ≤ 75 75 < x ≤ 100 100 < x ≤ 125 125 < x ≤ 150 150 < x ≤
175
频数 3 15 7 3 0 2
某市去年 4月AQI 的频数分布表
(1)该市去年 4 月 AQI 的类别以良为主,有 22 天(约占
全月 30天的 73%)AQI 处于 50 和 100 之间.
(2)有 3 天类别为优,3 天为轻度污染,还有 2 天 AQI 异常
大,为中度污染,没有重度污染和严重污染的情况.


轻度污染
中度污染
0
2
4
6
8
10
12
14
16
25
50
75
100
125
150
175
AQI
频数
某市去年 4月AQI 的频数分布直方图
(3)数据的分布左、右不对称,
中心偏向较低的 AQI,
有一个高峰.
(4)AQI 处于 50 和 75 之间
的天数最多.
除了分布表和直方图,还常用箱线图来描述
数据的分布情况.
箱线图
概念引入:
用最大值(除去异常值之后)、上四分位数、中位数、下四分位数和最小值(除去异常值之后)这五个指标来描述数据分布的统计图称为箱线图.
最小值
下四分位数
中位数
上四分位数
最大值
画箱线图要用到四分位数,你知道什么是四分位数吗?
概念引入:
一组数据按从小到大的顺序排列,中位数是从中间点把数据分成 2 等份.
将数据分成 100 等份的每一分点处的值叫作这组数据的百分位数.
百分位数的优点:
可以较全面地反映出数据的分布信息.
60, 39, 65,82,60,89, 109,81,73,69,
103,156,62,41,55,123,164,73,45,90,
64, 54, 70, 59, 73,86, 91, 58, 63, 82.
在实际应用中,有时候数据个数不多,我们可以用三个特殊的百分位数来刻画.
25%分位数
50%分位数
75%分位数
想一想,怎么找出这些特殊的百分数?
按从小到大的顺序排列
60, 39, 65,82,60,89, 109,81,73,69,
103,156,62,41,55,123,164,73,45,90,
64, 54, 70, 59, 73,86, 91, 58, 63, 82.
39,41,45,54,55,58,59,60,60,62,63,64,65,69,70,73,73,73,81,82,82,86,89,90,91,103,109,123,156,164.
71.5
所有数据中小于 71.5 的占 50%,称 71.5 为这组数据的 50% 分位数,
也叫中位数.
39,41,45,54,55,58,59,60,60,62,63,64,65,69,70,73,73,73,81,82,82,86,89,90,91,103,109,123,156,164.
在 71.5 左侧和右侧的数据中,你能分别找出它们各自的中位数吗?
60
所有数据中小于 60 的占 25%,称 60 为这组数据的 25% 分位数.
89
所有数据中小于 89 的占 75%,称 89 为这组数据的 75% 分位数.
71.5
39,41,45,54,55,58,59,60,60,62,63,64,65,69,70,73,73,73,81,82,82,86,89,90,91,103,109,123,156,164.
60
89
71.5
25%分位数
50%分位数
75%分位数
由于 60,71.5,89 这三个值把这组按由小到大顺序排列的数据分成四等份,所以称它们为这组数据的四分位数.
第一四分位数
第二四分位数
第三四分位数
下四分位数(Q1)
中位数(Q2)
上四分位数(Q3)
1. 某校 18 个班参加艺术节合唱比赛,通过简单随机抽样,
抽得 8 个班的比赛得分如下:91,90,94,87,93,96,91,85,
则这组数据的 75%分位数为_______.
85 87 90 91 91 93 94 96
91
88.5
93.5
25%分


50%



75%



93.5
2. 一组数据按从小到大排列为: 16,25,33,39,43,m,65,70.
若这组数据的下四分位数与上四分位数的和是 85,
则 m = _____.
16 25 33 39 43 m 65 70
41
29
下四分位数(Q1)
中位数(Q2)
上四分位数(Q3)
29 +
= 85
m = 47
47
归纳总结
求四分位数的方法:
(1)先将这组数据从小到大排列;
(2)计算 Q2,即求这组数据的中位数;
(3)计算 Q1,Q3;
①当 n 为偶数时,Q1为前 个数据的中位数,Q3为后 个数据的中位数;
②当 n 为奇数时,Q1为前 个数据的中位数,Q3为后 个数据的中位数.
39,41,45,54,55,58,59,60,60,62,63,64,65,69,70,73,73,73,81,82,82,86,89,90,91,103,109,123,156,164.
60
89
71.5
下四分位数
中位数
上四分位数
现在你知道怎么画箱线图吗?动手试一试.
39,41,45,54,55,58,59,60,60,62,63,64,65,69,70,73,73,73,81,82,82,86,89,90,91,103,109,123,156,164.
60
89
71.5
下四分位数
中位数
上四分位数
先画一条统计量的刻度线.
180
160
140
120
100
80
60
40
20
0
箱线图主要由矩形箱体和从箱体延伸出的两条竖直线段(称为须线)构成.
箱体
须线
须线
39,41,45,54,55,58,59,60,60,62,63,64,65,69,70,73,73,73,81,82,82,86,89,90,91,103,109,123,156,164.
60
89
71.5
下四分位数
中位数
上四分位数
180
160
140
120
100
80
60
40
20
0
下边缘 39
下四分位数 60
中位数 71.5
上四分位数 89
上边缘 123
异常值 156 和 164
180
160
140
120
100
80
60
40
20
0
你会根据箱线图来分析 AQI 的分布情况吗?
①该市去年 4 月有约一半的天数 AQI 处于 60
和 89 之间,类别为良,还有约四分之一的
天数 AQI 低于60,另有约四分之一的天数
AQI 高于 89.
②因为中位数离箱体的中间有点远,说明数据
的分布不是对称的,中心偏向较低的 AQI.
思 考
要寻找以下信息,可以借助上面的频数分布直方图还是箱线图?
①该市去年 4 月 AQI 有没有异常值;
②按 AQI 排序分段后,天数最多或最少的那一段 AQI 的
变化范围;
③该市去年 4 月 AQI 不超过 75 的天数;
④该市去年 4 月空气质量最好的七八天里,AQI 的变化范围.
0
2
4
6
8
10
12
14
16
25
50
75
100
125
150
175
AQI
频数
180
160
140
120
100
80
60
40
20
0
频数分布直方图是将涵盖数据最小值和最大值的这一整段等距分组后,回答诸如“每一段内有多少个数据”这样的问题.
0
2
4
6
8
10
12
14
16
25
50
75
100
125
150
175
AQI
频数
180
160
140
120
100
80
60
40
20
0
箱线图则是将所有数据等分为数据量相同的 4 个组(每组有四分之一总量个数据),通过计算下四分位数、中位数和上四分位数来确定“箱体”的位置,从而回答诸如“中间 50% 的数据处在哪个范围”这样的问题.
0
2
4
6
8
10
12
14
16
25
50
75
100
125
150
175
AQI
频数
180
160
140
120
100
80
60
40
20
0
共同点:① 都能描述数据的整体分布,
② 都需要先将一组数据排序.
在某项测试中,甲同学的 12 次测试成绩如下表所示:
(1)请将最小值、下四分位数、中位数、
上四分位数和最大值标记在如图所示
的箱线图中.
第1次 第2次 第3次 第4次 第5次 第6次
测试成绩 90 97 70 89 62 70
第7次 第8次 第9次 第10次 第11次 第12次
测试成绩 71 103 80 92 98 98
105
100
95
90
85
80
75
70
65
60
测试成绩/分
105
100
95
90
85
80
75
70
65
60
测试成绩/分
62
70.5
89.5
97.5
103
解: 将甲同学的成绩从小到大排列为:
62,70,70,71,80,89,90,92,97,98,98,103,
所以最小值为 62,下四分位数为 70.5,
中位数为 89.5,上四分位数为 97.5,
最大值为 103. 如图所示.
第1次 第2次 第3次 第4次 第5次 第6次
测试成绩 90 97 70 89 62 70
第7次 第8次 第9次 第10次 第11次 第12次
测试成绩 71 103 80 92 98 98
(2)甲同学测试成绩中有几次测试成绩
大于上四分位数?分别是哪几次?
第1次 第2次 第3次 第4次 第5次 第6次
测试成绩 90 97 70 89 62 70
第7次 第8次 第9次 第10次 第11次 第12次
测试成绩 71 103 80 92 98 98
105
100
95
90
85
80
75
70
65
60
测试成绩/分
62
70.5
89.5
97.5
103
甲同学测试成绩中有 3 次测试成绩
大于上四分位数,分别是第 8 次、
第 11 次和第 12 次.
(3)甲同学测试成绩介于 70.5 和 89.5 之间
的次数是否比介于 89.5 和 97.5 之间的
次数多?
105
100
95
90
85
80
75
70
65
60
测试成绩/分
62
70.5
89.5
97.5
103
第1次 第2次 第3次 第4次 第5次 第6次
测试成绩 90 97 70 89 62 70
第7次 第8次 第9次 第10次 第11次 第12次
测试成绩 71 103 80 92 98 98
甲同学测试成绩介于 70.5 和 89.5 之间的次数不比介于 89.5 和 97.5 之间的次数多
如何理解百分位数和四分位数?它们有什么区别?箱线图该怎么画?它是怎样反映数据的分布信息的?
数据
百分位数
分布信息
三个特殊的百分位数
四分位数
箱线图
图形表示

展开更多......

收起↑

资源预览