24.3数据的四分位数 课件(共32张PPT) 人教版数学八年级下册

资源下载
  1. 二一教育资源

24.3数据的四分位数 课件(共32张PPT) 人教版数学八年级下册

资源简介

第二十四章 数据的分析
八下数学 RJ
24.3 数据的四分位数
1.知道百分位数和四分位数,能计算一组数据的四分位数,正确理解四分位数如何刻画数据的取值特征,会用样本数据的数字特征分析相关问题.
2.了解四分位数和箱线图的关系,知道箱线图可以直观反映数据分布的信息,感悟百分位数的意义,形成和发展数据观念.
集中趋势和离散程度都是数据分布某一方面的特征. 为了获取数据更多的信息,人们还关心数据整体的分布情况. 本节我们将学习用四分位数大致刻画一组数据的分布情况.
问题 某银行有 A 和 B 两个理财经营团队.近三年,这两个团队分别负责经营12项理财产品,收益率 (单位:%) 如下:
如果你是一位购买理财产品的投资人,会选择哪个团队的产品?
{16D9F66E-5EB9-4882-86FB-DCBF35E3C3E4}A
4.77
3.98
6.44
4.89
2.15
3.85
3.64
3.21
3.18
2.02
4.11
4.10
B
3.18
3.84
3.99
3.67
3.40
3.60
4.10
4.21
4.15
4.44
3.87
3.91
我们用产品收益率的平均数和方差来进行分析:
????A≈3.862,????B≈3.863,
可以看出团队B的平均收益率略高,但差别不大;
s2A≈1.327,s2B≈0.117,
可以看出团队B收益率的波动较小,产品收益率的稳定性要好于团队A.
因此,如果你是稳健型投资者,那么应该选择团队B经营的理财产品;如果你是激进型投资者,那么应该选择团队A经营的理财产品.
?
{16D9F66E-5EB9-4882-86FB-DCBF35E3C3E4}A
4.77
3.98
6.44
4.89
2.15
3.85
3.64
3.21
3.18
2.02
4.11
4.10
B
3.18
3.84
3.99
3.67
3.40
3.60
4.10
4.21
4.15
4.44
3.87
3.91
思考 如果投资者还想进一步了解两个团队理财产品收益率的具体情况,例如收益率大部分在什么范围,哪些范围比较集中等信息,那么产品收益率的平均数和方差能反映出这些信息吗?
平均数和方差虽然可以反映产品收益率的集中趋势和离散程度,但无法反映出投资客户关心的这些信息.因此,我们需要能反映产品收益率更多分布信息的统计量.
一组数据按从小到大的顺序排列,中位数是从中间点把数据分成2等份. 将数据分成100等份的每一分点处的值叫作这组数据的百分位数.相比中位数,百分位数可以较全面地反映出数据的分布信息.
由于每个团队的产品收益率的数据个数不多,我们可以用三个特殊的百分位数来刻画.
如图所示,把团队A的产品收益率按从小到大的顺序排列.
容易得到这组数据的中位数为3.915,这个值把所有数据分成2等份,所有数据中小于这个值的占50%,称3.915为这组数据的50%分位数.
2.02,2.15,3.18,3.21,3.64,3.85,3.98,4.10,4.11,4.77,4.89,6.44
3.915
50%分位数
在3.915左侧和右侧的数据中,还可以分别得到它们各自的中位数3.195和4.44,所有数据中小于这两个值的分别占25%和75%,称3.195和4.44分别为这组数据的25%分位数和75%分位数.
2.02,2.15,3.18,3.21,3.64,3.85,3.98,4.10,4.11,4.77,4.89,6.44
3.915
4.44
3.195
50%分位数
75%分位数
25%分位数
由于3.195,3.915,4.44这三个值把这组按由小到大顺序排列的数据分成四等份,所以称它们为这组数据的四分位数,从小到大分别称为这组数据的第一四分位数、第二四分位数(中位数)、第三四分位数,分别记为Q1,Q2,Q3.
2.02,2.15,3.18,3.21,3.64,3.85,3.98,4.10,4.11,4.77,4.89,6.44
3.915
4.44
3.195
第一四分位数 第二四分位数 第三四分位数
2.02,2.15,3.18,3.21,3.64,3.85,3.98,4.10,4.11,4.77,4.89,6.44
3.915
4.44
3.195
由团队A产品收益率的三个四分位数,可以大致看出其产品收益率的分布情况.
其产品收益率小于3.195%的项目数占总数的25%,产品收益率小于3.915%的项目数占总数的一半,产品收益率大于 4.44% 的项目数占总数的25%. 产品收益率在3.195%至4.44%之间的项目数占总数的50%.
第一四分位数 第二四分位数 第三四分位数
3.18,3.40,3.60,3.67,3.84,3.87,3.91,3.99,4.10,4.15,4.21,4.44
3.89
3.635
4.125
第一四分位数
第二四分位数
第三四分位数
类似地,如图,可以得到团队B产品收益率的三个四分位数.
由团队B产品收益率的三个四分位数可以知道,其产品收益率小于3.635%的项目数占总数的25%,产品收益率小于3.89%的项目数占总数的一半,产品收益率大于4.125%的项目数占总数的25%.产品收益率在3.635%至4.125%之间的项目数占总数的50%.
例1 某班8名学生寒假阅读书籍的数量如下(单位:本):
8,7,9,7,8,6,9,8.
求这组数据的四分位数.
解:将该组数据按从小到大的顺序排列为:6,7,7,8,8,8,9,9.
∴该组数据的第二四分位数Q2= 8+82 =8,
该组数据的第一四分位数Q1= 7+72 =7,
该组数据的第三四分位数Q3= 8+92 =8.5.
?
确定一组数据的四分位数的步骤
(1)先将数据按照从小到大的顺序进行排列;
(2)找出这组数据的中位数,作为这组数据的第二四分位数;
(3)找出中位数左侧和右侧的数据各自的中位数,分别作为这组数据的第一四分位数和第三四分位数.
利用一组数据的三个四分位数,以及最小值、最大值可以刻画这组数据的大致分布情况.
为了更加直观地观察产品收益率的分布特征,我们可以用产品收益率的三个四分位数及最小值、最大值这五个数值画出箱线图.
2.02,2.15,3.18,3.21,3.64,3.85,3.98,4.10,4.11,4.77,4.89,6.44
3.915
4.44
3.195
第一四分位数 第二四分位数 第三四分位数
2 3 4 5 6 7 收益率/%
团队A产品收益率的箱线图如下图所示.
2 3 4 5 6 7 收益率/%
最小值
最大值
第一四分位数
第二四分位数
第三四分位数
整个箱体的长度为第三四分位数减去第一四分位数的差,称为四分位距. 由箱线图,容易看出产品收益率分布的大致情况,如分布的范围、中位数的大小、集中的范围、分布是否对称等.
它主要由矩形箱体和从箱体延伸出的两条水平线段(称为须线)构成.
探究 你会画出团队B产品收益率的箱线图吗?
3.18,3.40,3.60,3.67,3.84,3.87,3.91,3.99,4.10,4.15,4.21,4.44
3.89
3.635
4.125
第一四分位数
第二四分位数
第三四分位数
2 3 4 5 6 7 收益率/%
箱线图也可以按竖直方向画.为了便于比较两个团队产品收益率的分布特征,把两个箱线图按竖直方向并列画在同一幅图中,如右图所示.
收益率/%
7
6
5
4
3
2
1
0
A团队 B团队
从图中可以发现,两个团队产品收益率的中位数几乎相等(表示中位数的水平线段差不多高),但团队A的产品收益率波动明显比团队B的大(团队A的箱体和须线比团队B的长),这与用平均数、方差比较的结果是一致的.
收益率/%
7
6
5
4
3
2
1
0
A团队 B团队
从箱线图中,还可以看出分布的一些其他特征.
例如,团队B的产品收益率分布比团队A的更对称(中位数对应的水平线段在箱子的中间位置),团队A有约25%的产品收益率高于团队B的最高产品
收益率,也有约25%的
产品收益率低于团队B
的最低产品收益率,等等.
收益率/%
7
6
5
4
3
2
1
0
A团队 B团队
思考 与直方图、条形图比较,箱线图在表示数据方面有什么特点?
与直方图、条形图相比,箱线图具有以下特点:
(1)能够清晰地展示数据的分布范围、集中程度,适合分析数据的分布特征;
(2)适合多组数据对比,箱线图可以轻松地并排绘制多个数据集,便于直观比较不同组数据的分布差异;
(3)适用于大数据集,箱线图在数据量较大时仍然能够清晰展示数据的分布特征,而不会像直方图或条形图那样显得过于拥挤.
例2 根据下表中的数据,分别计算甲、乙两地气温的四分位数,在同一幅图中画出箱线图,据此比较甲、乙两地的气温特点.
解:将表中两地的气温(单位:℃)分别按从小到大的顺序排列,可得
甲地 9 10 11 12 13 14 16 16 18 21 21 23 24
乙地 11 12 13 14 15 15 16 17 17 18 19 20 21
{C4B1156A-380E-4F78-BDF5-A606A8083BF9}时刻
0:00
2:00
4:00
6:00
8:00
10:00
12:00
14:00
16:00
18:00
20:00
22:00
24:00
甲/℃
11
9
10
12
16
21
23
24
21
18
16
14
13
乙/℃
13
11
12
14
15
17
19
21
20
18
17
16
15
例2 根据下表中的数据,分别计算甲、乙两地气温的四分位数,在同一幅图中画出箱线图,据此比较甲、乙两地的气温特点.
甲、乙两地气温各有13个数据.甲地气温的最小值为9,最大值为24,三个四分位数分别为
Q2=16,Q1=11+122=11.5,Q3=21+212=21.
乙地气温的最小值为11,最大值为21,三个四分位数分别为
Q2=16,Q1=13+142=13.5,Q3=18+192=18.5.
?
{C4B1156A-380E-4F78-BDF5-A606A8083BF9}时刻
0:00
2:00
4:00
6:00
8:00
10:00
12:00
14:00
16:00
18:00
20:00
22:00
24:00
甲/℃
11
9
10
12
16
21
23
24
21
18
16
14
13
乙/℃
13
11
12
14
15
17
19
21
20
18
17
16
15
例2 根据下表中的数据,分别计算甲、乙两地气温的四分位数,在同一幅图中画出箱线图,据此比较甲、乙两地的气温特点.
甲、乙两地气温各有13个数据.甲地气温的最小值为9,最大值为24,三个四分位数分别为
Q2=16,Q1=11+122=11.5,Q3=21+212=21.
乙地气温的最小值为11,最大值为21,三个四分位数分别为
Q2=16,Q1=13+142=13.5,Q3=18+192=18.5.
?
{C4B1156A-380E-4F78-BDF5-A606A8083BF9}时刻
0:00
2:00
4:00
6:00
8:00
10:00
12:00
14:00
16:00
18:00
20:00
22:00
24:00
甲/℃
11
9
10
12
16
21
23
24
21
18
16
14
13
乙/℃
13
11
12
14
15
17
19
21
20
18
17
16
15
在同一幅图中画出两地气温的箱线图,如图所示.
可以看出,甲、乙两地气温的中位数相同,但甲地气温的波动明显比乙地的大,甲地约有25%时刻的气温高于乙地的最高温度,约有25%时刻的气温低于乙地的最低温度.
跟踪训练 某书店一个月内每天的书籍销售量的箱线图如图所示.
(1)这个月书籍销售量的最大值、最小值及四分位数分别是多少?(2)请分析这个月书籍的销售情况.
解:(1)
(2)从箱线图中可以看出,每天书籍销售量的分布不对称,有一半的天数销售量集中在90~96;数据的四分位距为93-80=13,说明数据的波动比较大.
1.求数据组13,15,12,27,22,24,28,30,31,18,19,20的四分位数.
解:把12个数据按从小到大的顺序排列为:
12, 13, 15, 18, 19, 20, 22, 24, 27, 28, 30, 31
第一四分位数:15+182=16.5,
第二四分位数:20+222=21,
第三四分位数:27+282=27.5.
?
2.某城市9月份空气质量指数的箱线图如图所示.
(1)这个月空气质量指数的最大值、最小值及四分位数分别是多少?(2)请分析这个月空气质量的特点.
解:(1)这个月空气质量指数的最大值是110,最小值是30,第一四分位数是40,第二四分位数是50,第三四分位数是80.
(2)从箱线图上可以看出这个月空气质量指数在80以下的占比达到75%,说明这个月该城市整体空气质量较好.
3.任何一组数据的四分位数,是否都恰好能把这组数据分成四等份?举例说明.
解:四分位数并不总是能将数据分成四等份,特别是当数据的数量不是4的倍数时.但在理论上,四分位数的目标是尽量接近这种划分.
4.某小组 8 名学生的数学成绩分别为
75,80,85,90,90,95,100,100.
(1) 求这组数据的平均数、中位数、众数;
(2) 计算第三四分位数.
解:(1) 平均数:(75 + 80 + 85 + 90 + 90 + 95 + 100 + 100)÷8 = 89.375;
将数据从小到大排序为 75,80,85,90,90,95,100,100,
中位数为(90 + 90)÷2 = 90;众数是 90 和 100.
(2)8×75% = 6,第三四分位数是第 6 个数和第 7 个数的平均值,即(95 + 100)÷2 = 97.5?.
数据的
四分位数
百分位数
四分位数
箱线图
三个四分位数及最大值、最小值
25%分位数,50%分位数,75%分位数
一组数据按从小到大的顺序排列,将数据分成100等份的每一分点处的值叫作这组数据的百分位数

展开更多......

收起↑

资源预览