24.3 数据的四分位数 课件(29页) 2025-2026学年人教版(2024) 初中数学八年级下册

资源下载
  1. 二一教育资源

24.3 数据的四分位数 课件(29页) 2025-2026学年人教版(2024) 初中数学八年级下册

资源简介

(共29张PPT)
24.3 数据的四分位数
第二十四章 数据的分析
1.理解一组数据的四分位数的概念,并会求一组数据的四分位数.
2.理解箱线图的构成及其意义,能够绘制和解读箱线图.
3.能够通过四分位数和箱线图的分析数据的分布特征.
集中趋势和离散程度都是数据分布某一方面的特征. 为了获取数据更多的信息,人们还关心数据整体的分布情况. 本节我们将学习用四分位数大致刻画一组数据的分布情况.
【问题】某银行有 A 和 B 两个理财经营团队. 近三年,这两个团队分别负责经营12项理财产品,收益率 (单位:%) 如下:
如果你是一位购买理财产品的投资人,会选择哪个团队的产品?
A 4.77 3.98 6.44 4.89 2.15 3.85 3.64 3.21 3.18 2.02 4.11 4.10
B 3.18 3.84 3.99 3.67 3.40 3.60 4.10 4.21 4.15 4.44 3.87 3.91
我们可以用产品收益率的平均数和方差这两个统计量来刻画这两个团队的经营水平. 通过计算,可以得到A和B两个团队产品收益率的平均数和方差分别为:
A≈3.862,B≈3.863,
s2A≈1.327,s2B≈0.117,
可以看出团队B收益率的波动较小,产品收益率的稳定性要好于团队A. 但差别不大;团队A的产品收益率的方差明显大于团队B,即团队B的产品收益率的稳定性要好于团队A.
因此,如果你是稳健型投资者,那么应该选择团队B经营的理财产品;如果你是激进型投资者,那么应该选择团队A经营的理财产品.
【思考】如果投资者还想进一步了解两个团队理财产品收益率的具体情况,例如收益率大部分在什么范围,哪些范围比较集中等信息,那么产品收益率的平均数和方差能反映出这些信息吗?
平均数和方差虽然可以反映产品收益率的集中趋势和离散程度,但无法反映出投资客户关心的这些信息. 因此,我们需要能反映产品收益率更多分布信息的统计量.
一组数据按从小到大的顺序排列,中位数是从中间点把数据分成2等份. 将数据分成100等份的每一分点处的值叫作这组数据的百分位数.相比中位数,百分位数可以较全面地反映出数据的分布信息.
概念引入:
由于每个团队的产品收益率的数据个数不多,我们可以用三个特殊的百分位数来刻画.
如图所示,把团队A的产品收益率按从小到大的顺序排列.
容易得到这组数据的中位数为=3.915,这个值把所有数据分成2等份,所有数据中小于这个值的占50%,称3.915为这组数据的50%分位数.
2.02,2.15,3.18,3.21,3.64,3.85,3.98,4.10,4.11,4.77,4.89,6.44
3.915
50%分位数
2.02,2.15,3.18,3.21,3.64,3.85,3.98,4.10,4.11,4.77,4.89,6.44
3.915
50%分位数
在3.915左侧和右侧的数据中,还可以分别得到它们各自的中位数3.195和4.44,所有数据中小于这两个值的分别占25%和75%,称3.195和4.44分别为这组数据的25%分位数和75%分位数.
4.44
3.195
75%分位数
25%分位数
由于3.195,3.915,4.44这三个值把这组按由小到大顺序排列的数据分成四等份,所以称它们为这组数据的四分位数,从小到大分别称为这组数据的第一四分位数、第二四分位数(中位数)、第三四分位数,分别记为Q1,Q2,Q3.
第一四分位数 第二四分位数 第三四分位数
2.02,2.15,3.18,3.21,3.64,3.85,3.98,4.10,4.11,4.77,4.89,6.44
3.915
4.44
3.195
第一四分位数又称下四分位数,第三四分位数又称上四分位数.
由团队A产品收益率的三个四分位数,可以大致看出其产品收益率的分布情况.
其产品收益率小于3.195%的项目数占总数的25%,产品收益率小于3.915%的项目数占总数的一半,产品收益率大于 4.44% 的项目数占总数的25%. 产品收益率在3.195%至4.44%之间的项目数占总数的50%.
第一四分位数 第二四分位数 第三四分位数
2.02,2.15,3.18,3.21,3.64,3.85,3.98,4.10,4.11,4.77,4.89,6.44
3.915
4.44
3.195
3.18,3.40,3.60,3.67,3.84,3.87,3.91,3.99,4.10,4.15,4.21,4.44
类似地,如图,可以得到团队B产品收益率的三个四分位数.
由团队B产品收益率的三个四分位数可以知道,其产品收益率小于3.635%的项目数占总数的25%,产品收益率小于3.89%的项目数占总数的一半,产品收益率大于4.125%的项目数占总数的25%.产品收益率在3.635%至4.125%之间的项目数占总数的50%.
3.89
3.635
4.125
第一四分位数 第二四分位数 第三四分位数
①先将数据按照从小到大的顺序进行排列;
②找出这组数据的中位数,作为这组数据的第二四分位数;
③找出中位数左侧和右侧的数据各自的中位数,分别作为这组数据的第一四分位数和第三四分位数.
利用一组数据的三个四分位数,以及最小值、最大值可以刻画这组数据的大致分布情况.
确定一组数据的四分位数的步骤
【练习】有一组数据:3,5,7,9,11,13,15,求这组数据的四分位数.
解:把7个数据按从小到大的顺序排列为:
3,5,7,9,11,13,15
第一四分位数:,
第二四分位数:,
第三四分位数:.
为了更加直观地观察产品收益率的分布特征,我们可以用产品收益率的三个四分位数及最小值、最大值这五个数值画出箱线图.
概念引入:
2 3 4 5 6 7
最小值
最大值
第一四分位数
第二四分位数
第三四分位数
整个箱体的长度为第三四分位数减去第一四分位数的差,称为四分位距. 由箱线图,容易看出产品收益率分布的大致情况,如分布的范围、中位数的大小、集中的范围、分布是否对称等.
它主要由矩形箱体和从箱体延伸出的两条水平线段(称为须线)构成.
矩形箱体
须线
须线
2 3 4 5 6 7 收益率/%
团队A产品收益率的箱线图如下图所示:
第一四分位数 第二四分位数 第三四分位数
2.02,2.15,3.18,3.21,3.64,3.85,3.98,4.10,4.11,4.77,4.89,6.44
3.915
4.44
3.195
类似地,可以画出团队B产品收益率的箱线图,如图所示:
2 3 4 5 6 7 收益率/%
如何直观比较团队A,B产品收益率的分布特征呢?
3.18,3.40,3.60,3.67,3.84,3.87,3.91,3.99,4.10,4.15,4.21,4.44
3.89
3.635
4.125
第一四分位数 第二四分位数 第三四分位数
为了便于比较两个团队产品收益率的分布特征,箱线图也可以按竖直方向画.把两个箱线图按竖直方向并列画在同一幅图中,如右图所示.
收益率/%
7
6
5
4
3
2
1
0
A团队 B团队
从图中可以发现,两个团队产品收益率的中位数几乎相等(表示中位数的水平线段差不多高),但团队A的产品收益率波动明显比团队B的大(团队A的箱体和须线比团队B的长),这与用平均数、方差比较的结果是一致的.
从箱线图中,你还得到什么信息?
例如,团队B的产品收益率分布比团队A的更对称(中位数对应的水平线段在箱子的中间位置),团队A有约25%的产品收益率高于团队B的最高产品收益率,也有约25%的产品收益率低于团队B的最低产品收益率,等等.
收益率/%
7
6
5
4
3
2
1
0
A团队 B团队
从箱线图中,还可以看出分布的一些其他特征.
中位数()在箱子中的位置能反映数据整体分布的偏斜情况.
靠箱体左侧:数据向右(较大值方向)偏斜(正偏).
靠箱体右侧:数据向左(较小值方向)偏斜(负偏).
居中:数据分布较对称.
须线的长短(特别是与箱子长度的对比)能反映两端数据分布的稀疏程度. 最大值、最小值提供了数据的范围(极差).
箱线图的信息解读
【思考】与直方图、条形图比较,箱线图在表示数据方面有什么特点?
箱线图具有以下特点:
①能够清晰地展示数据的分布范围、集中程度,适合分析数据的分布特征;
②适合多组数据对比,箱线图可以轻松地并排绘制多个数据集,便于直观比较不同组数据的分布差异;
③适用于大数据集,箱线图在数据量较大时仍然能够清晰展示数据的分布特征,而不会像直方图或条形图那样显得过于拥挤.
【例】根据下表中的数据,分别计算甲、乙两地气温的四分位数,在同一幅图中画出箱线图,据此比较甲、乙两地的气温特点.
时刻 0:00 2:00 4:00 6:00 8:00 10:00 12:00 14:00 16:00 18:00 20:00 22:00 24:00
甲/℃ 11 9 10 12 16 21 23 24 21 18 16 14 13
乙/℃ 13 11 12 14 15 17 19 21 20 18 17 16 15
利用四分位数和箱线图分析数据
解:将表中两地的气温(单位:℃)分别按从小到大的顺序排列,可得
甲地 9 10 11 12 13 14 16 16 18 21 21 23 24
乙地 11 12 13 14 15 15 16 17 17 18 19 20 21
甲、乙两地气温各有13个数据.甲地气温的最小值为9,最大值为24,三个四分位数分别为
Q2=16,Q1==11.5,Q3==21.
乙地气温的最小值为11,最大值为21,三个四分位数分别为
Q2=16,Q1==13.5,Q3==18.5.
解:将表中两地的气温(单位:℃)分别按从小到大的顺序排列,可得
甲地 9 10 11 12 13 14 16 16 18 21 21 23 24
乙地 11 12 13 14 15 15 16 17 17 18 19 20 21
气温/℃
35
30
25
20
15
10
5
0
甲地 乙地
在同一幅图中画出两地气温的箱线图,如图所示.
可以看出,甲、乙两地气温的中位数相同,但甲地气温的波动明显比乙地的大,甲地约有25%时刻的气温高于乙地的最高温度,约有25%时刻的气温低于乙地的最低温度.
百分位数
四分位数
数据的
四分位数
箱线图
一组数据按从小到大的顺序排列,将数据分成100等份的每一分点处的值叫作这组数据的百分位数
25%分位数,50%分位数,75%分位数
三个四分位数Q1,Q2,Q3及最大值、最小值
1.数据:1,3,4,5,2,6,7,8,9的第一四分位数为_______.
2.5
2.一组数据的箱线图如图.则这组数据的最大值是_____,最小值是_____,上四分位数是____,中位数是_____,下四分位数是_____.
200
80
170
160
120
3.某有一组被墨水污染的数据:4,17,7,14,★,★,★,16,10,4,4,11,其箱线图如图所示.下列说法错误的是( )
A.这组数据的第一四分位数是4
B.这组数据的中位数是10
C.这组数据的第三四分位数是15
D.被墨水污染的数据中一个数是3,一个数是18
B
4.某小组 8 名学生的数学成绩分别为
75,80,85,90,90,95,100,100.
(1) 求这组数据的平均数、中位数、众数;
(2) 计算第三四分位数.
解:(1) 平均数:(75 + 80 + 85 + 90 + 90 + 95 + 100 + 100)÷8 = 89.375;
将数据从小到大排序为 75,80,85,90,90,95,100,100,
中位数为(90 + 90)÷2 = 90;众数是 90 和 100.
(2)8×75% = 6,第三四分位数是第 6 个数和第 7 个数的平均值,即
(95 + 100)÷2 = 97.5 .

展开更多......

收起↑

资源预览