24.4 数据的分组 课件 (共26张PPT) 2025-2026学年人教版数学八年级下册

资源下载
  1. 二一教育资源

24.4 数据的分组 课件 (共26张PPT) 2025-2026学年人教版数学八年级下册

资源简介

(共26张PPT)
数据的分析
数据的分组
01
02
03
经历数据分组的活动,了解组内离差平方和与组间离差平方和的概念.
能够按照组内离差平方和最小的分组原则对数据进行分组.
借助数据的分组原则解决实际问题.
在社会生活中,分类现象普遍存在.
超市里各种商品按用途不同分类摆放
宾馆根据硬件设施、服务水平分成不同的星级
对于一组取值多样的数据,对其进行合理分组,也会有助于我们解决问题.
探索新知
问题 一家公司向社会招聘一名员工,所有应聘者先统一参加笔试,然后根据笔试成绩确定一部分应聘者进入面试. 将 10 名应聘者的笔试成绩(百分制)按从小到大的顺序排列如下:
58 64 68 75 76 83 85 89 90 92
你认为哪一部分应聘者应当进入面试?
你怎么理解这句话?
把笔试成绩分成好和差两组.


进入面试
淘汰
58 64 68 75 76 83 85 89 90 92
上面的问题可以理解为把这10名应聘者的笔试成绩分成好和差两组,则共有____种分组方法.
9
那如果要使每组组内的数据差距不大,且组与组之间的数据差别明显,那么你认为应遵循怎样的分组原则?
在前面的学习中,我们学习了离差平方和,了解到 d2 可以刻画一组数据的离散程度,结合上面的问题,你有什么想法?
概念引入:
( x1- x )2 + ( x2- x )2 + … + ( xn- x )2
d2 =
一般地,设有 n 个数据 x1,x2,…,xn,其平均数记为 x,则离差平方和为
如果把这组数据分为两组,前 m(m < n)个数据为一组,后(n-m)个数据为一组.
它们的离差平方和分别为


m 个数据
(n-m) 个数据
平均数:x1
平均数:x2
( x1- x1 )2 + ( x2- x1 )2 + … + ( xm- x1 )2
d12 =
( xm+1- x2 )2 + ( xm+2- x2 )2 + … + ( xn- x2 )2
d22 =
那么
( x1- x )2 + ( x2- x )2 + … + ( xn- x )2
d 2 =
= ( x1-x1 + x1- x )2 + ( x2-x1 + x1- x )2 +…+ (xm-x1 + x1-x )2
+ (xm+1-x2 + x2-x )2 + … + ( xn-x2 + x2- x )2
用完全平方公式展开:(a + b)2 = a2 + 2ab + b2
( x1-x1 )2 + 2( x1-x1 )( x1- x ) + ( x1- x )2
( x2-x1 )2 + 2( x2-x1 )( x1- x ) + ( x1- x )2
( xm-x1)2 + 2( xm-x1 )( x1- x ) + ( x1- x )2
我们先只观察 2 倍项,你有什么发现?
那么
( x1- x )2 + ( x2- x )2 + … + ( xn- x )2
d 2 =
= ( x1-x1 + x1- x )2 + ( x2-x1 + x1- x )2 +…+ (xm-x1 + x1-x )2
+ (xm+1-x2 + x2-x )2 + … + ( xn-x2 + x2- x )2
前 m 个数据 2 倍项的和为
2( x1 + x2 + … + xm-mx1 )( x1- x )
由平均数的意义:x1 + x2 + … + xm = mx1
= 0
同理,后面 (n-m) 个数据的 2 倍项的和也为 0.
所有 2 倍项的和为 0 ,计算时就不必考虑了.
那么
( x1- x )2 + ( x2- x )2 + … + ( xn- x )2
d 2 =
= ( x1-x1 + x1- x )2 + ( x2-x1 + x1- x )2 +…+ (xm-x1 + x1-x )2
+ (xm+1-x2 + x2-x )2 + … + ( xn-x2 + x2- x )2
= ( x1-x1 )2 + ( x2-x1 )2 +…+ (xm-x1 )2 + (xm+1-x2 )2 + … +
( xn-x2 )2 + m( x1-x )2 + (n-m)( x2-x )2
= d12 + d22 + m( x1-x )2 + (n-m)( x2-x )2
d12 + d22 称为组内离差平方和,表示两个组内数据的离散程度.
记为
称为组间离差平方和,表示两个组间的差异.
当分组结果满足组内差异最小的情况时,d12 + d22 与 满足什么条件?
d 2 = d12 + d22 +
这组数据的离差平方和,固定不变.
最小
最大
既可以按d12 + d22 最小
来分组,也可以按 最大来分组
将下列表格补充完整,找出最合适的分组方法.
分组
第 1 个间隔
第 2 个间隔
第 3 个间隔
第 4 个间隔
第 5 个间隔
第 6 个间隔
第 7 个间隔
第 8 个间隔
第 9 个间隔
d12
d12 + d22
d22
x1
x2
58
80.2
0
799.6
799.6
61
82.25
18
503.5
521.5
63.3
84.3
50.7
271.4
322.1
66.25
85.8
152.8
170.8
323.6
68.2
87.8
228.8
54.8
283.6
70.7
89
411.3
26
437.3
72.7
90.3
587.4
4.7
592.1
74.75
91
819.5
2
821.5
76.4
92
1026.2
0
1026.2
最小
58 64 68 75 76 83 85 89 90 92
分组
第 1 个间隔
第 2 个间隔
第 3 个间隔
第 4 个间隔
第 5 个间隔
第 6 个间隔
第 7 个间隔
第 8 个间隔
第 9 个间隔
d12
d12 + d22
d22
x1
x2
58
80.2
0
799.6
799.6
61
82.25
18
503.5
521.5
63.3
84.3
50.7
271.4
322.1
66.25
85.8
152.8
170.8
323.6
68.2
87.8
228.8
54.8
283.6
70.7
89
411.3
26
437.3
72.7
90.3
587.4
4.7
592.1
74.75
91
819.5
2
821.5
76.4
92
1026.2
0
1026.2
最小
当按第5个间隔分组时,组内离差平方和最小.
因此,按组内离差平方和最小的分法为
{58,64,68,75,76}和{83,85,89,90,92}
( x1- x1 )2 + ( x2- x1 )2 + … + ( xm- x1 )2
d12 =
( xm+1- x2 )2 + ( xm+2- x2 )2 + … + ( xn- x2 )2
d22 =
有一组数据: 5,6,8,9,10,按照“组内离差平方和最小”原则将这组数据分成两组,下列选项正确的是( )
A. {5} 和 {6,8,9,10}     B. {5,6} 和 {8,9,10}
C. {5,6,8} 和 {9,10}
D. {5,6,8,9} 和 {10}
= 0, = 8.75, = 8.75
= 0.5, = 2, = 2.5
= 4.67, = 0.5, = 5.17
= 10, = 0, = 10
B
有一组数据: 5,6,8,9,10,按照“组内离差平方和最小”原则将这组数据分成两组,下列选项正确的是( )
= m ( x1- x )2 + (n-m )( x2- x )2
最大
= (5-7.6)2 + 4(8.25- 7.6 )2 = 8.45
= 2(5.5- 7.6 )2 + 3(9-7.6)2 = 14.7
= 3(6.33- 7.6 )2 + 2(9.5-7.6)2 ≈ 12.06
= 4(7- 7.6 )2 + (10-7.6)2 = 7.2
A. {5} 和 {6,8,9,10}     B. {5,6} 和 {8,9,10}
C. {5,6,8} 和 {9,10}
D. {5,6,8,9} 和 {10}
B
例 10 个城市某月的每日最高温度的平均数(简称平均高温)如表所示.
城市 北京 石家庄 呼和浩特 哈尔滨 上海 广州 海口 成都 贵阳 昆明
平均高温/℃ 3 3 -3 -11 10 21 22 12 9 17
(1)根据平均高温的组内离差平方和最小的原则,把这 10 个城市分为两组.
解: 将表中的数据按从小到大排列,可得
-11 -3 3 3 9 10 12 17 21 22
城市 北京 石家庄 呼和浩特 哈尔滨 上海 广州 海口 成都 贵阳 昆明
平均高温/℃ 3 3 -3 -11 10 21 22 12 9 17
将它们分成两组共有9种情况,利用计算器或信息技术工具,分别计算组内离差平方和(结果保留小数点后一位),如下表所示.
分组 第一组 离差平方和 第二组 离差平方和 组内
离差平方和
第1个间隔 0 584.2 584.2
第2个间隔 32 380.9 412.9
第3个间隔 98.7 285.7 384.4
第4个间隔 132 158.8 290.8
第5个间隔 228.8 113.2 342
第6个间隔 308.8 62 370.8
第7个间隔 397.4 14 411.4
第8个间隔 562 0.5 562.5
第9个间隔 789.6 0 789.6
最小
因此,按组内离差平方和最小的分法为
{北京,石家庄,呼和浩特,哈尔滨} 和 {上海,广州,海口,成都,贵阳,昆明}.
城市 北京 石家庄 呼和浩特 哈尔滨 上海 广州 海口 成都 贵阳 昆明
平均高温/℃ 3 3 -3 -11 10 21 22 12 9 17
城市 北京 石家庄 呼和浩特 哈尔滨 上海 广州 海口 成都 贵阳 昆明
平均高温/℃ 3 3 -3 -11 10 21 22 12 9 17
(2)根据平均高温的组间离差平方和最大原则,把这 10 个城市分为两组.所得分组结果与(1)中结果一致吗?
分别计算各组数据的平均数和组间离差平方和,如表所示:
分组 组间离差平方和
第1个间隔 -11 10.44 413.9
第2个间隔 -7 12.125 585.2
第3个间隔 -3.67 13.43 613.7
第4个间隔 -2 15.17 707.3
第5个间隔 0.2 16.4 656.1
第6个间隔 1.83 18 627.3
第7个间隔 3.29 20 586.7
第8个间隔 5 21.5 435.6
第9个间隔 6.78 22 208.5
最大
所得分组结果与(1)中结果一致.
(3)结合地理课所学知识,说一说这样分组合理吗?
合理.因为第一组中的城市位于我国北方地区,普遍气温偏低,第二组中的城市位于我国南方,温度较高.
{北京,石家庄,呼和浩特,哈尔滨}
{上海,广州,海口,成都,贵阳,昆明}.
某年 5 个城市的人均生活用电量如下表所示.
【选自教材第185页 练习 第2题】
根据人均生活用电量的组内离差平方和最小的原则,把这 5 个城市分为两组.
城市 A B C D E
人均生活用电量/(kW·h) 910 886 847 812 788
解:将表中的数据按从小到大排列,可得788,812,847,886,910. 将它们分成两组共有 4 种情况:
分组 第一组 离差平方和 第二组 离差平方和 组内
离差平方和
第1个间隔 0 5592.75 5592.75
第2个间隔 288 2022 2310
第3个间隔 1760.67 288 2048.67
第4个间隔 5470.75 0 5470.75
所以按照第3个间隔分组时,组内离差平方和最小.分组情况为{C,D,E}和{A,B}.
什么是组内离差平方和?什么是组间离差平方和?对一组数据进行分组时,应遵循什么原则?
数据的分组
离差平方和
组内离差平方和
组内离差平方和最小
组间离差平方和
分组原则
组间离差平方和最大
完成本课对应课时作业.

展开更多......

收起↑

资源预览