24.4 数据的分组-课件(共22张PPT)--2025-2026学年人教版数学八年级下册(新教材)

资源下载
  1. 二一教育资源

24.4 数据的分组-课件(共22张PPT)--2025-2026学年人教版数学八年级下册(新教材)

资源简介

(共22张PPT)
人教版数学8年级下册培优精做课件24.4数据的分组第二十四章数据的分析授课教师:Home .班级:八年级(---)班.时间:.问题 一家公司向社会招聘一名员工,所有应聘者先统一参加笔试,然后根据笔试成绩确定一部分应聘者进入面试.将10名应聘者的笔试成绩(百分制)按从小到大的顺序排列如下:
58 64 68 75 76 83 85 89 90 92
你认为哪一部分应聘者应当进入面试?
探究新知
知识点
数据的合理分组原则——组内离差平方和最小
选择笔试成绩好的进入面试,那么怎样才算好呢?标准是什么呢?
例如,前三名或85分及以上为好成绩,其余为不太好的成绩.
探究新知
但是83分和85分的差距很小,若以“85分及以上”为好成绩的标准,则85分属于好成绩,而83分属于不太好的成绩.
这么看,有些标准没有考虑数据自身的特点.从公司确定面试应聘者的角度看,把笔试成绩相对接近的分到同一组,是一种较合理的做法.
因此,笔试成绩可以根据组内差异最小的原则进行分组.
要使分组后的组内差异最小,将笔试成绩按从小到大的顺序排列,使相互最接近的笔试成绩挨在一起,然后进行分组,可以发现,10个笔试成绩按顺序排列形成了9个间隔,如下.
每个间隔都可以把笔试成绩分成好和差两组,共有9种分法.
探究新知
58 64 68 75 76 83 85 89 90 92
怎么刻画组内笔试成绩差异的大小呢?哪种分法能使笔试成绩好和差两组的组内差异最小?
利用离差平方和刻画组内数据的离散程度,进而对数据进行分组
返回
1.
在跳绳测试中,某小组5位成员每分钟跳绳次数如下:175,176,175,175,180,若根据每分钟跳绳次数的组内离差平方和最小的原则将这5位成员分成两组,则需将数据由________到______排列,共分成________种情况.


4
返回
2.
D
小明将一组数据分成了两组{78,80}和{84,85,85,86},则第一组离差平方和与第二组离差平方和分别为(  )
A.2,3
B.3,2
C.3,4
D.2,2
一般地,设有一般地,设有n个数据x1,x2,…,xn,假设这些数据都不相等,其平均数记为 x,则离差平方和为=(x1- x)2+(x2- x)2+…+(xn- x)2.
如果把这组数据分为两组,前m(m<n)个数据为一组(称为第一组),后(n-m)个数据为一组(称为第二组),那么这n个数据的离差平方和可以分解为两类离差平方和:一类反映两个组内数据的离散程度,另一类反映两组数据之间的差异程度.
它们的平均数分别记为 x1和 x2,离差平方和分别为
=(x1- x1)2+(x2- x1)2+…+(xm- x1)2,
=(xm+1- x2)2+(xm+2- x2)2+…+(xn- x2)2.
探究新知
=(x1- x)2+(x2- x)2+…+(xn- x)2
=(x1- x)2+(x2- x)2+…+(xm- x)2+(xm+1- x)2+
(xm+2- x)2+…+(xn- x)2
=(x1- x1+ x1 - x )2+(x2- x1 + x1 - x )2+…+
(xm- x1 + x1 - x )2+(xm+1- x2 + x2 - x )2+(xm+2- x2 +
x2 - x )2+…+(xn- x2 + x2 - x )2
=(x1- x1)2+(x2- x1)2+…+(xm- x1)2+(xm+1- x2)2+
(xm+2- x2)2+…+(xn- x2)2
= + + m(x1- x)2+(n-m)(x2- x)2.
探究新知
其中 + 称为组内离差平方和,表示两个组内数据的离散程度;记=m(x1- x)2+(n-m)(x2- x)2,称为组间离差平方和,表示两个组间的差异.
一个合理的分组原则是使组内离差平方和达到最小,组间离差平方和达到最大.由于总体离差平方和 d2不变,只需考虑使组内离差平方和达到最小即可.
探究新知
根据组内离差平方和最小的原则,能使笔试成绩相差较小的应聘者分在同一组,计算这9种分法的组内离差平方和(结果保留小数点后一位).
分析:第一组1个、第二组9个数据,计算组内离差平方和;
第一组2个、第二组8个数据,计算组内离差平方和;
……
如下表所示.
探究新知
58 64 68 75 76 83 85 89 90 92
探究新知
分组 第一组离差平方和 第二组离差平方和 组内离差平方和
第1个间隔
第2个间隔
第3个间隔
第4个间隔
第5个间隔
第6个间隔
第7个间隔
第8个间隔
第9个间隔
0
18
50.7
152.8
228.8
411.3
587.4
819.5
1026.2
799.6
503.5
271.4
170.8
54.8
26
4.7
2
0
799.6
521.5
322.1
323.6
283.6
437.3
592.1
821.5
1 026.2
可以发现,当按第5个间隔分组时,组内离差平方和最小.
因此,分法为{58,64,68,75,76}和{83,85,89,90,92}.
3.
C
某校开展了以“书香校园”为主题的读书活动.八(1)班班长统计了该班其中一个小组的5名学生一学期课外图书的阅读量(单位:本),分别为5,6,10,14,20.现要依据阅读量把这5名学生分成两组,班长给出了四种分组方式(如下表),并计算出了不同分组方式的组内离差平方和(保留两位小数),你认为其中分组最合理的方式是(  )
A.第一种 B.第二种 C.第三种 D.第四种
分组情况 组内离差
平方和
第一种 第一组1个{5},第二组4个{6,10,14,20} 107.00
第二种 第一组2个{5,6},第二组3个{10,14,20} 51.17
第三种 第一组3个{5,6,10},第二组2个{14,20} 32.00
第四种 第一组4个{5,6,10,14},第二组1个{20} 50.75
返回
根据平均高温的组内离差平方和最小的原则,把这10个城市分为两组.
探究新知
考点
利用组内离差平方和最小原则对数据分组
城市 北京 石家庄 呼和浩特 哈尔滨 上海 广州 海口 成都 贵阳 昆明
平均高温/℃ 11 9 10 12 16 21 23 24 21 18
例 10个城市某月的每日最高温度的平均数(简称平均高温)如下表所示.
解:将表中的数据按从小到大排列,可得
-11 -3 3 3 9 10 12 17 21 22
将它们分成两组共有9种情况,分别计算组内离差平方和(结果保留小数点后一位),如下表所示.
探究新知
分组 第一组离差平方和 第二组离差平方和 组内离差平方和
第1个间隔
第2个间隔
第3个间隔
第4个间隔
第5个间隔
第6个间隔
第7个间隔
第8个间隔
第9个间隔
0
32
98.7
132
228.8
308.8
397.4
562
789.6
584.2
380.9
285.7
158.8
113.2
62
14
0.5
0
584.2
412.9
384.4
290.8
342
370.8
411.4
562.5
789.6
观察最后一列组内离差平方和可以发现,当按第4个间隔分组时,组内离差平方和最小.
探究新知
因此,按组内离差平方和最小的分法为{北京,石家庄,呼和浩特,哈尔滨}和{上海,广州,海口,成都,贵阳,昆明}.
结合地理课所学知识,说一说这样分组合理吗?
合理.这样分组大致沿秦岭淮河一线分为南北方.
4.
5
某环保组织开发了一个AI模型,用于识别不同树种的年龄(单位:年).现已收集6种树木的年龄数据,并由小到大排序:5,7,12,15,19,35.按照年龄的组内离差平方和最小的原则,将树木分成幼树组和成树组两组.
(1)共有________种分组方式;
(2)补全下表(保留整数):
(3)第______个间隔得到的组内离差平方和最小,因此幼树组为__________________,成树组为______.
分组 第一组离差平方和 第二组离差平方和 组内离差平方和
第1个间隔 455
第2个间隔 315
第3个间隔 26 224 250
第4个间隔
第5个间隔 131
0
455
2
317
63
128
191
0
131
5
{5,7,12,15,19}
{35}
返回
返回
5.
如图记录了某地连续5天的日最低气温,若把这5天的最低气温按组间离差平方和最大的原则分成两组,则这两组是__________________和_________________________.
{星期一,星期二}
{星期三,星期四,星期五}
6.
解:将这5个数据从小到大排序:65,69,70,80,81.
计算组内离差平方和(保留一位小数):
(4分)5个苹果的直径(单位:mm)分别为65,69,81,80,70,按照“组内离差平方和最小”的原则,把这5个苹果按直径大小分成三组.
分组情况 组内离差平方和
第一组1个,第二组1个,第三组3个 74.0
第一组1个,第二组2个,第三组2个 1.0
第一组1个,第二组3个,第三组1个 74.0
第一组2个,第二组1个,第三组2个 8.5
第一组2个,第二组2个,第三组1个 58.0
第一组3个,第二组1个,第三组1个 14.0
第2种情况的组内离差平方和最小,因此把这5个苹果按直径大小分成三组是{65},{69,70}和{80,81}.
返回
课堂小结
数据的分组
离差平方和: = + + m(x1- x)2+(n-m)(x2- x)2
组内离差平方和最小原则: 组内数据越集中,组间差异越清楚,分组才有意义

展开更多......

收起↑

资源预览