24.4 数据的分组 课件(19张PPT) 2025-2026学年数学人教版八年级下册

资源下载
  1. 二一教育资源

24.4 数据的分组 课件(19张PPT) 2025-2026学年数学人教版八年级下册

资源简介

24.4 数据的分组
“生活中为什么要对这些事物进行分类?分类给我们带来了哪些方便?”
超市饮品摆放、水果区摆放
分类能让事物更有序,方便查找或判断.
一家公司向社会招聘一名员工,所有应聘者先统一参加笔试,然后根据笔试成绩确定一部分应聘者进人面试.将10名应聘者的笔试成绩(百分制)按从小到大的顺序排列如下:
58、64、68、75、76、83、85、89、90、92.
公司要从这10人中选部分人进入面试,该如何确定“成绩好”的标准?你有哪些分组方法?
基于数据自身特点的分组方法——
数据的分组(基于离差 平方和)
问题
观察排序后的成绩间隔:58|64|68|75|76|83|85|89|90|92.
10 个数据有几个间隔?每个间隔能将数据分成几组?
10 个数据有 9 个间隔,每个间隔对应1种“两组分法”(如第1个间隔分“{58}和{64,68,…,92}”,第2个间隔分“{58,64}和{68,…,92}”),共 9 种分法.
组内数据差异最小
活动1:理解“组内差异最小”的需求
之前学过哪种指标能刻画数据的离散程度?
方差
(“方差的基础是‘离差平方和’,它能反映数据与平均数的偏离程度.”)
活动2:学习“离差平方和”的概念与计算
一般地,设有 n 个数据 ????1,????2,????3...???????? ,平均数为 ????,则总离差平方和为:????2=(????1?????)?+(????2?????)?+...+(?????????????)?.
如果把这组数据分为两组,前 m (m<n)个为第一组,后 n-m 个为第二组,第一组平均数为 ????1 ,离差平方和为 ????12;第二组平均数为????2 ,离差平方和为 ????22,则组内离差平方和为 ????12+????22 .
?
组内离差平方和越小,说明两组内部的数据越集中,分组越合理.
活动2:学习“离差平方和”的概念与计算
以招聘成绩的“第5个间隔”(分法:{58,64,68,75,76}和{83,85,89,
90,92})为例,分步计算组内离差平方和:
第一步:计算第一组平均数 ????1=(58+64+68+75+76)÷5=72.2;
?
第二步:计算第一组离差平方和 ????12=(58-72.2)?+(64-72.2)?+(68-72.2)?+(75-72.2)?+(76-72.2)?=228.8;
?
第三步:计算第二组平均数 ????2=(83+85+89+90+92)÷5=87.8;
?
活动2:学习“离差平方和”的概念与计算
第四步:计算第二组离差平方和 ????22=(83-87.8)?+(85-87.8)?+
(89-87.8)?+(90-87.8)?+(92-87.8)?=54.8;
?
第五步:组内离差平方和 ????12+????22=228.8+54.8=283.6.
?
活动2:学习“离差平方和”的概念与计算
1.分组任务:将数据分为9组,每组计算1种间隔的组内离差平方和.
观察汇总结果,得出什么结论?
活动3:验证“组内离差平方和最小”的分法
“第5个间隔”的组内离差平方和(283.6)最小,因此最优分法为{58,64,68,75,76}(不进面试)和{83,85,89,90,92}(进面试).
2.结论:
3.数据分组的步骤:
(1)将数据按从小到大排序;
(2)确定所有可能的间隔(n个数据有n-1个间隔,对应n-1种两组分法);
(3)计算每种分法的两组平均数及组内离差平方和;
(4)选择组内离差平方和最小的分法作为最优分组.
活动3:验证“组内离差平方和最小”的分法
1.数据分组的意义:让复杂数据更有序,帮助解决实际问题(如招聘筛选、成绩分类).
2.核心方法:基于“组内离差平方和最小”原则分组,步骤为“排序→找间隔→算离差平方和→选最小”.
归纳
例1 学校运动会上,5 名学生的跳远成绩(单位:米)分别是 4.2、4.5、4.8、5.2、5.5,体育老师要按照组内离差平方和最小的原则将学生成绩分为两组,用于后续训练安排,求分组方案.
解:把这5个数据分为两组,共有4种情况:
分为{4.2}和{4.5,4.8,5.2,5.5}时,组内离差平方和=0.58;
分为{4.2,4.5}和{4.8,5.2,5.5}时,组内离差平方和≈0.292;
分为{4.2,4.5,4.8}和{5.2,5.5}时,组内离差平方和=0.225;
解:分为{4.2,4.5,4.8,5.2}和{5.5}时,组内离差平方和=0.5475;
通过比较每组的组内离差平方和,可知应当分为{4.2,4.5,4.8}和{5.2,5.5}两组.
例1 学校运动会上,5 名学生的跳远成绩(单位:米)分别是 4.2、4.5、4.8、5.2、5.5,体育老师要按照组内离差平方和最小的原则将学生成绩分为两组,用于后续训练安排,求分组方案.
例2 某公司9个月份的销售额(单位:万元)分别为20、25、30、35、40、45、50、55、60,按组内离差平方和最小的原则将数据分为两组,应该怎样分组?
解:关键分割点计算:
分为(20, 25,30, 35)和(40,45, 50, 55,60)时,组内离差平方和=375;分为(20, 25,30, 35,40)和(45, 50, 55,60)时,组内离差平方和=375.
其他分割点计算略.
当离差平方和=375时,最小,应分为{20, 25,30, 35, 40}和{45, 50, 55,60},或(20, 25,30, 35)和(40,45, 50, 55,60).
例3 某机床加工标准直径为 100 mm 的零件,为检验质量,从中抽取加工的 12 件零件测量其直径,所得数据如下:96,98,99,99,100,100,101,102,102,103,103,105.
(1)按照“组内离差平方和最小”的原则,将这 12 个数据平均分成 3 组,请计算这 3 组数据的组内离差平方和.
(2)由(1)所得结果,判断哪组加工的零件的差异较小.
解:(1)将这 12 个数据按照从小到大的顺序排列后分成 3 组如下:
第一组:96,98,99,99;
第二组:100,100,101,102;
第三组:102,103,103,105.
第一组数据的平均数为(96+98+99+99)=98,
第一组数据的组内离差平方和为(96-98)?+(98-98)?+(99-98)?+(99-98)?=6.
解:(1)第二组数据的平均数为(100+100+101+102)=100.75,
第二组数据的组内离差平方和为(100-100.75)?+(100 -100.75)? + (101-100.75)? + (102-100.75)?=2.75.
第三组数据的平均数为(102+103+103+105)=103.25,
第三组数据的组内离差平方和为(102-103.25)?+(103-103.25)?+(103-103.25)?+(105-103.25)?=4.75.
所以这3组数据的组内离差平方和为 6+2.75+4.75=13.5.
解:(2)由(1)知,第二组的组内离差平方和最小,所以第二组零件的差异较小.
(2)由(1)所得结果,判断哪组加工的零件的差异较小.
数据的分组
离差平方和
组内离差平方和
组间离差平方和
计算公式
应用

展开更多......

收起↑

资源预览