20.5 数据分组 课件(共20张PPT)2025-2026学年沪科版八年级数学下册

资源下载
  1. 二一教育资源

20.5 数据分组 课件(共20张PPT)2025-2026学年沪科版八年级数学下册

资源简介

(共20张PPT)
第20章 数据的初步分析
20.5 数据分组
1.什么叫离差平方和?
2.假设你们是学校食堂的管理员,需要将苹果按大小分装到两个箱子中,以便给不同年级的学生.现有10 个苹果,直径(单位:mm)分别为:65,69,70,75,76,76,78,80,80,83.如何分组才最合理?
导入新课
2022年,我国数据产量全球占比达10.5%,截至2022年底,我国数据存储量全球占比达14.4%.在海量数据背景下,需要进行大数据分析,数据分组是基本且重要的方法之一.数据分组是根据研究目的和客观现象的内在特点,按照某种标准把数据划分为若干个不同的组,使组内的差异尽可能小,组间的差异尽可能大.分组分析法是在分组的基础上,将不同性质的现象分开,相同性质的现象归纳在一起,从而反映被研究对象的本质、差异和特征.数据分组的方法有很多,使“组内离差平方和最小”的方法是最常用的方法之一.
导入新课
任务一:数据分组
问题:我国10 个省份某年人均地区生产总值(简称人均GDP,单位:万元)的数据如下表所示:
从表中的数据可以看出,这10 个省份的人均GDP是有区别的,如果要把这10 个省份依据人均GDP的多少分为两组,并保证人均GDP相差不多的省份在一个组,应该如何划分?
高效课堂
按照“组内离差平方和最小”的方法,就能保证人均GDP相差不多的省份在一个组.那怎样能做到组内离差平方和最小?
一般地,假设有n个数据x1,x2,x3,…,xn,将其分成两组,其中前m个数据为一组(称为第一组),后(n-m)个数据为一组(称为第二组).
高效课堂
高效课堂
对数据的分组有两步,第一步是排序,第二步是确定组数和各组内数据的个数.我们只讨论分两组的情形,如果一共有n个数据,要把较小的m 个数据分为一组,把剩下的(n-m)个数据分为另一组.我们通过“组内离差平方和最小”的原则来确定m 的大小.上面的分析告诉我们,这样分组后,组内的差距可以达到最小,而组与组之间的差异可以达到最大.因此,我们通过计算和比较组内离差平方和,就可以将这10个省份分成两组,并保证人均GDP相差不多的省份在一个组.
高效课堂
利用电子表格软件的计算过程:
(1)在电子表格软件中输入省份代号和人均GDP的数据,并对数据按照人均GDP从小到大进行排序;
为什么要对数据先从小到大进行排序?
便于计算离差平方和,使能分到一组的数据差距更小.
高效课堂
(2)将排序后的人均GDP的数据根据每组个数进行分组,通过“公式”—“插入函数”—选择类别“统计”—“DEVSQ”函数,分别计算每组的离差平方和.
高效课堂
(3)利用“SUM”函数求出组内离差平方和,如下表所示:
高效课堂
(4)比较组内离差平方和的大小,找到组内离差平方和的最小值和对应的分组,得到这10 个省份依据人均GDP的两组划分,即“第一组7 个数,第二组3 个数”———省份划分为{省份2,省份10,省份4,省份7,省份9,省份8,省份3}和{省份6,省份1,省份5}.
这样分组后,组内的差距尽可能小,而组与组之间的差异明显.在社会经济统计研究中,数据分组的作用在于划分现象的类型、研究总体的结构与现象之间的依存关系.
高效课堂
思考:10 个省份依据人均GDP是不分组合适,还是分两组合适,抑或分三组更合适?
对于10 个省份依据人均GDP进行分组,建议分三组更合适.因为各省份受地理位置等因素影响,人均GDP差异较明显,高收入、中等收入、低收入水平突出.所以,分三组更合适.
高效课堂
任务二:知识应用
现有10 个苹果,直径(单位:mm)分别为:65,69,70,75,76,76,78,80,80,83.
将10 个苹果的直径按从小到大的顺序进行排列,按照“组内离差平方和最小”的原则将数据分为两组,分别计算各组数据的离差平方和,并填写表格.
高效课堂
高效课堂
计算结果表明,按“第一组3 个数,第二组7 个数”分组的组内离差平方和最小.即10 个苹果按直径大小分成的两组是{65,69,70},{75,76,76,78,80,80,83}.
高效课堂
课堂评价
B
课堂评价
4
课堂评价
1.本节课主要学习了哪些知识?
2.本节课还有哪些疑惑? 说一说!
课堂总结
基础性作业:教材练习第1,2题.
提高性作业:教材习题20.5第1题.
作业设计

展开更多......

收起↑

资源预览