24.4 数据的分组 课件(24页) 2025-2026学年人教版(新教材)初中数学八年级下册

资源下载
  1. 二一教育资源

24.4 数据的分组 课件(24页) 2025-2026学年人教版(新教材)初中数学八年级下册

资源简介

(共24张PPT)
24.4 数据的分组
1.经历数据分组的活动,了解组内离差平方和与组间离差平方和的概念.
2.能够按照组内离差平方和最小的分组原则对数据进行分组,解决实际问题.
为增强身体素质,学校组织同学们在课间进行跳绳,6名同学的训练成绩(每分钟的跳绳次数)按从小到大的顺序排列如下:
162,165,169,172,173,176
为高效提升这6名同学的成绩,体育老师想根据成绩的高低把这些同学分成两组,你能提出合理的建议吗?
第一组 第二组
162 165,169,172,173,176
162,165 169,172,173,176
162,165,169 172,173,176
162,165,169,172 173,176
162,165,169,172,173 176
想一想:把哪些同学分到一组才能体现老师的要求呢?
问题 一家公司向社会招聘一名员工,所有应聘者先统一参加笔试,然后根据笔试成绩确定一部分应聘者进入面试. 将 10 名应聘者的笔试成绩(百分制)按从小到大的顺序排列如下:
58 64 68 75 76 83 85 89 90 92
你认为哪一部分应聘者应当进入面试?
上面的问题可以理解为把这10名应聘者的笔试成绩分成好和差两组,则共有____种分组方法.
9
在前面的学习中,我们知道,离差平方和可以刻画一组数据的离散程度. 下面我们利用离差平方和刻画组内数据的离散程度,进而对数据进行分组.
思考1:怎么刻画组内笔试成绩差异的大小呢?哪种分法能使笔试成绩好和差两组的组内差异最小?
思考2:在前面的学习中,我们学习了离差平方和,了解到可以刻画一组数据的离散程度,结合上面的问题,你有什么想法?
一般地,设有 n 个数据 x1,x2,…,xn,其平均数记为 x,则离差平方和为
=(x1- x)2+(x2- x)2+…+(xn- x)2
如果把这组数据分为两组,前 m(m < n)个数据为一组,后(n-m)个数据为一组. 那么这n个数据的离差平方和可以分解为两类离差平方和:
它们的平均数分别记为 x1和 x2,离差平方和分别为
一类反映两个组内数据的离散程度
另一类反映两组数据之间的差异程度
=(x1- x1)2 +(x2- x1)2+…+(xm- x1)2
=(xm+1- x2)2+(xm+2- x2)2+…+(xn- x2)2
=(x1- x)2+(x2- x)2+…+(xn- x)2
那么
=(x1- x1+ x1 - x )2+(x2- x1 + x1 - x )2 +…+(xm- x1 + x1 - x )2+
(xm+1- x2 + x2 - x )2+(xm+2- x2 + x2 - x )2+…+(xn- x2 + x2 - x )2
用完全平方公式展开:(a + b)2 = a2 + 2ab + b2
我们先只观察 2 倍项,你有什么发现?
所有 2 倍项的和为 0 ,计算时就不必考虑了.
=(x1- x1)2+(x2- x1)2+…+(xm- x1)2+(xm+1- x2)2+(xm+2- x2)2+…+(xn- x2)2
= + + m(x1- x)2+(n-m)(x2- x)2.
d12 + d22 称为组内离差平方和,表示两个组内数据的离散程度.
记为
称为组间离差平方和,表示两个组间的差异.
=(x1- x)2+(x2- x)2+…+(xn- x)2
那么
=(x1- x1+ x1 - x )2+(x2- x1 + x1 - x )2 +…+(xm- x1 + x1 - x )2+
(xm+1- x2 + x2 - x )2+(xm+2- x2 + x2 - x )2+…+(xn- x2 + x2 - x )2
思考3:当分组结果满足组内差异最小的情况时,d12 + d22 与 满足什么条件?
d 2 = d12 + d22 +
这组数据的离差平方和,固定不变.
最小
最大
既可以按d12 + d22 最小来分组,也可以按 最大来分组
将下列表格补充完整,找出最合适的分组方法.
58 64 68 75 76 83 85 89 90 92
分组
第 1 个间隔
第 2 个间隔
第 3 个间隔
第 4 个间隔
第 5 个间隔
第 6 个间隔
第 7 个间隔
第 8 个间隔
第 9 个间隔
d12
d12 + d22
d22
x1
x2
58
80.2
0
799.6
799.6
61
82.25
18
503.5
521.5
63.3
84.3
50.7
271.4
322.1
66.25
85.8
152.8
170.8
323.6
68.2
87.8
228.8
54.8
283.6
70.7
89
411.3
26
437.3
72.7
90.3
587.4
4.7
592.1
74.75
91
819.5
2
821.5
76.4
92
1026.2
0
1026.2
最小
当按第5个间隔分组时,组内离差平方和最小.
因此,按组内离差平方和最小的分法为
{58,64,68,75,76}和{83,85,89,90,92}
有一组数据: 5,6,8,9,10,按照“组内离差平方和最小”原则将这组数据分成两组,下列选项正确的是( )
A. {5} 和 {6,8,9,10}     B. {5,6} 和 {8,9,10}
C. {5,6,8} 和 {9,10}
D. {5,6,8,9} 和 {10}
= 0, = 8.75, = 8.75
= 0.5, = 2, = 2.5
= 4.67, = 0.5, = 5.17
= 10, = 0, = 10
B
例 10 个城市某月的每日最高温度的平均数(简称平均高温)如表所示.
城市 北京 石家庄 呼和浩特 哈尔滨 上海 广州 海口 成都 贵阳 昆明
平均高温/℃ 3 3 -3 -11 10 21 22 12 9 17
(1)根据平均高温的组内离差平方和最小的原则,把这 10 个城市分为两组.
解:将表中的数据按从小到大排列,可得
-11 -3 3 3 9 10 12 17 21 22
将它们分成两组共有9种情况,利用计算器或信息技术工具,分别计算组内离差平方和(结果保留小数点后一位),如下表所示.
分组 第一组 离差平方和 第二组 离差平方和 组内
离差平方和
第1个间隔 0 584.2 584.2
第2个间隔 32 380.9 412.9
第3个间隔 98.7 285.7 384.4
第4个间隔 132 158.8 290.8
第5个间隔 228.8 113.2 342
第6个间隔 308.8 62 370.8
第7个间隔 397.4 14 411.4
第8个间隔 562 0.5 562.5
第9个间隔 789.6 0 789.6
最小
因此,按组内离差平方和最小的分法为
{北京,石家庄,呼和浩特,哈尔滨}
和 {上海,广州,海口,成都,贵阳,昆明}
城市 北京 石家庄 呼和浩特 哈尔滨 上海 广州 海口 成都 贵阳 昆明
平均高温/℃ 3 3 -3 -11 10 21 22 12 9 17
(2)根据平均高温的组间离差平方和最大原则,把这 10 个城市分为两组.所得分组结果与(1)中结果一致吗?
分别计算各组数据的平均数和组间离差平方和,如表所示:
分组 组间离差平方和
第1个间隔 -11 10.44 413.9
第2个间隔 -7 12.125 585.2
第3个间隔 -3.67 13.43 613.7
第4个间隔 -2 15.17 707.3
第5个间隔 0.2 16.4 656.1
第6个间隔 1.83 18 627.3
第7个间隔 3.29 20 586.7
第8个间隔 5 21.5 435.6
第9个间隔 6.78 22 208.5
最大
所得分组结果与(1)中结果一致.
(3)结合地理课所学知识,说一说这样分组合理吗?
合理.
因为第一组中的城市位于我国北方地区,普遍气温偏低,第二组中的城市位于我国南方,温度较高.
{北京,石家庄,呼和浩特,哈尔滨}
和 {上海,广州,海口,成都,贵阳,昆明}
什么是组内离差平方和?什么是组间离差平方和?对一组数据进行分组时,应遵循什么原则?
数据的分组
离差平方和
组内离差平方和
组内离差平方和最小
组间离差平方和
分组原则
组间离差平方和最大
1.小明将一组数据分成了两组{78,80}和{84,85,85,86},则第一组离差平方和与第二组离差平方和分别为(   )
A.2,3 B.3,2
C.3,4 D.2,2
D
2.如图记录了某地连续5天的日最低气温,若把这5天的最低气温按组间离差平方和最大的原则分成两组,则这两组是__________________和_________________________.
{星期一,星期二}
{星期三,星期四,星期五}
解:方式1:第一组[75,80,85](3人),第二组[90,95,100,105](4人).
第一组均值1=(75+80+85)÷3=80,
=(75-80)2+(80-80)2+(85-80)2=25+0+25=50.
第二组均值2=(90+95+100+105)÷4=97.5,
=(90-97.5)2+(95-97.5)2+(100-97.5)2+(105-97.5)2
=56.25+6.25+6.25+56.25=125.
+=50+125=175.
3.某班7名学生的数学小测成绩:75,80,85,90,95,100,105,请按“组内成绩更集中”的原则分为两组(一组3人,一组4人),确定最优分组.
方式2:第一组[75,80,85,90](4人),第二组[95,100,105](3人).
第一组均值1=(75+80+85+90)÷4=82.5,
=(75-82.5)2+(80-82.5)2+(85-82.5)2+(90-82.5)2
=56.25+6.25+6.25+56.25=125.
第二组均值2=(95+100+105)÷3=100,
=(95-100)2+(100-100)2+(105-100)2=25+0+25=50.
+=125+50=175.
最优分组为[75,80,85]和[90,95,100,105]
(或[75,80,85,90]和[95,100,105]).

展开更多......

收起↑

资源预览