沪科版(2024)八下20.5 数据分组课件(共30张PPT)

资源下载
  1. 二一教育资源

沪科版(2024)八下20.5 数据分组课件(共30张PPT)

资源简介

(共30张PPT)
沪科版-数学-八年级下册
第20章 数据的初步分析
20.5 数据分组
导入新课
设一组数据是x1,x2,…,xn,它们的平均数是,我们将(x1-)2+(x2- )2+…+(xn- )2称为这组数据的离差平方和,可以简记.
方差可以反映数据的波动程度:方差越大,数据的波动越大;方差越小,数据的波动越小.
将s2=[(x1- )2+(x2- )2+…+(xn- )2]称为这组数据的方差.
我国10个省份某年人均地区生产总值(简称人均GDP,单位:万
元)的数据如下表所示:
如何将这些省份按人均GDP分成两组,保证“组内省份的GDP差不多,组间差异大”?
省份序号 1 2 3 4 5 6 7 8 9 10
人均GDP/万元 15.68 6.24 10.11 7.18 16.42 12.13 7.37 10.07 8.85 7.16
知识模块一 组内、组间离差平方和的有关概念及计算
探究新知
一般地,设有一般地,设有n个数据x1,x2,…,xn,假设这些数据都不相等,其平均数记为 x,则离差平方和为=(x1- x)2+(x2- x)2+…+(xn- x)2.
如果把这组数据分为两组,前m(m<n)个数据为一组(称为第一组),后(n-m)个数据为一组(称为第二组),那么这n个数据的离差平方和可以分解为两类离差平方和:一类反映两个组内数据的离散程度,另一类反映两组数据之间的差异程度.
其中,


则=(x1- x)2+(x2- x)2+…+(xn- x)2
=(x1-)2+ (x2-)2+ +(xm-)2+(xm+1-)2+(xm+2-)2 + +(xn-)2+
=+
其中 =(x1-)2+ (x2-)2+ +(xm-)2+(xm+1-)2+(xm+2-)2 + +(xn-)2称为组内离差平方和,表示两个组内数据的离散程度;=m(- x)2+(n-m)(- x)2,称为组间离差平方和,表示两个组间的差异.
一个合理的分组原则是使组内离差平方和达到最小,组间离差平方和达到最大.由于总体离差平方和 S2不变,只需考虑使组内离差平方和达到最小即可.
省份序号 1 2 3 4 5 6 7 8 9 10
人均GDP/万元 15.68 6.24 10.11 7.18 16.42 12.13 7.37 10.07 8.85 7.16
解:将表中10个数据按从小到大排列,得到6.24,7.16,7.18,7.37,8.85,10.07,10.11,12.13,15.68,16.42.
将它们分成两组共有9种情况,分别计算组内离差平方和,如下表.
分组 组内离差平方和
第1个间隔
第2个间隔
第3个间隔
第4个间隔
第5个间隔
第6个间隔
第7个间隔
第8个间隔
第9个间隔
99.546
87.023
70.706
50.822
40.050
36.286
24.713
28.399
72.195
观察组内离差平方和可以发现,当按第5个间隔分组时,组内离差平方和最小.因此,按组内离差平方和最小的分法为{省份2,省份3,省份4,省份7,省份8,省份9,省份10}和{省份1,省份5,省份6}.
典例精析
范例1:研究人员比较两种教学法(甲、乙)的效果.甲教学法组3人,成绩为{85,90,95};乙教学法组3人,成绩为{75,80,85}.
(1)计算总平均值;
(2)计算总体离差平方和;
解:(1)=(85+90+95+75+80+85)÷6=85(分).
(2)总体离差平方和为(85-85)2+(90-85)2+(95-85)2+(75-85)2+(80-85)2+(85-85)2=0+25+100+100+25+0=250.
(3)计算组内离差平方和;
(4)计算组间离差平方和;
(3)甲=(85+90+95)÷3=90,乙=(75+80+85)÷3=80.
组内离差平方和为(85-90)2+(90-90)2+(95-90)2+(75-80)2+(80-80)2+(85-80)2=(25+0+25)+(25+0+25)=100.
(4)组间离差平方和为3×(90-85)2+3×(80-85)2=3×25+3×25=150.
(5)验证总体离差平方和=组内离差平方和+组间离差平方和是否成立.
(5)100+150=250成立.
知识模块二 利用组内离差平方和进行分组
10个城市某月的每日最高温度的平均数(简称平均高温)如下表所示.
根据平均高温的组内离差平方和最小的原则,把这10个城市分为两组.
城市 北京 石家庄 呼和浩特 哈尔滨 上海 广州 海口 成都 贵阳 昆明
平均高温/℃ 11 9 10 12 16 21 23 24 21 18
城市 北京 石家庄 呼和浩特 哈尔滨 上海 广州 海口 成都 贵阳 昆明
平均高温/℃ 11 9 10 12 16 21 23 24 21 18
解:将表中的数据按从小到大排列,可得
-11 -3 3 3 9 10 12 17 21 22
将它们分成两组共有9种情况,分别计算组内离差平方和(结果保留小数点后一位),如下表所示.
分组 第一组离差平方和 第二组离差平方和 组内离差平方和
第1个间隔
第2个间隔
第3个间隔
第4个间隔
第5个间隔
第6个间隔
第7个间隔
第8个间隔
第9个间隔
0
32
98.7
132
228.8
308.8
397.4
562
789.6
584.2
380.9
285.7
158.8
113.2
62
14
0.5
0
584.2
412.9
384.4
290.8
342
370.8
411.4
562.5
789.6
观察最后一列组内离差平方和可以发现,当按第4个间隔分组时,组内离差平方和最小.
因此,按组内离差平方和最小的分法为{北京,石家庄,呼和浩特,哈尔滨}和{上海,广州,海口,成都,贵阳,昆明}.
合理.这样分组大致沿秦岭淮河一线分为南北方.
结合地理课所学知识,说一说这样分组合理吗?
组内离差平方和最小原则进行数据分组的步骤:
(1)列数据:将已知数据按从小到大的顺序排列.
(2)列表:分别求数据每一个间隔的分组分成的两组数据的离差平方和.
(3)求和:将两组数据的离差平方和求和,选择组内离差平方和最小的分法.
(4)写结论:按所求间隔分组,得出结论.
典例精析
范例2:某班7名学生的数学小测成绩:75,80,85,90,95,100,105,按“组内成绩更集中”的原则分为两组(一组3人,一组4人),确定最优分组.
方式1:第一组{75,80,85}(3人),第二组{90,95,100,105}(4人).
第一组均值1=(75+80+85)÷3=80,
离差平方和为(75-80)2+(80-80)2+(85-80)2=25+0+25=50.
第二组均值2=(90+95+100+105)÷4=97.5.
离差平方和为(90-97.5)2+(95-97.5)2+(100-97.5)2+(105-97.5)2=56.25+6.25+6.25+56.25=125.
组内离差平方和为50+125=175.
方式2:第一组{75,80,85,90}(4人),第二组 {95,100,105}(3人).
第一组均值1=(75+80+85+90)÷4=82.5.
离差平方和为(75-82.5)2+(80-82.5)2+(85-82.5)2+(90-82.5)2=56.25+6.25+6.25+56.25=125.
第二组均值2=(95+100+105)÷3=100,
离差平方和为(95-100)2+(100-100)2+(105-100)2=25+0+25=50.
组内离差平方和为125+50=175.
步骤3:结论
最优分组为{75,80,85}和{90,95,100,105}(或{75,80,85,90}和{95,100,105}),
组内离差平方和最小,组内成绩更集中.
归纳总结
数据的
分组
组内离差平方和:数值越小,组内差异越小
组间离差平方和:数值越大,不同组之间差异越明显
总体离差平方和=组内+组间
根据组内离差平方和最小的原则分组
随堂练习
1.在跳绳测试中,某小组5位成员每分钟跳绳次数如下:175,176,175,175,180,若根据每分钟跳绳次数的组内离差平方和最小的原则将这5位成员分成两组,则需将数据由________到______排列,共分成________种情况.


4
2.小红同学为了在明年中考体育考试中取得好的成绩,每天自己在家里练习一分钟仰卧起坐,妈妈统计了她连续六天内做仰卧起坐的个数分别为:28,25,30,27,30,26.按照“组内离差平方和达到最小”的方法分成两组,则组内离差平方和的最小值是(  )
A. B. C. D.5
B
分组
第1个间隔 0 12.76 12.76
第2个间隔 0.5 6.75 7.25
第3个间隔 2 2.67 4.67
第4个间隔 5 0 5
第5个间隔 14.8 0 14.8
3.小明将一组数据分成了两组{78,80}和{84,85,85,86},则第一组离差平方和与第二组离差平方和分别为(  )
A.2,3
B.3,2
C.3,4
D.2,2
D
4.10个城市某月的每日最高温度的平均数(简称平均高温)如表所示.
根据平均高温的组内离差平方和最小的原则:把这10个城市分为两组.
城市 北京 石家庄 呼和浩特 哈尔滨 上海 广州 海口 成都 贵阳 昆明
平均高温/℃ 3 3 -3 -11 10 21 22 12 9 17
将它们分成两组共有9种情况,利用计算器或信息技术工具,分别计算组内离差平方和(结果保留小数点后一位),如表所示
分组 第一组离差平方和 第二组离差平方和 第三组离差平方和
第1个间隔 0 584.2 584.2
第2个间隔 32 380.9 412.9
第3个间隔 98.7 285.7 384.4
第4个间隔 132 158.8 290.8
第5个间隔 228.8 113.2 342
第6个间隔 308.8 62 370.8
第7个间隔 397.4 14 411.4
第8个间隔 562 0.5 562.5
第9个间隔 789.6 0 789.6
解:将表中的数据按从小到大排列:可得
-11 -3 3 3 9 10 12 17 21 22
观察最后一列组内离差平方和可以发现,当按第4个间隔分组时,组内离差平方和最小.因此,按组内离差平方和最小的分法为 {北京,石家庄,呼和浩特,哈尔滨}和 {上海,广州,海口,成都,贵阳,昆明}.
解:将这5个数据从小到大排序:65,69,70,80,81.
计算组内离差平方和(保留一位小数):
4.5个苹果的直径(单位:mm)分别为65,69,81,80,70,按照“组内离差平方和最小”的原则,把这5个苹果按直径大小分成三组.
分组情况 组内离差平方和
第一组1个,第二组1个,第三组3个 74.0
第一组1个,第二组2个,第三组2个 1.0
第一组1个,第二组3个,第三组1个 74.0
第一组2个,第二组1个,第三组2个 8.5
第一组2个,第二组2个,第三组1个 58.0
第一组3个,第二组1个,第三组1个 14.0
第2种情况的组内离差平方和最小,因此把这5个苹果按直径大小分成三组是{65},{69,70}和{80,81}.
这节课的收获是什么?
课堂小结

展开更多......

收起↑

资源预览