24.4数据的分组 课件(共25张PPT) 人教版数学八年级下册

资源下载
  1. 二一教育资源

24.4数据的分组 课件(共25张PPT) 人教版数学八年级下册

资源简介

第二十四章 数据的分析
八下数学 RJ
24.4 数据的分组
1.经历数据分类的活动,知道按照组内离差平方和最小的原则对数据进行分类的方法.
2.能解释数据分析的结果,能根据结果作出简单的判断和预测,并进行交流,感受用统计的思维和方法解决实际问题的过程,形成数据观念和模型观念.
在社会生活中,分类现象普遍存在.例如,超市里各种商品按用途不同分类摆放,宾馆根据硬件设施、服务水平等分成不同的星级,等等.在实际问题中,当面临的对象复杂多样时,分类往往可以为我们处理问题带来方便.对于一组取值多样的数据,对其进行合理分组,也会有助于我们解决问题.
问题 一家公司向社会招聘一名员工,所有应聘者先统一参加笔试,然后根据笔试成绩确定一部分应聘者进入面试.将10名应聘者的笔试成绩(百分制)按从小到大的顺序排列如下:
58 64 68 75 76 83 85 89 90 92
你认为哪一部分应聘者应当进入面试?
自然,应当选择笔试成绩好的应聘者进人面试.那么笔试成绩怎样才算好呢?可以有不同的标准.例如,前三名或85分及以上等,不管哪种标准,目的都是把笔试成绩分成好和差两组.
对笔试成绩进行分组,上面提到的标准各有其合理性,在实际中也经常被采用.但这些标准都没有考虑数据自身的特点,这可能导致两个很接近的笔试成绩被分到不同的组.
例如,83分与85分的差距很小,若以“85分及以上”为好成绩的标准,则85分属于好成绩,而83分属于差成绩.而从公司确定面试应聘者的角度看,把笔试成绩相对接近的分到同一组,是一种较合理的做法.
因此,笔试成绩可以根据组内差异最小的原则进行分组.
将笔试成绩按从小到大的顺序排列,使相互最接近的笔试成绩都挨在了一起. 因此,要使分组后的组内差异最小,只需在已排序数据的基础上寻找分组方法. 可以发现,10个笔试成绩按顺序排列形成9个间隔,如图所示.
58 64 68 75 76 83 85 89 90 92
每个间隔都可以把笔试成绩分成好和差两组,共有9种分法.
思考 怎么刻画组内笔试成绩差异的大小呢?哪种分法能使笔试成绩好和差两组的组内差异最小?
在前面的学习中,我们知道,离差平方和可以刻画一组数据的离散程度.下面我们利用离差平方和刻画组内数据的离散程度,进而对数据进行分组.
一般地,设有n个数据x1,x2,?,xn,其平均数记为????,则离差平方和为d2=(x1-????)2+(x2-????)2+?+(xn-????)2.
?
如果把这组数据分为两组,前m(md12=(x1-????1)2+(x2-????1)2+?+(xm-????1)2,
d22=(xm+1-????2)2+(xm+2-????2)2+?+(xn-????2)2,
?
那么
d2=(x1-????)2+(x2-????)2+?+(xn-????)2
=(x1-????1+????1-????)2+(x2-????1+????1-????)2+?+(xm-????1+????1-????)2+ (xm+1-????2+????2-????)2+ (xm+2-????2+????2-????)2+?+(xn-????2+????2-????)2
=(x1-????1)2+(x2-????1)2+?+(xm-????1)2+(xm+1-????2)2+(xm+2-????2)2+?+(xn-????2)2+ m(????1-????)2+(n-m)(????2-????)2
=d12+d22+m(????1-????)2+(n-m)(????2-????)2.
?
其中d12+d22称为组内离差平方和. 表示两个组内数据的离散程度;记
d122=m(????1-????)2+(n-m)(????2-????)2,
d122是m个第一组数据平均数、(n-m)个第二组数据平均数关于总体数据平均数的离差平方和,称为组间离差平方和,表示两个组间的差异.根据组内离差平方和最小的原则进行分组时,由于d?不变,既可以按d12+d22最小来分组,也可以按d122最大来分组.
?
这样,根据组内离差平方和最小的原则,能使笔试成绩相差较小的应聘者分在同一组.利用计算器或信息技术工具,可以计算出图中的9种分法的组内离差平方和(结果保留小数点后一位),如表所示.
{16D9F66E-5EB9-4882-86FB-DCBF35E3C3E4}分组
第一组离差平方和
第二组离差平方和
组内离差平方和
第1个间隔
0
799.6
799.6
第2个间隔
18
503.5
521.5
第3个间隔
50.7
271.4
322.1
第4个间隔
152.8
170.8
323.6
第5个间隔
228.8
54.8
283.6
第6个间隔
411.3
26
437.3
第7个间隔
587.4
4.7
592.1
第8个间隔
819.5
2
821.5
第9个间隔
1 026.2
0
1 026.2
观察最后一列组内离差平方和可以发现,当按第5个间隔分组时,组内离差平方和最小.
因此,按组内离差平方和最小的分法为{58,64,68,75,76}和{83,85,89,99,92}.
{16D9F66E-5EB9-4882-86FB-DCBF35E3C3E4}分组
第一组离差平方和
第二组离差平方和
组内离差平方和
第1个间隔
0
799.6
799.6
第2个间隔
18
503.5
521.5
第3个间隔
50.7
271.4
322.1
第4个间隔
152.8
170.8
323.6
第5个间隔
228.8
54.8
283.6
第6个间隔
411.3
26
437.3
第7个间隔
587.4
4.7
592.1
第8个间隔
819.5
2
821.5
第9个间隔
1 026.2
0
1 026.2
例1 10个城市某月的每日最高温度的平均数(简称平均高温)如表所示.
{16D9F66E-5EB9-4882-86FB-DCBF35E3C3E4}城市
北京
石家庄
呼和
浩特
哈尔滨
上海
广州
海口
成都
贵阳
昆明
平均高温/℃
3
3
-3
-11
10
21
22
12
9
17
解:将表中的数据按从小到大排列,可得
-11 -3 3 3 9 10 12 17 21 22
将它们分成两组共有9种情况,利用计算器或信息技术工具,分别计算组内离差平方和(结果保留小数点后一位),如表所示.
{16D9F66E-5EB9-4882-86FB-DCBF35E3C3E4}分组
第一组离差平方和
第二组离差平方和
组内离差平方和
第1个间隔
0
584.2
584.2
第2个间隔
32
380.9
412.9
第3个间隔
98.7
285.7
384.4
第4个间隔
132
158.8
290.8
第5个间隔
228.8
113.2
342
第6个间隔
308.8
62
370.8
第7个间隔
397.4
14
411.4
第8个间隔
562
0.5
562.5
第9个间隔
789.6
0
789.6
观察最后一列组内离差平方和可以发现,当按第4个间隔分组时,组内离差平方和最小.因此,按组内离差平方和最小的分法为
{北京,石家庄,呼和浩特,哈尔滨}
和{上海,广州,海口,成都,贵阳,昆明}.
{16D9F66E-5EB9-4882-86FB-DCBF35E3C3E4}分组
第一组离差平方和
第二组离差平方和
组内离差平方和
第1个间隔
0
584.2
584.2
第2个间隔
32
380.9
412.9
第3个间隔
98.7
285.7
384.4
第4个间隔
132
158.8
290.8
第5个间隔
228.8
113.2
342
第6个间隔
308.8
62
370.8
第7个间隔
397.4
14
411.4
第8个间隔
562
0.5
562.5
第9个间隔
789.6
0
789.6
跟踪训练 生物小组测量了10株新栽树苗的高度(单位:厘米),数据按从小到大的顺序排列为12,15,18,20,22,25,28,30,33,35.老师按照前5株(12~22)、后5株的方式将树苗分成了2组.
(1) 请计算该分组下的组内离差平方和.
解 :1?????1=12+15+18+20+225=17.4,
????12=(12-17.4)2+(15-17.4)2+(18-17.4)2+(20-17.4)2+(22-17.4)2=63.2.
????2= 25+28+30+33+355? =30.2,
????22=(25?30.2)2+(28?30.2)2+(30?30.2)2+(33?30.2)2+(35?30.2)2=62.8,
????12+????22=63.2+62.8=126.0.
?
跟踪训练 生物小组测量了10株新栽树苗的高度(单位:厘米),数据按从小到大的顺序排列为12,15,18,20,22,25,28,30,33,35.老师按照前5株(12~22)、后5株的方式将树苗分成了2组.
(2) 请计算该分组下的组间离差平方和,并验证?????12+????22+????122=d 2是否成立.
?
(2)因为?????=12+15+18+20+22+25+28+30+33+3510=23.8.
所以?????122=5×(17.4-23.8)2+5×(30.2-23.8)2=409.6.
????2=(12-23.8)2+(15-23.8)2+?+(35-23.8)2=535.6.
因为?????12+????22+????122=126.0+409.6=535.6=????2,
所以?????12+????22+????122=????2?成立.
?
组内离差平方和的计算方法
①排序:将一组数据从小到大排列;
②分组:把数据分成两组,前?m?(m③计算:分别计算这两组数据的离差平方和?????12,????22;
④求和:计算组内离差平方和?????12+????22.
?
1. 五个城市某月的平均低温(单位:℃) 如下表所示:
?
{16D9F66E-5EB9-4882-86FB-DCBF35E3C3E4}城市
A
B
C
D
E
平均低温/℃
0
-2
5
2
3
{16D9F66E-5EB9-4882-86FB-DCBF35E3C3E4}城市
A
B
C
D
0
-2
5
2
3
根据平均低温的组内离差平方和最小的原则,把这5个城市分为两组.
解:将平均低温按从小到大的顺序排列,5个平均低温按顺序排列
形成4个间隔,如图所示.
?2?|?0?|?2?|?3?|?5
?
每个间隔都可以把平均低温分成两组,共有4种分法.
{C4B1156A-380E-4F78-BDF5-A606A8083BF9}分组
第一组离差平方和
第二组离差平方和
组内离差平方和
第1个间隔
0
13
13
第2个间隔
2
4.67
6.67
第3个间隔
8
2
10
第4个间隔
14.75
0
14.75
观察最后一列组内离差平方和可以发现,当按第2个间隔分组时,组内离差平方和最小,因此,按组内离差平方和最小的分法为{A ,B}和{C,D,E} .
2.某校八年级10名学生参加投篮训练,进球数分别为
13,15,4,6,9,11,20,22,25,18.
体育老师需将学生分为两组,使组内成绩差异最小(组内离差平方和最小),请确定分组方式.
解:将进球数的数据按照从小到大的顺序排列如下:
4,6,9,11,13,15,18,20,22,25.
将它们分成两组共有9种情况,分别计算组内离差平方和如下表:
观察最后一列组内离差平方和可以发现,当按第5个间隔分组时,组内离差平方和最小.
因此组内离差平方和最小的分法为{4,6,9,11,13}和{15,18,20,22,25}.
{C4B1156A-380E-4F78-BDF5-A606A8083BF9}分组
第一组离差平方和
第二组离差平方和
组内离差平方和
第 1 个间隔
0.0
318.2
318.2
第 2 个间隔
2.0
217.9
219.9
第 3 个间隔
12.7
151.4
164.1
第 4 个间隔
29.0
98.8
127.8
第 5 个间隔
53.2
58.0
111.2
第 6 个间隔
87.3
26.8
114.1
第 7 个间隔
146.9
12.7
159.6
第 8 个间隔
220.0
4.5
224.5
第 9 个间隔
308.9
0.0
308.9
3.巴黎奥运会中,美国、中国、日本、澳大利亚、法国分别以金牌40枚、40枚、20枚、18枚、16枚位列金牌榜前5位,根据组内离差平方和最小的原则,把这5个国家分为三组,应该如何分?(保留小数点后一位)
解:将所得金牌数量按照从小到大的顺序排列为
16,18,20,40,40.
{C4B1156A-380E-4F78-BDF5-A606A8083BF9}分组
第一组离差平方和
第二组离差平方和
第三组离差平方和
组内离差平方和
{16}{18}{20,40,40}
0
0
266.7
266.7
{16}{18,20}{40,40}
0
2
0
2
{16}{18,20,40}{40}
0
296
0
296
{16,18}{20}{40,40}
2
0
0
2
{16,18}{20,40}{40}
2
200
0
202
{16,18,20}{40}{40}
8
0
0
8
16,18,20,40,40.
观察最后一列可以发现,按组内离差平方和最小的分组方法为{法国},{澳大利亚、日本}和{美国、中国}或{法国、澳大利亚},{日本}和{美国、中国}.
数据的分组
按组内离差平方和最小分组
按组间离差平方和最大分组

展开更多......

收起↑

资源预览