人教版(2024版)八下数学 24.4 数据的分组 课件(共37张PPT)+教案+同步探究学案

资源下载
  1. 二一教育资源

人教版(2024版)八下数学 24.4 数据的分组 课件(共37张PPT)+教案+同步探究学案

资源简介

(共37张PPT)
第二十四章 数据的分析
24.4 数据的分组
1.理解并会计算组内、组间离差平方和,明确二者关联.
2.掌握 “组内离差平方和最小” 原则,能合理分组解决实际问题.
3.体会离差平方和在数据分组中的应用价值,培养数据分析与逻辑推理能力,提升用统计方法解决实际问题的意识.
1.什么是离差?
统计中通常先对离差进行平方,然后求和.我们把
(x1-)2+(x2-)2+…+(xn-)2
叫作这n个数据关于平均数的离差平方和,记作“d2”.
一般地,有n个数据x1,x2,…,xn,用表示它们的平均数,我们把
xi-(i=1,2,…,n)
叫作xi关于平均数的离差.
2.什么是离差平方和?
在社会生活中,分类现象普遍存在.例如,超市里各种商品按用途不同分类摆放,宾馆根据硬件设施、服务水平等分成不同的星级,等等.在实际问题中,当面临的对象复杂多样时,分类往往可以为我们处理问题带来方便.对于一组取值多样的数据,对其进行合理分组,也会有助于我们解决问题.
问题:一家公司向社会招聘一名员工,所有应聘者先统一参加笔试,然后根据笔试成绩确定一部分应聘者进入面试.将10名应聘者的笔试成绩(百分制)按从小到大的顺序排列如下:
58 64 68 75 76 83 85 89 90 92
你认为哪一部分应聘者应当进入面试?
自然,应当选择笔试成绩好的应聘者进入面试.那么笔试成绩怎样才算好呢?可以有不同的标准.例如,前三名或85分及以上等.不管哪种标准,目的都是把笔试成绩分成好和差两组.
对笔试成绩进行分组,上面提到的标准各有其合理性,在实际中也经常被采用.但这些标准都没有考虑数据自身的特点,这可能导致两个很接近的笔试成绩被分到不同的组.
例如,83分与85分的差距很小,若以“85分及以上”为好成绩的标准,则85分属于好成绩,而83分属于差成绩.而从公司确定面试应聘者的角度看,把笔试成绩相对接近的分到同一组,是一种较合理的做法.因此,笔试成绩可以根据组内差异最小的原则进行分组.
将笔试成绩按从小到大的顺序排列,使相互最接近的笔试成绩都挨在了一起.因此,要使分组后的组内差异最小,只需在已排序数据的基础上寻找分组方法.
可以发现,10个笔试成绩按顺序排列形成9个间隔,如图所示.
58|64|68|75|76|83|85|89|90|92
每个间隔都可以把笔试成绩分成好和差两组,共有9种分法.
思考:怎么刻画组内笔试成绩差异的大小呢?哪种分法能使笔试成绩好和差两组的组内差异最小?
在前面的学习中,我们知道,离差平方和可以刻画一组数据的离散程度.下面我们利用离差平方和刻画组内数据的离散程度,进而对数据进行分组.
一般地,设有n个数据x1,x2,…,xn,其平均数记为,则离差平方和为
d2=(x1-)2+(x2-)2+…+(xn-)2.
如果把这组数据分为两组,前m(m<n)个数据为一组,后(n-m)个数据为一组,它们的平均数分别记为1和2,离差平方和分别为
=(x1-1)2+(x2-1)2+…+(xm-1)2,
=(xm+1-2)2+(x m+2-2)2+…+(xn-2)2,
那么
d2=(x1-1+1-)2+(x2-1+1-)2+…+(xm-1+1-)2+(x m+1-2+2-)2+(x m+2-2+2-)2+…+(xn-2+2-)2
=(x1-1)2+(x2-1)2+…+(xm-1)2+(x m+1-2)2+(x m+2-2)2+…+(xn-2)2+m(x1-)2+(n-m)(x2-)2
=+m(x1-)2+(n-m)(x2-)2
记=m(x1-)2+(n-m)(x2-)2,
是m个第一组数据平均数、(n-m)个第二组数据平均数关于总体数据平均数的离差平方和,称为组间离差平方和,表示两个组间的差异.
d2=+m(x1-)2+(n-m)(x2-)2
其中称为组内离差平方和,表示两个组内数据的离散程度;
根据组内离差平方和最小的原则进行分组时,由于d2不变,既可以按最小来分组,也可以按最大来分组.
这样,根据组内离差平方和最小的原则,能使笔试成绩相差较小的应聘者分在同一组.利用计算器或信息技术工具,可以计算出图中的9种分法的组内离差平方和(结果保留小数点后一位),
如表所示.
58|64|68|75|76|83|85|89|90|92
分组 第一组离差平方和 第二组离差平方和 组内离差平方和
第1个间隔 0 799.6 799.6
第2个间隔 18 503.5 521.5
第3个间隔 50.7 271.4 322.1
第4个间隔 152.8 170.8 323.6
第5个间隔 228.8 54.8 283.6
第6个间隔 411.3 26 437.3
第7个间隔 587.4 4.7 592.1
第8个间隔 819.5 2 821.5
第9个间隔 1026.2 0 1026.2
观察最后一列组内离差平方和可以发现,当按第5个间隔分组时,组内离差平方和最小.因此,按组内离差平方和最小的分法为
{58,64,68,75,76}

{83,85,89,90,92}.
例:10个城市某月的每日最高温度的平均数(简称平均高温)如表所示
城市 北京 石家庄 呼和浩特 哈尔滨 上海 广州 海口 成都 贵阳 昆明
平均高温/℃ 3 3 -3 -11 10 21 22 12 9 17
根据平均高温的组内离差平方和最小的原则,把这10个城市分为两组.
解:将表中的数据按从小到大排列,可得
-11 -3 3 3 9 10 12 17 21 22
将它们分成两组共有9种情况,利用计算器或信息技术工具,分别计算组内离差平方和(结果保留小数点后一位),如表所示.
分组 第一组离差平方和 第二组离差平方和 组内离差平方和
第1个间隔 0 584.2 584.2
第2个间隔 32 380.9 412.9
第3个间隔 98.7 285.7 384.4
第4个间隔 132 158.8 290.8
第5个间隔 228.8 113.2 342
第6个间隔 308.8 62 370.8
第7个间隔 397.4 14 411.4
第8个间隔 562 0.5 562.5
第9个间隔 789.6 0 789.6
观察最后一列组内离差平方和可以发现,当按第4个间隔分组时,组内离差平方和最小.因此,按组内离差平方和最小的分法为
{北京,石家庄,呼和浩特,哈尔滨}

{上海,广州,海口,成都,贵阳,昆明}.
结合地理课所学知识,说一说这样分组合理吗?
【知识技能类练习】必做题:
1.如果组内离差平方和很大,说明( )
A.组间差异大 B.组内差异大 C.总差异小 D.均值相等
B
【知识技能类练习】必做题:
2.学校种植园中有4盆相同品种的植物,需要按植物的株高分成两组进行培养,使得同组内植物株高尽量接近,将4盆植物的株高从小到大排序后分成两组,共有3种情况,计算它们的组内离差平方和结果如下表所示,则4盆植物的最优分组序号是___________.
序号 分组情况 组内离差平方和
① 第一组1个,第二组3个 44
② 第一组2个,第二组2个 28
③ 第一组3个,第二组1个 16.67

【知识技能类练习】必做题:
3.设有两组数据,第一组数据为3,5,7;第二组数据为6,8,10.分别计算这两组数据各自的组内离差平方和.
解:第一组数据:,组内离差平方和为:.
第二组数据:,组内离差平方和为:.
【知识技能类练习】选做题:
4.在引体向上测试中,5名同学完成的个数分别为13,15,7,9,12.要使个数相差较小的同学分在一组,下表是4种分法的组内离差平方和(结果保留小数点后一位)
分组 第一组离差平方和 第二组离差平方和 组内离差平方和
第1个间隔 0
第2个间隔 2
第3个间隔 2
第4个间隔 0
根据组内离差平方和最小原则,把这5名同学引体向上的个数分为两组,下列分组正确的是( )
A.和 B.和
C.和 D.和
B
【综合拓展类练习】
5.某工厂生产一批零件,随机抽取6个零件的直径(单位:)为10.2,10.3,10.5,10.8,11.0,11.2.质检部门想将零件分为“合格组”和“待复检组”,要求组内直径波动最小,如何分组?计算最小组内离差平方和(结果保留小数点后两位).
【综合拓展类练习】
解:将数据分成两组,共有5种情况,分别计算组内离差平方和如表所示:
分组 第一组离差平方和 第二组离差平方和 组内离差平方和
第1个间隔 0.00 0.53 0.53
第2个间隔 0.01 0.27 0.28
第3个间隔 0.05 0.08 0.13
第4个间隔 0.21 0.02 0.23
第5个间隔 0.45 0.00 0.45
由表可知,当按第个间隔分组时,组内离差平方和最小为,即分组为和,第一组为“合格组”,第二组为“待复检组”.
数据的分组
分组原则
组内离差平方和
组间离差平方和
【知识技能类作业】必做题:
1.在分组时要求“组内离差平方和最小”,其目的是( )
A.使每组数据量相等
B.使每组组内数据差异尽可能小,组间数据差异尽可能大
C.减少计算复杂度
D.保证组间均值相等
B
【知识技能类作业】必做题:
2.将一组数据,,,,,分成前个一组,后个一组,则这组数据的组内离差平方和是___________.
【知识技能类作业】必做题:
3.在统计学里,分组的方法有很多,其中较常用的方法是使“组内离差平方和达到最小”.多组数据的组内离差平方和是指每组数据的离差平方和的和.现在有10个苹果的直径分别是65,75,76,69,80,70,76,81,78,80.按照“组内离差平方和达到最小”的方法,把这10个苹果按直径大小分成两组.
【知识技能类作业】必做题:
解:将个数据由小到大排序为,,,,,,,,,.计算不同分组的组内离差平方和,结果如下表:
分组情况 组内离差平方和
第一组个,第二组个
第一组个,第二组个
第一组个,第二组个
第一组个,第二组个
第一组个,第二组个
第一组个,第二组个
第一组个,第二组个
第一组个,第二组个
第一组个,第二组个
计算结果表明,第三种情况的组内离差平方和最小.
因此把个苹果按直径大小分成两组是,.
【知识技能类作业】选做题:
4.山西省晋南地区独特的地理与气候条件,为苹果提供了良好的生长条件,运城地处北纬,黄土层深厚肥沃,是公认的苹果“黄金生产带”.现某苹果商贩购进一批苹果按照苹果的个头进行包装销售.抽取其中的10个苹果直径为,按照“组内离差平方和达到最小”的方法分成2组,将这10个数据从小到大排序,分别按前个数据为第一组、其余数据为第二组()进行分组,共有9种情况,如下:(结果保留整数)
分组 第一组离差平方和 第二组离差平方和 组内离差平方和
第1个间隔 0 147 147
第2个间隔 8 90 98
第3个间隔 14 34 48
【知识技能类作业】选做题:
分组 第一组离差平方和 第二组离差平方和 组内离差平方和
第4个间隔 51 24 75
第5个间隔 82 16 98
第6个间隔 103 5 108
第7个间隔 135 1 136
第8个间隔 182 1 183
第9个间隔 218 0 218
观察最后一列组内离差平方和可以发现,当按第3个间隔分组时,组内离差平方和最小.因此,按组内离差平方和最小的分法为___________和____________________.
【综合拓展类作业】
5.现有一组数据:8,12,16,20,24,28.若将其分为2组,试根据组内离差平方和最小的原则,确定最优分组方式,并计算分组后的总组内离差平方和.
解:分组方式1:前3个与后3个数据,即和.
第一组:,
离差平方和.
第二组:,
离差平方和.
总离差平方和:.
【综合拓展类作业】
分组方式2:奇偶位置分组,即和.
第一组:,
离差平方和.
第二组:,
离差平方和.
总离差平方和:.
分组方式3:小值与大值分组,即和.
第一组:,
离差平方和.
第二组:,离差平方和.
总离差平方和:.
最优分组为和,总组内离差平方和为64.中小学教育资源及组卷应用平台
分课时教学设计
第九课时《24.4 数据的分组》教学设计
课型 新授课 复习课口 试卷讲评课口 其他课口
教学内容分析 本节课是数据分析单元的重要应用课,承接前面离差平方和、方差等知识,将统计工具延伸到数据分组的实际场景中,是统计知识从描述性分析向分类应用的关键过渡.本课以笔试成绩、城市气温等实例为载体,引导学生理解组内、组间离差平方和的意义与关联,掌握“组内离差平方和最小”的分组原则,为后续聚类分析等统计方法奠定基础.它完善了数据分析的知识链条,让学生体会统计方法在解决实际分类问题中的价值,培养学生用数据说话、理性决策的能力,落实数据分析的核心素养.
学习者分析 学生已掌握离差平方和、平均数的计算方法,具备一定的数据分析基础,但对“组内、组间离差平方和”的概念较为陌生,对二者的关联理解存在困难.学生习惯用固定标准分组,缺乏从数据自身特征出发的分组意识,对“组内离差平方和最小”原则的应用逻辑不清晰,在实际问题中难以将计算与分组决策结合,运算过程也易出现错误,需要借助实例与表格直观理解分组的合理性.
教学目标 1.理解并会计算组内、组间离差平方和,明确二者关联. 2.掌握“组内离差平方和最小”原则,能合理分组解决实际问题. 3.体会离差平方和在数据分组中的应用价值,培养数据分析与逻辑推理能力,提升用统计方法解决实际问题的意识.
教学重点 理解组内、组间离差平方和的概念,掌握“组内离差平方和最小”的分组原则.
教学难点 能运用“组内离差平方和最小”原则,对数据进行合理分组并解决实际问题.
学习活动设计
教师活动学生活动环节一:学习目标教师活动1: 师出示学习目标: 1.理解并会计算组内、组间离差平方和,明确二者关联. 2.掌握“组内离差平方和最小”原则,能合理分组解决实际问题. 3.体会离差平方和在数据分组中的应用价值,培养数据分析与逻辑推理能力,提升用统计方法解决实际问题的意识.学生活动1: 学生齐声读本课的学习目标活动意图说明: 明确本节课的学习目标,使教师的教和学生的学有效结合在一起,激发学生的学习动力,提高学生课堂参与的兴趣与积极性.环节二:新知导入教师活动2: 问题:1.什么是离差? 答案:一般地,有n个数据x1,x2,…,xn,用表示它们的平均数,我们把 xi-(i=1,2,…,n) 叫作xi关于平均数的离差. 2.什么是离差平方和? 答案:统计中通常先对离差进行平方,然后求和.我们把 (x1-)2+(x2-)2+…+(xn-)2 叫作这n个数据关于平均数的离差平方和,记作“d2”. 导言:在社会生活中,分类现象普遍存在.例如,超市里各种商品按用途不同分类摆放,宾馆根据硬件设施、服务水平等分成不同的星级,等等.在实际问题中,当面临的对象复杂多样时,分类往往可以为我们处理问题带来方便.对于一组取值多样的数据,对其进行合理分组,也会有助于我们解决问题.学生活动2: 学生积极回答问题活动意图说明: 从生活中常见的分类现象切入,引导学生体会分类在实际问题中的便利性,自然过渡到数据分组的学习.既唤醒学生的生活经验,也点明合理分组对数据分析的重要意义,为后续探究“组内离差平方和最小”的分组原则做好铺垫.环节三:新知讲解教师活动3: 问题:一家公司向社会招聘一名员工,所有应聘者先统一参加笔试,然后根据笔试成绩确定一部分应聘者进入面试.将10名应聘者的笔试成绩(百分制)按从小到大的顺序排列如下: 58 64 68 75 76 83 85 89 90 92 你认为哪一部分应聘者应当进入面试? 讲解:自然,应当选择笔试成绩好的应聘者进入面试.那么笔试成绩怎样才算好呢?可以有不同的标准.例如,前三名或85分及以上等.不管哪种标准,目的都是把笔试成绩分成好和差两组. 对笔试成绩进行分组,上面提到的标准各有其合理性,在实际中也经常被采用.但这些标准都没有考虑数据自身的特点,这可能导致两个很接近的笔试成绩被分到不同的组.例如,83分与85分的差距很小,若以“85分及以上”为好成绩的标准,则85分属于好成绩,而83分属于差成绩.而从公司确定面试应聘者的角度看,把笔试成绩相对接近的分到同一组,是一种较合理的做法.因此,笔试成绩可以根据组内差异最小的原则进行分组. 将笔试成绩按从小到大的顺序排列,使相互最接近的笔试成绩都挨在了一起.因此,要使分组后的组内差异最小,只需在已排序数据的基础上寻找分组方法.可以发现,10个笔试成绩按顺序排列形成9个间隔,如图所示. 58|64|68|75|76|83|85|89|90|92 每个间隔都可以把笔试成绩分成好和差两组,共有9种分法. 思考:怎么刻画组内笔试成绩差异的大小呢?哪种分法能使笔试成绩好和差两组的组内差异最小? 讲解:在前面的学习中,我们知道,离差平方和可以刻画一组数据的离散程度.下面我们利用离差平方和刻画组内数据的离散程度,进而对数据进行分组. 一般地,设有n个数据x1,x2,…,xn,其平均数记为,则离差平方和为 d2=(x1-)2+(x2-)2+…+(xn-)2. 如果把这组数据分为两组,前m(m<n)个数据为一组,后(n-m)个数据为一组,它们的平均数分别记为1和2,离差平方和分别为 =(x1-1)2+(x2-1)2+…+(xm-1)2, =(xm+1-2)2+(x m+2-2)2+…+(xn-2)2, 那么 d2=(x1-1+1-)2+(x2-1+1-)2+…+(xm-1+1-)2+(x m+1-2+2-)2+(x m+2-2+2-)2+…+(xn-2+2-)2 =(x1-1)2+(x2-1)2+…+(xm-1)2+(x m+1-2)2+(x m+2-2)2+…+(xn-2)2+m(x1-)2+(n-m)(x2-)2 =+m(x1-)2+(n-m)(x2-)2 其中称为组内离差平方和,表示两个组内数据的离散程度;记 =m(x1-)2+(n-m)(x2-)2, 是m个第一组数据平均数、(n-m)个第二组数据平均数关于总体数据平均数的离差平方和,称为组间离差平方和,表示两个组间的差异.根据组内离差平方和最小的原则进行分组时,由于d2不变,既可以按最小来分组,也可以按最大来分组. 这样,根据组内离差平方和最小的原则,能使笔试成绩相差较小的应聘者分在同一组.利用计算器或信息技术工具,可以计算出图中的9种分法的组内离差平方和(结果保留小数点后一位),如表所示. 分组第一组离差平方和第二组离差平方和组内离差平方和第1个间隔0799.6799.6第2个间隔18503.5521.5第3个间隔50.7271.4322.1第4个间隔152.8170.8323.6第5个间隔228.854.8283.6第6个间隔411.326437.3第7个间隔587.44.7592.1第8个间隔819.52821.5第9个间隔1026.201026.2
观察最后一列组内离差平方和可以发现,当按第5个间隔分组时,组内离差平方和最小.因此,按组内离差平方和最小的分法为 {58,64,68,75,76} 和 {83,85,89,90,92}. 例:10个城市某月的每日最高温度的平均数(简称平均高温)如表所示 城市北京石家庄呼和浩特哈尔滨上海广州海口成都贵阳昆明平均高温/℃33-3-1110212212917
根据平均高温的组内离差平方和最小的原则,把这10个城市分为两组. 解:将表中的数据按从小到大排列,可得 -11 -3 3 3 9 10 12 17 21 22 将它们分成两组共有9种情况,利用计算器或信息技术工具,分别计算组内离差平方和(结果保留小数点后一位),如表所示. 分组第一组离差平方和第二组离差平方和组内离差平方和第1个间隔0584.2584.2第2个间隔32380.9412.9第3个间隔98.7285.7384.4第4个间隔132158.8290.8第5个间隔228.8113.2342第6个间隔308.862370.8第7个间隔397.414411.4第8个间隔5620.5562.5第9个间隔789.60789.6
观察最后一列组内离差平方和可以发现,当按第4个间隔分组时,组内离差平方和最小.因此,按组内离差平方和最小的分法为 {北京,石家庄,呼和浩特,哈尔滨} 和 {上海,广州,海口,成都,贵阳,昆明}. 追问:结合地理课所学知识,说一说这样分组合理吗?学生活动3: 学生小组合作探究,班内交流后认真听老师的点评和讲解 活动意图说明: 借助笔试成绩、城市气温等实例,让学生理解组内离差平方和的意义,掌握“组内离差平方和最小”的分组原则,学会合理分组解决实际问题,培养数据分析与逻辑推理能力.环节四:课堂小结教师活动4: 问题:本节课你都学习到了哪些知识? 教师通过学生的回答,进行归纳 学生活动4: 学生积极回顾本节课学习到的知识活动意图说明: 通过学生自己回顾、总结、梳理所学的知识,将所学的知识与以前学过的知识进行紧密联系,完善认知结构和知识体系.
板书设计 课题:24.4数据的分组一、组内离差平方和 二、组间离差平方和 三、分组原则 教师板演区学生展示区
课堂练习 【知识技能类练习】 必做题: 1.如果组内离差平方和很大,说明( ) A.组间差异大 B.组内差异大 C.总差异小 D.均值相等 答案:B 2.学校种植园中有4盆相同品种的植物,需要按植物的株高分成两组进行培养,使得同组内植物株高尽量接近,将4盆植物的株高从小到大排序后分成两组,共有3种情况,计算它们的组内离差平方和结果如下表所示,则4盆植物的最优分组序号是___________. 序号分组情况组内离差平方和①第一组1个,第二组3个44②第一组2个,第二组2个28③第一组3个,第二组1个16.67
答案:③ 3.设有两组数据,第一组数据为3,5,7;第二组数据为6,8,10.分别计算这两组数据各自的组内离差平方和. 解:第一组数据:,组内离差平方和为:. 第二组数据:,组内离差平方和为:. 选做题: 4.在引体向上测试中,5名同学完成的个数分别为13,15,7,9,12.要使个数相差较小的同学分在一组,下表是4种分法的组内离差平方和(结果保留小数点后一位) 分组第一组离差平方和第二组离差平方和组内离差平方和第1个间隔0第2个间隔2第3个间隔2第4个间隔0
根据组内离差平方和最小原则,把这5名同学引体向上的个数分为两组,下列分组正确的是( ) A.和 B.和 C.和 D.和 答案:B 【综合拓展类练习】 5.某工厂生产一批零件,随机抽取6个零件的直径(单位:)为10.2,10.3,10.5,10.8,11.0,11.2.质检部门想将零件分为“合格组”和“待复检组”,要求组内直径波动最小,如何分组?计算最小组内离差平方和(结果保留小数点后两位). 解:将数据分成两组,共有5种情况,分别计算组内离差平方和如表所示: 分组第一组离差平方和第二组离差平方和组内离差平方和第1个间隔0.000.530.53第2个间隔0.010.270.28第3个间隔0.050.080.13第4个间隔0.210.020.23第5个间隔0.450.000.45
由表可知,当按第个间隔分组时,组内离差平方和最小为,即分组为和,第一组为“合格组”,第二组为“待复检组”.
作业设计 【知识技能类作业】 必做题: 1.在分组时要求“组内离差平方和最小”,其目的是( ) A.使每组数据量相等 B.使每组组内数据差异尽可能小,组间数据差异尽可能大 C.减少计算复杂度 D.保证组间均值相等 答案:B 2.将一组数据,,,,,分成前个一组,后个一组,则这组数据的组内离差平方和是___________. 答案: 3.在统计学里,分组的方法有很多,其中较常用的方法是使“组内离差平方和达到最小”.多组数据的组内离差平方和是指每组数据的离差平方和的和.现在有10个苹果的直径分别是65,75,76,69,80,70,76,81,78,80.按照“组内离差平方和达到最小”的方法,把这10个苹果按直径大小分成两组. 答案:把10个苹果按直径大小分成两组是,. 【解析】先对数据排序,再尝试不同的连续分段划分方式,计算每种划分的总离差平方和,选出最小的那个划分. 解:将个数据由小到大排序为,,,,,,,,,. 计算不同分组的组内离差平方和,结果如下表: 分组情况组内离差平方和第一组个,第二组个第一组个,第二组个第一组个,第二组个第一组个,第二组个第一组个,第二组个第一组个,第二组个第一组个,第二组个第一组个,第二组个第一组个,第二组个
计算结果表明,第三种情况的组内离差平方和最小. 因此把个苹果按直径大小分成两组是,. 选做题: 4.山西省晋南地区独特的地理与气候条件,为苹果提供了良好的生长条件,运城地处北纬,黄土层深厚肥沃,是公认的苹果“黄金生产带”.现某苹果商贩购进一批苹果按照苹果的个头进行包装销售.抽取其中的10个苹果直径为,按照“组内离差平方和达到最小”的方法分成2组,将这10个数据从小到大排序,分别按前个数据为第一组、其余数据为第二组()进行分组,共有9种情况,如下:(结果保留整数) 分组第一组离差平方和第二组离差平方和组内离差平方和第1个间隔0147147第2个间隔89098第3个间隔143448第4个间隔512475第5个间隔821698第6个间隔1035108第7个间隔1351136第8个间隔1821183第9个间隔2180218
观察最后一列组内离差平方和可以发现,当按第3个间隔分组时,组内离差平方和最小.因此,按组内离差平方和最小的分法为___________和___________. 答案: 【综合拓展类作业】 5.现有一组数据:8,12,16,20,24,28.若将其分为2组,试根据组内离差平方和最小的原则,确定最优分组方式,并计算分组后的总组内离差平方和. 解:分组方式1:前3个与后3个数据,即和. 第一组:, 离差平方和. 第二组:, 离差平方和. 总离差平方和:. 分组方式2:奇偶位置分组,即和. 第一组:, 离差平方和. 第二组:, 离差平方和. 总离差平方和:. 分组方式3:小值与大值分组,即和. 第一组:, 离差平方和. 第二组:,离差平方和. 总离差平方和:. 最优分组为和,总组内离差平方和为64.
教学反思 本节课通过实例引导学生理解数据分组的原则,学生基本能掌握组内离差平方和的计算方法,但部分学生对组内、组间离差平方和的关联理解不透彻,在实际分组时,难以将计算结果与分组决策有效结合,对分组的合理性分析不够深入.后续教学应加强步骤梳理,多结合生活实例,强化计算与应用的衔接,提升学生运用统计方法解决实际问题的能力.
21世纪教育网(www.21cnjy.com)中小学教育资源及组卷应用平台
同步探究学案
课题 24.4 数据的分组 单元 第二十四章 学科 数学 年级 八年级
学习 目标 1.理解并会计算组内、组间离差平方和,明确二者关联. 2.掌握“组内离差平方和最小”原则,能合理分组解决实际问题. 3.体会离差平方和在数据分组中的应用价值,培养数据分析与逻辑推理能力,提升用统计方法解决实际问题的意识.
重点 理解组内、组间离差平方和的概念,掌握“组内离差平方和最小”的分组原则.
难点 能运用“组内离差平方和最小”原则,对数据进行合理分组并解决实际问题.
探究过程
导入新课 【引入思考】 1.什么是离差? 2.什么是离差平方和?
新知探究 本节课来研究: 本节我们借助离差平方和刻画数据的离散程度,研究数据的分组。 问题:一家公司向社会招聘一名员工,所有应聘者先统一参加笔试,然后根据笔试成绩确定一部分应聘者进入面试.将10名应聘者的笔试成绩(百分制)按从小到大的顺序排列如下: 58 64 68 75 76 83 85 89 90 92 你认为哪一部分应聘者应当进入面试? 自然,应当选择笔试成绩好的应聘者进入面试.那么笔试成绩怎样才算好呢?可以有不同的标准.例如,前三名或85分及以上等.不管哪种标准,目的都是把笔试成绩分成好和差两组. 对笔试成绩进行分组,上面提到的标准各有其合理性,在实际中也经常被采用.但这些标准都没有考虑数据自身的特点,这可能导致两个很接近的笔试成绩被分到不同的组.例如,83分与85分的差距很小,若以“85分及以上”为好成绩的标准,则85分属于好成绩,而83分属于差成绩.而从公司确定面试应聘者的角度看,把笔试成绩相对接近的分到同一组,是一种较合理的做法.因此,笔试成绩可以根据组内差异最小的原则进行分组. 将笔试成绩按从小到大的顺序排列,使相互最接近的笔试成绩都挨在了一起.因此,要使分组后的组内差异最小,只需在已排序数据的基础上寻找分组方法.可以发现,10个笔试成绩按顺序排列形成9个间隔,如图所示. 58|64|68|75|76|83|85|89|90|92 每个间隔都可以把笔试成绩分成好和差两组,共有9种分法. 思考:怎么刻画组内笔试成绩差异的大小呢?哪种分法能使笔试成绩好和差两组的组内差异最小? 在前面的学习中,我们知道,离差平方和可以刻画一组数据的离散程度.下面我们利用离差平方和刻画组内数据的离散程度,进而对数据进行分组. 一般地,设有n个数据x1,x2,…,xn,其平均数记为,则离差平方和为 d2=(x1-)2+(x2-)2+…+(xn-)2. 如果把这组数据分为两组,前m(m<n)个数据为一组,后(n-m)个数据为一组,它们的平均数分别记为1和2,离差平方和分别为 =(x1-1)2+(x2-1)2+…+(xm-1)2, =(xm+1-2)2+(x m+2-2)2+…+(xn-2)2, 那么 d2=(x1-1+1-)2+(x2-1+1-)2+…+(xm-1+1-)2+(x m+1-2+2-)2+(x m+2-2+2-)2+…+(xn-2+2-)2 =(x1-1)2+(x2-1)2+…+(xm-1)2+(x m+1-2)2+(x m+2-2)2+…+(xn-2)2+m(x1-)2+(n-m)(x2-)2 =+m(x1-)2+(n-m)(x2-)2 其中称为组内离差平方和,表示两个组内数据的离散程度; 记=m(x1-)2+(n-m)(x2-)2, 是m个第一组数据平均数、(n-m)个第二组数据平均数关于总体数据平均数的离差平方和,称为组间离差平方和,表示两个组间的差异.根据组内离差平方和最小的原则进行分组时,由于d2不变,既可以按最______来分组,也可以按最______来分组. 这样,根据组内离差平方和最小的原则,能使笔试成绩相差较小的应聘者分在同一组.利用计算器或信息技术工具,可以计算出图中的9种分法的组内离差平方和(结果保留小数点后一位),如表所示. 分组第一组离差平方和第二组离差平方和组内离差平方和第1个间隔0799.6799.6第2个间隔18503.5521.5第3个间隔50.7271.4322.1第4个间隔152.8170.8323.6第5个间隔228.854.8283.6第6个间隔411.326437.3第7个间隔587.44.7592.1第8个间隔819.52821.5第9个间隔1026.201026.2
观察最后一列组内离差平方和可以发现,当按第5个间隔分组时,组内离差平方和最小.因此,按组内离差平方和最小的分法为 {58,64,68,75,76} 和 {83,85,89,90,92}. 例:10个城市某月的每日最高温度的平均数(简称平均高温)如表所示 城市北京石家庄呼和浩特哈尔滨上海广州海口成都贵阳昆明平均高温/℃33-3-1110212212917
根据平均高温的组内离差平方和最小的原则,把这10个城市分为两组. 问题:结合地理课所学知识,说一说这样分组合理吗?
课堂练习 【知识技能类练习】 必做题: 1.如果组内离差平方和很大,说明( ) A.组间差异大 B.组内差异大 C.总差异小 D.均值相等 2.学校种植园中有4盆相同品种的植物,需要按植物的株高分成两组进行培养,使得同组内植物株高尽量接近,将4盆植物的株高从小到大排序后分成两组,共有3种情况,计算它们的组内离差平方和结果如下表所示,则4盆植物的最优分组序号是___________. 序号分组情况组内离差平方和①第一组1个,第二组3个44②第一组2个,第二组2个28③第一组3个,第二组1个16.67
3.设有两组数据,第一组数据为3,5,7;第二组数据为6,8,10.分别计算这两组数据各自的组内离差平方和. 选做题: 4.在引体向上测试中,5名同学完成的个数分别为13,15,7,9,12.要使个数相差较小的同学分在一组,下表是4种分法的组内离差平方和(结果保留小数点后一位) 分组第一组离差平方和第二组离差平方和组内离差平方和第1个间隔0第2个间隔2第3个间隔2第4个间隔0
根据组内离差平方和最小原则,把这5名同学引体向上的个数分为两组,下列分组正确的是( ) A.和 B.和 C.和 D.和 【综合拓展类练习】 5.某工厂生产一批零件,随机抽取6个零件的直径(单位:)为10.2,10.3,10.5,10.8,11.0,11.2.质检部门想将零件分为“合格组”和“待复检组”,要求组内直径波动最小,如何分组?计算最小组内离差平方和(结果保留小数点后两位).
课堂小结 说一说:今天这节课,你都有哪些收获?
作业设计 【知识技能类作业】 必做题: 1.在分组时要求“组内离差平方和最小”,其目的是( ) A.使每组数据量相等 B.使每组组内数据差异尽可能小,组间数据差异尽可能大 C.减少计算复杂度 D.保证组间均值相等 2.将一组数据,,,,,分成前个一组,后个一组,则这组数据的组内离差平方和是___________. 3.在统计学里,分组的方法有很多,其中较常用的方法是使“组内离差平方和达到最小”.多组数据的组内离差平方和是指每组数据的离差平方和的和.现在有10个苹果的直径分别是65,75,76,69,80,70,76,81,78,80.按照“组内离差平方和达到最小”的方法,把这10个苹果按直径大小分成两组. 选做题: 4.山西省晋南地区独特的地理与气候条件,为苹果提供了良好的生长条件,运城地处北纬,黄土层深厚肥沃,是公认的苹果“黄金生产带”.现某苹果商贩购进一批苹果按照苹果的个头进行包装销售.抽取其中的10个苹果直径为,按照“组内离差平方和达到最小”的方法分成2组,将这10个数据从小到大排序,分别按前个数据为第一组、其余数据为第二组()进行分组,共有9种情况,如下:(结果保留整数) 分组第一组离差平方和第二组离差平方和组内离差平方和第1个间隔0147147第2个间隔89098第3个间隔143448第4个间隔512475第5个间隔821698第6个间隔1035108第7个间隔1351136第8个间隔1821183第9个间隔2180218
观察最后一列组内离差平方和可以发现,当按第3个间隔分组时,组内离差平方和最小.因此,按组内离差平方和最小的分法为___________和___________. 【综合拓展类作业】 5.现有一组数据:8,12,16,20,24,28.若将其分为2组,试根据组内离差平方和最小的原则,确定最优分组方式,并计算分组后的总组内离差平方和.
21世纪教育网 www.21cnjy.com 精品试卷·第 2 页 (共 2 页)
21世纪教育网(www.21cnjy.com)

展开更多......

收起↑

资源列表