资源简介 中小学教育资源及组卷应用平台第4章 数据分析4.3 数据分类 学习目标与重难点学习目标:1.理解组内离差平方和、组间离差平方和的含义,掌握其计算方法,落实数据分析素养。2.能运用“组内离差平方和最小”的原则对数据进行合理分组,提升数据处理与问题解决能力。3.体会数据分类在实际生活中的应用价值,培养严谨的统计思维和科学探究精神。学习重点:组内离差平方和的计算方法,理解“组内离差平方和最小”的分组原则。学习难点:理解组内离差平方和、组间离差平方和的统计意义,体会分组方法的合理性。 学习过程一、复习回顾【回顾】什么是离差平方和?什么是方差?二、探究新知探究:组内离差平方和与组间离差平方和教材第144页【探究】某田径队10名运动员跳远的最好成绩如下:编号 ① ② ③ ④ ⑤ ⑥ ⑦ ⑧ ⑨ ⑩成绩/m 5.85 6.13 6.11 6.01 5.91 6.19 5.81 5.84 6.22 5.98教练组拟根据这组数据将队员分为两组进行分层训练,应当如何划分呢 【定义】一般地,设一组数据为, ,…, ,它的平均数为,离差平方和为.如果把这组数据分为两组,前m个数据为第一组,后个数据为第二组.第一组的平均数记作,第二组的平均数记作,,其中称为组内离差平方和,反映了两个组内数据的离散程度,称为组间离差平方和,反映了两组数据之间的差异程度.数学上已经证明=+.【做一做】编号 ① ② ③ ④ ⑤ ⑥ ⑦ ⑧ ⑨ ⑩成绩/m 5.85 6.13 6.11 6.01 5.91 6.19 5.81 5.84 6.22 5.98任务一:将数据从小到大排列任务二:观察,将数据分为两组任务三:计算组内离差平方和、组间离差平方和、离差平方和【注意】在大数据分析中,数据的分组是重要的方法之一. 虽然可以有多种方法对数据进行分组,但是,使得“组内离差平方和最小”的方法是最传统的,也是非常合理的.三、合作交流【思考】1.上述分组符合“组内离差平方和最小”的原则吗?2.有几种分组方法?3.哪种分组情况组内离差平方和最小?以小组为单位合作计算:分组情况 组内离差平方和 分组情况 组内离差平方和第一组1个 第二组9个 第一组6个 第二组4个第一组2个 第二组8个 第一组7个 第二组3个第一组3个 第二组7个 第一组8个 第二组2个第一组4个 第二组6个 第一组9个 第二组1个第一组5个 第二组5个四、课堂练习【知识技能类作业】必做题1.将数据:3,5,7,9,11分为两组,第一组:3,5,7,第二组:9,11,则此种分组情况下的组间离差平方和是( )A.25 B.30 C.40 D.452.若一组数据在某种分组情况下的离差平方和D2=50,组内离差平方和…=30,则组间离差平方和等于( )A.20 B.30 C.80 D.无法确定3.将排序后的数据分为两组,下列关于计算组内离差平方和的说法正确的是( )A.计算第一组的离差平方和即可B.应计算两组离差平方和的总和C.仅计算最大值与最小值的差D.应计算两组离差平方和的平均数选做题4.假设4个城市的人均用水量(单位:)为:城市;城市;城市;城市.根据组内离差平方和最小原则,把这4个城市分成两组,那么分组为 和 .5.在引体向上测试中,5名同学完成的个数分别为13,15,7,9,12,根据组内离差平方和最小原则,把这5名同学引体向上的个数分为两组,那么分组为 和 ,此时的组内离差平方和约为 .6.学校种植园中有4盆相同品种的植物,需要按植物的株高分成两组进行培养,使得同组内植物株高尽量接近,将4盆植物的株高从小到大排序后分成两组,共有3种情况,计算它们的组内离差平方和结果如下表所示,则4盆植物的最优分组序号是 .序号 分组情况 组内离差平方和① 第一组1个,第二组3个 44② 第一组2个,第二组2个 28③ 第一组3个,第二组1个 16.67【综合拓展类作业】7.校篮球队的五名主力队员的身高(单位:cm)分别是176,180,184,190,190,若按前3后2分成两组,求组间离差平方和.五、课堂小结这节课你收获了什么 六、作业布置1.把数据2,8,10,4,12按大小顺序分成两组,能使“组内离差平方和达到最小”的是( )。A.{2},{4,8,10,12} B.{2,4},{8,10,12}C.{2,4,8},{10,12} D.{2,4,8,10},{12}2.统计学规定,某次测量得到n个结果:x1,x2,…,xn,令y=(x-x1)2+(x-x2)2+…+(x-xn)2,当y取最小值时,对应的x的值称为这次测量的“最佳近似值”。若某次测量得到5个结果:9.8,10.1,10.5,10.3,9.8,则这次测量的“最佳近似值”为 。3.科研人员选出8株植物,在同等实验条件下,测量它们光合作用速率[单位: 统计结果为35,30,23,17,20,25,32,30,若按照“组内离差平方和达到最小”法,则需先将数据由 到 排序,再将这8株植物分成两组,共可以分成 种情况。4.甲、乙、丙、丁四名学生竞赛成绩(单位:分)如下:15,18,15,24,请按照“组内离差平方和最小”的方法,将竞赛成绩分成两组。答案解析课堂练习:1.【答案】B【解析】解:数据的平均数为(3+5+7+9+11)÷5=7,第一组的平均数为(3+5+7)÷3=5,第二组的平均数为(9+11)÷2=10,∴ 组间离差平方和是,故答案为:B2.【答案】A【解析】解: 组间离差平方和等于50-30=20,故答案为:A.3.【答案】B【解析】解:对于每组数据,计算其内部每个数据点与该组均值的差的平方和是组内离差平方和,故答案为:B.4.【答案】{A,B};{C,D}【解析】解:分组,和,组,均值为,离差平方和为;组,均值为,离差平方和为;组内离差平方和为.其他分组的总离差平方和均大于,因此该分组满足组内离差平方和最小.故答案为:{A,B};{C,D}5.【答案】;;6.667【解析】解:根据组内离差平方和最小原则,把这5名同学引体向上的个数分为两组最优分组为:和第一组平均数为:,组内离差平方和为第二组平均数为:,组内离差平方和为∴组内离差平方和约为2+6.667=6.667故答案为:;;6.6676.【答案】③【解析】解:由题意可知,要使同组内植物株高尽量接近,需选择组内离差平方和最小的分组.比较表格中三组的组内离差平方和,得,因此序号③的组内离差平方和最小,为最优分组.故答案为:③ .7.【答案】解: ,,即组间离差平方和为120作业布置:1.【答案】B【解析】解:解:由题知,因为 则 所以0+35=35;因为 则 又则 所以2+8=10;因为 则 又则( 所以因为 则 40,又 所以40+0=40.因为 所以B 选项符合题意.故答案为:B.2.【答案】10.1【解析】解:y=(x-9.8)2+(x-10.1)2+(x-10.5)2+(x-10.3)2+(x-9.8)2=x2-19.6x+96.04+x2-20.2x+102.01+x2-21x+110.25+x2-20.6x+106.09+x2-19.6x+96.04=5x2-101x+510.43=5(x-10.1)2+0.38。当x=-10.1时,y取最小值,∴这次测量的“最佳近似值”是10.1。故答案为:10.1.3.【答案】小,大,7.【解析】解:解:按照“组内离差平方和达到最小”法,则需先将数据由小到大排序,再将这8株植物分成两组时,共可以分成8-1=7种情况.故答案为:小,大,7.4.【答案】解:将4个数据从小到大排序:15,15,18,24。把4个数据分成两组,共有3种情况:第一种情况:第一组1个数据{15},离差平方和为0。第 二 组 3 个 数 据 {15, 18, 24} , 平 均 数 是离差平方和为( =42。故第一种情况的组内离差平方和为0+42=42。第二种情况:第一组2个数据{15,15},平均数是 离差平方和为0。第二组2个数据{18,24},平均数是离差平方和为故第二种情况的组内离差平方和为0+18=18。第三种情况:第一组3个数据{15,15,18},平均数是 离差平方和为(第二组1个数据{24},离差平方和为0,故第三种情况的组内离差平方和为0+6=6。∵6<18<42,∴第三种情况的组内离差平方和最小。∴将竞赛成绩分成的两组是{15,15,18},{24}。21世纪教育网 www.21cnjy.com 精品试卷·第 2 页 (共 2 页)21世纪教育网(www.21cnjy.com)中小学教育资源及组卷应用平台学 科 数学 年 级 八 设计者教材版本 湘教版 册、章 下册第4章课标要求 1.理解平均数、中位数、众数的意义,能计算中位数、众数、加权平均数,知道它们是对数据集中趋势的描述。 2.体会刻画数据离散程度的意义,会计算一组简单数据的离差平方和、方差。 3.经历数据分类的活动,知道按照组内离差平方和最小的原则 对数据进行分类的方法。 4.通过实例,了解频数和频数分布的意义,能画频数直方图,能利用频数直方图解释数据中蕴含的信息。 5.体会样本与总体的关系,知道可以用样本平均数估计总体平均数,用样本方差估计总体方差。 6.会计算四分位数,了解四分位数与箱线图的关系,感悟百分位数的意义。 7.能解释数据分析的结果,能根据结果作出简单的判断和预测,并能进行交流。内容分析 本单元属于初中数学“统计与概率”模块,是学生在数据收集、整理基础上开展数据分析的关键内容,也是衔接中小学统计知识的重要桥梁。教材以“数据特征分析—数据分布呈现—统计思想应用”为主线,系统编排了统计量计算、数据分类、图表解读与总体估计等内容,层层递进构建了数据分析的知识体系,既落实计算技能,也渗透统计思想,是培养学生数据意识的重要载体。学情分析 八年级学生已具备基础的算术运算与初步数据处理经验,对平均数、条形图等内容有一定认知,且在生活中接触过各类统计数据,具备学习基础。但学生抽象思维仍在发展,对加权平均数权重、方差的波动意义、样本估计总体等概念理解易停留在表面,存在机械套用公式、不会结合情境选择统计量等问题,需通过生活化情境与探究活动引导突破难点。单元目标 (一)教学目标 1.理解平均数、中位数、众数、方差等统计量的意义,掌握其计算方法,能结合情境合理选择统计量描述数据特征,发展数据意识与运算能力。 2.掌握箱线图、频数直方图的解读方法,能从图表中提取信息、分析数据分布,提升数据分析与直观想象素养。 3.理解用样本估计总体的统计思想,能运用统计知识解决实际问题,发展数学建模与应用意识。 4.在数据分析中体会统计的随机性,培养理性思考、合作探究的能力,形成用数据说话的科学态度。 (二)教学重点、难点 重点:理解各类统计量的意义,掌握平均数、方差、频数分布的计算方法,能结合情境选择统计量分析数据,解读统计图表信息。 难点:理解加权平均数的权重意义、方差刻画数据波动的本质,灵活选择统计量解决实际问题,理解用样本估计总体的统计思想。单元知识结构框架及课时安排 (一)单元知识结构框架 (二)课时安排 课时编号单元主要内容课时数4.1平均数、中位数、众数24.2方差14.3数据分类14.4四分位数与箱线图24.5数据的频数分布24.6总体的平均数与方差的估计14.7统计的简单应用1第4章小结与复习1综合与实践估计池塘中鱼的数量1达成评价 课题课时目标达成评价评价任务4.1 平均数、中位数、众数(1)1.理解算术平均数、加权平均数的概念,掌握两类平均数的计算方法,能运用加权平均数解决实际问题。 2.经历从实际情境中抽象平均数概念的过程,体会“权”对平均数的影响,发展数据分析与数学建模能力。 3.感受统计知识在生活中的应用价值,培养用数据说话的理性思维,提升数学应用意识与核心素养。能运用平均数与加权平均数解决实际问题。任务一:复习导入,回顾什么是平均数。 任务二:探究新知,探究平均数与加权平均数。 任务三:例题精讲,运用知识。 任务四:巩固练习,课堂小结。4.1 平均数、中位数、众数(2)1.掌握中位数、众数的计算方法,能准确求解两组及以上数据的中位数,识别众数。 2.对比分析平均数、中位数、众数的特点,能结合实际情境选择恰当的统计量分析数据,发展数据分析素养。 3.体会统计知识在生活中的应用价值,培养用数据理性分析问题的思维,提升数学应用意识。1.能准确求解两组及以上数据的中位数,识别众数。 2.能结合实际情境选择恰当的统计量分析数据,发展数据分析素养。任务一:复习导入,回顾旧知。 任务二:探究新知,探究中位数与众数。 任务三:例题精讲,运用新知。 任务四:巩固练习,课堂小结。4.2 方差1.理解方差概念,掌握方差计算公式,能正确计算数据的离差平方和与方差。 2.理解方差的统计意义,会用方差比较两组数据的稳定性,解决实际问题。 3.经历方差概念形成过程,提升数据分析与运算能力,培养统计思维。1.能正确计算数据的离差平方和与方差。 2.会用方差比较两组数据的稳定性,解决实际问题。任务一:复习导入,求平均数。 任务二:探究新知,了解什么是方差. 任务三:例题精讲,求方差。 任务四:巩固练习,课堂小结。4.3 数据分类1.理解组内离差平方和、组间离差平方和的含义,掌握其计算方法。 2.能运用“组内离差平方和最小”的原则对数据进行合理分组。能运用“组内离差平方和最小”的原则对数据进行合理分组。任务一:情境导入,认真思考。 任务二:探究新知,探究数据分类. 任务三:巩固练习,课堂小结4.4 四分位数与箱线图(1)1.理解百分位数、四分位数的概念,掌握其计算方法,落实数据分析素养。 2.能根据数据个数和排列情况,正确计算第25、50、75百分位数,提升数据处理能力。能根据数据个数和排列情况,正确计算第25、50、75百分位数。任务一:情境导入。 任务二:探究新知,探究四分位数。 任务三:例题精讲,进行计算。 任务四:巩固练习,课堂小结。4.4 四分位数与箱线图(2)1.理解四分位差的概念与统计意义,掌握箱线图的构成与解读方法。 2.能利用四分位差比较数据的离散程度,会根据数据绘制箱线图,提升数据处理与可视化能力。1.掌握箱线图的构成与解读方法。 2.能利用四分位差比较数据的离散程度,会根据数据绘制箱线图。 任务一:复习导入。 任务二:探究新知,探究箱线图。 任务三:例题精讲,进行绘制。 任务四:巩固练习,课堂小结。4.5.1 频数与频率1.理解频数、频率的概念,掌握其计算方法,落实数据分析素养。 2.能对实际数据进行频数统计与频率计算,提升数据整理与处理能力。 3.体会频数与频率在描述数据分布、分析实际问题中的作用,培养用统计思维解决问题的意识。能对实际数据进行频数统计与频率计算。任务一:情境导入,数据分类。 任务二:探究新知,探究频数与频率。 任务三:例题精讲,进行计算。 任务四:巩固练习,课堂小结。4.5.2 频数直方图1.理解频数直方图的概念,掌握其绘制步骤,落实数据分析素养。 2.能对实际数据进行分组、列频数分布表并绘制频数直方图,提升数据整理与可视化能力。能对实际数据进行分组、列频数分布表并绘制频数直方图。任务一:情境导入。 任务二:探究新知,理解频数直方图的概念。 任务三:例题精讲,进行绘制。 任务四:巩固练习,课堂小结。4.6 总体的平均数与方差的估计1.理解用样本平均数、样本方差估计总体平均数与方差的统计思想,落实数据分析素养。 2.掌握样本平均数、样本方差的计算方法,能运用抽样估计解决实际问题,提升数据处理与统计推断能力。1.能运用样本平均数、样本方差估计总体平均数与方差。 2.能运用抽样估计解决实际问题。任务一:复习回顾。 任务二:探究新知,总体的平均数与方差的估计。 任务三:例题精讲,进行估计。 任务四:巩固练习,课堂小结。4.7 统计的简单应用1.理解用样本频率估计总体频率的方法,掌握散点图的绘制与解读,落实数据分析素养。 2.能运用抽样估计解决实际问题,通过散点图分析变量关系,提升数据处理与统计决策能力。1.能用样本频率估计总体频率,掌握散点图的绘制与解读。 2.能运用抽样估计解决实际问题,通过散点图分析变量关系。任务一:复习导入,回顾旧知。 任务二:探究新知,探究统计的简单应用。 任务三:例题精讲,进行估计与绘制。 任务四:巩固练习,课堂小结。第4章 小结与评价1.系统梳理本单元核心知识点,构建完整的数据分析知识体系,落实数据分析素养。 2.能熟练运用平均数、方差、频数分布、抽样估计等知识解决实际问题,提升数据处理与综合应用能力。 3.体会统计知识在实际问题中的应用价值,培养严谨的统计思维与知识整合能力。1.能构建完整的数据分析知识体系。 2.能熟练运用平均数、方差、频数分布、抽样估计等知识解决实际问题。 任务一:知识图谱,梳理本章知识点。 任务二:思考回顾,回顾重点知识,了解注意事项 任务三:自评互评,了解知识掌握情况 任务四:巩固练习,进行习题自测。综合与实践:估计池塘中鱼的数量1.理解标记重捕法的原理,掌握用样本频率估计总体数量的计算方法。 2.能通过模拟试验探究标记重捕法的过程,提升动手实践、合作探究与数据处理能力。1.能用样本频率估计总体数量的计算方法。 2.能通过模拟试验探究标记重捕法的过程。任务一:情境导入。 任务二:认真思考, 合作探究。 任务三:合作交流,进行估计。21世纪教育网(www.21cnjy.com)中小学教育资源及组卷应用平台分课时教学设计第一课时《4.3 数据分类》教学设计课型 新授课 复习课 试卷讲评课 其他课 教学内容分析 《数据分类》是湘教版八年级下册第4章《数据分析》的第二节的内容。本节课是湘教版八年级下册数据分析单元中“数据分类”的内容,以跳远成绩分组为载体,通过引入组内离差平方和、组间离差平方和的概念,渗透“组内差异小、组间差异大”的分类原则,衔接了平均数、方差等已有统计知识,为后续聚类分析等统计方法的学习奠定基础,同时培养学生用数据说话的统计思维。学习者分析 八年级学生已掌握平均数、方差的计算方法,具备初步的数据分析能力,但对“用离差平方和进行数据分组”的量化分类方法较为陌生,抽象的统计概念理解存在一定难度。同时,学生对“为何这样分组”的合理性探究兴趣浓厚,需要借助具体实例降低理解门槛,引导其从“感性分组”向“理性量化分组”过渡。教学目标 1.理解组内离差平方和、组间离差平方和的含义,掌握其计算方法,落实数据分析素养。 2.能运用“组内离差平方和最小”的原则对数据进行合理分组,提升数据处理与问题解决能力。 3.体会数据分类在实际生活中的应用价值,培养严谨的统计思维和科学探究精神。教学重点 组内离差平方和的计算方法,理解“组内离差平方和最小”的分组原则。教学难点 理解组内离差平方和、组间离差平方和的统计意义,体会分组方法的合理性。学习活动设计教师活动学生活动环节一:新知导入教师活动1: 【回顾】什么是离差平方和?什么是方差? 离差平方和:设一组数据为,,…,,各个数据与平均数之差的平方和,称为这组数据的离差平方和,记作. =()2+()2+…+()2. 离差平方和刻画了一组数据与其平均数的总离散程度. 方差:设一组数据为, ,…, ,各个数据与平均数之差的平方的平均值,称为这组数据的方差,记作. s=()2+()2+…+()2. 方差刻画了一组数据与其平均数的平均离散程度.学生活动1: 合作交流,举手回答问题 活动意图说明:复习导入有利于衔接新旧知识,提高学习效率。通过旧知识引入新的知识有利于活跃课堂教学氛围,激发学生学习动机。环节二:探究新知教师活动2: 探究:组内离差平方和与组间离差平方和 【探究】某田径队10名运动员跳远的最好成绩如下: 编号①②③④⑤⑥⑦⑧⑨⑩成绩/m5.856.136.116.015.916.195.815.846.225.98教练组拟根据这组数据将队员分为两组进行分层训练,应当如何划分呢 教师讲授:同学们,10名运动员的跳远成绩有高有低,教练想给大家做分层训练,让水平相近的同学一组练习,效果会更好。那怎么分组才最科学,能让每组里大家的水平差不多,两组之间又有明显区分呢?今天我们就来学习一个新的统计量,帮我们解决这个问题。 【定义】一般地,设一组数据为, ,…, ,它的平均数为,离差平方和为. 如果把这组数据分为两组,前m个数据为第一组,后个数据为第二组. 第一组的平均数记作,第二组的平均数记作,令 , 其中称为组内离差平方和,反映了两个组内数据的离散程度,称为组间离差平方和,反映了两组数据之间的差异程度. 数学上已经证明=+. 【做一做】 编号①②③④⑤⑥⑦⑧⑨⑩成绩/m5.856.136.116.015.916.195.815.846.225.98任务一:将数据从小到大排列 任务二:观察,将数据分为两组 任务三:计算组内离差平方和、组间离差平方和、离差平方和 教师讲授:将上述10名运动员跳远的最好成绩的数据从小到大排列,得 5.81,5.84,5.85,5.91,5.98,6.01,6.11,6.13,6.19,6.22. 观察上述数据,前5个数据相差不多,后5个数据也相差不多,于是可以尝试把前5个数据作为第一组,后5个数据作为第二组,且将第一组数据的平均数记作,第二组数据的平均数记作,将这10个数据的平均数记作. 第一组:5.81,5.84,5.85,5.91,5.98; 第二组:6.01,6.11,6.13,6.19,6.22. =(5.81+5.84+5.85+5.91+5.98)=5.878, =(6.01+6.11+6.13+6.19+6.22)=6.132, =(5.81+5.84+5.85+5.91+5.98+6.01+6.11+6.13+6.19+6.22)=6.005. 因此组内离差平方和为 = 组间离差平方和为 =5×(5.8786.005) +5×(6.1326.005) =0.16129. 另外,这10个数据的离差平方和S 为 =(5.816.005) +(5.846.005) +(5.856.005) +(5.916.005) +(5.986.005) +(6.016.005) +(6.116.005) +(6.136.005) +(6.196.005) +(6.226.005) =0.20605. 又+=0.04476+0.16129=0.20605, 于是=+. 教师讲授:在大数据分析中,数据的分组是重要的方法之一. 虽然可以有多种方法对数据进行分组,但是,使得“组内离差平方和最小”的方法是最传统的,也是非常合理的.学生活动2: 学生认真思考 认真听讲 认真听讲,了解什么是组内离差平方和和组间离差平方和 认真听讲,了解组内离差平方和、组间离差平方和、离差平方和之间的关系 学生认真思考,完成任务 认真听讲 分组 计算平均数 计算离差平方和 计算组间离差平方和 计算离差平方和 认真听讲,了解数据分类的原则活动意图说明:借助跳远成绩分组实例,引入组内、组间离差平方和概念,通过计算验证平方和分解关系,让学生理解统计分组科学依据,提升数据分析素养。环节三:合作交流教师活动3: 教师提问:1.上述分组符合“组内离差平方和最小”的原则吗? 2.有几种分组方法? 3.哪种分组情况组内离差平方和最小? 以小组为单位合作计算: 分组情况组内离差平方和分组情况组内离差平方和第一组1个 第二组9个第一组6个 第二组4个第一组2个 第二组8个第一组7个 第二组3个第一组3个 第二组7个第一组8个 第二组2个第一组4个 第二组6个第一组9个 第二组1个第一组5个 第二组5个教师讲授:计算结果表明,将排序后的前6个数据分为一组,后4个数据分为另一组,可以使组内离差平方和最小 .即应将编号为①④⑤⑦⑧⑩的运动员分为一组,其他运动员为另一组进行分层训练 .通过数据也可以看到,这样的分组是合理的. 教师讲授: 数据分组的一般步骤 1.将所给的一组数据按从小到大的顺序排列. 2.将排序后的一组数据依次分成两组,有种情况. 3.计算每种情况下的组内离差平方和. 4.比较各种情况的组内离差平方和的大小,最小的一组即要分组的形式.学生活动3: 学生认真思考 认真计算 认真听讲 认真听讲,了解数据分组的一般步骤活动意图说明:学生通过合作探究不仅促进了学生的合作意识,还有利于提高学生解决问题的能力,能促进学生的全面发展。环节四:课堂总结教师活动4: 组内离差平方和: 组间离差平方和: 数据分组的一般步骤 1.将所给的一组数据按从小到大的顺序排列. 2.将排序后的一组数据依次分成两组,有种情况. 3.计算每种情况下的组内离差平方和. 4.比较各种情况的组内离差平方和的大小,最小的一组即要分组的形式.学生活动4: 学生跟随教师对学习内容进行归纳梳理 活动意图说明:对课堂教学进行归纳梳理,给学生一个整体印象,促进学生掌握知识总结规律。板书设计课堂练习 【知识技能类作业】 必做题: 1.将数据:3,5,7,9,11分为两组,第一组:3,5,7,第二组:9,11,则此种分组情况下的组间离差平方和是( ) A.25 B.30 C.40 D.45 2.若一组数据在某种分组情况下的离差平方和D2=50,组内离差平方和…=30,则组间离差平方和等于( ) A.20 B.30 C.80 D.无法确定 3.将排序后的数据分为两组,下列关于计算组内离差平方和的说法正确的是( ) A.计算第一组的离差平方和即可 B.应计算两组离差平方和的总和 C.仅计算最大值与最小值的差 D.应计算两组离差平方和的平均数 选做题: 4.假设4个城市的人均用水量(单位:)为:城市;城市;城市;城市.根据组内离差平方和最小原则,把这4个城市分成两组,那么分组为 和 . 5.在引体向上测试中,5名同学完成的个数分别为13,15,7,9,12,根据组内离差平方和最小原则,把这5名同学引体向上的个数分为两组,那么分组为 和 ,此时的组内离差平方和约为 . 6.学校种植园中有4盆相同品种的植物,需要按植物的株高分成两组进行培养,使得同组内植物株高尽量接近,将4盆植物的株高从小到大排序后分成两组,共有3种情况,计算它们的组内离差平方和结果如下表所示,则4盆植物的最优分组序号是 . 序号分组情况组内离差平方和①第一组1个,第二组3个44②第一组2个,第二组2个28③第一组3个,第二组1个16.67【综合拓展类作业】 7.校篮球队的五名主力队员的身高(单位:cm)分别是176,180,184,190,190,若按前3后2分成两组,求组间离差平方和.作业设计 【知识技能类作业】 必做题: 1.把数据2,8,10,4,12按大小顺序分成两组,能使“组内离差平方和达到最小”的是( )。 A.{2},{4,8,10,12} B.{2,4},{8,10,12} C.{2,4,8},{10,12} D.{2,4,8,10},{12} 2.统计学规定,某次测量得到n个结果:x1,x2,…,xn,令y=(x-x1)2+(x-x2)2+…+(x-xn)2,当y取最小值时,对应的x的值称为这次测量的“最佳近似值”。若某次测量得到5个结果:9.8,10.1,10.5,10.3,9.8,则这次测量的“最佳近似值”为 。 3.科研人员选出8株植物,在同等实验条件下,测量它们光合作用速率[单位: 统计结果为35,30,23,17,20,25,32,30,若按照“组内离差平方和达到最小”法,则需先将数据由 到 排序,再将这8株植物分成两组,共可以分成 种情况。 【综合拓展类作业】 4.甲、乙、丙、丁四名学生竞赛成绩(单位:分)如下:15,18,15,24,请按照“组内离差平方和最小”的方法,将竞赛成绩分成两组。教学反思 本节课通过跳远成绩实例引导学生从感性分组过渡到量化分组,大部分学生能掌握组内离差平方和的计算,但部分学生对公式的统计意义理解仍不够透彻,后续可增加更多生活化实例(如湿度数据、成绩分组)帮助学生内化概念。同时,课堂上对“组内离差平方和最小”原则的探究过程可进一步放手,让学生自主尝试不同分组方式,在对比中体会量化分组的优势,提升探究的深度与主动性。21世纪教育网(www.21cnjy.com)(共33张PPT)第4章 数据分析4.3 数据分类01教学目标02新知导入03新知讲解04课堂练习05课堂小结06作业布置01教学目标理解组内离差平方和、组间离差平方和的含义,掌握其计算方法,落实数据分析素养。01能运用“组内离差平方和最小”的原则对数据进行合理分组,提升数据处理与问题解决能力。02体会数据分类在实际生活中的应用价值,培养严谨的统计思维和科学探究精神。0302新知导入回顾1.什么是离差平方和?2.什么是方差?设一组数据为, ,…, ,各个数据与平均数之差的平方和,称为这组数据的离差平方和,记作.=(x1)2+()2+…+(xn)2.02新知导入设一组数据为, ,…, ,各个数据与平均数之差的平方的平均值,称为这组数据的方差,记作.s=(x1)2+()2+…+(xn)2.=03新知探究一种划分的方法是,使得每一组的数据比较稳定,即每一组数据的组内差异小,组间差异大.探究某田径队10名运动员跳远的最好成绩如下:编号 ① ② ③ ④ ⑤ ⑥ ⑦ ⑧ ⑨ ⑩成绩/m 5.85 6.13 6.11 6.01 5.91 6.19 5.81 5.84 6.22 5.98教练组拟根据这组数据将队员分为两组进行分层训练,应当如何划分呢 03新知探究一般地,设一组数据为, ,…, ,它的平均数为,离差平方和为.如果把这组数据分为两组,前m个数据为第一组,后个数据为第二组., ,… , , ,… ,第一组第二组03新知探究第一组的平均数记作,第二组的平均数记作,令,其中称为组内离差平方和,反映了两个组内数据的离散程度,称为组间离差平方和,反映了两组数据之间的差异程度.数学上已经证明=+.03新知探究编号 ① ② ③ ④ ⑤ ⑥ ⑦ ⑧ ⑨ ⑩成绩/m 5.85 6.13 6.11 6.01 5.91 6.19 5.81 5.84 6.22 5.98任务一:将数据从小到大排列任务二:观察,将数据分为两组任务三:计算组内离差平方和、组间离差平方和、离差平方和将上述10名运动员跳远的最好成绩的数据从小到大排列,得5.81,5.84,5.85,5.91,5.98,6.01,6.11,6.13,6.19,6.22.03新知探究编号 ① ② ③ ④ ⑤ ⑥ ⑦ ⑧ ⑨ ⑩成绩/m 5.85 6.13 6.11 6.01 5.91 6.19 5.81 5.84 6.22 5.98观察上述数据,前5个数据相差不多,后5个数据也相差不多,于是可以尝试把前5个数据作为第一组,后5个数据作为第二组,且将第一组数据的平均数记作,第二组数据的平均数记作,将这10个数据的平均数记作.03新知探究=(5.81+5.84+5.85+5.91+5.98)=5.878,=(6.01+6.11+6.13+6.19+6.22)=6.132,=(5.81+5.84+5.85+5.91+5.98+6.01+6.11+6.13+6.19+6.22)=6.005.第一组:5.81,5.84,5.85,5.91,5.98;第二组:6.01,6.11,6.13,6.19,6.22.03新知探究第一组:5.81,5.84,5.85,5.91,5.98;第二组:6.01,6.11,6.13,6.19,6.22.因此组内离差平方和为03新知探究组间离差平方和为=5×(5.8786.005) +5×(6.1326.005) =0.16129.另外,这10个数据的离差平方和S 为=(5.816.005) +(5.846.005) +(5.856.005) +(5.916.005) +(5.986.005) +(6.016.005) +(6.116.005) +(6.136.005) +(6.196.005) +(6.226.005) =0.20605.又+=0.04476+0.16129=0.20605,于是=+.03新知探究思考上述分组符合“组内离差平方和最小”的原则吗?在大数据分析中,数据的分组是重要的方法之一. 虽然可以有多种方法对数据进行分组,但是,使得“组内离差平方和最小”的方法是最传统的,也是非常合理的.想一想:有几种分组方法?03新知探究按照组内离差平方和最小的原则,应保证跳远最好成绩相差不多的运动员在一个组,将从小到大排列后的10个数据依次分为两组,有下面9种情况:第一组1个数据,第二组9个数据;第一组2个数据,第二组8个数据;…;第一组9个数据,第二组1个数据.哪种分组情况组内离差平方和最小?03新知探究分组情况 组内离差平方和 分组情况 组内离差平方和第一组1个 第二组9个 第一组6个 第二组4个第一组2个 第二组8个 第一组7个 第二组3个第一组3个 第二组7个 第一组8个 第二组2个第一组4个 第二组6个 第一组9个 第二组1个第一组5个 第二组5个0.16380.12510.07980.05100.04480.04070.07480.10610.154703新知探究计算结果表明,将排序后的前6个数据分为一组,后4个数据分为另一组,可以使组内离差平方和最小 .即应将编号为①④⑤⑦⑧⑩的运动员分为一组,其他运动员为另一组进行分层训练 .通过数据也可以看到,这样的分组是合理的.03新知探究数据分组的一般步骤1.将所给的一组数据按从小到大的顺序排列.2.将排序后的一组数据依次分成两组,有种情况.3.计算每种情况下的组内离差平方和.4.比较各种情况的组内离差平方和的大小,最小的一组即要分组的形式.04课堂练习【知识技能类作业】必做题:1.将数据:3,5,7,9,11分为两组,第一组:3,5,7,第二组:9,11,则此种分组情况下的组间离差平方和是( )A.25 B.30 C.40 D.452.若一组数据在某种分组情况下的离差平方和D2=50,组内离差平方和…=30,则组间离差平方和等于( )A.20 B.30 C.80 D.无法确定BA04课堂练习3.将排序后的数据分为两组,下列关于计算组内离差平方和的说法正确的是( )A.计算第一组的离差平方和即可B.应计算两组离差平方和的总和C.仅计算最大值与最小值的差D.应计算两组离差平方和的平均数B04课堂练习【知识技能类作业】选做题:4.假设4个城市的人均用水量(单位:t)为:城市A:8;城市B:10;城市C:12;城市D:15.根据组内离差平方和最小原则,把这4个城市分成两组,那么分组为 和 .5.在引体向上测试中,5名同学完成的个数分别为13,15,7,9,12,根据组内离差平方和最小原则,把这5名同学引体向上的个数分为两组,那么分组为 和 ,此时的组内离差平方和约为 .{A,B}{C,D}{7,9}{12,13,15}6.66704课堂练习6.学校种植园中有4盆相同品种的植物,需要按植物的株高分成两组进行培养,使得同组内植物株高尽量接近,将4盆植物的株高从小到大排序后分成两组,共有3种情况,计算它们的组内离差平方和结果如下表所示,则4盆植物的最优分组序号是 .③序号 分组情况 组内离差平方和① 第一组1个,第二组3个 44② 第一组2个,第二组2个 28③ 第一组3个,第二组1个 16.6704课堂练习【综合拓展类作业】7.校篮球队的五名主力队员的身高(单位:cm)分别是176,180,184,190,190,若按前3后2分成两组,求组间离差平方和.解:,,即组间离差平方和为120.05课堂小结组内离差平方和:,.组间离差平方和:06作业布置【知识技能类作业】1.把数据2,8,10,4,12按大小顺序分成两组,能使“组内离差平方和达到最小”的是( ).A.{2},{4,8,10,12}B.{2,4},{8,10,12}C.{2,4,8},{10,12}D.{2,4,8,10},{12}B06作业布置2.统计学规定,某次测量得到n个结果:x1,x2,…,xn,令y=(xx1)2+(xx2)2+…+(xxn)2,当y取最小值时,对应的x的值称为这次测量的“最佳近似值”。若某次测量得到5个结果:9.8,10.1,10.5,10.3,9.8,则这次测量的“最佳近似值”为 .10.106作业布置3.科研人员选出8株植物,在同等实验条件下,测量它们光合作用速率[单位:统计结果为35,30,23,17,20,25,32,30,若按照“组内离差平方和达到最小”法,则需先将数据由 到 排序,再将这8株植物分成两组,共可以分成 种情况。小大706作业布置【综合拓展类作业】4.甲、乙、丙、丁四名学生竞赛成绩(单位:分)如下:15,18,15,24,请按照“组内离差平方和最小”的方法,将竞赛成绩分成两组.解:将4个数据从小到大排序:15,15,18,24.把4个数据分成两组,共有3种情况:第一种情况:第一组1个数据{15},离差平方和为0.第 二 组 3 个 数 据 {15, 18, 24} , 平 均 数 是 ,06作业布置离差平方和为( =42.故第一种情况的组内离差平方和为0+42=42.第二种情况:第一组2个数据{15,15},平均数是 ,离差平方和为0.第二组2个数据{18,24},平均数是离差平方和为.故第二种情况的组内离差平方和为0+18=18.06作业布置第三种情况:第一组3个数据{15,15,18},平均数是 ,离差平方和为( .第二组1个数据{24},离差平方和为0,故第三种情况的组内离差平方和为0+6=6.∵6<18<42,∴第三种情况的组内离差平方和最小.∴将竞赛成绩分成的两组是{15,15,18},{24}.07板书设计组内离差平方和:组间离差平方和:4.3数据分类习题讲解书写部分Thanks!https://www.21cnjy.com/recruitment/home/fine 展开更多...... 收起↑ 资源列表 4.3 数据分类 学案.docx 4.3 数据分类 教案.docx 4.3 数据分类.pptx 第4章 数据分析 大单元教学设计.docx