第20章 数据的初步分析 章末复习 课件(共26张PPT) 2025-2026学年沪科版八年级数学下册

资源下载
  1. 二一教育资源

第20章 数据的初步分析 章末复习 课件(共26张PPT) 2025-2026学年沪科版八年级数学下册

资源简介

(共26张PPT)
沪科版·八年级下册
第20章 数据的初步分析
章末复习
数据的
初步分析
数据的频数分布
数据的集中趋势
数据的离散程度
四分位数和箱线图
数据分组
频率
频数分布表
频数直方图
平均数
中位数
众数
加权平均数
离差平方和
方差
四分位数
箱线图
组内离差平方和最小
知识体系
回顾与思考
考点1
数据的频数分布
1. 在 n 个数据中,某类数据出现的次数 m 称为该类数据出现的频数, 称为该类数据出现的______.
频率
所有对象的频率之和等于1
2. 频数分布表一般由三部分组成,一是数据分组;二是频数统计;三是频数.
1.确定数据变动范围:
2.决定组距和组数:
3.决定分点;
4.列频数分布表;
5.画频数直方图.
画频数直方图的步骤有:
计算这批数据中最大数与最小数的差;
分组情况
频数
每个长方形条的高表示相应小组内数据的频数
2
3
10
19
5
1
考点2
数据的集中趋势
平均数 定义 一组数据的平均值称为这组数据的平均数
算术平均数 一般地,如果有n个数x1,x2,···,xn,那么___________________叫作这n个数的平均数
加权平均数 一般求加权平均数,可统一用下面的公式:
叫作这n个数据的加权平均数
平均数与加权平均数有什么联系和区别,举例说明加权平均数中 “权”的意义.
都反映了数据的集中趋势;
当每个数据的“权”都相等时,加权平均数就等于算术平均数.
算数平均数的各数据地位平等,加权平均数中各数据的重要性(权重)不同;
中位数 定义 将一组数据按照由小到大(或由大到小)的顺序排列,如果数据的个数是奇数,那么处于_____________就是这组数据的中位数;如果数据的个数是偶数,那么中间_________________就是这组数据的中位数
防错提醒 确定中位数时,一定要注意先把整组数据按照由小到大(或由大到小)的顺序排列,再确定
中间位置的数
两个数据的平均数
不受个别偏大或偏小数据的影响
众数 定义 一组数据中出现次数_______的数据叫作这组数据的众数
防错提醒 (1)一组数据中众数不一定只有一个,还可能没有;
(2)当一组数据中含极端值时,其平均数往往不能准确反映这组数据的集中趋势,应考虑用中位数或众数来分析
最多
例 某校举办校园唱红歌比赛,选出10名同学担任评委,并事先拟定从如下四种方案中选择合理方案来确定演唱者的最后得分(每个评委打分最高10分).
方案1:所有评委给分的平均分.
方案2:在所有评委中,去掉一个最高分和一个
最低分,再计算剩余评委的平均分.
方案3:所有评委给分的中位数.
方案4:所有评委给分的众数.
举一反三训练
为了探究上述方案的合理性,先对某个同学的演唱成绩进行统计实验,下面是这个同学的得分统计图:
(1)分别按上述四种方案计算这个同学演唱的最后得分.
(2)根据(1)中的结果,请用统计的知识说明哪些方案不适合作为这个同学演唱的最后得分?
解:(1)方案1:
方案2:
方案3:8(分)
方案4:8 和 8.4(分)
(2)因为方案 1 中的平均数受极端数值的影响,不适合作为这个同学演唱的最后得分,所以方案 1 不适合作为最后得分的方案. 因为方案 4 中的众数有两个,众数失去了实际意义,所以方案 4 不适合作为最后得分的方案.
考点3
数据的离散程度
表示波动的量 定义 意义
离差平方和 设一组数据是x1,x2,···,xn,它们的平均数是 ,我们将 称为这组数据的离差平方和,可以简记为 . 离差平方和越大,数据的波动越_____,反之也成立

表示波动的量 定义 意义
方差 设一组数据是x1,x2,···,xn,它们的平均数是 ,我们将 称为这组数据的方差. 方差越大,数据的波动越_____,反之也成立

已知六个数据-3,-2,1,3,6,x 的中位数为 1,求这组数据的方差.
解:共有 6 个数据,排序后1总在中间.中位数应该是排序后的第 3 个数和第 4 个数的平均数,即:
举一反三训练
m25,m50,m75就把这组数据分成个数相等的四部分,因此分别称为第一四分位数(Q1)、第二四分位数(Q2)和第三四分位数(Q3),统称四分位数.
考点4
四分位数和箱线图
统计学上,常用箱线图直观地展示一组数据的统计特征值,便于分析不同类别数据各层次水平的差异(如离散程度、分布差异等).
5
4
3
2
1
0
最小值
最大值
第一四分位数
第二四分位数(中位数)
第三四分位数
须长
举一反三训练
求下列各组数据的四分位数:
(1)15,35,37,22,13,20,21,25,23;
(2)9.6,10.0,8.2,9.6,9.3,9.6,9.7,9.2,9.3,9.5,10.0,10.0,11.5,9.8.
(1) 15,35,37,22,13,20,21,25,23;
解:将这 9 个数据从小到大排列,得
13,15,20,21,22,23,25,35,37;
因为数据的个数是奇数,所以中位数 m50 = 22.
9×25% = 2.25,9×75% = 6.75.
第 25 百分位数 m25 是第3个数20,
第 75 百分位数 m75 是第7个数25.
因此,该组数据的四分位数分别为20,22,25.
(2)9.6,10.0,8.2,9.6,9.3,9.6,9.7,9.2,9.3,9.5,10.0,10.0,11.5,9.8.
解:将这 14 个数据从小到大排列,得
8.2,9.2,9.3,9.3,9.5,9.6,9.6,9.6,9.7,9.8,10.0,10.0,10.0,11.5.
14×50% = 7,中位数 m50 是第7、8个数的平均数 .
14×25% = 3.5,14×75% = 10.5.
第 25 百分位数 m25 是第 3 个数9.3,
第 75 百分位数 m75 是第 11 个数10.0.
因此,该组数据的四分位数分别为9.3,9.6,10.0.
考点5
数据分组
一个合理的分组原则是使组内离差平方和达到最小,组间离差平方和达到最大.由于总体离差平方和 S2不变,只需考虑使组内离差平方和达到最小即可.
n 个数据的总体离差平方和 S 2 可以表示为:
数据的分组一般步骤:
1. 第一步是排序;
2. 第二步是确定组数和各组内数据的个数.
我们只讨论分两组的情形,如果一共有 n 个数据,要把较小的 m 个数据分为一组,把剩下的 (n - m) 个数据分为另一组.
3. 通过“组内离差平方和最小” 的原则来确定 m 的大小.
数据分组
组内离差平方和:数值越小,组内差异越小
组间离差平方和:数值越大,不同组之间差异越明显
根据组内离差平方和最小的原则分组
总体离差平方和= 组内+组间
自评与互评
你是如何理解用平均数、中位数、众数描述数据的集中趋势的?又是如何理解用离差平方和与方差描述数据的离散程度的?请与同学交流.
用样本估计总体是一种重要的统计思想,请举例说明“用样本估计总体”在日常生活中的应用,并与同学交流.
大数据时代,统计学在各领域都有着广泛的应用.请同学们查阅与统计学相关的资料,并与大家分享.
课后作业
1.从教材习题中选取;
2.完成练习册本课时的习题.

展开更多......

收起↑

资源预览