第4章 数据分析 小结与复习 课件(共53张PPT) 2025-2026学年湘教版八年级数学下册

资源下载
  1. 二一教育资源

第4章 数据分析 小结与复习 课件(共53张PPT) 2025-2026学年湘教版八年级数学下册

资源简介

(共53张PPT)
小结与复习
第4章 数据的分析
一、平均数
平均数 定义 一组数据的平均值称为这组数据的平均数
平均数 一般地,如果有 n 个数 x1,x2,…,xn,那么__________________叫做这 n 个数的平均数
加权平均数 一般地,若 n 个数 x1,x2,…,xn 的权数分别是 f1,f2,…,fn ( f1 + f2 + … + fn = 1),则这 n 个数的加权平均数为_____________________
中位数 定义 将一组数据按照由小到大 (或由大到小) 的顺序排列,如果数据的个数是奇数,那么位于______________就是这组数据的中位数;如果数据的个数是偶数,那么中间________________就是这组数据的中位数
防错 提醒 确定中位数时,一定要注意先把整组数据按照大小顺序排列,再根据奇偶个数确定
众 数 定义 一组数据中出现次数______的数据叫做这组数据的众数
防错 提醒 (1) 一组数据中众数不一定只有一个;(2) 当一组数据中出现极端值时,其平均数往往不能准确反映这组数据的集中趋势,就应考虑结合中位数或众数来分析
中间位置的数
两个数的平均数
最多
1. 离差平方和的概念:
设一组数据为 x1,x2,…,xn,各个数据与平均数  之差的平方和,称为这组数据的离差平方和,记作 S2.

离差平方和 S2 刻画了一组数据与其平均数 的总离散程度.
二、方差
表示波 动的量 定义 意义
方差 设有一组数据 x1,x2,…,xn,各数据与它们的________的差的平方的平均值,叫做这组数据的方差,记作 s2. 即____________________________ 方差越大,数据的波动越___,反之也成立.
平均数

一般地,设一组数据为 x1,x2,…,xn,它的平均数为 ,离差平方和为 S2. 如果把这组数据分为两组,前 m 个数据为第一组,后 (n-m) 个数据为第二组,第一组的平均数记作 ,第二组的平均数记作 , 令
三、数据分类
其中 为组内离差平方和,反映承两个组内数据的离散程度,
为组间离差平方和,反映了两组数据之间的差异程度.
数学上已经证明
=+.
一般地,设一组数据的个数为 n,把这组数据从小到大排列:
(1)小于或等于中位数的数据个数与 n 的比值大于或等于 50%,大于或等于中位数的数据个数与 n 的比值大于或等于 50%,于是把中位数叫作第 50 百分位数,记作 m50.
四、四分位数与箱线图
因此 m50 也叫作第二四分位数.
由于 50% ,
(2) 如果有一个数满足“小于或等于这个数的数据个数与 n 的比值大于或等于 25%,大于或等于这个数的数据个数与 n 的比值大于或等于 75%”,那么称这个数是第 25 百分位数,记作 m25.
因此 m25 也叫作第一四分位数.
由于 25% ,
(3) 如果有一个数满足“小于或等于这个数的数据个数与 n 的比值大于或等于 75%,大于或等于这个数的数据个数与 n 的比值大于或等于 25%”,那么称这个数是第 75 百分位数,记作 m75.
因此 m75 也叫作第三四分位数.
由于 75% ,
264
260
256
252
248
244
240
零件的质量/g
最大值
最小值
第三四分位数
中位数
第一四分位数
最大值
第三四分位数
第一四分位数
最小值
中位数
像图中这样,由一组数据的最小值、第一四分位数、中位数、第三 四分位数、最大值这 5 个数绘制而成的图是这组数据的箱线图,它是由矩形“箱子”和从箱子延伸出的两条线段构成的图形,直观地表示了这组数据的分布状态.
五、频数与频率
1. 频数
把在不同小组中的数据个数称为频数.
2. 频率
(1)我们把每一组的频数与数据总数的比叫做这一组数据的频率.
(2)一般地,如果重复进行 n 次试验,某个试验结果出现的次数 m 称为在这 n 次试验中出现的频数,而频数与试验总次数的比 称为这个试验结果在这n 次试验中出现的频率.
1.条形统计图与频数直方图的区别和联系
(1) 联系——用途都是可以直观地表示出具体
数量.频数直方图是特殊的条形统计图.
(3) 绘制的形式不同——条形统计图各条形分
开;频数直方图的条形连在一起.
(2) 区别——条形统计图是直观地显示出具体
数据;频数直方图是表现频数的分布情况.
3.频数直方图
2. 制作频数直方图大致步骤:
(1) 找出所给数据中的最大值和最小值,求最大值与最小值的差确定统计量的范围;
(4) 根据分组和频数,绘制频数直方图.
(3) 统计每组中数据的频数;
(2) 确定组数和组距并进行分组 (数据个数在 100
以内,一般分 5 至 12 组);
六、用样本推断总体
知识方法要点 关键总结 注意事项
用样本平均数估
计总体平均数
从总体中选取样本,然后通过对样本的分析,去推断总体的情况.运用样本
平均数估计总体平均数
选取的样本应
具有代表性
用样本方差估计
总体方差
由于简单随机样本客观地
反映了实际情况,能够代
表总体,可以用简单随机
样本的方差去估计总体的
方差,从而比较两个样本
的稳定性
先求样本的平
均数,再求方

知识方法要点 关键总结 注意事项
用样本的“率”
去估计总体的
“率”
在实践中,常常通过简
单的随机抽样,用样本
的“率”去估计总体相
应的“率”
注意“率”和
“抽样”的含义
通过资料预测
发展趋势
在研究总体情况时,
需要先确定样本容量,
进行抽样调查,在选取简
单随机样本后整理数据、
分析数据确定样本的情况,
推断总体发展趋势
注意区分“样本”
和“总体”
七.统计的简单应用
考点一 平均数、中位数、众数
例1 某市在开展节约用水活动中,对某小区 200 户居民家庭用水情况进行统计分析,其中 3 月份比 2 月份节约用水情况如下表所示:
节水量(m3) 1 1.5 2
户数 20 120 60
请问:(1) 抽取的 200 户家庭节水量的平均数是______,中位数是______,众数是_______;
(2) 根据以上数据,估计该市 100 万户居民家庭 3 月份比2 月份的节水量是_________.
1.6
1.5
160 万 m3
1.5
1. 某米店经营某种品牌的大米,该店记录了一周中不同包装 (10 kg,20 kg,50 kg) 的大米的销售量 (单位:袋) 如下:10 kg 装100 袋;20 kg 装 220 袋;50 kg 装 80 袋.如果每 500 g 大米的进价和售价都相同,则他最应该关注的是这些销售数据 (袋数) 中的( )
A. 平均数 B. 中位数 C. 众数 D. 最大值
C 
针对训练
2. 一组数据中的一个数大小发生了变化,一定会影响这组数据的平均数、众数、中位数中的( )
A.1 个   B.2 个  C.3 个  D.0 个
A
3. 某地发生地震灾害后,某中学八 (1) 班学生积极捐款献爱心,如图所示是该班 50 名学生的捐款情况统计,则他们捐款金额的众数和中位数分别是 (  )
A.20,10  
B.10,20 
C.16,15   
D.15,16
B
4. 小刚在“中国梦·我的梦”演讲比赛中,演讲内容、语言表达、演讲技能、形象礼仪四项得分依次为 9.8,9.4,9.2,9.3. 若其综合得分按演讲内容 50%、语言表达 20%、演讲技能 20%、形象礼仪 10% 的比例计算,则他的综合得分是______分.
9.55
考点二 方差的计算及应用
例2 小明和小亮在课外活动中报名参加了短跑训练小组. 在近几次百米训练中,所测成绩如图所示,请根据图中所示解答以下问题:
次数 1 2 3 4 5
小明 13.3 13.3 13.2 13.3
小亮 13.2 13.4 13.1 13.3
13.4
13.5
(1) 根据图中信息补全表格;
(2) 分别计算成绩的平均数和方差,填入表格. 若你是老师,将小明与小亮的成绩比较分析后,将分别给予他们怎样的建议?
平均数 方差
小明
小亮
13.3
13.3
0.02
0.004
解:从平均数看,两人的平均水平相同;从方差看,小明的成绩较稳定,小亮的成绩波动较大.
给小明的建议是:加强锻炼,提高爆发力,提升短跑成绩;
给小亮的建议是:总结经验,找出成绩忽高忽低的原因,在稳定中提升.
平均数 方差
小明
小亮
13.3
13.3
0.02
0.004
针对训练
5. 小张和小李去练习射击,第一轮 10 发子弹打完后,两人的成绩如图. 根据图中的信息,小张、小李两人中成绩较稳定的是 .
小张
例3 如果把一组数据从小到大排序,用 m50 表示中位数,称为 50% 分位数,那么中位数把这组数据分为两部分,分别记为 S 和 T ;进一步,用 m25 和 m75 分别表示 S 和 T 的中位数,那么所有数据中小于或等于 m25 的占 25% ,小于或等于 m75 的占 75% .这样,m25 ,m50,m75 这三个数值把所有数据分为个数相等的四个部分,因此称为四分位数.
请求出以下这组数据:4.77,3.98,6.44,4.98,2.15,
3.85,3.64,3.21,3.18,2.02,4.11,4.10 中的
m25 =____,m50 =____,m75=____.
考点三 四分位数与箱线图
解析:将数据按从小到大排序为
2.02,2.15,3.18,3.21,3.64,3.85,3.98,4.10,4.11,4.77,4.98,6.44,
所以 m50 =
m25 =
m75 =
故答案为 3.195 ,3.915 ,4.44.
6. 已知一组数据:3,5,7,x ,9 的平均数为 6 ,则该组数据的 50% 分位数为 ( ) 
A.4.5 B.5 C.5.5 D.6
D  
7. 某地一年之内12个月的降水量分别为:71,66,64,58,56,56,56,53,53,51,48,46,则该地区的月降水量75%分位数为 ( )  
A.61 B.53 C.58 D.64
A
【变式训练】
例4 某中学七、八年级各选派 10 名选手参加学校举办的“爱我祖国”知识竞赛,计分采用 10 分制,选手得分均为整数,成绩达到 6 分或 6 分以上为合格,达到 9 分或 10 分为优秀.这次竞赛后,七、八年级两支代表
队选手成绩分布的条形统计图和成绩统计分析表如下所示,其中七年级代表队得 6 分、10 分的选手人数分别为 a,b.
考点四 分析数据做决策
队别 平均分 中位数 方差 合格率 优秀率
七年级 6.7 m 3.41 90% n
八年级 7.1 7.5 1.69 80% 10%
(1) 请依据图表中的数据,求 a,b 的值;
(2) 直接写出表中 m,n 的值;
(3) 有人说七年级的合格率、优秀率均高于八年级,所以七年级队成绩比八年级队好,但也有人说八年级队成绩比七年级队好.请你给出两条支持八年级队成绩好的理由.
(1) 解:依题意,得
解得
(2) m=6,n=20%.
(3) ① 八年级队平均分高于七年级队;
② 八年级队的成绩比七年级队稳定;
③ 八年级队的成绩集中在中上游,所以支持八年级队成绩好 (注:任说两条即可).
(3×1 + 6a + 7×1 + 8×1 + 9×1 + 10b)÷10 = 6.7,
1 + a + 1 + 1 + 1 + b = 10.
a = 5,
b = 1.
6. 经市场调查,某种优质西瓜质量为 (5±0.25) kg 的最为畅销.为了控制西瓜的质量,农科所采用 A,B 两种种植技术进行试验.现从这两种技术种植的西瓜中各随机抽取 20 个,记录它们的质量如下 (单位:kg):
A:4.1 4.8 5.4 4.9 4.7 5.0 4.9 4.8 5.8 5.2
5.0 4.8 5.2 4.9 5.2 5.0 4.8 5.2 5.1 5.0
B:4.5 4.9 4.8 4.5 5.2 5.1 5.0 4.5 4.7 4.9
5.4 5.5 4.6 5.3 4.8 5.0 5.2 5.3 5.0 5.3
针对训练
(1) 若质量为 (5±0.25) kg 的为优等品,根据以上信息完成下表:
(2) 请分别从优等品数量、平均数与方差三方面对 A,B两种技术做出评价;从市场销售的角度看,你认为推广哪种种植技术较好?
解:从优等品数量的角度看,因为 A 种技术种植的西瓜优等品数量较多,所以 A 种技术较好;
从平均数的角度看,因为 A 种技术种植的西瓜质量的平均数更接近 5 kg,所以 A 种技术较好;
从方差的角度看,因为 B 种技术种植的西瓜质量的方差更小,所以 B 种技术种植的西瓜质量更为稳定;
从市场销售角度看,因为优等品更畅销,A 种技术种植的西瓜优等品数量更多,且平均质量更接近 5 kg,因而更适合推广 A 种技术.
例5 某中学某次作文比赛后,老师将所有参赛的作文,按所得的“甲、乙、丙、丁”成绩进行了分类统计,得甲、乙、丙、丁的频率依次为 0.15、0.35、0.30、x,其中频率为 x 的频数为 20,求这次作文比赛中得甲、乙、丙的同学各有多少人.
解:∵ 0.15+0.35+0.3+x = 1,
∴ x = 0.2.参赛总人数为 20÷0.2 = 100(人),
∴ 得甲的人数为 100×0.15 = 15(人),
得乙的人数为 100×0.35 = 35(人),
得丙的人数为 100×0.30 = 30(人).
考点五 频数与频率
方法总结
各频数之和为数据总数,各频率之和为 1,频数=数据总数×频率.
8. 已知一个样本中,50 个数据分别落在 5 个组内,第 Ⅰ,Ⅱ,Ⅲ,Ⅳ,Ⅴ,五组数据的个数分别为 2,8,15,20,5,则第四组的频率为_______.
针对训练
7. 已知一个样本中,50 个数据分别落在 5 个组内,第一,二,三,五的数据个数分别为 2,8,15,5,则第四组的频数为 ,频率为 .
20
0.4
0.4
例6 对某班学生一次数学测验成绩进行各分数段人数如图所示,根据图示信息填空:
(1) 该班有学生 人;
(2) 成绩在 69.5~79.5
范围内的人数为 ;
(3) 如果以大于或等于
80 分为优良,那么该
班的优良率约为 .
4
8
12
16
4
8
10
16
12
人数(人)
分数(分)
49.5
59.5
69.5
79.5
89.5
99.5
50
10
56%
0
考点六 频数直方图及其应用
学会从图形中得到信息,然后利用所得信息结合已知解决问题,其中要注意结合应用统计图的特点.
归纳总结
9.下列说法正确的是 ( )
A. 样本的数据总数等于频数之和
B. 扇形统计图可以告诉我们各部分的数量分别是多少
C. 如果一组数据可以用扇形统计图表示,那么它一定可以用频数直方图表示
D. 将频数直方图中小长方形上面一边的一个端点顺次连接起来,就可以得到频数折线图
A
针对训练
11. 在对 60 个数据进行整理的频数分布表中,各组的频率之和为_____,各组的频数之和为_____.
60
1
12. 对某班同学的身高进行统计(单位:厘米),频数分布表中 165.5~170.5 这一组学生人数是 12,频率为 0.25,则该班共有____名同学.
48
10. 在 1000 个数据中,用适当的方法抽取 50 个作为样本进行统计,频数分布表中 54.5~57.5 这一组的频率为 0.12, 那么估计总体数据落在 54.5~57.5 之间的约有 ( )
A. 120 个 B. 60 个 C. 12 个 D. 6 个
A
例7 甲、乙、丙、丁思维选手各射击 10 次,每人的平均成绩都是 9.3 环,方差如下表:
则这四个人中成绩发挥最稳定的是(   )
 A.甲   B.乙 C.丙    D.丁
B
选手 甲 乙 丙 丁
方差 0.035 0.016 0.022 0.025
【解析】根据方差的意义可作出判断.方差是用来衡量一组数据波动大小的量,方差越小,表明这组数据分布比较集中,各数据偏离平均数越小,即波动越小,数据约稳定.
考点七 根据方差判定稳定性
方差是用来衡量一组数据波动大小的量,方差越大,表明这组数据偏离平均数越大,即波动越大,数据越不稳定;反之,方差越小,表明这组数据分布比较集中,各数据偏离平均数越小,及波动越小,数据越稳定.
方法归纳
针对训练
13.人们常用来反映数据 x1,x2,…,xn 的变化特征的量是(   )
 A.中位数   B.众数   C.方差   D.平均值
C
例8 如图是九年级某班学生适应性考试文综成绩(依 A,B,C,D 等级划分,且 A 等为成绩最好)的条形统计图和扇形统计图,请根据图中的信息回答下列问题:
(1)补全条形统计图.
(2)求 C 等所对应的扇形统计图的圆心角的度数.
(3)求该班学生共有多少人
(4)如果文综成绩是 B 等及 B 等以上的学生才能报考示范性高中,请你用该班学生的情况估计该校九年级 400名学生中,有多少名学生有资格报考示范性高中.
考点八 用样本估计总体
解析:综合条形统计图和扇形图提供的数据,先计算出总人数,而后再逐一计算出各个等级成绩的学员人数.
解:(1)调查的总人数是:15÷25% = 60 (人),
则 B 类的人数是:60×40% = 24 (人).
补全条形统计图如右:
(2) C 等所对应的扇形统计图的圆心角的度数是:
360°×(1 - 25% - 40% - 5%) = 108°.
(3) 该班学生共有 60 人.
(4) 400×(25% + 40%) = 260(人).
方法归纳
用样本的数字特征对总体的数字特征进行估计,基本做法是从数据中提取信息,并根据实际问题的需要,从样本数据的数字特征出发,对总体的数字特征进行估计.
针对训练
14.为了了解某市初三年级学生体育成绩(成绩均为整数),随机抽取了部分学生的体育成绩并分段
(A:20.5~22.5;B:22.5~24.5;C:24.5~26.5;D:26.5~28.5;E:28.5~30.5) 统计如下:体育成绩统计表
分数段 频数(人) 频率
A 12 0.05
B 36 a
C 84 0.35
D b 0.25
E 48 0.20
根据上面提供的信息,回答下列问题:
(1)在统计表中,a =    ,b =    ,并将统计图补充完整.
(2)小明说:“这组数据的众数一定在 C 中.”你认为小明的说法正确吗     (填“正确”或“错误”).
(3)若成绩在 27 分以上(含 27 分)定为优秀,则该市今年 48 000 名初三年级学生中体育成绩为优秀的学生人数约有多少
解:(1)∵ a = 1 - 0.05 - 0.35 - 0.25 - 0.20 = 0.15,
48÷0.2 = 240,
∴ b = 240×0.25 = 60.
补全统计图如右.
(2) 错误.
(3) 48 000×(0.25 + 0.20) = 21 600(人)
数据的分析
数据的一般水
平或集中趋势
数据的离散程
度或波动大小
平均数、
加权平均数
中位数
众 数
方 差




总体
简单
随机
样本
样本平均值
样本方差
随机抽样
样本的某种“率”
样本的频数、频率分布
总体平均值
总体方差
总体的某种“率”
总体的频数、频率分布
总体在未来一段时间的发展水平
总体在未来一段时间的发展趋势
估计
控制
预测

展开更多......

收起↑

资源预览