浙教版(2024)数学八下 第3章 数据分析初步 单元复习课件(共43张PPT)

资源下载
  1. 二一教育资源

浙教版(2024)数学八下 第3章 数据分析初步 单元复习课件(共43张PPT)

资源简介

(共43张PPT)
第3章 数据分析初步
单元复习
(浙教版)八年级

01
知识梳理
02
例题剖析
03
综合训练
01
知识梳理
第一部分
知识梳理
01
知识梳理
知识点1:平均数
1.平均数的定义:
一般地,有个数,, , ,我们把叫作这 个数的算术平均数,简称平均数,记作 (读作“ 拔”)。
特点
反映了一组数据取值的平均水平,是刻画数据集中趋势最常用的统计量。
01
知识梳理
知识点1:平均数
2.权重:
一组数据中,一个数的频数可以看作这个数的“权重”,简称权。
3.加权平均数:
一般地,对于一组数据,, , ,对应的权分别为,, , ,则称 为这组数据的加权平均数。
特点
加权平均数是一种考虑数据权重的统计方法,其核心特点在于通过赋予各个数据不同的重要性(权)来更准确地反映数据的整体趋势。
01
知识梳理
平均数与加权平均数的区别与联系
区别 联系
平均数 平均数对应的一组数据中的各 个数据的“权”相同。 若各个数据的权相同,
则加权平均数就是平均
数,所以平均数实质是
加权平均数的特例。
加权平 均数 加权平均数对应的一组数据中 的各个数据的“权”不一定相 同。
知识点1:平均数
01
知识梳理
知识点1:平均数
2.分布式计算:
当样本容量较大时,我们可以把样本分成若干个子样本,分别统计出平均数,然后运用计算加权平均数的方法,求出整个样本数据的平均数。将一个大的计算任务分解成若干个小的计算任务分别计算,再将结果汇总处理得到最终结果,这样的计算方式称为分布式计算。
特点
(1)可以节约整体计算时间,提高计算效率;
(2)可以减少大量数据传输和存储带来的时间、经济成本。
02
例题剖析
例1 引体向上是某市初中毕业生体育学业考试男生自主选考科目之一.
现有10名九年级男生成绩(单位:个)如下:
7,3,11,11,8,8,2,8,9,3,则这10名男生引体向上的平均成绩为( )
C
A. 9个 B. 8个 C. 7个 D. 11个
例2 某校对班级考核打分采用的方案为卫生占40%,课间纪律占30%,课堂纪律占30%.九年级一班某学期这三部分的分数依次为91分、95分、93分,则九年级一班某学期的考核分数为( C )
A. 92分 B. 92.5分
C. 92.8分 D. 93分
C
02
例题剖析
例3 某社区组织垃圾分类知识竞赛活动,A,B两个小区的居民参与,A小区的平均成绩为88分,B小区的平均成绩为95分.若A,B两个小区参与活动的居民人数之比为5∶4,则所有参与竞赛的居民的平均成绩约为( A )
A. 91分 B. 92分 C. 89分 D. 93.5分
A
01
知识梳理
知识点2:中位数与众数
1.中位数:
将一组数据按从小到大(或从大到小)的顺序排列,位于中间的数值是中位数。
特点
一组数据按大小排序后,位于中位数左、右两侧的数据个数相同,因此中位数反映一组数据取值的中间水平。
注意:(1)中位数的单位与数据的单位相同。
(2)一组数据的中位数是唯一的,它可能是这组数据中的原数据,也可能不是。#4.1.1
01
知识梳理
知识点2:中位数与众数
如何求一组数据的中位数?
中位数
①排序
②取值
将数据由小到大(或由大到小)排列
当数据的个数为奇数时,处于中间位置的数就是中位数;
当数据的个数为偶数时,居中的数据有两个,取这两个数据的平均数为这组数据的中位数.
01
知识梳理
知识点2:中位数与众数
2.众数:
众数是一组数据中出现次数最多的那个数据。
特点
众数是刻画数据集中趋势的一种统计量,当一组数据有较多的重复数据时,众数往往能较好地反映其集中趋势。
注意:求一组数据的众数时,众数可能是不唯一的,如数据1,3,3,5,5,6的众数是3和5:如果各个数据都不相同,这种情况下众数已失去意义。
01
知识梳理
知识点2:中位数与众数
如何求一组数据的众数?
①一组数据中出现次数最多的那个数据;
②如果一组数据中有两个或两个以上的数据出现的次数并列最多,那么把这几个数据都作为这组数据的众数;
③如果一组数据中没有出现相同的数据,那么就认为这组数据没有众数.
01
知识梳理
知识点2:中位数与众数
平均数 中位数 众数
概 念 一组数据的总和除以这组数据的个数所得到的商叫做这组数据的平均数. 将一组数据按照由小到大(或由大到小)的顺序排列,如果数据的个数是奇数,则称处于中间位置的数为这组数据的中位数;如果数据的个数是偶数,则称中间两个数据的平均数为这组数据的中位数. 一组数据中出现次数最多的数据就是这组数据的众数.
求法 需要计算 ①所有数据相加求和 ②和除以数据的个数 不需计算或简单计算 ①将数据按照由小到大(或由大到小)的顺序排列 ②判断数据个数是奇数还是偶数 ③奇数:中间位置 偶数:中间两个数据的平均数 不需要计算(在原数据中)
判断每个数据出现的次数
个数 唯一性 唯一性 一个或多个或没有
平均数、中位数、众数对比
01
知识梳理
知识点2:中位数与众数
平均数、中位数、众数对比
平均数 中位数 众数
代表 反映“平均水平” 反映“中等水平”,代表相对位置. 如果知道一组数据的中位数,那么可以知道,小于或大于这个中位数的数据约各占一半. 反映“多数水平”
众数往往是人们所关心的一个量.
特点 ①与每个数据有关 ②易受极端值影响 ①与排列位置有关 ②不受数据极端值影响 ①与出现次数有关
②不受极端值影响
作用 常用的数据代表,比较可靠稳定.因为与每个数据都有关,反映出来的信息最充分. 平均数可描述数据整体平均水平,也可以作为不同组数据比较的标准,应用广泛,如平均成绩,平均身高等. 可靠性较差,只利用了部分数据,当一组数据的个别数据偏大或偏小时,用中位数描述数据的集中趋势较合适. 可靠性较差,只利用了部分数据,当一组数据中的个别数据变动较大,且某个数据出现次数最多,用众数描述数据的集中趋势较合适.
联系 ①描述数据集中趋势的统计量.②是一组数据的代表值.③反映数据的一般水平.
02
例题剖析
例4 某电脑公司销售部为了制订下个月的销售计
划,对20位销售员本月的销售量进行了统计,
绘制成如图所示的统计图,则这20位销售人员
本月销售量的中位数、众数分别是( )
C
A. 17台,14台 B. 20台,12台
C. 20台,20台 D. 25台,20台
02
例题剖析
例5 某公司拟推出由7个盲
盒组成的套装产品,现有10个盲盒可供
选择,统计这10个盲盒的质量如图所示.
C
A. 甲、丁 B. 乙、戊 C. 丙、丁 D. 丙、戊
序号为1到5号的盲盒已选定,这5个盲盒质量的中位数恰好
为100,6号盲盒从甲、乙、丙中选择1个,7号盲盒从丁、戊
中选择1个,使选定7个盲盒质量的中位数仍为100,可以选
择( )
例6 如果数据20,30,50,90和 的众数是20,那么这组数据的
中位数是____,平均数是____.
30
42
01
知识梳理
知识点3:离差平方和与方差
1.离差平方和:
样本中,各数据与平均数的差(又称离差)的平方和称为
离差平方和,记为 。
特点
可以刻画一组数据的离散程度,在比较两组数据的离散程度时,只适用于数据个数相同的情况。
对于一组数据,, ,,这组数据的平均数为 ,则

01
知识梳理
知识点3:离差平方和与方差
2.方差:
一般地,一组数据的各离差的平方的平均数叫作这组数据
的方差,记为 。
特点
方差能较好地反映出数据的离散程度,方差越大,说明数据的波动越大(即离散程度越大),越不稳定;在利用方差比较两组数据的离散程度时,不受数据个数的限制。
01
知识梳理
知识点3:离差平方和与方差
3.标准差:
一组数据的方差的算术平方根称为这组数据的标准差。
特点
标准差越大,说明数据的波动越大,越不稳定。
01
知识梳理
知识点3:离差平方和与方差
4.组内离差平方和与组间离差平方和:
一般地,设有个数据,,, ,,它们的平均数为 ,离差平方和为。如果把这些数据分为两组,第1组有 个数据,平均数为,离差平方和为;第2组有个数据,平均数为 ,离差平方和为,其中。
通过计算可以得到以下等式
通常称 为组内离差平方和,它表达了两个组组内数据的离散程度;
称 为组间离差平方和,它表达了两个组之间的差异。#3.1.2
01
知识梳理
知识点3:离差平方和与方差
数据分组原则:
合理的分组原则是使 最小,同时使最大。
由于总离差平方和 不变,所以只需考虑 最小,即组内离差平方和最小即可。
特别说明:在大数据分析中,数据分组是重要的方法之一。数据分组方法有许多种,其中使得“组内离差平方和最小”的方法最为常见。
02
例题剖析
例7 甲、乙、丙、丁四支女子花样游泳队的人数相同,且平均身高相同,身高的方差分别是 =0.3cm2, =0.1cm2, =0.2cm2, =0.15cm2.身高最整齐的花样游泳队是( B )
A. 甲队 B. 乙队
C. 丙队 D. 丁队
B
例8 对于一组统计数据6,7,6,5,6.下列说法错误的是( D )
A. 平均数是6 B. 中位数是6
C. 众数是6 D. 方差是6
D
02
例题剖析
例9 八年级一班甲小组的5名学生进行飞镖训练,某次训练的成绩(单位:环)分别为4,3,5,7,6.甲小组成绩的离差平方和是  10 环2,标准差是    环.
10 
 
例10 把数据2,8,10,4,12按大小顺序分成两组,能使“组内离差平方和达到最小”的是( B )
A. {2},{4,8,10,12} B. {2,4},{8,10,12}
C. {2,4,8},{10,12} D. {2,4,8,10},{12}
B
01
知识梳理
知识点4:四分位数与箱线图
1.百分位数:
一组数据按从小到大的顺序排列,将数据分成100等份的每一分点处的值叫作这组数据的百分位数。
意义
百分位数是一类关于数据整体分布的统计量,它可以较全
面地反映出数据的分布信息。
01
知识梳理
知识点4:四分位数与箱线图
2.四分位数:
在一组从小到大排列的数据中,,, 这三个数值把所有数据分为个数相等的四个部分,这三个数叫作四分位数。
其中第25百分位数也称为下四分位数,第75百分位数也称为上四分位数。
01
知识梳理
知识点4:四分位数与箱线图
确定一组数据的四分位数的步骤:
(1)先将数据按照从小到大的顺序进行排列;
(2)找出这组数据的中位数;
(3)找出中位数左侧和右侧的数据各自的中位数,分别作为这组
数据的下四分位数和上四分位数。
01
知识梳理
知识点4:四分位数与箱线图
3.箱线图:
人们用如图所示的统计图来表示四分位数所刻画的一组数据的分布特点。水平的线从下至上依次表示最小值, (下四分位数),(中位数), (上四分位数),最大值。图中的长方形(即“箱子”)的高度等于与的差,反映了中间 数据的离散程度。这样的统计图叫作箱线图。
01
知识梳理
知识点4:四分位数与箱线图
3.箱线图:
意义
“箱子”越扁,说明中间的数据越集中;
“箱子”越高,说明中间的数据越分散。
说明:箱线图大多用于多组数据的比较。箱体越扁,中间的竖线(也就是常说的“须”)越短,说明数据越集中。#8.1
01
知识梳理
知识点4:四分位数与箱线图
箱线图的画法
(1)找出一组数据的最小值、第一四分位数、中位数、第三四分位数和最大值,并用5 条横线分别对应这5 个数据;
(2)连接第一四分位数和第三四分位数,画出“箱体”;
(3)将最小值和最大值与“箱体”相连接,中位数在“箱体”中间.
注意:箱线图可以画成竖直的,也可以画成横向的.
02
例题剖析
例11 某地有8个快递收件点,在某天接收到的快递件数分别为360,284,290,300,188,240,260,288,则这组数据的上四分位数和下四分位数分别为( B )
A. 250,290 B. 295,250
C. 240,300 D. 240,295
B
例12 某老师绘制了一次数学小测验中甲、乙、丙三个班级学生得分的箱线图(如图),若每班有42名学生,则  丙 班的第11名的分数最高(填“甲”“乙”或“丙”).
丙 
02
例题剖析
例13 已知一组数据按从小到大排列如下:11,12,15,x,17,y,22,26.
经计算,该组数据的中位数是16,第75百分位数是20,则x=  15 ,
y=  18 .
15 
18 
01
知识梳理
第二部分
综合训练
03
综合训练
1.我国古代科举制度始于隋成于唐,兴盛于明.明代会试分南卷、北卷、中卷,
按 的比例录取,若某年会试录取人数为100,则中卷录取人数为( )
A
A. 10 B. 35 C. 55 D. 75
2.某数学兴趣小组调查了全班学生平均每天的阅读时间,统计结果如下表所示,
则在本次调查中,全班学生平均每天阅读时间的中位数和众数分别是( )
每天阅读时间(小时) 0.5 1 1.5 2
人数 8 13 16 3
C
A. 2,1 B. , C. 1, D. 1,2
03
综合训练
3. 为了解某公司的收入水平,随机挑选五人的月工资进行抽样调查,月工资
(单位:元)分别是,, ,, ,那么能够较好的
反映他们收入平均水平的是( )
A
A. 中位数 B. 标准差 C. 平均数 D. 众数
4.甲、乙、丙、丁四人进行射击测试,每人10次射击的平均成绩恰好都是9.2环,
方差分别是环,环,环,
环 ,在本次射击测试中,这四个人成绩最稳定的是( )
A
A. 甲 B. 乙 C. 丙 D. 丁
03
综合训练
6. 某街道有两所初中,这两所初中的八年级学生的平均身高分别为162cm,166cm.若这两所初中八年级学生人数之比为2∶5,则这两所初中八年级所有学生的平均身高约为  164.9 cm(精确到0.1cm).
164.9 
5. 甲、乙、丙、丁四人各掷骰子5次(骰子每次出现的点数可能为1,2,3,4,5,6),并分别记录每次出现的点数,四人根据统计结果对各自的试验数据分别做了如下描述:① 中位数为3,众数为5;② 中位数为3,最大值与最小值的差为3;③ 中位数为1,平均数为2;④ 平均数为3,方差为2.其中,可以判断一定没有出现点数6的描述共有( B )
A. 1个 B. 2个 C. 3个 D. 4个
B
03
综合训练
7. 小强每天坚持做引体向上,他记录了某一周每天做引体向上的个数如下表:
星 期 日 一 二 三 四 五 六
个 数 11 12       13 12
其中有三天的个数被墨汁覆盖了,但小强已经计算出这组数据的唯一众数是13,平均数是12,则这组数据的上四分位数是  13 ,方差是    .
13 
 
03
综合训练
8. 在大数据分析中,数据的分组是重要的方法之一.虽然有多种方法可以对数据进行分组,但是,使得“组内离差平方和最小”的方法是最传统的,也是最合理的.下表是把1,2,3,4,5这5个数据从小到大排列后进行了分组.
分组情况 组内离差平方和 组间离差平方和 离差平方和
第一组数据 第二组数据 1 2,3,4,5 5 5 10
1,2 3,4,5 a b 10
1,2,3 4,5 c d 10
1,2,3,4 5 5 5 10
根据分组的情况请直接写出a,b,c,d的值,并说明如何分组比较合理.
解:a=2.5,b=7.5,c=2.5,d=7.5.由分组的情况,可知把5个数据分成1,2和3,4,5或1,2,3和4,5两组的组内离差平方和最小,这样的分组比较合理
03
综合训练
9. 甲、乙两组的测试成绩(单位:分)如下:
甲:91,96,70,89,60,70,100,80,92,98;
乙:92,93,70,88,82,75,96,80,92,95.
(1) 求甲组的成绩数据的四分位数;
解:(1) 将甲组的成绩数据从小到大排列为 60,70,70,80,89,91,92,96,98,100,所以m25=70,m50= =90,m75=96
03
综合训练
(2) 根据四分位数可绘制如图所示的箱线图,观察图中乙组的箱线图,绘制甲组的箱线图;
解:(2) 如图所示
03
综合训练
(3) 根据箱线图和对四分位数的理解,谈谈对两组成绩的看法.
解:(3) 根据箱线图和四分位数,可知甲组成绩的中位数和乙组相同,但甲组成绩明显比乙组的波动大(合理即可)
Thanks!
https://www.21cnjy.com/recruitment/home/fine

展开更多......

收起↑

资源预览