沪科版(2024)八下第20章 数据的初步分析小结与复习课件(共48张PPT)

资源下载
  1. 二一教育资源

沪科版(2024)八下第20章 数据的初步分析小结与复习课件(共48张PPT)

资源简介

(共48张PPT)
沪科版-数学-八年级下册
第20章 数据的初步分析
第20章小结与复习
知识结构图
数据的初步分析
数据的频数分布
频率
频数分布表
频数直方图
平均数
加权平均数
中位数
众数
离差平方和
方差
四分位数
箱线图
数据分组
组内离差平方和最小
数据的集中趋势
数据的离散程度
四分位数和箱线图
知识模块一 数据的频数分布
探究新知
1.一般地,把一批数据中落在某个小组内数据的个数称为该组的______,频率频数 数据总数;所有对象的频率之和等于1.
2.频数分布表一般由三部分组成,一是数据分组;二是频数统计;三是频数.
3.频数直方图的横轴表示分组情况,纵轴表示频数.每个长方形条的高表示相应小组内数据的______.
频数
频数
绘制频数分布直方图的具体步骤是什么?
(1)确定数据变动范围:计算这批数据中最大数与最小数的差;
(2)决定组距和组数:组数=;
(3)决定分点;
(4)列频数分布表;
(5)画频数分布直方图.
典例精析
范例1:某中学八年级五班同学纷纷捐出自己的零花钱,为建档立卡的贫困学生献爱心,该班第2小组8名同学捐款数额如下(单位:元):12,5,10,5,20,10,10,8.这组捐款数据中,“10”出现的频率是 ( )
A.25% B.37.5%
C.30% D.32.5%
B
仿例:将某测速区雷达监测到的一组汽车的速度(单位:km/h)数据整理,得到频数分布表.
速度区间/(km/h) 频数 频率
30<x≤40 14 0.07
40<x≤50 50
50<x≤60 0.48
60<x≤70
70<x≤80 18 0.09
合计 1
(1)请把表中的数据填写完整;
(2)根据表格,绘制频数分布直方图;
(2)根据表格信息,绘制频数分布直方图如图.
速度区间/(km/h) 频数 频率
30<x≤40 14 0.07
40<x≤50 50
50<x≤60 0.48
60<x≤70
70<x≤80 18 0.09
合计 1
0.25 
96 
22 
0.11 
200
(3)如果此地的汽车速度超过60km/h即为违章,那么违章车辆共有多少辆?
(3)速度超过60km/h的车辆有22+18=40(辆).
∴违章车辆共有40辆.
知识模块二 平均数、中位数和众数
平均数 定义 一组数据的平均值称为这组数据的平均数
算术平 均数 一般地,如果有 n 个数 x1,x2,…,xn,那么_____________________叫做这 n 个数的平均数
加权平 均数 一般求加权平均数,可统一用下面的公式:
= ( f1+ f2+ +fk =n,k≤n)叫做这 n 个数据的加权平均数
算术平均数与加权平均数的区别与联系
区别 联系
算术平均数 算术平均数对应的一组数据中各个数据的“重要程度”相同,即各个数据的权相同 若各个数据的权相同,则加权平均数就是算术平均数,因而算术平均数实际上是加权平均数的一种特例
加权平均数 加权平均数对应的一组数据中各个数据的“重要程度”不一定相同,即各个数据的权不一定相同
中位数 定义 将一组数据按照由小到大(或由大到小)的顺序排列,如果数据的个数是奇数,那么处于________________就是这组数据的中位数;如果数据的个数是偶数,那么中间___________________就是这组数据的中位数
防错 提醒 确定中位数时,一定要注意先把整组数据按照由小到大(或由大到小)的顺序排列,再确定
中间位置的数
两个数据的平均数
众 数 定义 一组数据中出现次数________的数据叫做这组数据的众数
防错 提醒 (1) 一组数据中众数不一定只有一个,还可能没有;
(2) 当一组数据中含极端值时,其平均数往往不能准确反映这组数据的集中趋势,应考虑用中位数或众数来分析
最多
典例精析
范例2:在世界读书日即将到来之际,某班级开展了“读书分享会”活动,并统计了全班30名同学在过去一个月的读书数量(单位:本),数据如下:
根据以上表中数据,下列说法正确的是( )
A.这组数据的众数是8  B.这组数据的中位数是3
C.这组数据的平均数是3 D.这组数据的中位数和众数相同
读书数量/本 1 2 3 4 5
人数 5 8 7 6 4
B
知识模块三 离差平方和与方差
设一组数据是x1,x2,…,xn,它们的平均数是,我们将(x1-)2+(x2- )2+…+(xn- )2称为这组数据的离差平方和,可以简记.
将s2=[(x1- )2+(x2- )2+…+(xn- )2]称为这组数据的方差.
方差可以反映数据的波动程度:方差越大,数据的波动越大;方差越小,数据的波动越小.
典例精析
范例3:甲、乙两位同学参加学校组织的射击选拔赛,每人射击10次,射击成绩的平均数都是9环,方差分别是=3.8,=2.5,则这10次射击成绩较稳定的是______(填“甲”或“乙”).

仿例:某景区有甲、乙两条上山的小路,均由连续的台阶构成,如图所示是甲、乙两路段部分台阶示意图(图中数据表示每一级台阶的高度,单位: cm)
求甲、乙两路段台阶高度的离差平方和与方差,并说明哪条路段的台阶走起来更舒服.
解:甲路段的台阶走起来更舒服.理由如下:
甲路段台阶高度的平均数为甲=×(15+16+16+14+14+15)=15(cm).
甲路段台阶高度的离差平方和为M甲=[2×(15-15)2+2×(16-15)2+2×(14-15)2]=4.
于是方差==.
乙路段台阶高度的平均数为乙=×(11+15+18+17+10+19)=15(cm).
乙路段台阶高度的离差平方和为M乙=[(11-15)2+(15-15)2+(18-15)2+(17-15)2+(10-15)2+(19-15)2]=70.
于是方差==.
从方差来看, < 因此,甲路段的台阶走起来更舒服.
知识模块四 四分位数与箱线图
一组数据从小到大排列,第25百分位数(记作m25)、中位数(记作m50)、第75百分位数(记作m75)把所有的数据等分成四部分,因此,称为四分位数,m25,m50,m75分别称为第一四分位数(Q1)、第二四分位数(Q2)第三四分位数(Q3).其中m25满足小于或等于m25的至少占25%,大于或等于m25的至少占75%.
四分位数
25%分位数
50%分位数
75%分位数
记为m25,称为下四分位数
记为m50,称为中位数
记为m75,称为上四分位数
前半部分数据的中位数
后半部分数据的中位数
求 n 个数据的四分位数的方法:
(1)先将这组数据从小到大排列;
(2)计算中位数即 50% 分位数m50:
①当n为偶数时,m50为第个数和第(+1)个数的平均数;
②当n为奇数时,m50为第个数.
(3)计算下四分位数m25、上四分位数m75:
①当n为偶数时,中位数将这组数据分为数量相等的两组数据,每组有个数,m25为前个数据的中位数,m75为后个数据的中位数;
②当n为奇数时,中位数将这组数据分为数量相等的两组数据,每组有 个数,m25为前 个数据的中位数,m75为后 个数据的中位数.
n 个数据的四分位数其他计算方法:
(1)先将这组数据从小到大排列;
(2)计算 i=n×p%(p=25,50,75 分别对应下四分位数、中位数、上四分位数):
①若 i 是整数,第 i 个数和第(i+1)个数的平均数为 p% 分位数;
②若 i 不是整数,设 i0 为大于 i 的最小整数,第 i0 个数为 p%分位数.
箱线图:箱线图是一种用来反映一组数据的整体分布情况的统计图,特别适用于多组数据的分布情况的比较,其中包含了最小值、最大值和四分位数信息。
箱线图的两种常见形式:
画箱线图的一般步骤:
(1)画数轴:画一条数轴,度量单位大小和数据的单位一致,起点比最小值稍小,终点比最大值稍大.
(2)画箱体:画一个长方形盒,两端边的位置分别对应数据的上、下四分位数. 在长方形盒内部的中位数位置画一条线段,表示中位数.
(3)画须线:从长方形盒两端边向外各画一条须线延伸至数据的最大值和最小值,分别在最大值和最小值处画一条线段.
典例精析
范例4:已知一组数据:3,5,2,4,2,3,2,6,则这组数据的第一四分位数是 ( )
A.5        B.4        
C.3        D.2
D
仿例:甲、乙两组的测试成绩如下:
甲:91,96,70,89,60,70,100,80,92,98;
乙:92,93,70,88,82,75,96,80,92,95.
(1)求甲组数据的四分位数;
解:(1)将甲组的成绩从小到大排列为60,70,70,80,89,91,92,96,98,100,
这组数据的中位数是×(89+91)=90,
即第二四分位数是90.
因为×10=2.5,所以第3个数70是第一四分位数.
因为×10=7.5,所以第8个数96是第三四分位数.
(2)根据四分位数可绘制如下的箱线图,观察图中乙组的箱线图,绘制甲组的箱线图;
(3)根据箱线图和对四分位数的理解,谈谈对两组成绩的看法.
(2)如图所示.
(3)根据箱线图和四分位数可知甲组成绩的中位数和乙组相同,但甲组成绩明显比乙组的波动大.
知识模块五 数据分组
一般地,设有一般地,设有n个数据x1,x2,…,xn,假设这些数据都不相等,其平均数记为 x,则离差平方和为=(x1- x)2+(x2- x)2+…+(xn- x)2.
如果把这组数据分为两组,前m(m<n)个数据为一组(称为第一组),后(n-m)个数据为一组(称为第二组),那么这n个数据的离差平方和可以分解为两类离差平方和:一类反映两个组内数据的离散程度,另一类反映两组数据之间的差异程度.
其中,


则=(x1- x)2+(x2- x)2+…+(xn- x)2
=(x1-)2+ (x2-)2+ +(xm-)2+(xm+1-)2+(xm+2-)2 + +(xn-)2+
=+
其中 =(x1-)2+ (x2-)2+ +(xm-)2+(xm+1-)2+(xm+2-)2 + +(xn-)2称为组内离差平方和,表示两个组内数据的离散程度;=m(- x)2+(n-m)(- x)2,称为组间离差平方和,表示两个组间的差异.
一个合理的分组原则是使组内离差平方和达到最小,组间离差平方和达到最大.由于总体离差平方和 S2不变,只需考虑使组内离差平方和达到最小即可.
组内离差平方和最小原则进行数据分组的步骤:
(1)列数据:将已知数据按从小到大的顺序排列.
(2)列表:分别求数据每一个间隔的分组分成的两组数据的离差平方和.
(3)求和:将两组数据的离差平方和求和,选择组内离差平方和最小的分法.
(4)写结论:按所求间隔分组,得出结论.
典例精析
范例5:某小组8名学生的数学考试成绩(单位:分)分别为:
88,98,87,92,92,90,91,96.
老师决定将这些成绩按照以下分组方式分为两组,以便更好地分析学生的成绩分布.
第一组{87,88,90,91,92,92},第二组{96,98}.
试计算上述分组情况下的组内离差平方和.
解:第一组数据的平均数为:(87+88+90+91+92+92)÷6=90,
第一组数据的离差平方和为:(87-90)2+(88-90)2+…+(92-90)2=22,
第二组数据的平均数为:(96+98)÷2=97,
第二组数据的离差平方和为:(96-97)2+(98-97)2=2,
所以组内离差平方和为22+2=24.
仿例:现有数据:6,8,10,12,14,通过“组内离差平方和最小”的原则分为两组(每组至少2个数据),找出最优分组.
步骤1:数据排序(已排序):6,8,10,12,14;
步骤2:尝试所有合理分组方式,计算组内离差平方和;
方式1:第一组{6,8},第二组{10,12,14}.
第一组均值1=(6+8)÷2=7,
离差平方和为(6-7)2+(8-7)2=1+1=2,
第二组均值2=(10+12+14)+3=12,
离差平方和为(10-12)2+(12-12)2+(14-12)2=4+0+4=8,
组内离差平方和为2+8=10.
方式2:第一组{6,8,10},第二组{12,14}.
第一组均值1=(6+8+10)÷3=8,
离差平方和为(6-8)2+(8-8)2+(10-8)2=4+0+4=8.
第二组均值2=(12+14)÷2=13,
离差平方和为(12-13)2+(14-13)2=1+1=2.
组内离差平方和为8+2=10.
步骤3:结论.
两种分组方式组内离差平方和均为最小值 10,因此最优分组为{6,8} 和{10,12,14}(或 {6,8,10}和{12,14}).
随堂练习
1.某米店经营某种品牌的大米,该店记录了一周中不同包装(10 kg,20 kg,50 kg)的大米的销售量(单位:袋)如下:10 kg装100袋;20 kg装220袋;50 kg装80袋.如果每500 g大米的进价和售价都相同,则他最应该关注的是这些销售数据(袋数)中的 ( )
A.平均数 B.中位数 C.众数 D.最大值
C 
2.一组数据中的一个数大小发生了变化,一定会影响这组数据的平均数、众数、中位数中的 ( )
A.1个   B.2个  C.3个  D.0个
A 
3.某地发生地震灾害后,某中学八(1)班学生积极捐款献爱心,如图所示是该班50名学生的捐款情况统计,则他们捐款金额的众数和中位数分别是(  )
A.20,10  
B.10,20 
C.16,15   
D.15,16
B
4. 小刚在“中国梦·我的梦”演讲比赛中,演讲内容、语言表
达、演讲技能、形象礼仪四项得分依次为9.8,9.4,9.2,9.3. 若其综合得分按演讲内容50%、语言表达20%、演讲技能20%、形象礼仪10%的比例计算,则他的综合得分是_________.
9.55
5.小张和小李去练习射击,第一轮10发子弹打完后,两人的成绩如图.根据图中的信息,小张小李两人中成绩较稳定的是 .
小张
6.经市场调查,某种优质西瓜质量为(5±0.25)kg的最为畅销.为了控制西瓜的质量,农科所采用A,B两种种植技术进行试验.现从这两种技术种植的西瓜中各随机抽取20个,记录它们的质量如下(单位:kg):
A:4.1 4.8 5.4 4.9 4.7 5.0 4.9 4.8 5.8 5.2
5.0 4.8 5.2 4.9 5.2 5.0 4.8 5.2 5.1 5.0
B:4.5 4.9 4.8 4.5 5.2 5.1 5.0 4.5 4.7 4.9
5.4 5.5 4.6 5.3 4.8 5.0 5.2 5.3 5.0 5.3
(1)若质量为(5±0.25)kg的为优等品,根据以上信息完成下表:
优等品数量(个) 平均数 方差
A 16
B 10
4.990
0.103
4.975
0.093
(2)请分别从优等品数量、平均数与方差三方面对A,B两种技术做出评价;从市场销售的角度看,你认为推广哪种种植技术较好?
解:(2)从优等品数量的角度看,因A种技术种植的西瓜优等品数量较多,所以A种技术较好;
从平均数的角度看,因A种技术种植的西瓜质量的平均数更接近5kg,所以A种技术较好;
从方差的角度看,因B种技术种植的西瓜质量的方差更小,所以B种技术种植的西瓜质量更为稳定;
从市场销售角度看,因优等品更畅销,A种技术种植的西瓜优等品数量更多,且平均质量更接近5kg,因而更适合推广A种技术.
7.根据组内离差平方和最小的原则,把图中的10 个苹果按直径大小分成两组.
解:将10个数据从小到大排列:65,69,70,75,76, 76,78,80,80,81. 分类讨论并计算组内离差平方和(结果保留小数点后三位)如右表:
分组情况 组内离差平方和
第一组1个,第二组9个 146.889
第一组2个,第二组8个 98
第一组3个,第二组7个 48
第一组4个,第二组6个 74.25
第一组5个,第二组5个 98
第一组6个,第二组4个 107.583
第一组7个,第二组3个 136.095
第一组8个,第二组2个 182.375
第一组9个,第二组1个 218
分组情况 组内离差平方和
第一组1个,第二组9个 146.889
第一组2个,第二组8个 98
第一组3个,第二组7个 48
第一组4个,第二组6个 74.25
第一组5个,第二组5个 98
第一组6个,第二组4个 107.583
第一组7个,第二组3个 136.095
第一组8个,第二组2个 182.375
第一组9个,第二组1个 218
计算结果表明,第3种情况的组内离差平方和最小.
因此把10个苹果按直径大小分成的两组是{65,69,70}和
{75,76,76,78,80,80,81}.
这节课的收获是什么?
课堂小结

展开更多......

收起↑

资源预览