第 20 章 数据的初步分析 小结与复习 课件(共30张PPT)

资源下载
  1. 二一教育资源

第 20 章 数据的初步分析 小结与复习 课件(共30张PPT)

资源简介

(共30张PPT)
小结与复习
第 20 章 数据的初步分析
一、数据的集中趋势
平均数 定义 一组数据的平均值称为这组数据的平均数
算术平 均数 一般地,如果有 n 个数 x1,x2,…,xn,那么_____________________叫做这 n 个数的平均数
加权平 均数 一般求加权平均数,可统一用下面的公式:
叫做这 n 个数据的加权平均数
中位数 定义 将一组数据按照由小到大(或由大到小)的顺序排列,如果数据的个数是奇数,那么处于________________就是这组数据的中位数;如果数据的个数是偶数,那么中间___________________就是这组数据的中位数
防错 提醒 确定中位数时,一定要注意先把整组数据按照由小到大(或由大到小)的顺序排列,再确定
众 数 定义 一组数据中出现次数________的数据叫做这组数据的众数
防错 提醒 (1) 一组数据中众数不一定只有一个,还可能没有;
(2) 当一组数据中含极端值时,其平均数往往不能准确反映这组数据的集中趋势,应考虑用中位数或众数来分析
中间位置的数
两个数据的平均数
最多
表示波 动的量 定义 意义
离差平方和 离差平方和越大,数据的波动越___,反之也成立
设一组数据是 x1,x2,…,xn,它们的平均数是 ,我们将
称为这组数据的离差平方和 . 可以简记为 .
二、数据的波动程度


表示波 动的量 定义 意义
方差 方差越大,数据的波动越___,反之也成立
设一组数据是 x1,x2,…,xn,它们的平均数是 ,我们将
称为这组数据的方差.
三、用样本估计总体
1. 统计的基本思想:用样本的特征(平均数和方差)估计总体的特征.
2. 统计的决策依据:利用数据做决策时,要全面、
多角度地去分析已有数据,从数据的变化中发
现它们的规律和变化趋势,减少人为因素的影响.
四、四分位数与箱线图
一组数据从小到大排列,第 25 百分位数 ( 记作m25)、中位数(记作 m50)、第 75 百分位数(记作 m75) 把所有的数据等分成四部分,因此,称为四分位数。
m25 称为第一四分位数 (Q1),
m50 称为第二四分位数(Q2),
m75 称为第三四分位数(Q3)。
其中 m25 满足小于或等于 m25 的至少占 25% ,
m75 满足小于或等于 m75 的至少占 75% 。
数据个数为 n 的一组数据四分位数的求法:
m25 (Q1) :计算 n×25%,当结果为整数时,m25 为这个数与下一个数的平均数.不为整数时,将 n×25% 的结果向上取整,得到的那个数为 m25 ,
m50 (Q2) = 整组数据的中位数,
m75 (Q3) :计算 n×75%,当结果为整数时,m25为这个数与下一个数的平均数.不为整数时,将 n×75% 的结果向上取整,得到的那个数为 m75 。
统计学上,常用箱线图直观地展示一组数据的统计特征值,便于分析不同类别数据各层次水平的差异(如离散程度、分布差异等).
5
4
3
2
1
0
最小值
最大值
第一四分位数
第二四分位数(中位数)
第三四分位数
须长
考点一 平均数、中位数、众数
例1 某市在开展节约用水活动中,对某小区 200 户居民家庭用水情况进行统计分析,其中 3 月份比 2 月份节约用水情况如下表所示:
节水量(m3) 1 1.5 2
户数 20 120 60
请问:(1) 抽取的200户家庭节水量的平均数是____m3,中位数是______m3,众数是______m3.
(2) 根据以上数据,估计该市 100 万户居民家庭 3 月份比 2 月份的节水量是_________.
1.6
1.5
160万 m3
1.5
1. 某米店经营某种品牌的大米,该店记录了一周中不同包装(10 kg,20 kg,50 kg)的大米的销售量(单位:袋)如下:10 kg 装 100 袋;20 kg 装 220 袋;50 kg 装 80 袋.如果每 500 g 大米的进价和售价都相同,那么他最应该关注的是这些销售数据(袋数)中的( )
A.平均数 B.中位数 C.众数 D.最大值
C 
2. 一组数据中的一个数大小发生了变化,一定会影响
这组数据的平均数、众数、中位数中的( )
  A.1 个   B.2 个  C.3 个  D.0 个
A 
针对训练
3. 某地发生地震灾害后,某中学八 (1) 班学生积极捐款献爱心,如图是该班 50 名学生的捐款情况统计,则他们捐款金额的众数和中位数分别是 (  )
A.20,10  
B.10,20 
C.16,15   
D.15,16
B
4. 小刚在“中国梦·我的梦”演讲比赛中,演讲内容、语言表达、演讲技能、形象礼仪四项得分依次为 9.8,9.4,9.2,9.3. 若其综合得分按演讲内容 50%、语言表达 20%、演讲技能 20%、形象礼仪 10% 的比例计算,则他的综合得分是______分.
9.55
考点二 方差的计算及应用
例2 小明和小亮在课外活动中,报名参加了短跑训练小组. 在近几次百米训练中,所测成绩如图所示,请根据图中所示解答以下问题:
(1) 根据图中信息,
补全表格.
次数 1 2 3 4 5
小明 13.3 13.3 13.2 13.3
小亮 13.2 13.4 13.1 13.3
13.4
13.5
(2) 分别计算成绩的平均数和方差,填入表格. 若你是
老师,将小明与小亮的成绩比较分析后,将分别给予他们怎样的建议?
平均数 方差
小明
小亮
13.3
13.3
0.02
0.004
解:从平均数看,两人的平均水平相同;从方差看,
小明的成绩较稳定,小亮的成绩波动较大.
给小明的建议是:加强锻炼,提高爆发力,提升
短跑成绩;
给小亮的建议是:总结经验,找出成绩忽高忽低
的原因,在稳定中提高.
平均数 方差
小明
小亮
13.3
13.3
0.02
0.004
5. 小张和小李去练习射击,第一轮 10 发子弹打完后,两人的成绩如图. 根据图中的信息,小张、小李两人中成绩较稳定的是 .
小张
针对训练
考点三 四分位数与箱线图
例3 某考生参加某校的综合评价招生并成功通过了初试,在面试阶段中,8 位老师根据考生表现给出分数 ( 单位:分),分数由低到高依次为 76 ,77 ,79,80,80,81,84,85,这组数据的上四分位数为 ( )
A. 80.5 分 B. 81.5 分 C. 82.5 分 D. 83.5 分
C
6. 下面是根据八年 2 班学生 1 分钟跳绳次数制作的箱线图,由图不能确定这组数据的( )
A.下四分位数 B.中位数
C.最大值 D.平均数
针对训练
D
7. 求出以下这组数据
4.77,3.98,6.44,4.98,2.15,3.85,
3.64,3.21,3.18,2.02,4.11,4.10
的 m25=______,m50=_____,m75=______.
3.195
3.915
4.44
例4 甲、乙两组的测试成绩如下:
甲:91,96,70,89,60,70,100,80,92,98;
乙:92,93,70,88,82,75,96,80,92,95.
(1) 求甲组数据的四分位数;
解:(1) 把甲的成绩从小到大排列为:
60,70,70,80,89,91,92,96,98,100,
中位数 m50 = (89+91)÷2= 90.
10×25% = 2.5 10 ×75% =7.5
m25 是第 3 个数 ,第 75 百分位数 m75 是第 8 个数。
故 m25 =70,m50=90,m75 = 96.
(2) 根据四分位数可绘制如下的箱线图,观察图中乙组的箱线图,绘制甲组的箱线图;
根据箱线图和四分位数,
可知甲组成绩比较分散,
乙成绩比较集中(答案不唯一)
(3) 根据箱线图和对四分位数的理解,谈谈对两组成绩的看法.
例5 某中学七、八年级各选派 10 名选手参加学校举办的“爱我祖国”知识竞赛,计分采用 10 分制,选手得分均为整数,成绩达到 6 分或 6 分以上为合格,达到 9 分或 10 分为优秀.这次竞赛后,七、八年级两支代表队选手成绩分布的条形统计图和
成绩统计分析表如下所示,
其中七年级代表队得 6 分、
10 分的选手人数分别为 a,
b.
考点四 分析数据做决策
队别 平均分 中位数 方差 合格率 优秀率
七年级 6.7 m 3.41 90% n
八年级 7.1 7.5 1.69 80% 10%
(1) 请依据图表中的数据,求 a,b 的值;
依题意,得
(3×1 + 6a + 7×1 + 8×1 + 9×1 + 10b)÷10 = 6.7,
1 + a + 1 + 1 + 1 + b = 10.
a = 5,
b = 1.
(2) 直接写出表中 m,n 的值;
解得
m=6,n=20%.
①八年级队平均分高于七年级队;
②八年级队的成绩比七年级队稳定;
③八年级队的成绩集中在中上游,所以支持八年级
队成绩好(注:任说两条即可).
(3) 有人说七年级的合格率、优秀率均高于八年级,所以七年级队成绩比八年级队好,但也有人说八年级队成绩比七年级队好.请你给出两条支持八年级队成绩好的理由.
8. 经市场调查,某种优质西瓜质量为(5±0.25) kg 的最为畅销.为了控制西瓜的质量,农科所采用 A,B 两种种植技术进行试验.现从这两种技术种植的西瓜中各随机抽取 20 个,记录它们的质量如下(单位:kg):
A:4.1 4.8 5.4 4.9 4.7 5.0 4.9 4.8 5.8 5.2
5.0 4.8 5.2 4.9 5.2 5.0 4.8 5.2 5.1 5.0
B:4.5 4.9 4.8 4.5 5.2 5.1 5.0 4.5 4.7 4.9
5.4 5.5 4.6 5.3 4.8 5.0 5.2 5.3 5.0 5.3
针对训练
(1) 若质量为 (5±0.25) kg 的为优等品,根据以上信息
完成下表:
(2)请分别从优等品数量、平均数与方差三方面对 A,B 两种技术做出评价;从市场销售的角度看,你认为推广哪种种植技术较好?
解:从优等品数量的角度看,因为 A 种技术种植的西瓜优等品数量较多,所以 A 种技术较好;
从平均数的角度看,因为 A 种技术种植的西瓜质量的平均数更接近 5 kg,所以 A 种技术较好;
从方差的角度看,因为 B 种技术种植的西瓜质量的方差更小,所以 B 种技术种植的西瓜质量更为稳定;
从市场销售角度看,因优等品更畅销,A 种技术种植的西瓜优等品数量更多,且平均质量更接近 5 kg,因而更适合推广 A 种技术.
数据收集→数据整理→数据描述→数据分析  
数据的
集中趋势
数据的
波动程度
方 差
用样本平均数
估计总体平均数
用样本方差
估计总体方差
用样本估计总体
平均数
中位数
众 数

展开更多......

收起↑

资源预览