24.3 数据的四分位数 课件(共16张PPT)

资源下载
  1. 二一教育资源

24.3 数据的四分位数 课件(共16张PPT)

资源简介

(共16张PPT)
第二十四章 数据的分析
24.3 数据的四分位数
人教 2024
旧知回顾
在进行数据分析时,经常需要关注数据的 和数据的 .
数据的集中趋势常用到三个统计量—— ;
数据的波动情况又称为数据的离散程度,刻画数据的波动情况,常用两个统计量—— .
问题提出
在一些具体问题中,了解一组数据的分布情况,单单的平均数和方差不足以解决问题,看下面的例子:
某银行有A和B两个理财经营团队. 近三年,这两个团队分别负责经营12项理财产品,收益率(单位: %)如下:
A 4.77 3.98 6.44 4.89 2.15 3.85 3.64 3.21 3.18 2.02 4.11 4.10
B 3.18 3.84 3.99 3.67 3.40 3.60 4.10 4.21 4.15 4.44 3.87 3.91
如果你是一位购买理财产品的投资者,会选择哪个团队的产品
我的团队:
我的团队:
激进型投资者选我
稳健型投资者选我,我的方差小,稳定性更好.
你们说的都有道理,但是我还想了解
收益率大部分在什么范围
哪些范围比较集中?
该怎么办呢?
你是需要了解产品收益的更多分布信息. 我来介绍一个:四分位数
四分位数
中位数:一组数据按从小到大的顺序排列,中位数从中间点把数据2等份.
如果从小到大排序后,将数据100等份,那么每个分点的值叫作这组数据的百分位数
(类似的,还有千分位数等).
显然,百分位数相比中位数,可以更全面地反映出数据的分布信息.
我来评估一下:百分位数虽然可以更全面反映数据的分布信息,但是需要将数据100等份,比较麻烦. 四分位数更简洁一些.尤其是在数据个数不多的情况下,四分位数实用性更大.
取三个特殊的百分位数,25%分位数、50%分位数、75%分位数,将数据四等份,那么这三个分位数分别叫作这组数据的第一四分位数、第二四分位数(中位数)、第三四分位数,统称为这组数据的四分位数,通常情况下分别记作Q1、Q2、Q3.
第一四分位数又称下四分位数,第三四分位数又称上四分位数.
实战举例
例1. 求下列数据的四分位数:
(1) 1, 2, 4, 5, 7, 8, 10, 12 (2)33, 45, 32, 36, 44, 49, 50, 55, 46, 48
(3) 40, 39, 44, 49, 45, 38, 36, 51, 48, 32, 39
数据从小到大排序:1,2,4,5,7,8,10,12 共8个数据
先确定中位数Q2=6
中位数左侧数据1,2,4,5再取中位数Q1=3
中位数右侧数据7,8,10,12再取中位线Q3=9
数据从小到大排序:
32,33,36,44,45,46,48,49,50,55 共10个数据
先确定中位数Q2=45.5
中位数左侧数据32,33,36,44,45再取中位数Q1=36
中位数右侧数据46,48,49,50,55再取中位线Q3=49
数据从小到大排序:
32,36,38,39,39,40,44,45,48,49,51 共11个数据
先确定中位数Q2=40
中位数左侧数据32,36,38,39,39再取中位数Q1=38
中位数右侧数据44,45,48,49,51再取中位线Q3=48
总结一下确定四分位数的方法吧:
1. 首先按照从小到大排序
2. 确定整组数据的中位数,即数据的第二四分位数Q2
3. 确定Q2左侧的数据的中位数,作为整组数据的第一四分位数Q1
4. 确定Q2右侧的数据的中位数,作为整组数据的第三四分位数Q3
实战举例
例5. 已知一组数据按由小到大排列如下:10,11, 12, 15, a, 17, b, c, 24, 26.经计算,该组数据的中位数是16,平均数是17,上四分位数是20.
则a= ,b= ,c= .
例3. 小明参加8场羽毛球比赛所得的分数由低到高为74, a, b, 80, 81, 81, 83, 85.
若这组数据的第一四分位数为78,则小明得分的平均数为 .
例4. 从小到大排序的9个数据:10,16,25,33,39,43,m,65,70. 若这组数据的下四分位数与上四分位数的和是73,则m的值是 .
例2. 某校为了解学生的课外阅读情况,随机抽取了部分学生,对他们一周的课外阅读时间进行了调查,统计数据如右表所示. 则抽取的这部分学生一周的课外阅读时间数据的第三四分位数Q3为 .
阅读时间/h 1 2 3 4
人数 11 10 12 11
牛刀小试
尝试一下:利用刚才介绍的四分位数来分析一下前面问题中的两组数据.
某银行有A和B两个理财经营团队. 近三年,这两个团队分别负责经营12项理财产品,收益率(单位: %)如下:
A 4.77 3.98 6.44 4.89 2.15 3.85 3.64 3.21 3.18 2.02 4.11 4.10
B 3.18 3.84 3.99 3.67 3.40 3.60 4.10 4.21 4.15 4.44 3.87 3.91
如果你是一位购买理财产品的投资者,会选择哪个团队的产品
A: 2.02 2.15 3.18 3.21 3.64 3.85 3.98 4.10 4.11 4.77 4.89 6.44
3.195
第一四分位数
3.915
第二四分位数
4.44
第三四分位数
B: 3.18 3.40 3.60 3.67 3.84 3.87 3.91 3.99 4.10 4.15 4.21 4.44
3.635
第一四分位数
3.89
第二四分位数
4.125
第三四分位数
牛刀小试
产品收益率小于3.195%的项目数占总数的25%,产品收益率小于3.915%的项目数占总数的50%,产品收益率大于4.44%的项目数占总数的25%,产品收益率在3.195%至4.44%之间的项目数占总数的50%.
产品收益率小于3.635%的项目数占总数的25%,产品收益率小于3.89%的项目数占总数的50%,产品收益率大于4.125%的项目数占总数的25%,产品收益率在3.635%至4.125%之间的项目数占总数的50%.
利用四分位数,确实对这些数据的分布
了解的更全面. 但是...
不够直观!
我再来介绍一个:
箱线图
箱线图
用一组数据的四分位数及最小、最大值可以画出这组数据的箱线图(box plot)
第一四分位数
第二四分位数
第三四分位数
由箱线图,可以直观看出一组数据的分布范围、中位数的大小、集中的范围、分布是否对称等.
箱线图中,整个箱体的长度叫作四分位距,等于第三四分位数减去第一四分位数.
箱线图
箱线图可以很直观地反映出一组数据的分布情况. 当需要对两组数据的分布情况进行比较时,我们可以把两组数据的箱线图按竖直方向并列画在同一幅图中.
右图是前面问题中,两个理财团队收益率的箱线图. 来一起讨论一下吧!
表示中位数(第二分位数)的水平线段差不多高,说明两个团队产品收益率的中位数几乎相等.
A的箱体和须线都比B的箱体和须线长,说明A的产品收益率波动比B的大.
B箱体中中位数对应的水平线段在箱体的中间位置,说明团队B的产品收益率分布比团队A的更对称.
A有约25%的产品收益率高于B的最高产品收益率,也有约25%的产品收益率低于团队B的最低产品收益率.
实战举例
例1. 计算下面问题中两组数据的四分位数,在同一幅图中画出箱线图,并据此比较两个小组的跳绳成绩特点.
(课本P149问题1)甲、乙两小组同学的跳绳成绩(单位:次/min)如下:
甲组 182 194 143 185 156
乙组 199 148 242 170 141
甲:
最小值143 最大值194
Q1=149.5 Q2=182 Q3=189.5
乙:
最小值141 最大值242
Q1=144.5 Q2=170 Q3=220.5
讨论一下吧:
比较两个小组的跳绳成绩特点.
实战举例
例2. 如图,甲、乙两支仪仗队队员的身高情况如图
所示,设两支队员身高数据的方差分别为 ,
则 与 的大小关系是 .
例3. 已知一组数据的箱线图如图,则这组数据的直方图可能是( )
实战举例
例4. (课本P180 Ex1)某城市9月份空
气质量指数的箱线图如图所示.
(1)这个月空气质量指数的最大值、
最小值及四分位数分别是多少?
(2)请分析这个月空气质量的特点.
例5. 已知甲、乙两班人数相同,在一次测试中两班成绩的箱线图如图所示.
(1)图中虚线分别对应甲班和乙班的哪个四分位数;
(2)图中甲班的"箱子"被128分成两部分,其中"下半截箱子"较长,这说明了什么?
(3)由此图估计甲、乙两班中平均分较高的班级是哪个.
实战举例
例6. (课本P181 T3)某班有40名同学,一次测试的成绩(百分制)如下:
32 44 54 55 58 62 65 65 68 69 69 69 70 71 71 72 73 74 75 75 75 76
77 77 78 79 80 80 81 83 85 85 87 87 89 90 92 94 99 99
请结合测试成绩的四分位数和箱线图分析这个班这次测试成绩的特点.
最小值32 最大值99
Q1=69
Q2=75
Q3=84
实战举例
例7. (课本P181 T4)八年级两个班男生的身高(单位:cm)分别如下:
A班 164 171 163 158 167 175 169 181 168 176 175 162 166 165 172
169 171 168 174 170
B班 172 170 163 161 179 160 176 174 170 178 183 166 168 167 180 171 168 172
请结合男生身高的四分位数和箱线图比较这两个班级男生的身高差异.
最小值158 最大值181
Q1=165.5 Q2=169 Q3=173
最小值160 最大值183
Q1=167 Q2=170.5 Q3=176
再 见

展开更多......

收起↑

资源预览