资源简介 (共21张PPT)第2课时 四分位数及箱线图6.2 中位数与箱线图1.理解四分位数的概念,掌握四分位数的计算方法。2.理解箱线图的构成及其意义,能够绘制和解读箱线图。3.能够通过四分位数和箱线图分析数据的分布特征。某班级数学考试成绩:50, 60, 65, 70, 75, 80, 85, 90, 95……问题1:如何描述这组数据的分布情况?问题2:除了平均数和中位数,还有哪些统计量可以帮助我们分析数据?在百分位数中,除了最小值与最大值外,我们尤为关注25%分位数、50%分位数、75%分位数,它们把一组数据分为个数相等的四部分,因此分别称为下四分位数、中位数和上四分位数,记为m25,m50,m75,统称四分位数。那么,如何计算一组数据的四分位数呢 中位数即50%分位数,例 某市12月16—31日每日的最高气温(单位:℃)依次如下:5, 3, 2, 2, 2, 2, 3, 3, 5, 5, -2, -2, -5, -1, -1, -1。求这组数据的四分位数m25, m50, m75。解:将这16个数据由小到大排序:-5 -2 -2 -1 -1 -1 -1 2 2 2 2 3 3 3 5 5 5因此 m50==2(℃);前一半数据的中位数为整组数据的下四分位数,故后一半数据的中位数为整组数据的上四分位数,故m25= =-1(℃)m75= =3(℃)1.有一组数据:3, 5, 7, 9, 11, 13, 15,求这组数据的下四分位数、中位数和上四分位数。2.在一次体育测试中,10 名学生的跳远成绩(单位:米)分别为:4.5, 4.8, 5.0, 5.2, 5.5, 5.8, 6.0, 6.2, 6.5, 6.8。请根据这些数据,确定成绩处于下四分位数以下的学生人数。m25=5m50=9m75=132人老师记录了全班40名学生1 min 跳绳的次数:132 136 144 162 144 115 132 136 123 144136 136 132 159 136 144 129 136 139 153123 133 144 137 152 138 136 129 129 134138 149 125 128 128 133 138 134 146 148(1)求全班学生1min跳绳次数的最小值、下四分位数、中位数、上四分位数和最大值。解:将40名学生1分钟跳绳的次数从小到大排列为:115,123,123,125,128,128,129,129,129,132,132,132,133,133,134,134,136,136,136,136,136,136,136,137,138,138,138,139,144,144,144,144,144,146,148,149,152,153,159,162最小值为:115最大值为:162m25==132;m50==136;m75==144。(2)老师绘制了如图所示的统计图。你能读懂这个统计图吗 图中出现了5条横线,分别对应5个数据,它们是怎样的数据 你认为这个统计图是如何画出的 最大值最小值中位数上四分位数下四分位数(3)根据图,中间的“箱子”被136分成了两部分,其中“下半截箱子”比较短,这说明什么 “下半截箱子” 比较短,说明下四分位数与中位数之间的距离相对较小。即班级中有 25% 的数据集中在相对较小的范围内,且靠近中位数 136。这意味着跳绳次数在 132(下四分位数)到 136(中位数)之间的学生人数相对较少。在全班学生1分钟跳绳次数的数据中,存在159、162等较大的极端值,这些较大的值会对平均数产生向上的拉动作用,而中位数不受这些极端值的影响。所以可以估计全班学生1分钟跳绳次数的平均数大于中位数。(4)请你估计一下,全班学生1min跳绳次数的平均数和中位数哪个大 图1所示的这种统计图叫作箱线图。箱线图有时也画成如图2所示的形式。图1图2(1)在图3的直方图中,数据的分布有什么特点 图4的箱线图是否也反映了数据的这种特征 图3图4议一议 为了反映全班学生1min跳绳次数的整体情况,小颖和小亮分别画出了图3 和图4。(2)读取箱线图时,你可以借鉴之前学习统计图的哪些经验?(1)图3直方图中数据主要集中在130 - 140跳绳次数区间内,两端的数据较少,呈现中间多、两边少的分布特征;图4的箱线图也反映了这种数据中间多、两边少的特征。(2)读取箱线图时,可以借鉴条形图通过长度比较数据离散程度的经验,以及折线图观察数据分布范围和集中趋势变化的经验 。(1)图5是同一班级学生两次1min跳绳成绩的箱线图。该班学生第二次跳绳成绩有什么变化 你是如何得出结论的 图51.第一次跳绳成绩的中位数是 136,第二次跳绳成绩的中位数是 153,中位数增大,说明第二次跳绳成绩的中间水平比第一次高。2.第一次跳绳成绩的四分位距(上四分位数 144 减去下四分位数 132 )为 12;第二次跳绳成绩的四分位距(上四分位数 160 减去下四分位数 146 )为 14,且第二次跳绳成绩的最大值 181 与最小值 130 的差值也比第一次(最大值 162 与最小值 115 的差值 )大,说明第二次跳绳成绩的数据分布更分散。3.从箱线图看,第二次跳绳成绩的上半部分(大于中位数部分)相对第一次更长,说明第二次跳绳成绩在高分段的人数比第一次多。变 化 如 下1.能直观展示数据分布特征:通过箱线图的箱子,可以直观地看出数据的集中趋势(中位数)、离散程度(四分位距和全距)以及数据的偏态性(箱子上下部分的长短)。2.能识别异常值:箱线图能清晰地标记出异常值,超出须的范围的点即为异常值,便于分析数据中是否存在特殊情况。3.数据信息简洁明了:相比于大量原始数据,箱线图用几个关键数值(最小值、下四分位数、中位数、上四分位数、最大值 )就能概括数据的主要特征,便于不同数据集之间的比较。(2)你认为箱线图在表示数据方面有什么特点 与同伴进行交流。1.一组数据的箱线图中,若下半截箱子明显比上半截箱子短,说明该组数据( )A. 大部分数据集中在较小值一端B. 大部分数据集中在较大值一端C. 数据分布均匀D. 存在较多异常值2.一组数据为 3,5,7,9,11,13,15,17,其下四分位数是 。3.若一组数据的箱线图中箱子长度较短,说明数据的________较小。离散程度B64.某公司员工的月薪数据绘制箱线图后,发现存在一些异常值,这些异常值是月薪特别高的几位高管。若去掉这些异常值,箱线图中的哪些特征值可能会发生变化,如何变化?解:最大值会变小,因为去掉了月薪特别高的高管数据。上四分位数可能会变小,因为去掉较大值后,排序会改变,使得上四分位数对应的数值变小。中位数和下四分位数有可能不变,如果这些高管数据原本在中位数和下四分位数排序之外,则不受影响;也有可能改变,如果去掉这些数据后,原有的排序发生变化。最小值不变,因为去掉的是较大值,对最小值无影响。四分位数箱线图箱线图 展开更多...... 收起↑ 资源预览