20.5 数据分组-课件(共26张PPT)--沪科版数学八年级下册(新教材)

资源下载
  1. 二一教育资源

20.5 数据分组-课件(共26张PPT)--沪科版数学八年级下册(新教材)

资源简介

(共26张PPT)
沪科版数学8年级下册培优精做课件授课教师:Home .班级:8年级(*)班.时间:.20.5数据分组第20章数据的初步分析沪科版数学八年级下册20.5数据分组练习题一、选择题(每题3分,共15分)1.下列关于数据分组的说法,正确的是()A.数据分组时,组距可以任意设定,无需考虑数据特点B.数据分组的核心是将杂乱的数据整理成有序的组,便于分析C.分组后,每组的数据个数可以为0D.数据分组时,各组的组距必须不相等2.数据分组中,组距是指()A.每组的最大值B.每组的最小值C.每组中最大值与最小值的差D.每组的数据个数3.对一组数据进行分组时,若数据的最大值为100,最小值为20,设定组距为10,则组数为()A. 7 B. 8 C. 9 D. 104.下列分组中,组距相等且分组合理的是()A. 10~20、20~30、35~45、45~55B. 5~15、15~25、25~35、35~45C. 0~10、10~20、20~30、30~40、45~55D. 10~20、25~35、35~45、45~555.已知一组数据有50个,分组后各组的频数之和为()A. 50 B.组数C.组距D.无法确定二、填空题(每题3分,共15分)1.数据分组时,通常先找出数据的______和______,再根据数据特点确定组距和组数。2.组数的计算公式为:组数≈(最大值-最小值)÷______,若结果不是整数,需向上取整。3.分组后,每个组的两个端点称为______,其中较小的端点称为______,较大的端点称为______。4.已知一组数据:15、23、32、41、27、19、35、47、22、38,最大值为47,最小值为15,组距为10,则组数为______,第一组可设定为______。5.数据分组后,每个组内的数据个数称为______,各组频数之和等于______。三、解答题(共70分)11.(10分)已知一组数据:25、30、28、32、26、35、29、31、27、33、24、34,求:(1)这组数据的最大值和最小值;(2)若组距为3,计算组数,并确定各组的分组区间。12.(12分)某班40名学生的数学成绩(单位:分)如下:75、80、85、88、90、92、93、95、98、100、78、82、86、89、91、94、96、76、81、83、87、90、92、95、77、80、84、88、90、93、97、79、81、85、89、91、94、96、80、82。(1)找出这组数据的最大值、最小值;(2)设定组距为5,计算组数,并列出各组的分组区间;(3)统计各组的频数(无需绘制频数分布表)。13.(12分)为了解学生的课外阅读时间(单位:分钟),随机抽取30名学生调查,结果如下:30、45、60、40、50、35、55、40、25、50、65、45、50、30、40、55、60、50、45、35、40、50、55、40、35、50、60、45、40、50。(1)求这组数据的最大值、最小值和极差(最大值-最小值);(2)若组距为10,确定组数和各组的分组区间(起始组为20~30);(3)说明分组的目的是什么。14.(12分)已知一组数据的最大值为88,最小值为23,组距为10,回答下列问题:(1)计算组数;(2)设计合理的分组区间(每组左闭右开);(3)若数据总数为45,若某组的频数为9,求该组的频率。15.(12分)某工厂生产的零件长度(单位:cm)如下:10.2、9.8、10.5、9.9、10.1、10.3、9.7、10.0、10.4、9.6、10.2、9.9、10.1、9.8、10.3、10.0、9.7、10.1、10.2、9.9。(1)找出这组数据的最大值和最小值;(2)设定组距为0.3,计算组数,并确定各组的分组区间;(3)统计长度在10.0~10.3cm(含两端)的频数。16.(12分)已知一组数据有60个,最大值为120,最小值为40,回答下列问题:(1)若组距为15,计算组数并设计分组区间;(2)若分组后,其中一组为60~75,求该组的组距和组中值(组中值=(组上限+组下限)÷2);(3)若该组(60~75)的频数为12,求该组的频率,并说明该频率的含义。参考答案一、选择题1. B 2. C 3. B 4. B 5. A二、填空题1.最大值;最小值7.组距8.组限;组下限;组上限9. 4;15~25 10.频数;数据总数三、解答题1.解:(1)最大值=35,最小值=24;(2)极差=35-24=11,组数≈11÷3≈3.67,向上取整得组数=4;分组区间:24~27、27~30、30~33、33~36(组距为3,左闭右开)。2.(1)最大值=100,最小值=75;(2)极差=100-75=25,组数=25÷5=5;分组区间:75~80、80~85、85~90、90~95、95~100;(3)各组频数:75~80(4人)、80~85(8人)、85~90(7人)、90~95(10人)、95~100(11人)。3.(1)最大值=65,最小值=25,极差=65-25=40;(2)组数=40÷10=4,分组区间:20~30、30~40、40~50、50~60、60~70(补充一组覆盖最大值);(3)分组目的:将杂乱的课外阅读时间数据整理成有序的组,便于观察数据的分布规律,快速了解不同时间段的学生人数分布情况。4.(1)极差=88-23=65,组数≈65÷10=6.5,向上取整得组数=7;(2)分组区间(左闭右开):23~33、33~43、43~53、53~63、63~73、73~83、83~93;(3)频率=9÷45=0.2。5.(1)最大值=10.5,最小值=9.6;(2)极差=10.5-9.6=0.9,组数=0.9÷0.3=3;分组区间:9.6~9.9、9.9~10.2、10.2~10.5;(3)长度在10.0~10.3cm的频数为10。6.(1)极差=120-40=80,组数≈80÷15≈5.33,向上取整得组数=6;分组区间:40~55、55~70、70~85、85~100、100~115、115~130;(2)组距=75-60=15,组中值=(60+75)÷2=67.5;(3)频率=12÷60=0.2,含义:这60个数据中,落在60~75这个区间内的数据占总数据的20%。新课导入
生活里的分类能帮我们高效做事,那杂乱的数据也可以通过“分组”变得清晰——这就是我们今天要学的《数据分组》.
通过合理分组,不仅能快速统计各类数据的数量,还能利用即将要学的“组内离差平方和”判断分组是否让数据更集中、更便于分析.
数据分组是根据研究目的和客观现象的内在特点,按照某种标准把数据划分为若干个不同的组,使组内的差异尽可能小,组间的差异尽可能大.
分组分析法是在分组的基础上,将不同性质的现象分开,相同性质的现象归纳在一起,从而反映被研究对象的本质、差异和特征.
推进新课
问题 我国10个省份某年人均地区生产总值(简称人均GDP,单位:万元)的数据如下表所示:
省份代号 1 2 3 4 5 6 7 8 9 10
人均GDP/万元 15.68 6.24 10.11 7.18 16.42 12.13 7.37 10.07 8.85 7.16
思考 如果要把这10个省份依据人均GDP的多少分为两组,并保证人均GDP相差不多的省份在一个组,应该如何划分?
对于这个问题,为了保证人均 GDP 相差不多的省份在一个组,应该如何划分,试着讨论一下?
思考
按照“组内离差平方和最小”的方法,就能保证人均 GDP 相差不多的省份在一个组.
平均数
中位数
众数
一般地,假设有 n 个数据 x1 , x2 , x3 , … , xn , 若将其分成两组,其中前 m 个数据为一组 ( 称为第一组 ), 后 ( n-m ) 个数据为一组 ( 称为第二组 ).
这 n 个数据的总体离差平方和 S 2 可以表示为:
称为组内离差平方和,表达了两个组内数据的离散程度.
称为组间离差平方和,表达了两组数据之间的差异.
一个合理的分组原则是使组内离差平方和达到最小,组间离差平方和达到最大.由于总体离差平方和 S2不变,只需考虑使组内离差平方和达到最小即可.
数据的分组一般步骤:
1. 第一步是排序;
2. 第二步是确定组数和各组内数据的个数.
我们只讨论分两组的情形,如果一共有 n 个数据,要把较小的 m 个数据分为一组,把剩下的 (n - m) 个数据分为另一组.
3. 通过“组内离差平方和最小” 的原则来确定 m 的大小.
(1)在电子表格软件中输入省份代号和人均 GDP 的数据,并对数据按照人均 GDP 从小到大进行排序;
用电子表格软件计算
用电子表格软件进行数据分组
省份代号 1 2 3 4 5 6 7 8 9 10
人均GDP/万元 15.68 6.24 10.11 7.18 16.42 12.13 7.37 10.07 8.85 7.16
(2)如图,将排序后的人均 GDP 的数据根据每组个数进行分组,通过“公式”—“插入函数”—选择类别“统计”—“DEVSQ” 函数,分别计算每组的离差平方和;
输入各组对应的函数后得到数据:
(3)利用“SUM”函数得到组内离差平方和,如下图所示
(4)按组内离差平方和最小来进行选择,
故分组为:第一组
{ 省份 2,省份 10,省份 4,省份 7,省份9,省份8,省份3}
第二组
{省份 6,省份1,省份5 }.
在社会经济统计研究中,数据分组的作用在于划分现象的类型、研究总体的结构与现象之间的依存关系.
随堂练习
1. 按照“组内离差平方和达到最小”的方法,小明将一组数据分成了两组{80,82}和{87,86,90,85},计算这两组数据的组内离差平方和为    .
16
2. 小红同学为了在明年中考体育考试中取得好的成绩,每天自己在家里练习做一分钟仰卧起坐,妈妈统计了她连续六天内仰卧起坐的个数:28,25,30,27,30,26.按照“组内离差平方和最小”的方法分成两组,则组内离差平方和的最小值是 ( )
A. B. C. D. 5
B
返回

1.科研人员选出8株植物,在同等实验条件下,测量它们光合作用速率(单位:μmol·m-2·s-1).统计结果为35,30,23,17,20,25,32,30,若按照“组内离差平方和达到最小”法,则需先将数据由________到________排序,再将这8株植物分成两组时,共可以分成________种情况.

7
31.25
2.现有一组数据:12,15,18,20,22,25,将其分成两组{12,15}和{18,20,22,25},求这种分组情况的组内离差平方和为________.
返回
【点拨】第1组数据{12,15}的平均数为(12+15)÷2=13.5,则离差平方和为(12-13.5)2+(15-13.5)2=4.5.第2组数据{18,20,22,25}的平均数为(18+20+22+25)÷4=21.25,则离差平方和为(18-21.25)2+(20-21.25)2+(22-21.25)2+(25-21.25)2=26.75.所以这种分组情况的组内离差平方和为4.5+26.75=31.25.
3. 北京时间2025年4月24日,搭载神舟二十号载人飞船的长征二号F遥二十运载火箭在酒泉卫星发射中心点火发射,随后神舟二十号飞行乘组顺利进入中国空间站,展示了我国在航天领域的强大实力,谱写了航天强国建设的新篇章.某校为了培养学生对航天知识的学习兴趣,开展了航天知识答题竞赛活动,现从该校八年级全部学生的成绩中随机抽取6名学生的成绩:86,81,95,89,88,89.按照“组内离差平方和达到最小”的方法把这6名学生的成绩分成两组.
【解】将6个数据由小到大排列可得81,86,88,89,89,95,将它们分为两组共有5种情况,分别计算组内离差平方和如下表:
分组 第一组离 差平方和 第二组离 差平方和 组内离差
平方和
第一组1个,第二组5个 0 45.2 45.2
第一组2个,第二组4个 12.5 30.75 43.25
第一组3个,第二组3个 26 24 50
第一组4个,第二组2个 38 18 56
第一组5个,第二组1个 45.2 0 45.2
返回
观察最后一列组内离差平方和可以发现,当按第一组2个,第二组4个分组时,组内离差平方和最小.因此,按组内离差平方和最小的分法为{81,86}和{88,89,89,95}.
课堂小结
数据分组
组内离差平方和:数值越小,组内差异越小
组间离差平方和:数值越大,不同组之间差异越明显
根据组内离差平方和最小的原则分组
总体离差平方和= 组内+组间

展开更多......

收起↑

资源预览