资源简介 (共26张PPT)第九章 统计9.2用样本估计总体9.2.1总体取值规律的估计复习回顾1、分层随机抽样定义2、分层随机抽样的特点3、分层随机抽样的步骤4、样本平均数的计算公式1.掌握频率分布表的作法以及频率分布直方图的画法.2.掌握用频率分布直方图估计总体.3.能根据实际问题的特点,选择恰当的统计图表对数据进行可视化描述,体会合理使用统计图表的重要性.4.结合实例,能用样本估计总体的取值规律.学习目标导入收集数据是为了寻找数据中蕴含的信息.因为实际问题中数据多而且杂乱,往往无法直接从原始数据中发现规律,所以需要根据问题的背景特点,选择合适的统计图表对数据进行整理和直观描述.在此基础上,通过数据分析,找出数据中蕴含的信息,就可以用这些信息来解决实际问题了.下面我们讨论对随机抽样获取的数据的处理方法.新知讲解思考:我们在初中学过哪些统计图?条形图折线图扇形图频数分布直方图新知讲解探究:我国是世界上严重缺水的国家之一,城市缺水问题较为突出.某市政府为了节约生活用水,计划在本市试行居民生活用水定额管理,即确定一个居民月用水量标准a,用水量不超过a的部分按平价收费,超出a的部分按议价收费. 那么标准a定为多少比较合理呢?●每户居民月均用水标准a如果定得太低,会影响很多居民的日常生活;●每户居民月均用水标准a如果定得太高,会不利于节约用水;新知讲解追问1:如何调查全市所有居民用户的月用水量分布情况?①全面调查:如果经费、时间等条件允许,可以通过全面调查获取过去一年全市所有居民用户的月均用水量数据②抽样调查:由于全市的居民用户很多,通常采用抽样调查的方式,分析样本观测数据,估计全市居民用户月均用水量的分布情况.追问2:在此问题中,总体和个体是什么?总体是该市全体居民用户的月均用水量,个体是每户居民用户的月均用水量新知讲解假设通过简单随机抽样,我们获得了100位居民某年的月均用水量(单位:t).9.0 13.6 14.9 5.9 4.0 7.1 6.4 5.4 19.4 2.02.2 8.6 13.8 5.4 10.2 4.9 6.8 14.0 2.0 10.52.1 5.7 5.1 16.8 6.0 11.1 1.3 11.2 7.7 4.92.3 10.0 16.7 12.0 12.4 7.8 5.2 13.6 2.4 22.43.6 7.1 8.8 25.6 3.2 18.3 5.1 2.0 3.0 12.022.2 10.8 5.5 2.0 24.3 9.9 3.6 5.6 4.4 7.95.1 24.5 6.4 7.5 4.7 20.5 5.5 15.7 2.6 5.75.5 6.0 16.0 2.4 9.5 3.7 17.0 3.8 4.1 2.35.3 7.8 8.1 4.3 13.3 6.8 1.3 7.0 4.9 1.87.1 28.0 10.2 13.8 17.9 10.1 5.5 4.6 3.2 21.6问题: 从这组数据我们能发现什么信息呢?如果将这组数据按从小到大排序, 发现这组数据的最小值是1.3t, 最大值是28.0t, 其他在1.3t和28.0t之间. 为了更深入地挖掘数据蕴含的信息,需要对数据作进一步的整理与分析.新知讲解在初中,我们曾用频数分布表和频数分布图来整理和表示这种数值型数据,由此能使我们清楚地知道数据分布在各个小组的个数.在这个实际问题中,因为我们更关心月均用水量在不同范围内的居民占全市居民用户的比例,所以选择频率分布表和频率分布直方图在整理和表示数据.问题:什么是频数?什么是频率?如何画频率分布表和频率分布直方图?频数:在总体(或样本)中,某个个体出现的次数叫做这个个体的频数.频率:某个个体的频数与总体(或样本)中所含个体的数量的比叫做这个个体的频率.与画频数分布直方图类似,我们可以按以下步骤制作频率分布表、画频率分布直方图.新知讲解——频率分布直方图1、求极差:一组数据中最大值与最小值的差.样本观测数据的最小值是_______,最大值是_______,极差为______________, 这说明样本观测数据的变化范围是26.7 t.1.3 t28.0 t28.0 1.3=26.72、决定组距与组数①当样本量不超过100时,常分成5—12组.②一般取等长组距,且组距应力求“取整”.③分组时可以先确定组距,也可以先确定组数.若取所有的组距为3,则,即可以将数据分为9组,这也说明这个组距是比较合适的.合适的组距与组数对发现数据分布规律有重要意义,数据的个数越多,所分的组数也越多.组距与组数的确定没有固定的标准,常常需要一个尝试和选择的过程.新知讲解——频率分布直方图1、求极差:最小值为1.3,最大值为28,极差为26.72、决定组距与组数:组距为3,分9组3、将数据分组:由于组距为3,9个组距的总长度为27,超过极差,故可使第一组的左端点略小于数据中的最小值,最后一组的右端点略大于数据中的最大值.如,可取区间为[1.2,28.2],按如下方式把样本观测数据以组距3分为9组:[1.2,4.2),[4.2,7.2),…,[25.2,28.2]各组数值所在区间取左闭右开区间,最后一组取闭区间新知讲解——频率分布直方图4.列频率分布表:计算各小组的频率频率频率和为1频数和为样本量从频率分布表可看出样本观测数据在各个小组的比例.如:月均用水量在区间[4.2,7.2)内的居民用户最多;用水量超过16.2的各区间内数据所占比例较小……新知讲解——频率分布直方图5、画频率分布直方图:横轴表示月均用水量,纵轴表示①小长方形的高:反映样本数据的疏密程度②小长方形的面积:频率 纵轴用表示的优点:如果小长方形的高为频率,那么区间越长,长方形就越高,两个长度不同的区间的频率比较就没有意义.新知讲解——频率分布直方图画频率分布直方图的步骤:第一步,求极差;第二步,确定组距与组数;第三步,将数据分组;第四步,列频率分布表;第五步,画频率分布直方图;新知讲解——频率分布直方图频率分布直方图的性质:①在频率分布直方图中,纵轴是频率与组距的比值,每个小长方形的宽是组距.因此,每个小长方形的面积等于×组距=频率所以各小长方形面积表示相应各组的频率②所有小长方形的面积和等于1新知讲解——频率分布直方图观察频率分布表和频率分布直方图,你觉得这组数据中蕴含了哪些有用的信息?你能从图表中发现居民用户月均用水量的哪些分布规律?你能给出适当的语言描述吗?(1)从频率分布表中可以看出,样本观测数据落在各个小组的比例大小.例如,月均用水量在区间[4.2,7.2)内的居民用户最多,在区间[1.2,4.2)内的次之,而月均用水量超过16.2的各区间内数据所占比例较小,等等.新知讲解——频率分布直方图有了样本观测数据的频率分布,我们可以用它估计总体的取值规律.根据100 户居民用户的月均用水量的频率分布,可以推测该市全体居民用户月均用水量也会有类似的分布,即大部分居民用户月均用水量集中在较低值区域.这使我们确定用水量标准时,可以定一个合适的值,以达到既不影响大多数居民用户的水费支出,又能节水的目的.需要注意的是,由于样本的随机性,这种估计可能会存在一定误差,但这一误差一般不会影响我们对总体分布情况的大致了解.新知讲解——频率分布直方图分别以3和27为组数,对数据进行等距分组,画出100户居民用户月均用水量的频率分布直方图.观察图形,你发现不同的组数对于直方图呈现数据分布规律有什么影响?同一组数据,组数不同,得到的直方图形状也不尽相同.组数少、组距大:易看出数据整体的分布特点,无法看出每组内的数据分布情况,损失了较多的原始数据信息;组数多、组距小:保留较多原始数据信息;但小长方形较多,有时图形会变得不规则,不容易从中看出总体分布特点;直方图会依赖样本数据,稳定性差.新知讲解思考:除频率分布直方图外,我们在初中还学习过条形图、扇形图、折线图、频数分布直方图等,你能说出不同的统计图的特点吗?扇形图主要用于直观描述各类数据占总数的比例条形图主要用于直观描述不同类别或分组数据的频数;直方图主要用于直观描述不同分组数据的频率;折线图主要用于描述数据随时间的变化趋势离散型数据连续型数据离散型数据要根据实际问题的特点,选择恰当的统计图对数据进行可视化描述,以使我们通过图形直观地发现样本数据的分布情况,进而估计总体的分布规律。巩固练习1、辨析:(1)用样本的频率分布可以估计总体分布.( )(2)频率分布直方图的纵轴表示频率.( )(3)频率分布直方图中小矩形的面积表示该组的个体数.( )2、一个容量为80的样本中,数据的最大值为152,最小值为60,组距为10,应将样本数据分为( ).A.10组 B.9组 C.8组 D.7组A√××巩固练习3.如图所示的是某班50名学生期中考试数学成绩的频率分布直方图,其中成绩(单位:分)的分组区间分别是 ,, ,,则图中 的值为( )A. 0.120 B. 0.180C. 0.012 D. 0.018[解析] 由题意得,解得 .D巩固练习4、从某小区抽取100户居民进行月用电量调查,发现其用电量都在50到350度之间,频率分布直方图如图所示.(1)直方图中的值为________;(2)这些用户中,用电量落在区间[100,250)内的户数为____.0.004470原理:频率和/长方形面积和为1原理:样本容量×频率巩固练习5、如图,胡晓统计了他爸爸9月的手机通话明细清单,发现他爸爸该月共通话60次.胡晓按每次通话时间长短进行分组(每组为左闭右开的区间),画出了频率分布直方图.(1) 通话时长在区间[15,20),[20,30) 内的次数分别为多少 (2) 区间[20, 30)上的小长方形高度低于[15, 20)上的小长方形的高度,说明什么 解:(1)通话时长在区间[15,20),[20,30)内的次数分别为9次和12次(2)区间[20,30)内的通话次数少于区间[15,20内的通话次数.巩固练习6. 为加强对中学生实践创新能力和团队精神的培养,促进教育教学改革,某市教育局将举办全市中学生创新知识竞赛.某校举行选拔赛,共有200名学生参加,为了解学生的成绩情况,从中抽取了50名学生的成绩(得分均为整数,满分为100分)进行统计,得到以下频率分布表:分组 频数 频率0.261518 0.36合计 50[解析] 根据题意,知成绩在 内的频数 ,成绩在 内的频数 ,成绩在 内的频率 ,成绩在 内的频率 ,频率之和 .(1)求a,b,c,d,e的值;巩固练习6. 为加强对中学生实践创新能力和团队精神的培养,促进教育教学改革,某市教育局将举办全市中学生创新知识竞赛.某校举行选拔赛,共有200名学生参加,为了解学生的成绩情况,从中抽取了50名学生的成绩(得分均为整数,满分为100分)进行统计,得到以下频率分布表:分组 频数 频率0.261518 0.36合计 50(2) 画出频率分布直方图.[解析] 作出频率分布直方图,如图所示.课堂总结频率分布直方图性质步骤1.求极差2.决定组距与组数3.将数据分组4.列频率分布表5.画频率分布直方图 展开更多...... 收起↑ 资源预览