9.2.1总体取值规律的估计 课件(共37张PPT)

资源下载
  1. 二一教育资源

9.2.1总体取值规律的估计 课件(共37张PPT)

资源简介

(共37张PPT)
要求:综合材料内容及含义,选好角度,确定立意,明确文体,自拟题目,不得套作,不得抄袭。不少于800字。
二战期间,为了加强对战机的防护,英美军方调查了作战后的幸存飞机上弹痕的分布,决定哪里弹痕多就加强哪里。然而统计学家沃德力排众议,指出更应该注意弹痕少的位置,因为这些部位受到重创的飞机,很难有机会返航,而这部分数据被忽略了。事实证明,沃德是正确的。
——2018全国二卷语文作文
这位统计学家在分析问题的时候,能够做到不被表面现象所迷惑,在获取数据之后,选择合适的工具对数据进行整理和直观描述,过数据分析,找出数据中蕴含的信息,进而得到了正确的统计分析结果.
前面研究学习了两种抽样来收集数据 ,数据收集后,必须从中寻找包含的信息,以使我们能通过样本的规律估计总体的规律,解决相应的实际问题.
但由于数据多而杂,往往无法直接从原始数据中发现规律, 所以需要通过一定的方法去处理数据.
所以需要根据问题的背景特点, 选择合适的统计图 表来对数据进行整理和直观描述.
在此基础上,通过数据分析,找出数据中蕴含的信息,就可以用这些信息来解决实际问题了.
我们在初中学过哪些统计图?
频数条形图
折线图
扇形图
频数直方图
下面我们讨论对随机抽样获取的数据的处理方法.
9.2.1总体取值规律估计
9.2用样本估计总体
学习目标
1.掌握频率分布表的作法以及频率分布直方图的画法.
2.掌握用频率分布直方图估计总体.
面对一个统计问题,在随机抽样获得观测数据的基础上,需要根据数据分析的需要,选择适当的统计图表描述和表示数据,获得样本规律,并利用样本的规律估计总体的规律,解决相应的实际问题。
请看下面的水资源问题。
问题1 我国是世界上严重缺水的国家之一,城市缺水问题较为突出。某市政府为了节约生活用水,计划对居民生活用水费用实施阶梯式水价制度,即确定一户居民月均用水量标准a,用水量不超过a的部分按平价收费,超出a的部分按议价收费.
如果希望确定一个比较合理的标准,以使大部分居民用水的水费支出不受影响,你认为需要做哪些工作?
标准如果定得太低,影响很多居民的日常生活;如果标准太高,则不利于节水。
为了确定一个较为合理的用水标准,必须先了解在全市所有居民用户中,月用水量在不同范围内的居民所占的比例情况.
①全面调查(普查):时间,经费允许
②抽样调查:
总体:该市的全体居民用户
个体:每户居民用户
调查的变量:居民用户的均用水量.
假设通过随机抽样,获得了100户居民用户的月均用水量数据:(单位:t)
从这组数据我们能发现什么信息呢?
容易发现:这组数据的最小值时1.3t,最大值是28.0t,其它值在1.3t~28.0t之间.
除此之外,很难从随意记录下来的数据中直接看出规律.
为此,我们需要对数据进行整理和分析.
分析数据的基本方法:
1.用图将它们画出来: 提取信息、传递信息.
2.用表格: 用紧凑的表格改变数据的排列形式,提供解释数据的新方式.
在初中,我们曾用频数分布表和频数分布图来整理和表示这种数值型数据,由此能使我们清楚地知道数据分布在各个小组的个数。
在这个实际问题中,因为我们更关心月均用水量在不同范围内的居民占全市居民用户的比例,所以选择频率分布表和频率分布直方图在整理和表示数据。
将一批数据按要求分为若干组,各组内的数据的个数,叫做该组数据的频数,各个小组数据在样本容量中所占的比例的大小,叫做该组数据的频率。
为了了解数据分布的规律,可利用频率分布表和频率分布图来分析,具体做法如下:
非负数
(1)求极差:
极差为一组数据中最大值与最小值的差.
这说明样本观测的数据变化范围是26.7t.
它反映了一组数据的最大幅度,对极端值敏感
描述数据的离散程度
28.0 -1.3=26.7
极差
(2)决定组距与组数:
极差、组距、组数之间的关系:
组距是指每个小组的两个端点之间的距离.
组距与组数的确定没有固定的标准,数据的分组可以是等距的,也可以是不等距的,为方便起见,往往按等距分组.
若取组距为3,则
即可将数据分为9组;
组数与数据的个数有关(样本容量)
这样分组合理吗
组距为4时分几组
可以将数据分成7组.
①样本容量越大,分组越多;
②样本容量不超过100时,常分成5~12组,
由于组距为3,9个组距的长度超过极差,我们可以使第一组的左端点略小于数据中的最小值,最后一组的右端点略大于数据中的最大值.
例如:可以取区间为[1.2,28.2],按如下方式把样本数据以组距3分成9组:
[1.2,4.2),[4.2,7.2),...,[25.2,28.2]
(3)将数据分组:
通常对组内数据所在区间:左闭右开,最后一组取闭区间.
统计频数,计算各小组的频率,作出频率分布表.
(4)列频率分布表:
频率之和为1
频率分布表一般分五列
1.“分组”,2.“频数累计(可省),3.“频数”,4.“频率”,
5.“频率/组距” 最后一行是合计.
频率/组距
0.077
0.107
0.043
0.030
0.030
0.017
0.010
0.013
0.007
(5)画频率分布直方图:
横轴表示月均用水量
小长方形的面积=组距× =频率
各小长方形的面积和为1
纵轴表示
频率/组距实际上就是频率分布直方图中各小长方形的高度,它反映了各组样本观测数据的疏密程度。
月平均用水量/t
0.12
0.1
0.08
0.06
0.04
0.02
0
1.2 4.2 7.2 10.2 13.2 16.2 19.2 22.2 25.2 28.2
0.107
0.043
0.030
0.030
0.017
0.010
0.013
0.007
0.077
频率/组距
(1)求极差(即一组数据中最大值与最小值的差)
(2)决定组距与组数(将数据分组)
(3)将数据分组
方法小结:画频率分布直方图的一般步骤为:
(4)列出频率分布表.
(填写频率/组距一栏)
(5)画出频率分布直方图.
组距:指每个小组的两个端点的距离,
组数:将数据分组,当数据在100个以内时, 按数据多少常分5-12组.
频率分布直方图的纵轴是频率/组距,而频数分布直方图的纵轴是频数
(2)从频率分布直方图能直观地表明数据分布的形状和总体趋势.可以看出,数据的分布不对称,图形左边高、右边低,右边有一个较长的“尾巴”。这表明大部分居民用户的月均用水量集中在一个较低值区域,尤其在[1.2,7.2)最为集中,少数用户居民的月均用水量偏多,而且随着月均用水量的增加,居民用户数呈现降低趋势.
观察频率分布表和频率分布直方图,你觉得这组数据中蕴含了哪些有用的信息?你能从图表中发现居民用户月均用水量的哪些分布规律?你能给出适当的语言描述吗?
(1)从频率分布表中可以看出,样本观测数据落在各个小组的比例大小.
例如,月均用水量在区间[4.2,7.2)内的居民用户最多,在区间[1.2,4.2)内的次之,而月均用水量超过16.2的各区间内数据所占比例较小,等等.
有了样本观测数据的频率分布,我们可以用它估计总体的取值规律。根据100户居民用户的月均用水量的频率分布,可以推测该市全体居民用户月均用水量也会有类似的分布,即大部分居民用户月均用水量集中在较低值区域.
需要注意的是,由于样本的随机性,这种估计可能会存在一定误差,但这一误差一般不会影响我们对总体分布情况的大致了解.
这使我们确定用水量标准时,可以定一个合适的值,以达到既不影响大多数居民用户的水费支出,又能节水的目的.
探究 分别以3和27为组数,对数据进行等距分组,画出100户居民月均用水量的频率分布直方图,你发现不同的组数对直方图呈现数据分布规律有什么影响?
组数少、组距大:易看出数据整体的分布特点,无法看出每组内的数据分布情况,损失了较多的原始数据信息;
组数多、组距小:保留较多原始数据信息;但小长方形较多,有时图形会变得不规则,不容易从中看出总体分布特点;直方图会依赖样本数据,稳定性差.
因此,我们要注意积累数据分组、合理使用图表经验。
 从某校高三学生中抽取50名参加数学竞赛,成绩(单位:分)分组及各组的频数如下:
[40,50),2;[50,60),3;[60,70),10;[70,80),15;[80,90),12;[90,100],8.
(1)列出样本的频率分布表;
例1
画频率分布直方图
(2)画出频率分布直方图;
(3)估计成绩在[60,90)的学生比例.
成绩分组 频数累计 频数 频率
[40,50) 2 0.04
[50,60) 3 0.06
[60,70) 10 0.2
[70,80) 15 0.3
[80,90) 12 0.24
[90,100] 8 0.16
合计 50 1.00
频率分布表如下,
(2)画出频率分布直方图;
频率分布直方图如图所示.
(3)估计成绩在[60,90)的学生比例.
学生成绩在[60,90)的频率为(0.2+0.3+0.24)×100%=74%,所以估计成绩在[60,90)的学生比例为74%.
 为了了解高一年级学生的体能情况,某校抽取部分学生进行一分钟跳绳次数测试,将所得数据整理后,画出频率分布直方图如图所示,图中从左到右各小矩形的面积之比为2∶4∶17∶15∶9∶3,第二小组的频数为12.
(1)第二小组的频率是多少?
样本容量是多少?
例2
(2)若次数在110(含110)以上为达标,则该校高一年级全体学生的达标率约为多少?
频率分布直方图的应用
频率分布直方图是以面积的形式来反映数据落在各小组内的频率大小,
(2)若次数在110(含110)以上为达标,则该校高一年级全体学生的达标率约为多少?
频率分布直方图的性质
①因为小矩形的面积=组距× =频率,所以各小矩形的面积表示相应各组的频率.
这样,频率分布直方图就以面积的形式反映了数据落在各个小组内的频率大小.
反思感悟
③频率分布直方图反映了样本在各个范围内取值的可能性,由抽样的代表性利用样本在某一范围内的频率,可近似地估计总体在这一范围内的可能性.
 某大学艺术专业400名学生参加某次测评,根据男女学生人数比例,使用分层随机抽样的方法从中随机抽取了100名学生,记录他们的分数,将数据分成7组:[20,30),[30,40),…,[80,90],并整理得到如下频率分布直方图:
(1)从总体的400名学生中随
机抽取一人,估计其分数小
于70的概率;
跟踪训练2
(2)已知样本中分数小于40的学生有5人,试估计总体中分数在区间[40,50)内的人数;
(1)根据频率分布直方图可知,样本中分数不小于70的频率为(0.02+0.04)×10=0.6,
所以样本中分数小于70的频率为1-0.6=0.4,
所以从总体的400名学生中随机抽取一人,估计其分数小于70的概率约为0.4.
(2)已知样本中分数小于40的学生有5人,试估计总体中分数在区间[40,50)内的人数;
根据题意可知样本中分数不小于50的频率为(0.01+0.02+0.04+0.02)×10=0.9,
样本中分数在区间[40,50)内的人数为100-100×0.9-5=5,
(3)已知样本中有一半男生的分数不小于70,且样本中分数不小于70的男女生人数相等.试估计总体中男生和女生人数的比例.
由题意可知,样本中分数不小于70的学生人数为(0.02+0.04)×10×
100=60,所以样本中分数不小于70的男生人数为
所以样本中的男生人数为30×2=60,
女生人数为100-60=40,
所以样本中男生和女生人数的比例为60∶40=3∶2,
所以估计总体中男生和女生人数的比例约为3∶2.
1. 从某小区抽取100户居民用户进行月用电量调查,发现他们的用电量都在50~350 kW h之间,进行适当分组后(每组为左闭右开的区间),画出频率分布直方图如图所示.
(1) 直方图中x的值为________;
(2) 在被调查的用户中,用电量落在区间[100,250) 内的户数为_____.
70
0.0044
教材197页
解:(1) 通话时长在区间[15,20),[20,30)内的次数分别为9次和12次.
(2) 区间[20,30)内的通话次数 少于区间[15,20内的通话次数.
2.如图,胡晓统计了他爸爸9月的手机通话明细清单,发现他爸爸该月共通话60次. 胡晓按每次通话时间长短进行分组(每组为左闭右开的区间),画出了频率分布直方图.
(1) 通话时长在区间[15,20),[20,30) 内的次数分别为多少
(2) 区间[20, 30)上的小长方形高度低于[15, 20)上的小长方形的高度,说明什么
课堂
小结
1.知识清单:
(1)频率分布直方图.
(2)频率分布直方图的应用.
2.方法归纳:图表识别、数据分析.
3.常见误区:频率分布直方图中小矩形的高以及小矩形的面积代表的意义理解不清.
再见

展开更多......

收起↑

资源预览