资源简介 《用样本估计总体》教案课题 6.4用样本估计总体 单元 第六单元 学科 数学 年级 高一教学目标与核心素养 1.数学建模:掌握数学建模的相关知识,为数学建模的学习打好基础的同时,也能学习利用数学建模解决实际问题。 2.直观想象:了解用样本估计总体的离散程度 3.数据分析:通过经历提出问题—推导过程—得出结论—例题讲解—练习巩固的过程,让学生认识到数学知识的逻辑性和严密性重点 难点 重点:;用样本估计总体的离散程度;频率分布直方图估计总体分布 难点:用样本估计总体的集中趋势;用样本估计总体的离散程度;频率分布直方图估计总体分布教学过程教学环节 教师活动新课导入 情境导入: 我们在研究一个对象时,并不那么容易获取全部数据,这时可采用随机抽样的方法在总体中抽取样本。由于样本是从总体中抽取的部分数据,因而蕴含总体的许多信息,这使得我们有可能通过样本的某些特性去估计总体的相应特征。通常包括用样本的数字特征(如平均数、方差)估计总体的数字特征,用样本的频率分布估计总体的分布,这就是本节要学习的主要内容。新知探究 新知探究(一):用样本估计总体的集中趋势 在初中,我们已经学习了反映一组数据的集中趋势的数字特征,包括平均数、中位数和众数,这些数字特征同样适用于用样本估计总体的集中趋势。 下面就一起来回顾一下相关知识并作一定拓展。 平均数: 平均数也称为均值,是刻画一组数据集中趋势最主要的指标。 ●若样本容量为n,第i个个体是,则样本平均数: 在随机抽样的前提下,当样本容量增加时,样本均值会向总体均值μ接近,于是称为μ的估计。 在分层抽样中,用N表示总体A的个体总数,若将总体A分为L层,用表示第i层(i= 1, 2, ...,L)的个体总数,则有 称i= 1, 2, ...,L)为第i层的层权 对i= 1, 2, ..,L,用表示从第i层抽出样本的均值 称是总体μ的简单估计 众数: 我们称观测数据中出现次数最多的数是众数,用表示。 在抽样调查中,样本中出现次数最多的数就是样本的众数。若每个数出现的次数都相同,它就没有众数。一组数据可以有两个或多个众数。 中位数: 将一组观测数据按从小到大的顺序排列后,称处于中间位置的数是中位数,用表示。当数据个数为奇数时,中间位置的数即为中位数;当数据个数为偶数时,中间两个数的平均数为中位数。 练一练: 某公司全体职工的月工资如下: (1)求该公司月工资数据组中的众数、中位数和平均数; (2)众数、中位数和平均数中的哪一个更能反映该公司的工资水平? 解: (1) 上述数据中2000出现次数最多为22次,故众数为2000, ;将80个数据按从小到大排列,位于中间的数为2000、2500, 因此中位数为2250; 平均数为= (2)由于大多数员工的月工资都达不到平均数3115,显然用平均数作为该公司员工月工资的代表值并不合适;众数2000和中位数2250在一定程度上代表了大多数人的工资水平,较能反映月工资水平的实际情况。 众数、中位数和平均数的比较: (1)均能反映数据的集中趋势,又具有不同的特点; (2)平均数的计算要用到所有数据,能充分利用数据提供的信息,但易受极端值的影响; (3)中位数对极端值不敏感,但没有利用数据中的所有信息; (4)众数只能反映一组数据中出现次数最多的数据,也没有利用数据中的所有信息。 新知探究(二):用样本估计总体的离散程度 数据的离散程度可以用极差、方差或标准差来描述。 极差: 在统计学中, 我们将一组数据中的最大值与最小值统称为极值,将最大值与中最小值之差称为极差,用R表示。 方差: 若从总体中随机抽样,获得n个观测数据、 、 …、 用表示这n个数据的均值,则称为这n个数据的样本方差。 方差在刻画一组数据的离散程度时,存在一定的局限性,如方差的单位是观测数据的单位的平方,而刻画离散程度的一种理想度量应当具有与观测数据相同的单位,解决这一局限的方法就是引入标准差。 标准差: 标准差是方差的算术平方根。若是样本方差,则称s=是样本标准差。则样本标准差计算公式为: s= 极差、方差、标准差的比较: (1)极差是描述数据离散程度的最简单的代表值,但易受极端值的影响,不能全面地描述数据的离散程度; (2)样本方差刻画了样本数据相对于样本均值集中或离散的程度。若样本是随机抽取的,当样本容量较大时,样本方差是总体方差的估计; (3)在刻画观测数据的离散程度上,方差与标准差是一样的,样本标准差依赖于样本的选取,带有随机性,样本标准差是总体标准差的估计。 新知探究(三):用频率分布直方图估计总体分布 在前面的学习中,我们知道频率分布直方图能够直观地反映样本的频率分布规律。 前几节,我们根据某公共图书馆在一年中,通过随机抽样调查得到的60天的读者借书量,绘制频率分布直方图如图: 一方面,由于是随机抽样,所以该直方图可以认为是一年的所有工作日中读者借书量的分布的近似,即随机抽样得到的样本的频率分布直方图是总体分布的近似; 另一方面,由抽样的随机性,可以想到若随机抽取另一个容量为60的样本,所形成的样本频率分布直方图会与前一个有所不同,但都可以近似的看作总体的分布。 总之,该例题中,从频率分布直方图可以更直观的看到该图书馆每日借出图书册数的分布情况。 新知探究(四):百分位数 百分位数是位于按一定顺序排列的一组数据中某一个百分位置的数值,以表示,其中r是区间[1,99]内的整数。一个百分位数将总体或样本的全部观测值分为两部分,有r%个观测值小于或等于它,有(100-r) %个观测值大于或等于它。当r% = 50%时,P,即对应中位数。 思考:如何求一组观测数据的百分位数呢? 以为例,设观测数据已经按从小到大的顺序排列,则: 第一步,计算c=n25%; 第二步,如果c不是整数,用m表示比c大的最小整数,则所求的是;如果c是整数,则所求的是. 对于[1,99]内的整数r,将上述25%改为r%,即可求得。 统计学中, 称为第一四分位数, 称为第二四分位数, 称为第三四分位数。 练一练: 计算下列数据的第一四分位数:1,5,9,12,13,18,21,23,28,36 解:即求 数据量n=10 c=n×25%=2.5不是整数 而3是比2.5大的最小整数 所以==9 对于从小到大排列的n个数, 大约处于处, 大约处于中间, 大约处于处。百分位数是用于衡量数据位置的度量,它提供了有 关数据在最大值与最小值之间位置的信息。多个百分位数结合使用,可更全面的描述数据的分布特征。典型例题 典型例题 有甲、乙两个球队,甲队6名队员,乙队20名队员,身高数据如下: 甲队:187,181,175,185,173,179; 乙队:180,179,182,184,183,183,183,176,176,181,177,177,178,180,177, 184,177,182,177,183 (1)求两队队员的平均身高; (2)比较两队,哪队的身高整齐些? 解: (1) (2)=25, =8.2 所以> 所以乙队队员的身高更整齐些。 学生和教师共同探究完成1个练习题。 通过思考,培养学生探索新知的精神和能力.课堂小结 用样本估计总体的集中趋势 用样本估计总体的离散程度; 用频率分布直方图估计总体分布; 百分位数。 展开更多...... 收起↑ 资源预览