资源简介 9.1.2 分层随机抽样 1.通过实例了解分层随机抽样的概念、特点和操作步骤. 2.掌握各层样本量化比例分配的方法. 3.掌握分层抽样中样本平均数与总体平均数的计算方法. 问题:在高一年级的712名学生中.现欲了解全体高一年级学生的平均身高,要从中抽取一个容量为50的样本,可以采取简单随机抽样的方式. 会不会出现样本中50个个体大部分来自高个子或矮个子的情形? 为什么会出现这种“极端样本”? 如何避免这种“极端样本”? 会 (1)抽样结果的随机性;(2)个体差异较大 减少总体中个体的差异性 抽样调查最核心的问题是什么? 样本的代表性 高中阶段性别是影响身高的一个主要因素 问题:在高一年级的712名学生中,男生有326名、女生有386名.现欲了解全体高一年级学生的平均身高,要从中抽取一个容量为50的样本. 按比例分配 针对以上的不足,能否利用一些额外信息改进简单随机抽样方法,减少“极端”样本的出现,从而提高对整个年级平均身高的估计效果呢? 思考1 如何分配样本量才更合理?理由是什么? 思考2 问题:在高一年级的712名学生中,男生有326名、女生有386名.现欲了解全体高一年级学生的平均身高,要从中抽取一个容量为50的样本. 无论是男生还是女生,每个学生被抽到的可能性相等. 合在一起就可以得到一个容量为50的样本. 分层随机抽样的定义: 一般地,按一个或多个变量把总体划分成若干个子总体,每个个体属于且仅属于一个子总体,在每个子总体中独立地进行简单随机抽样,再把所有子总体中抽取的样本合在一起作为总样本,这样的抽样方法称为分层随机抽样,每一个子总体称为层. 在分层随机抽样中,如果每层样本量都与层的大小成比例,那么称这种样本量的分配方式为比例分配. 知识归纳 比例分配:抽样比例=每层样本量每层的个体数=样本容量总体容量 ? 每层抽取的样本量 = 抽样比例 ×该层个体数 第1层样本量 第1层个体数 第2层样本量 总样本量 第2层个体数 总体的个体数 如果层数分为2层,第1层和第2层包含的个体数分别为????和????,抽取的样本数分别????和????, ? 知识归纳 分层随机抽样步骤:(比例分配) 分层 按某种特征将总体分成若干部分(层) 计算 抽样比 抽样比=?样本容量??总体容量? ? 定数 按抽样比确定每层抽取的个体数 抽样 各层分别按简单随机抽样的方法抽取样本 汇总 综合各层抽样,组成样本 每层抽取的样本量 = 抽样比例 ×该层个体数 注意: 当总体是由差异明显的几个部分组成时, 往往选用分层随机抽样的方法. 知识归纳 ? ? 1. 为了解某地区的中小学生的视力情况,拟从该地区的中小学生中抽取部分学生进行调查,事先已了解到该地区小学、初中、高中三个学段学生的视力情况有较大差异,而男女生视力情况差异不大.在下面的抽样方法中,最合理的抽样方法是( ). A.简单随机抽样 B.按性别分层抽样 C.按学段分层抽样 D.系统抽样 C ? ? 2.某校高一、高二、高三年级各有学生数分别为800,1000,800 (单位:人),现用分层抽样的方法抽取一个容量为n的样本了解网课学习情况,样本中高一学生的人数为48人,那么此样本的容量n为( ) A.108 B.96 C.156 D.208 ? ? 按上述方法抽取一个容量为50的样本,其观测数据(单位:????????)如下: ? 173.0???174.0???166.0???172.0???170.0???165.0???165.0???168.0??184.0 173.0???172.0???173.0???175.0???168.0???170.0???172.0??176.0???175.0 168.0???173.0???167.0???170.0???175.0 ? 163.0???164.0???161.0???157.0???162.0???165.0???158.0???155.0???164.0 162.5???154.0???154.0???164.0???149.0????159.0??161.0???170.0???171.0 155.0???148.0???172.0???162.5????158.0???155.5???157.0??163.0???172.0 ? 男生: 女生: 平均数为170.6 平均数为160.6 利用以上数据如何估计整个高一年级学生身高的平均数? 思考 在分层随机抽样中,如果分2层,第1层和第2层人数分别为????和????.抽取的样本量分别是????和????. 我们用????1,????2...????????表示第1层各个个体的变量值,用????1,????2...????????表示第1层样本的各个个体的变量值。 用????1,????2...????????表示第2层各个个体的变量值,用????1,????2...????????表示第2层样本的各个个体的变量值。 ? 分层随机抽样的平均数: {22838BEF-8BB2-4498-84A7-C5851F593DF1} 总体平均数 样本平均数 第1层 第2层 ????=????1+????2+...????????????= ? 1????????=1???????????? ? ????=????=1????????????+????=1????????????????+????=????????+????????????+???? =????????+????????+????????+???????? ? ????=????=1????????????+????=1????????????????+????=????????+????????????+????=????????+????????+????????+???????? ? 总体 在比例分配的分层随机抽样中: 在比例分配的分层随机抽样中,可以直接用样本平均数估计总体平均值 对各层样本平均数加权(层权)求和 进行比例分配的分层随机抽样的相关计算时,常用到的3个关系: ? ? 例题.某市的3个区共有高中学生20 000人,且3个区的高中学生人数之比为2∶3∶5,现要从所有学生中抽取一个容量为200的样本,调查该市高中学生的视力情况.若样本中3个区的高中学生的平均视力分别4.8,4.8,4.6,试估计该市高中学生的平均视力. 解:确定每层抽取的个体数,在3个区分别抽取的学生人数之比也是2:3:5,?所以抽取的学生人数分别是 ? 样本中高中学生的平均视力为 , 所以估计该市高中学生的平均视力约为4.7. 小明想通过多次抽样考察一下分层随机抽样的估计效果.他用比例分配的分层随机抽样方法,从高一年级学生中抽取了10个样本量为50的样本,计算出样本平均数如下表所示,观察表中的数据,你有什么发现? 思考 我们把分层随机抽样的平均数与上一小节样本量为50的简单随机抽样的平均数用图形进行表示,其中红线表示整个年级学生身高的平均数. 发现3:在总体差异较大时,分层随机抽样的效果一般会优于简单随机抽样。 发现1:分层随机抽样的样本平均数围绕总体平均数波动,与简单随机抽样的结果比较,分层抽样并没有明显优于简单随机抽样。 发现2:相对而言,分层抽样的样本平均数波动幅度更均匀,简单随机抽样的样本平均数有偏离总体平均数幅度比较大的极端数据。 本节课我们学习了哪些内容? 1.知识点: (1)分层随机抽样. 2.方法归纳:数据分析. 3.易错点:在分层随机抽样中,每个个体被抽到的可能性相等,与层数及分层无关,每一层的抽样一般采用简单随机抽样. (2)有关的计算公式 (3)获取数据的途径. 1.下列实验中最适合用分层抽样法抽样的是( ) A.从一箱3 000个零件中抽取5个入样 B.从一箱3 000个零件中抽取600个入样 C.从一箱30个零件中抽取5个入样 D.从甲厂生产的100个零件和乙厂生产的200个零件中抽取6个入样 2.一批灯泡400只,其中20 W、40 W、60 W的数目之比是4∶3∶1,现用分层抽样的方法产生一个容量为40的样本,三种灯泡依次抽取的个数为( ) A.20,15,5 B.4,3,1 C.16,12,4 D.8,6,23. 3.某单位有职工100人,不到35岁的有45人,35岁到49岁的有25人,剩下的为50岁以上(包括50岁)的人,用分层抽样的方法从中抽20人,各年龄段分别抽取的人数为( ) A.7,5,8 B.9,5,6 C.7,5,9 D.8,5,7 D A B 4.(多选)某运动队由足球运动员18人,篮球运动员12人,乒乓球运动员6人组成(每人只参加一项),现从这些运动员中抽取一个容量为n的样本,若采用分层随机抽样的方法,且不用删除个体:则样本量n的取值不可能是( ) A.5 B.6 C.20 D.24 AC 展开更多...... 收起↑ 资源预览