资源简介 9.1.2 分层随机抽样 第九章 统计 1.通过实例了解分层随机抽样的概念、特点和操作步骤. 2.掌握各层样本量化比例分配的方法. 3.掌握分层抽样中样本平均数与总体平均数的计算方法. 能否利用总体中的一些额外信息对抽样方法进行改进呢? 这种“极端”样本的平均数会大幅度地偏离总体平均数,从而使得估计出现较大的误差 想一想:在某次体育馆中人员身高的调查中,可以像右图这样选择样本吗? 抽样调查最核心的问题是样本的代表性,简单随机抽样是使总体中每一个个体都有相等的机会被抽中,但因为抽样的随机性,有可能会出现比较“极端”的样本. 问题1:在高一年级的712名学生中,男生有326名、女生有386名. 现欲了解全体高一年级学生的平均身高,要从中抽取一个容量为50的样本.如何避免极端样本的出现? 同样地,为了避免出现样本中50个个体大部分来自高个子或矮个子的“极端样本”. 分层抽样,减少层内差距 追问:如果按照男生、女生两个子总体抽取样本,那么抽取男生和女生的样本量如何确定才有利于反映总体呢?为什么? 女生样本量= 女生人数 全体学生数 ×总样本量 男生样本量= 男生人数 全体学生数 ×总样本量 这样,无论男生、女生,每个学生被抽到的概率都相等. 分层随机抽样的定义: 一般地,按一个或多个变量把总体划分成若干个子总体,每个个体属于且仅属于一个子总体,在每个子总体中独立地进行简单随机抽样,再把所有子总体中抽取的样本合在一起作为总样本,这样的抽样方法称为分层随机抽样,每一个子总体称为层. 在分层随机抽样中,如果每层样本量都与层的大小成比例,那么称这种样本量的分配方式为比例分配. 分层随机抽样的步骤: 分层 按某种特征将总体分成若干部分(层) 计算 抽样比 抽样比= 样本容量 总体容量 ? 定数 按抽样比确定每层抽取的个体数 抽样 各层分别按简单随机抽样的方法抽取样本 汇总 综合各层抽样,组成样本 1:某中学有老年教师20人,中年教师65人,青年教师95人,为了调查他们的健康状况,需从他们中抽取一个样本容量为36的样本,则合适的抽样方法是( ) ????.抽签法 ????.随机数法 ????.分层随机抽样 ????.其他抽样方法 ? 【答案】:???? ? 2:某单位共有老年、中年、青年职工320人,其中青年职工150人,老年职工与中年职工的人数之比为7∶10.为了了解职工的身体情况,现采用按比例分配分层随机抽样的方法进行调查,抽取的样本中有青年职工30人,则抽取的老年职工的人数为 ????.14 ????.20 ????.21 ????.70 ? 【答案】:???? ? 分层随机抽样的特点: 讨论:分层随机抽样有什么特点呢? 分层随机抽样适用于总体有差异明显的几个部分组成的情况。 比例分配的分层随机抽样是等可能抽样,如果层数分为 2层,第 1 层和第 2 层包含的个体数分别为????和????,抽取的样本数分别????和????。 ? 3.某学校的学生由小学部、初中部、高中部构成,其中小学部与初中部共有700人,该校领导采用按比例分配的分层随机抽样的方法抽取12名学生进行家访,若高中部抽取了5名学生,则该校高中部有_____名学生. 【答案】:500 ? 4.某中学高一年级有学生600人,高二年级有学生450人,高三年级有学生750人,若该校取一个容量为????的样本,每个学生被抽到的可能性均为0.2, 则????=_______. ? 【答案】:360 ? 想一想: 1.若小明同学期中考试70分,期末考试90分,则两次考试小明的平均分是多少? 2.若小明同学期中考试70分,期末考试90分,按学校规定,期中考试占40%,而期末考试占60%,则两次考试小明的平均分是多少? ? (70+90)÷2=80 分(算术平均数) ? 70×0.4+90×0.6=82 分(加权平均数) ? 问题2:在树人中学高一年级有712名学生中,男生有326名, 女生有386名. 抽取一个容量为50的样本,估计整个年级平均身高. 追问1:如果张华在各层中按比例分配样本,那么男生、女生中分别抽取了多少名? 男生:23; 女生27. ? 按上述方法抽取一个容量为50的样本,其观测数据(单位:????????)如下: ? 173.0 174.0 166.0 172.0 170.0 165.0 165.0 168.0 184.0 173.0 172.0 173.0 175.0 168.0 170.0 172.0 176.0 175.0 168.0 173.0 167.0 170.0 175.0 ? 163.0 164.0 161.0 157.0 162.0 165.0 158.0 155.0 164.0 162.5 154.0 154.0 164.0 149.0 159.0 161.0 170.0 171.0 155.0 148.0 172.0 162.5 158.0 155.5 157.0 163.0 172.0 ? 男生: 女生: 按上述方法抽取一个容量为50的样本,其观测数据(单位:????????)如下: ? 173.0 174.0 166.0 172.0 170.0 165.0 165.0 168.0 184.0 173.0 172.0 173.0 175.0 168.0 170.0 172.0 176.0 175.0 168.0 173.0 167.0 170.0 175.0 ? 163.0 164.0 161.0 157.0 162.0 165.0 158.0 155.0 164.0 162.5 154.0 154.0 164.0 149.0 159.0 161.0 170.0 171.0 155.0 148.0 172.0 162.5 158.0 155.5 157.0 163.0 172.0 ? 男生: 女生: 平均数为170.6 平均数为160.6 男生身高的样本平均数为170.6 女生身高的样本平均数为160.6 男生身高的总体平均数约为170.6 女生身高的总体平均数约为160.6 估计 如何估计整个高一年级学生身高的平均数? 思考1 进行比例分配的分层随机抽样的相关计算时,常用到的3个关系 {5C22544A-7EE6-4342-B048-85BDC9FD1C3A} 总体平均数 样本平均数 第1层 第2层 总体 ????=????1+????2+…+????????????=1????????=1???????????? ? ????=????1+????2+…+????????????=1????????=1???????????? ? ????=????1+????2+…+????????????=1????????=1???????????? ? ????=????1+????2+…+????????????=1????????=1???????????? ? ????=????=1????????????+????=1????????????????+???? ? ????=????=1????????????+????=1????????????????+???? ? =????????+????????????+???? ? =????????+????????????+???? ? 小明想通过多次抽样考察一下分层随机抽样的估计效果.他用比例分配的分层随机抽样方法,从高一年级学生中抽取了10个样本量为50的样本,计算出样本平均数如下表所示,小明有了一个重要发现.你是否也有所发现? 思考2 我们把分层随机抽样的平均数与上一小节样本量为50的简单随机抽样的平均数用图形进行表示,其中红线表示整个年级学生身高的平均数. 发现3:在总体差异较大时,分层随机抽样的效果一般会优于简单随机抽样。 发现1:分层随机抽样的样本平均数围绕总体平均数波动,与简单随机抽样的结果比较,分层抽样并没有明显优于简单随机抽样。 发现2:相对而言,分层抽样的样本平均数波动幅度更均匀,简单随机抽样的样本平均数有的偏离总体平均数的幅度比较大的极端数据。 5.某校有初中、高中两个部门,其中初中有学生850人,高中有学生650人,小军想要进行一个视力调查,对学校按部门进行按比例分配分层随机抽样,得到初中生、高中生平均视力分别为1.0 , 0.8,其中样本量为60,则在初中部、高中部各抽取多少人?整个学校平均视力是多少? ? 解: 所以在初中部、高中部各抽取34,26人,整个学校平均视力约为0.91. 变式:某一个地区共有五个乡镇,人口3万人,其人口比例为3 : 2 : 5 : 2 : 3,从3万人中抽取一个300人的样本,分析某种疾病的发病率,已知这种疾病与不同的地理位置及水土有关,问应采取什么样的方法?并写出具体过程. ? 解:因为疾病与地理位置和水土均有关系,所以不同乡镇的发病情况差异明显,因而采用分层随机抽样的方法.具体过程如下: 第一步,将3万人分为5层,其中一个乡镇为一层. 第二步,按照样本容量的比例求得各乡镇应抽取的人数分别为 60人,40人,100人,40人,60人. 第三步,按照各层抽取的人数随机抽取各乡镇应抽取的样本. 第四步,将300人合到一起,即得到一个样本. 可以直接用样本平均数估计总体平均值 展开更多...... 收起↑ 资源预览