资源简介 (共51张PPT)概率与统计专题二 统计9.2 统计知识点1 总体与样本1. 总体:在统计问题中,把所研究对象的全体称为总体.2. 个体:总体中的每一个对象称为个体.3. 样本:从总体中抽取的一部分个体所组成的集合称为总体的样本.4. 样本量:样本中个体的数目称为样本量,也称为样本容量.知识点2 抽样方法1. 简单随机抽样(1)简单随机抽样的定义一般地,设总体中的个体数为N. 从中逐个不放回地抽取n个个体作为样本 (n≤N),且每次抽取时总体内的每个个体被抽到的概率相等,这种抽样方法 称为简单随机抽样.(2)抽签法①基本步骤:第一步是编号,把总体中的N个个体从1至N逐一编号;第二步是 做签,做编号为1至N的签;第三步是抽签,将做好的签放到容器中,摇匀后, 从中不放回地逐个抽取n个签;第四步是取样,按照抽取到的签上的号码取出对 应的个体,得到一个容量为n的样本.②特点:个体数量较少;个体逐个抽取;个体不放回抽样,所抽取的样本中没有 被重复抽取的个体;等可能性抽样,每一个个体被抽取的概率相等.2. 系统抽样(1)系统抽样的定义当总体容量较大时,可将总体分成均衡的若干部分,按照预先确定的规则,从每 一部分中抽取一个个体,得到需要的样本,这种抽样方法称为系统抽样.(2)系统抽样的特点①个体数目比较多;②把总体分成均衡的若干部分,分段间隔相等,在第一段用抽签法确定起始编 号,其余依次加上间隔的整数倍;③每个个体被抽到的概率相等.3. 分层抽样(1)分层抽样的定义当总体由差异明显的几部分组成时,可将总体按差异情况分成互不重叠的几个部 分(在统计上称为“层”),再从每一层内随机抽取一定数量的个体组成样本, 这种抽样方法称为分层抽样.(2)分层抽样的特点①适用于由差异比较明显的几个部分组成的总体;②按比例确定每层抽取个体的个数;③用抽签法或系统抽样的方法在每一层抽样;④每个个体被抽到的概率相同.(3)分层抽样的基本步骤①分层:将总体按照一定标准分层;②计算:样本容量与总体个数的比值;③确定各层应抽取的个体数(按②中的比值确定各层应该抽取的个体数);④取样:在每一层抽样,所抽取的个体合在一起就是所需要的样本.4. 三种抽样方法的异同点类别 相同点 不同点 相互联系 适用范围简单随机抽样 抽样过程中 每个个体被 抽到的概率 是相同的 从总体中逐个不 放回地抽取 — 总体中的个体数比 较少系统抽样 将总体分成均衡 的若干部分,按 照预先确定的规 则在每一部分中 抽取 在起始部分 抽样时采用 抽签法抽样 总体中的个体数比 较多类别 相同点 不同点 相互联系 适用范围分层抽样 抽样过程中 每个个体被 抽到的概率 是相同的 将总体分成几 层,分层进行抽 取 各层抽样时 采用抽签法 或系统抽样 总体由差异明显的 几部分组成知识点3 用样本的频率分布估计总体1. 样本的频率分布的有关概念(1)频数的定义在统计学中,将样本按照一定的方法分成若干组,每组内所含个体的数目称为该 组的频数.(2)频率某组的频数与样本容量的比值称为该组的频率.(3)频率分布表频率分布表一般由分组、频数、频率组成,可以清楚地反映数据的分布规律.2. 用样本的频率分布估计总体(1)用样本的频率分布估计总体的步骤①选择恰当的抽样方法得到样本数据;②求极差,确定组数和组距,确定分点并列出频率分布表;③绘制频率分布直方图;④观察频率分布表和频率分布直方图,根据样本的频率分布,估计总体中某事件 发生的概率.(2)基本思想用样本的频率分布可估计总体的频率分布,进而估计总体中某事件发生的概率.知识点4 用样本均值、标准差估计总体1. 样本均值(1)样本均值的定义(2)样本均值的意义在统计工作中,样本均值反映样本的平均水平,通常用来估计总体的平均数,样 本容量越大,这种估计的可信程度越高.2. 样本方差与样本标准差(1)样本方差的定义(3)样本方差与样本标准差的意义样本的方差和标准差反映了样本的波动情况,即数据的离散程度.方差或标 准差越大,说明数据的离散程度越大;方差或标准差越小,说明数据的离散 程度越小.3. 用样本的均值和方差(或标准差)估计总体(1)基本思想分别用样本的均值和标准差估计总体的平均水平和波动情况.(2)意义用样本估计总体时,样本的均值、方差(或标准差)只是总体的平均数、方差 (或标准差)的近似值.将样本均值与方差(或标准差)结合,可对总体做出较 好的估计.在实际应用中,当所得数据的平均值不相等时,需要先分析数据的平 均水平,再计算方差(或标准差)并分析其稳定性.例1 为了解某校600名学生的视力情况,从中抽取50名学生的视力情况进行统计 分析.在这项调查中,样本容量是( ).A. 50名学生 B. 50名学生的视力情况C. 600名学生 D. 50【考查目标】 本题考查样本容量.【解析】 由题意可知,总体是600名学生的视力情况,个体是每一名学生的视力 情况,样本是被抽取出来的50名学生的视力情况,样本容量是50.【答案】 D【解题技巧】 (1)解题的关键是理解总体、个体、样本和样本容量的概念.(2)总体是研究对象的全体,样本是被抽取出来的个体的集合,样本容量是样 本的数目.A. 112名学生是总体B. 每个学生是个体C. 抽取的30名学生的数学成绩是样本D. 112与30的比值是样本容量【解析】根据总体、个体、样本、样本容量的定义可知C项正确.C例2 (2022届安徽省“江淮十校”职教高考第十次联考)为了了解某地区中小 学生的视力情况,现从该地区中小学生中抽取部分学生进行调查,事先已了解该 地区小学、初中、高中三个学段学生的视力情况有较大差异,而男女生视力情况 差异不大.该调查最适合采用的抽样方法是( ).A. 简单随机抽样 B. 按性别分层抽样C. 按学段分层抽样 D. 系统抽样【考查目标】 本题考查抽样方法.【解析】 因为该地区小学、初中、高中三个学段学生的视力情况有较大差 异,而男女生视力情况差异不大,所以该调查最适合采用的抽样方法是按学 段分层抽样.【答案】 C【解题技巧】 当总体由差异明显的几部分组成时,一般采用分层抽样.A. 系统抽样 B. 简单随机抽样C. 分层抽样 D. 以上都可C例3 (2021年安徽省职教高考真题)某学校为了了解1 000名学生的体质状况, 将这些学生编号为1,2,…,1 000,用系统抽样的方法从这些学生中等距抽取 100名进行体质测试,若23号学生被抽到,则下面编号对应的学生被抽到的是 ( ).A. 100 B. 107 C. 113 D. 115【考查目标】 本题考查系统抽样.【解析】 由系统抽样的特点可知,本题中被抽到的学生的编号可组成公差为10 的等差数列.【答案】 C【解题技巧】 根据系统抽样按等分段间隔抽样的规则,可将样本编号转化成一个 等差数列,公差是分段间隔.A. 57 B. 67 C. 77 D. 87C例4 (2024年安徽省职教高考真题)某学校高一年级有210名学生,高二年级有 180名学生,高三年级有150名学生.为了解学生的身体状况,该学校采用分层抽 样的方法抽取n名学生进行体能测试.若从高二年级抽取了30名学生,则n= ( ).A. 55 B. 65 C. 90 D. 120【考查目标】 本题考查分层抽样.【答案】 C【解题技巧】 分层抽样就是按比例抽样,所占比例越大,被抽取得越多,所占比 例越小,被抽取得越少.A. 6 B. 18 C. 24 D. 36A. 240 B. 360 C. 540 D. 660CD例5 (2022年安徽省职教高考真题)从一块小麦地里随机抽取100株小麦,测量 各株小麦的高度(单位:cm).根据测量的数据得到频率分布直方图(如图), 则样本高度落在区间[15,20]上的频数为( ).A. 10 B. 20 C. 30 D. 40【考查目标】 本题考查频率分布直方图的简单应用.【解析】 样本高度落在区间[15,20]上的频率为1-(0.10+0.06)×5=0.2, 所以其频数为0.2×100=20.【答案】 B【解题技巧】 能够读懂频率分布直方图是解题的关键.频率分布直方图的横轴表 示数据的分组情况,纵轴表示频率与组距的比值,因此,某一组距的频率就等于 其对应矩形的面积.根据频率分布直方图能够得到各组的频率,进而解决一些简 单的问题.BA. 3 600 B. 3 000 C. 2 400 D. 1 500【解析】由题图可知,每周平均体育运动时间少于4小时的人数是12 000× (0.025+0.100)×2=3 000.A. 身高数据比体重数据的离散程度大B. 身高数据比体重数据的离散程度小C. 身高数据和体重数据的离散程度一样大D. 身高数据和体重数据的离散程度无法判断【考查目标】 本题考查统计数据的应用.【答案】 B【解题技巧】 (1)样本均值反映样本的平均水平,通过样本均值来估计总体的 平均数时,样本容量越大,这种估计可信程度越高.(2)方差能描述数据的离散程度,方差越小,数据的离散程度越小,即数据波 动越小、越稳定.变式训练6(1)某校要从甲、乙两名优秀选手中选一名选手参加全市中学生田径百米比 赛,在最近的8次选拔赛中,他们的成绩(单位:秒)如下:甲:12.1,12.5,13.0,12.5,12.8,12.2,12.4,12.5;乙:12.0,12.9,12.2,13.1,12.2,13.0,12.1,12.9.①他们的平均成绩分别是多少?②他们这8次选拔赛成绩的方差各是多少?(保留到小数点后第2位)③这两名选手的选拔成绩各有什么特点?(2)某中等职业学校农艺专业的学生为了考察甲、乙两种农作物的长势,分别 从中抽取了10株苗,测得苗高(单位:mm)如下表所示.甲 9 10 11 12 7 13 10 8 12 8乙 8 13 12 11 10 12 7 7 9 11请你经过计算,回答下列问题:①哪种农作物的10株苗长得比较高?②哪种农作物的10株苗长得比较整齐?(保留到小数点后第1位)A. 总体 B. 个体C. 总体中的一个样本 D. 样本容量【解析】根据样本的定义可知,C项符合题意.CA. 3,2 B. 2,3C. 2,30 D. 30,2AA. 5件 B. 10件C. 12件 D. 15件B学生 甲 乙 丙 丁21.4 22.5 22.5 20.3方差s2 6.6 6.6 2.5 7.2A. 甲 B. 乙C. 丙 D. 丁【解析】从均值来看,乙、丙两人的平均得分最高,整体成绩较好,而丙的方差 比乙的方差小,所以这四人中丙的成绩最好而且稳定,所以丙是最佳人选.CA. 875 B. 1 000C. 1 010 D. 1 250A【解析】由频率分布直方图知,获得“优秀”的学生的频率是0.035×10= 0.35;故可估计此次知识竞赛中获得“优秀”的学生人数是0.35×2 500=875.二、填空题6. 已知样本数据6,x,7,5,6的样本均值是6,则x= ,样本标准差 是 .6 7. 采用系统抽样的方法从含有2 000个个体的总体(编号为0~1 999)中抽取一个 容量为100的样本,若在第一段用简单随机抽样的方法得到的起始个体编号为 13,则第6个入样编号是 .1138. 将容量为100的样本数据分为8组,各组频数如下表所示,则第3组的频率 是 .组号 1 2 3 4 5 6 7 8频数 10 13 14 14 15 13 12 90.14三、解答题9. 为了检测3 000个零件的长度是否合格,现从中抽取500个零件进行测量,请分 别指出此次统计调查中的总体、个体、样本和样本容量.解:根据题意和统计的相关知识可知,总体为3 000个零件的长度,个体为每一 个零件的长度,样本为500个零件的长度,样本容量为500.10. 某商场新进了一批直径为12 mm的螺丝,从中抽取了20个螺丝,生产商规定 它们的标准差若大于0.2 mm,就可以要求退货.这20个螺丝的直径(单位: mm)如下:11.8,11.7,12.0,12.1,12.3,12.2,12.0,11.5,12.3,12.1,12.0,12.2,11.9,11.7,11.9,12.1,12.3,12.2,11.8,11.9.通过计算说明该商场是否可以要求退货?(保留到小数点后第3位)解:由题图,可得(0.035+0.030+a+0.010)×10=1,解得a=0.025,所以这500辆汽车中车速低于60 km/h的汽车有(0.025+0.035)×10×500=300 (辆).12. 某企业500名员工参加“学雷锋”志愿活动,按年龄(单位:岁)分组如下: 第1组为[25,30),第2组为[30,35),第3组为[35,40),第4组为[40, 45),第5组为[45,50],得到如下表所示的尚不完整的频数分布表和频率分布直 方图.分组 [25,30) [30,35) [35,40) [40,45) [45,50]人数 50 50 a 150 b(1)求频数分布表中正整数a,b的值;解:(1)由频率分布直方图可知,第3组的频率为0.08×5=0.4,第5组的频率 为0.02×5=0.1,所以a=0.4×500=200,b=0.1×500=50.(2)现在要从年龄较小的第1组、第2组、第3组中用分层抽样的方法抽取6人, 求分别从第1组、第2组、第3组抽取的人数.解:(2)第1组、第2组、第3组的人数分别为50,50,200,人数之比为 1∶1∶4,所以用分层抽样的方法抽取6人,从这三组中抽取的人数分别为1,1,4. 展开更多...... 收起↑ 资源预览