资源简介 (共37张PPT)综合微评(六)时间:120分钟 满分:150分2门世2有3厚第6章 统计学初步6.1 获取数据的途径及统计概念6.2 抽 样新课程标准 新学法解读1.了解数据获取的途径及统计的相关概念. 2.通过实例,了解简单随机抽样的含义及其解决问题的过程,掌握两种简单随机抽样方法:抽签法和随机数法. 3.通过实例,了解分层随机抽样的特点和适用范围,了解分层随机抽样的必要性,掌握各层样本量比例分配的方法. 1.通过设计抽签法或随机数法完成抽样,体会简单随机抽样的必要性和重要性.训练学生数学模型的核心素养. 2.会利用比例分配的分层随机抽样对差异明显的总体进行抽样,并掌握求解相关数据常用的方法.笔记 教材知识点一 获取数据的途径统计数据主要来自两条途径:间接来源和直接来源.知识点二 统计的相关概念1.总体和个体把调查对象的全体称为总体,组成总体的每一个调查对象称为个体.为了强调调查目的,也可以把调查对象的某些指标的全体作为总体,每一个调查对象的相应指标作为个体.2.样本从总体中抽取的那部分个体称为样本,样本中包含的个体数称为样本容量,简称为样本量.从总体中抽取样本的工作称为抽样.3.普查和抽样调查普查,又称全面调查,即对需要调查的对象进行逐个调查.抽样调查是从总体中抽取一部分个体进行调查.知识点三 简单随机抽样1.放回简单随机抽样一般地,设一个总体含有N(N为正整数)个个体,从中逐个抽取n(1≤n2.不放回简单随机抽样一般地,设一个总体含有N(N为正整数)个个体,从中逐个抽取n(1≤n放回简单随机抽样和不放回简单随机抽样统称为简单随机抽样.通过简单随机抽样获得的样本称为简单随机样本.知识点四 两种简单随机抽样的方法1.抽签法先给个体进行编号.然后把所有编号写在外观、质地等无差别的小纸片(也可以是卡片、小球等)上作为号签,并将这些小纸片放在一个不透明的盒里,充分搅拌.最后从盒中不放回地逐个抽取号签,使与号签上的编号对应的个体进入样本.直到抽足样本所需要的个体数.抽签法简单易行,但当总体较大时,操作起来比较麻烦.因此,抽签法一般适用于总体中个体数不多的情形.2.随机数法先给个体进行编号,例如1~712.用随机数工具产生1~712范围内的整数随机数,把产生的随机数作为抽中的编号,使与编号对应的个体进入样本.重复上述过程,直到抽足样本所需要的个体数.如果生成的随机数有重复,即同一编号被多次抽到,可以剔除重复的编号并重新产生随机数,直到产生的不同编号个数等于样本所需要的个体数.知识点五 分层抽样当总体由差异明显的几个部分组成时,为了使抽取的样本更好地反映总体的情况,把总体中各个个体按照某种特征或某种规则划分为互不交叉的层,然后对各层按其在总体中所占比例独立进行简单随机抽样,这种抽样方法称为分层抽样.自我 检测1.(多选题)下面的四个问题中,可以用抽样调查方法的是( )A.某医院供应库房工作人员对新入库的10万只一次性医用口罩进行质检B.某银行对某公司100万元存款的现钞的真假检验C.空降兵战士检查20个伞包及伞的质量D.某质检部门检验最新一批汽车的防碰撞性能解析:对于A选项,10万只一次性医用口罩容量很大,应采用抽样调查的方法;对于B选项,100万元存款的现钞的真假检验必须普查,不能放过任何一张假钞;对于C选项,伞包以伞的质量决定人的生命,必须普查;对于D选项,防碰撞性能的检测会对汽车产生破坏,应采取抽样调查的方法.故选AD.答案:AD2.某单位有职工160人,其中业务员104人,管理人员32人,后勤服务人员24人,现用比例分配的分层随机抽样法从中抽取一容量为20的样本,则抽取管理人员有( )A.3人 B.4人C.7人 D.12人解析:由=,设抽取管理人员x人,则=,得x=4.故选B.答案:B3.一个总体中含有100个个体,以简单随机抽样方法从该总体中抽取一个容量为5的简单随机样本,则指定的某个个体被抽到的可能性为________.解析:因为是简单随机抽样,故每个个体被抽到的概率都相等,所以指定的某个个体被抽到的可能性为.答案:4.从一批零件中抽取10个零件,测得它们的长度(单位:cm)如下:22.36 22.35 22.33 22.35 22.3722.34 22.38 22.36 22.32 22.35由此估计这批零件的平均长度.在此统计活动中:(1)总体为:____________________;(2)个体为:____________________;(3)样本为:____________________;(4)样本量为:____________________.答案:(1)这批零件的长度 (2)每个零件的长度 (3)抽取的10个零件的长度 (4)105.某公司生产三种型号的轿车,产量分别是1 200辆、6 000辆和2 000辆,为检验该公司的产品质量,现用分层随机抽样的方法抽取46辆进行检验,这三种型号的轿车依次应抽取________辆、________辆、________辆.解析:三种型号的轿车共9 200辆,抽取样本量为46辆,则按=的比例抽样,所以依次应抽取1 200×=6(辆),6 000×=30(辆),2 000×=10(辆).答案:6 30 10研习 1 简单随机抽样的概念[典例1] 下面的抽样方法是简单随机抽样吗?为什么?(1)某班45名学生,指定个子最高的5名学生参加学校组织的某项活动;(2)从20个零件中一次性随机抽出3个进行质量检验;(3)一儿童从玩具箱中的20件玩具中随意拿出一件来玩,玩完后放回再拿出一件,连续拿了5件.[解] (1)不是简单随机抽样,因为这不是等可能抽样.(2)一次性随机抽取3个与逐个不放回抽取3个是等价的,因此是不放回简单随机抽样.(3)是放回简单随机抽样.[延伸探究] 在简单随机抽样过程中,每个个体被抽到的可能性一样吗?怎样计算这个可能性的大小?[答案] 一样.计算公式为.巧归纳简单随机抽样的判断方法判断所给抽样是不是简单随机抽样,关键是看它们是否符合简单随机抽样的特点,即总体的个数有限;逐个抽取;等机会抽样.[练习1] 下列抽取样本的方式是简单随机抽样吗?为什么?(1)在机器传送带上每隔10个抽取一件产品作为样本;(2)从无限多个个体中抽取50个个体作为样本;(3)箱子里共有100个零件,从中选取10个零件进行检验,在抽样操作时,从中任意地拿出一个零件进行质量检验后再把它放回箱里;(4)从50个个体里一次性随机抽取5个个体作为样本.解:(1)不是,因为传送带上的产品数量不确定.(2)不是,因为个体的数目无限多.(3)是放回简单随机抽样.(4)是,因为它是一次性随机抽取,与逐个不放回随机抽取含义一样.研习 2 抽签法的应用[典例2] 某单位支援西部开发,现从报名的18名志愿者中选取6名组成志愿小组到西藏工作3年.请设计一种抽取方法.[解] 按抽签法的一般步骤进行设计.第一步 将18名志愿者编号,号码为1,2,…,18;第二步 将号码分别写在一张形状、大小相同的纸条上,制成号签;第三步 将所有号签放入一个箱子中,充分搅匀;第四步 依次取出6个号码,并记录其编号;第五步 将对应编号的志愿小组成员选出.[延伸探究] 从哪几个方面可判断一个抽样方法是抽签法?[答案] 一是编号,二是搅拌均匀,三是依次不放回抽取.巧归纳抽签法抽样的步骤一般地,用抽签法从容量为N的总体中抽取一个容量为n的样本的步骤为:(1)把总体中的N个个体编号(号码可以从1到N);(2)将这N个号码写在形状、大小相同的签上(签可以是小球、卡片或纸条).(3)将这些号签放在同一个箱子里均匀搅拌.(4)从箱子中每次随机地抽出一个号签不放回,并记录其编号,连续抽取n次.(5)将总体中与抽到的号签的编号相一致的n个个体取出.[练习2] 某市环保局有各县报送的空气质量材料15份,为了解全市的空气质量,要从中抽取一个容量为5的样本,试确定用何种方法抽取,请具体实施操作.解:总体容量小,样本容量也小,可用抽签法.步骤如下:(1)将15份材料逐个编号,号码分别是1,2,3,…,15;(2)将以上15个号码分别写在15张相同的小纸条上,揉成小球,制成号签;(3)把号签放入一个不透明的容器中,充分搅拌均匀;(4)从容器中逐个抽取5个号签,并记录上面的号码;(5)找出和所抽号码对应的5份材料,组成样本.研习 3 随机数法的应用[典例3] 现从80瓶水中抽取6瓶进行检验,利用随机数表抽取样本时,先将80瓶水编号为00,01,02,…,79,在随机数表中任选一个数,例如选出第1行第5列的数7,规定从选定的数7开始向右读,依次选取两个数字,则得到的样本编号为______________.附表:16 22 77 94 39 49 54 43 54 82 17 37 93 23 7887 35 20 96 43 84 26 34 91 6484 42 17 53 31 57 24 55 06 88 77 04 74 47 6721 76 33 50 25 83 92 12 06 7663 01 63 78 59 16 95 55 67 19 98 10 50 71 7512 86 73 58 07 44 39 52 38 7933 21 12 34 29 78 64 56 07 82 52 42 07 44 3815 51 00 13 42 99 66 02 79 5457 60 86 32 44 09 47 27 96 54 49 17 46 09 6290 52 84 77 27 08 02 73 43 28[解析] 找到第1行第5列的数7开始向右读,依次选取两个数字,第一个符合条件的数是77,它的下一个数是94,大于79,故舍去,第二个符合条件的数是39,第三个符合条件的数是49,第四个符合条件的数是54,第五个符合条件的数是43,它的下一个数是54,与第四个数重复,故舍去,再下一个数是82,比79大,故舍去,第六个符合条件的数是17.故得到的样本编号为77,39,49,54,43,17.[答案] 77,39,49,54,43,17[延伸探究] 用随机数表法抽样时,如何确定开始位置?如何读数?[答案] 在随机数表中任选一个数字作为开始位置,按照一定的顺序和要求取样本,取满为止.巧归纳1.随机数表法抽样的步骤(1)将总体中的所有个体编号(每个号码位数一致).(2)在随机数表中任选一个数字作为初始数字.(3)从初始数字开始按照一定的顺序和要求获取样本号码(重复号码和不在编号范围内的号码跳过,直到取满为止).(4)按所得号码抽取样本.2.抽签法和随机数法的优点和缺点(1)抽签法的特点优点:抽签法简单易行,当总体中的个体数不多时,使总体处于“搅拌均匀”的状态比较容易,这时每个个体有均等的机会被抽中,从而能够保证样本的代表性.缺点:当总体中的个体数较多时,将总体“搅拌均匀”就比较困难,用抽签法产生的样本代表性差的可能性很大.(2)随机数法的特点优点:简单易行,它很好地解决了用抽签法时,当总体中的个体数较多时制签难的问题.缺点:当总体中的个体数很多,需要的样本容量也很大时,用随机数法抽取样本仍不方便. [练习3] 欲从某单位45名职工中随机抽取10名职工参加一项社区服务活动,试用随机数法确定这10名职工,请写出抽样过程.现将随机数表部分摘录如下:16 22 77 94 39 49 54 43 54 82 17 37 93 23 7887 35 20 96 43 84 42 17 53 31 57 24 55 06 8877 04 74 47 67 21 76 33 50 25 63 01 63 78 5916 95 55 67 19 98 10 50 71 75 12 86 73 58 07解:第一步 将45名职工编号为00,01,02,03,…,44;第二步 从随机数表中任意一个位置,例如从所给数表中第1行的第3列和第4列的数字开始向右读,首先取22,然后取77,94均大于44,跳过;继续向右读数得到39;49,54大于44,跳过;继续可以得到43,然后同样跳过大于44及与前面重复的数字可以得到17,37,23,35,20,43,42,31.第三步 确定编号为17,20,22,23,31,35,37,39,42,43的10名职工作为参加该项社区服务活动的人选.研习 4 分层抽样的概念[典例4] 某单位有老年人28人,中年人54人,青年人81人,为了调查他们的身体状况,从他们中抽取容量为36的样本,最适合抽取样本的方法是( )A.简单随机抽样B.抽签法C.分层随机抽样D.先从老年人中剔除1人,再分层随机抽样[解析] 总体总人数为28+54+81=163(人),样本容量为36,由于总体由差异明显的三部分组成,考虑用分层随机抽样.若按36∶163抽取样本,无法得到整数解,故考虑先剔除1人,抽取比例变为36∶162=2∶9,则中年人取54×=12(人),青年人取81×=18(人),先从老年人中剔除1人,老年人取27×=6(人),组成容量为36的样本.故选D.[答案] D[延伸探究] 适合分层抽样的总体具有什么特征?[答案] 适合分层抽样的总体是由具有明显差异的几部分构成的.巧归纳分层抽样的前提和遵循的两条原则(1)前提:分层抽样使用的前提是总体可以分层,层与层之间有明显区别,而层内个体间差异较小,每层中所抽取的个体数可按各层个体数在总体的个体数中所占的比例抽取.(2)遵循的两条原则:①将相似的个体归入一类,即为一层,分层要求每层的各个个体互不交叉,即遵循不重复、不遗漏的原则;②分层抽样为保证每个个体等可能入样,需遵循在各层中进行简单随机抽样,每层样本数量与每层个体数量的比等于抽样比.[练习4] 某电视台在因特网上就观众对某一节目的喜欢程度进行调查,参加调查的人数为12 000人,其中持各种态度的人数如下表所示:很喜欢 喜欢 一般 不喜欢2 435 4 567 3 926 1 072电视台为了进一步了解观众的具体想法和意见,打算从中抽取60人进行更为详细的调查,应怎样进行抽样?解:因为总体中人数较多,所以不宜采用简单随机抽样.又由于持不同态度的人数差异较大,故选择分层抽样的方法.采用分层随机抽样方法,其总体容量为12 000.“很喜欢”占=,应取60×≈12(人);“喜欢”占,应取60×≈23(人);“一般”占,应取60×≈20(人);“不喜欢”占,应取60×≈5(人).从“很喜欢”“喜欢”“一般”和“不喜欢”中分别应取12人、23人、20人、5人.研习 5 分层抽样的应用[典例5] 长时间的低头,对人的颈椎、眼睛等会造成一定的损害,为了了解某群体中“低头族”的比例,现从该群体(包含老、中、青三个年龄段)的1 000人中采用分层抽样的方法抽取100人进行调查.已知这100人里老、中、青三个年龄段的分配比例如图所示,则这个群体里青年人人数为________.[解析] 这个群体里青年人占比为1-35%-20%=45%,故这个群体里青年人的数量为1 000×45%=450.[答案] 450巧归纳1.分层抽样的特点(1)适用于总体由差异明显的几部分组成的情况;(2)更充分地反映了总体的情况;(3)是等可能性抽样,每个个体被抽到的可能性都是.2.用分层抽样应注意的问题(1)用分层抽样抽取样本时,需照顾到各层中的个体,所以每层抽取的比例都等于样本容量在总体中的比例.(2)在分层抽样中,确定抽样比k是抽样的关键.一般地,抽样比k=(N为总体容量,n为样本容量),按抽样比k在各层中抽取个体,就能确保抽样的公平性.(3)在每层抽样时,一般采用简单随机抽样的方法进行.[练习5] 一批产品中,有一级品100个,二级品60个,三级品40个,选择一种合适的抽样方法,从这批产品中抽取一个容量为20的样本.解:由题意可知,用分层抽样的方法比较好.因为总体中个体数与样本容量的比为200∶20=10∶1,所以需从一级品中抽取×100=10(个),从二级品中抽取×60=6(个),从三级品中抽取×40=4(个).将一级品的100个按00,01,…,99编号;将二级品的60个产品按00,01,…,59编号;将三级品的40个产品按00,01,…,39编号;采用随机数法,分别从中抽取10个、6个、4个号码,这样就得到一个容量为20的样本.1.(多选题)下列抽样方法不是简单随机抽样的是( )A.从平面直角坐标系中抽取5个点作为样本B.某可乐公司从仓库中的1 000箱可乐中一次性随机抽取20箱进行质量检查C.某连队从120名战士中,挑选出50名最优秀的战士去参加抢险救灾活动D.从10个手机中逐个不放回地随机抽取2个进行质量检验(假设10个手机已编号)解析:对于A,平面直角坐标系中有无数个点,这与要求总体中的个体数有限不相符,故A中的抽样方法不是简单随机抽样;对于B,一次性随机抽取与逐个不放回地随机抽取是等价的,故B中的抽样方法是简单随机抽样;对于C,挑选的50名战士是最优秀的,不符合简单随机抽样的等可能性,故C中的抽样方法不是简单随机抽样;对于D,易知D中的抽样方法是简单随机抽样.答案:AC2.分层抽样又称为类型抽样,即将相似的个体归入一类(层),然后每层各抽取若干个个体构成样本,所以分层随机抽样为保证每个个体等可能入样,必须进行( )A.每层等可能抽样B.每层不等可能抽样C.所有层同一抽样比,等可能抽样D.所有层抽同样多样本容量,等可能抽样解析:保证每个个体等可能的入样,是简单随机抽样、分层抽样共同的特征,为了保证这一点,每层用同一抽样比是不可少的.故选C.答案:C3.利用简单随机抽样的方法,从n个个体(n>13)中抽取13个个体,若第二次抽取时,余下的每个个体被抽到的概率为,则在整个抽样过程中,每个个体被抽到的概率为________.解析:由已知=,解得n=37.∵每个个体被抽到的概率相等,∴被抽到的概率为.答案:4.用分层抽样方法从某校学生中抽取一个容量为45的样本,其中高一年级抽20人,高三年级抽10人.已知该校高二年级共有学生300人,求该校学生总数.解:要抽取一个容量为45的样本,高一年级抽取20人,高三年级抽取10人,∴高二年级抽取45-20-10=15(人).∴抽样比为=,设该校学生总数为n,则=,∴n=900.∴该校学生总数为900.5.某班有50名学生,要从中随机抽出6名学生参加一项活动,请分别用抽签法和随机数法进行抽样并写出过程.解:采用抽签法抽选过程:将这50名学生的学号写在形状、大小相同的号签上,然后将这些号签放在同一盒子里,均匀搅拌.抽签时,每次抽出1个号签不放回,然后将号签均匀搅拌,再进行下一次抽取,如此下去,连抽6次,再将所抽得的6个号签上的学号所对应的6名同学选出即可.采用随机数法抽选过程:先将50名同学编号为00,01,02,…,49.78413 66308 51573 51964 87683 30372 39169 9713448306 38560 15098 13843 70492 18883 21278 9091240402 30871 15596 95800 23560 78961 18860 33267再从上面所提供的随机数表中任选一数作为开始,如从第二行第3,4个数30开始,然后向右读数63>49,舍去,继续向右读数,重复的和大于49的舍去,得15,09,38,43,21,于是抽取的样本号码是09,15,21,30,38,43. [示例] 总体由编号为01,02,…,19,20的20个个体组成,利用下面的随机数表选取6个个体,选取方法是从随机数表第1行的第5列和第6列数字开始,由左到右依次选取两个数字,则选出来的第5个个体的编号为________.7816 6572 0802 6314 0702 4369 9728 01983204 9234 4935 8200 3623 4869 6938 7481[错解] 由题意得,选取方法是从随机数表第1行的第5列和第6列数字开始由左到右依次选取两个数字,则选出的数字分别为:08,02,14,07, 02,所以选出来的第5个个体的编号为02.故填02.[错因分析] 错误的根本原因是忽视了02前面已经出现,应舍掉.[正解] 由题意得,选取方法是从随机数表第1行的第5列和第6列数字开始,由左到右依次选取两个数字,则选出的数字分别为08,02,14,07,01,所以选出来的第5个个体的编号为01.[答案] 01课时作业(四十五) 获取数据的途径及统计概念 抽样一、选择题1.从某批零件中抽取50个,然后再从50个中抽出40个进行合格检查,发现合格品有36个,则该批产品的合格率约为( )A.36% B.72% C.90% D.25%解析:×100%=90%.故选C.答案:C2.(多选题)某中学高一年级有20个班,每班50人;高二年级有30个班,每班45人.甲就读于高一,乙就读于高二.学校计划从这两个年级中共抽取235人进行视力调查,下列说法中正确的有( )A.应该采用分层随机抽样法B.高一、高二年级应分别抽取100人和135人C.乙被抽到的可能性比甲大D.该问题中的总体是高一、高二年级的全体学生的视力解析:由于各年级的年龄段不一样,因此应采用分层随机抽样法.由于比例为=,因此从高一年级1 000人中应抽取100人,高二年级1 350人中应抽取135人,甲、乙被抽到的可能性都是,因此只有C不正确,故选ABD.答案:ABD3.从总数为N的一批零件中抽取一个容量为30的样本,若每个零件被抽取的可能性为25%,则N为( )A.150 B.200 C.100 D.120解析:N==120.故选D.答案:D4.某商场有四类食品,其中粮食类、植物油类、动物性食品类及果蔬类分别有40种、10种、30种、20种,现从中抽取一个容量为20的样本进行食品安全检测,若采用分层随机抽样的方法抽取样本,则抽取的植物油类与果蔬类食品种数之和是( )A.4 B.5 C.6 D.7解析:因为抽样比为=,抽取的植物油类种数是10×=2,则抽取的果蔬类食品种数是20×=4,所以抽取的植物油类与果蔬类食品种数之和是2+4=6.答案:C5.(多选题)已知某地区有小学生120 000人,初中生75 000人,高中生55 000人,当地教育部门为了了解本地区中小学生的近视率,按小学生、初中生、高中生进行分层抽样,抽取一个容量为2 000的样本,得到小学生,初中生,高中生的近视率分别为30%,70%,80%.下列说法中正确的有( )A.从高中生中抽取了440人B.每名学生被抽到的概率为C.估计该地区中小学生总体的平均近视率为60%D.估计高中学生的近视人数约为44 000解析:由题意,抽样比为=,B正确;从高中生中抽取了55 000×=440(人),A正确;高中生近视人数约为55 000×80%=44 000(人),D正确;学生总人数为250 000人,小学生占比=,同理,初中生、高中生分别占比,,在2 000的样本中,小学生、初中生和高中生分别抽取了960人,600人和440人,则近视人数为960×30%+600×70%+440×80%=1 060(人),所以估计该地区中小学总体的平均近视率为=53%,C错误.故选ABD.答案:ABD6.我国南宋数学家秦九韶所著《数书九章》中有“米谷粒分”问题:粮仓开仓收粮,粮农送来米1 512石,验得米内夹谷,抽样取米一把,数得216粒内夹谷27粒,则这批米内夹谷约为( )A.164石 B.178石C.189石 D.196石解析:由已知,抽得样本中含谷27粒,占样本的比例为=,则由此估计总体中谷的含量约为1 512×=189(石).答案:C7.某校数学教研组为了解学生学习数学的情况,采用分层随机抽样的方法从高一600人、高二780人、高三n人中,抽取35人进行问卷调查,已知高二被抽取的人数为13,则n等于( )A.660 B.720C.780 D.800解析:因为从高一600人、高二780人、高三n人中,抽取35人进行问卷调查,已知高二被抽取的人数为13,所以=,解得n=720.答案:B8.(多选题)某公司生产三种型号的轿车,产量分别为1 200辆,6 000辆和2 000辆.为检验该公司的产品质量,公司质监部门要抽取46辆进行检验,则下列说法正确的是( )A.应采用分层随机抽样抽取B.应采用抽签法抽取C.三种型号的轿车依次抽取6辆,30辆,10辆D.这三种型号的轿车,每一辆被抽到的概率都是相等的解析:由于总体按型号分为三个子总体,所以应采用分层随机抽样抽取,A正确;因为总体量较大,故不宜采用抽签法,所以B错误;设三种型号的轿车依次抽取x辆,y辆,z辆,则有解得所以三种型号的轿车依次抽取6辆、30辆、10辆,故C正确;由分层随机抽样的定义可知,D也正确.答案:ACD二、填空题9.为了调查某市城区某小河流的水体污染状况,某学校甲班的同学就某个指标抽取了样本量为50的5个样本,乙班的同学抽取了样本量为100的5个样本,得到如下数据:抽样序号1 2 3 4 5样本量为50 的平均数 123.1 120.2 125.4 119.1 123.6样本量为 100的平均数 119.8 120.1 121.0 120.3 120.2据此可以认定________班的同学调查结果能够更好地反映总体,这两个班的同学调查的该项指标约为________(答案不唯一,只要合理即可).解析:由抽样调查的意义可以知道,增加样本量可以提高估计效果,所以乙班同学的调查结果能更好地反映总体,由表可知,该项指标约为120.答案:乙 12010.已知某乡农田有山地8 000亩,丘陵12 000亩,平地24 000亩,洼地4 000亩.现抽取农田480亩估计全乡农田粮食平均亩产量,采用__________抽样的方法比较合理,其中山地应抽________亩.解析:因为=100,所以应抽=80.答案:分层随机 8011.某学校为了调查学生的学习情况,从每班随机抽取5名学生进行调查,若(1)班有50名学生,将每名学生编号为00,01,02,…,49.请从随机数表的第2行第6列(下表为随机数表的前5行)开始,依次向右,直到取足样本,则抽取样本的号码是______________.03 47 43 73 86 36 96 47 36 61 46 98 63 71 62 33 26 16 80 45 60 11 14 10 9597 74 24 67 62 42 81 14 57 20 42 53 32 37 32 27 07 36 07 51 24 51 79 89 7316 76 62 27 66 56 50 26 71 07 32 90 79 78 53 13 55 38 58 59 88 97 54 14 1012 56 85 99 26 96 96 68 27 31 05 03 72 93 15 57 12 10 14 21 88 26 49 81 7655 59 56 35 64 38 54 82 46 22 31 62 43 09 90 06 18 44 32 53 23 83 03 30 30解析:采用随机数表法抽取样本的关键是找准读数的行与列,记录在编号范围内的数.从第2行第6列开始读取依次为:46,24,28,11,45.答案:46,24,28,11,45三、解答题12.一个学生在一次知识竞赛中要回答的8道题是这样产生的:从15道历史题中随机抽出3道,从20道地理题中随机抽出3道,从12道生物题中随机抽出2道.试用抽签法确定这个学生所要回答的三门学科的题的序号.(历史题编号分别为1~15,地理题编号分别为16~35,生物题编号分别为36~47)解:将1~15号签放在同一盒子里,搅拌均匀,每次抽出一个号签不放回,连抽3次;将16~35号签放在同一盒子里,搅拌均匀,每次抽出一个号签不放回,连抽3次;将36~47号签放在同一盒子里,搅拌均匀,每次抽出一个号签不放回,连抽2次.将所得的号签对应着的题目抽出来即可.13.某机械厂三个车间共有工人1 000名,各车间男、女工人数如下表:第一车间 第二车间 第三车间女工 170 120 y男工 180 x z已知在全厂工人中随机抽取1名,抽到第二车间男工的可能性是0.13,其中第三车间的男女比例为3∶2.(1)求x,y,z的值;(2)现用分层抽样的方法在全厂男工人中抽取55名工人进行技术比武,则在第三车间抽取多少名男工人?解:(1)由=0.13,得x=130.因为第一车间的工人数是170+180=350,第二车间的工人数是120+130=250,所以第三车间的工人数是1 000-350-250=400.所以y=400×=160,z=400×=240.(2)设应从第三车间抽取m名男工人,因为共有男工人180+130+240=550,则由=,得m=24,所以应在第三车间抽取24名男工人.14.有以下两个案例:案例一:从同一批次同类型号的10袋牛奶中抽取3袋检测其三聚氰胺含量;案例二:某公司有员工800人:其中高级职称有160人,中级职称有320人,初级职称有200人,其余人员有120人,从中抽取容量为40的样本,了解该公司职工收入情况.(1)你认为这些案例应采用怎样的抽样方式较为合适?(2)在你使用的分层随机抽样案例中写出抽样过程.解:(1)案例一中,因为总体个数较少,用简单随机抽样;案例二中,因为总体按职称特征分为四个层次,用分层随机抽样.(2)①分层,将总体分为高级职称、中级职称、初级职称及其余人员四层;②确定抽样比例q==;③按上述比例确定各层样本数分别为8人、16人、10人、6人;④按简单随机抽样方法在各层确定相应的样本;⑤汇总构成一个容量为40的样本.6.3 统计图表新课程标准 新学法解读1.掌握常用几种统计图表(条形统计图、扇形统计图、折线统计图和频率分布)的功能及其特点. 2.能针对实际问题和收集到的数据的特点,选择科学的统计图表. 3.能从统计图表中获取有价值的信息. 1.通过掌握四种统计图表的功能和特点,提升直观想象素养. 2.通过对实际问题和收集到的数据特点进行分析,选择科学的统计图表,提升数据分析素养.笔记 教材知识点一 常见统计图表1.条形统计图条形统计图是用一个单位长度表示一定的数量,根据数量的多少画成长短不同的直条,然后把这些直条按照一定的顺序排列起来.其优点是便于看出和比较各种数量的多少,即条形统计图能清楚地表示出每个项目的具体数目,易于比较数据间的差别.缺点是不能明确显示部分与整体的对比.2.折线统计图建立直角坐标系,用横轴上的数字表示样本值,用纵轴上的单位长度表示一定的数量,根据样本值和数量的多少描出相应点,然后用直线段顺次连接相邻点,得到一条折线,用这条折线表示样本数据情况,这种表述和分析数据的统计图称为折线统计图.折线统计图不但可以表示数量的多少,而且能够用折线的起伏清楚直观地表示数量的增减变化的情况,但不适合总体分布较多的情况.3.扇形统计图扇形统计图中,用圆面积代表总体,圆面中的各个扇形分别代表总体中的不同部分,扇形面积的大小反映所表示的那部分占总体的百分比的大小.其优点是可以很清楚地表示各部分数量同总数之间的关系,即扇形统计图能清楚地表示出各部分在总体中所占的百分比.缺点是会丢失部分数据信息且不适合总体中部分较多的情况.4.条形图、扇形图、折线图的特点统计图 特点条形图 用于直观描述不同类别或分组数据的频数和频率,适用于描述离散型的数据扇形图 用于直观描述各类数据占总数的比例折线图 用于描述数据随时间的变化趋势复合 条形图 将两组数据同时反映到一个条形图上.通过条形图中柱的高低,可以更直观地比较两组数据知识点二 频率分布直方图1.制作频率分布直方图的步骤第一步,求极差,即一组数据中最大值与最小值的差.第二步,决定组距与组数.为了方便起见,一般取等长组距,并且组距应力求“取整”.第三步,将数据分组.通常对组内数值所在区间取左闭右开区间,最后一组取闭区间.第四步,列频率分布表.统计各组数据的频数,计算频率,作出频率分布表.第五步,画频率分布直方图.画图时,以横轴表示分组,纵坐标(小长方形的高)表示频率与组距的比值.2.频率分布直方图的特征(1)各小长方形的面积和为1.(2)纵轴表示,小长方形的面积=组距×=频率.(3)各组的频率之比=各组的频数之比=各小长方形的高之比=各小长方形的面积之比.自我 检测1.当收集到的数据量很大或有多组数据时,用哪种统计图表示较合适( )A.频率分布直方图 B.条形统计图C.折线统计图 D.扇形统计图解析:结合各种统计图的特征知,适合用条形统计图.答案:B2.(多选题)某学校为了调查学生一周在生活方面的支出情况,抽取了一个容量为n的样本,其频率分布直方图如图所示,其中支出在[50,60]内的学生有60人,则下列说法正确的是( )A.样本中支出在[50,60]内的频率为0.03B.样本中支出不少于40元的人数为132C.n的值为200D.若该校有2 000名学生,则一定有600人支出在[50,60]内解析:样本中支出在[50,60]内的频率为1-(0.010+0.024+0.036)×10=0.3,故A错误;样本中支出不少于40元的人数为×60+60=132,故B正确;n==200,故n的值为200,故C正确;若该校有2 000名学生,则可能有0.3×2 000=600(人)支出在[50,60]内,故D错误.故选BC.答案:BC3.一个容量为80的样本中,数据的最大值为152,最小值为60,组距为10,应将样本数据分为( )A.10组 B.9组C.8组 D.7组解析:由题意知,=9.2,故应分成10组.答案:A4.如图是华联商厦某个月甲、乙、丙三种品牌彩电的销售量统计图,则甲、丙两种品牌彩电该月的销售量之和为________台.解析:由图可知,甲品牌该月的销售量为45台,丙品牌该月的销售量为30台,所以甲、丙两种品牌彩电该月的销售量之和为75台.答案:75研习 1 条形统计图[典例1] 为了丰富校园文化生活,某校计划在午间校园广播台播放“百家讲坛”的部分内容.为了了解学生的喜好,抽取若干名学生进行问卷调查(每人只选一项内容),整理调查结果,绘制统计图如图所示.请根据统计图提供的信息回答以下问题:(1)求抽取的学生数;(2)若该校有3 000名学生,估计喜欢收听易中天《品三国》的学生人数;(3)估计该校喜欢收听刘心武评《红楼梦》的女学生人数约占全校学生人数的百分比.[解] (1)从统计图上可以看出:喜欢收听于丹析《庄子》的男生有20人,女生有10人;喜欢收听《故宫博物馆》的男生有30人,女生有15人;喜欢收听于丹析《论语》的男生有30人,女生有38人;喜欢收听易中天《品三国》的男生有64人,女生有42人;喜欢收听刘心武评《红楼梦》的男生有6人,女生有45人.所以抽取的学生数为20+10+30+15+30+38+64+42+6+45=300(人).(2)喜欢收听易中天《品三国》的男生有64人,女生有42人,共有106人,占所抽取总人数的比例为,由于该校有3 000名学生,因此可以估计喜欢收听易中天《品三国》的学生有×3 000=1 060(名).(3)该校喜欢收听刘心武评《红楼梦》的女学生人数约占全校学生人数的比例为×100%=15%.巧归纳(1)在绘制条形统计图时,要搞清统计图的横轴和纵轴所表示的实际意义.(2)条形统计图是用一个单位长度表示一定的数量,根据数量的多少画成长短不同的直条,然后把这些直条按照一定的顺序排列起来;其特点是便于看出和比较各种数量的多少,即条形统计图能清楚地表示出每个项目的具体数目.[练习1] (1)某社区为了解本社区中老年人锻炼身体的方式,在全社区范围内随机抽查部分中老年人,了解到锻炼方式有:A—走路、B—骑行、C—打球、D—其他方式,且统计得知,走路锻炼占45%,并将收集的数据整理绘制得到如图所示不完整的统计图,则打球锻炼的人数为________.(2)某班有50名学生,以其身高分成如下几组:第一组 145 cm~150 cm 2人第二组 150 cm~155 cm 5人第三组 155 cm~160 cm 7人第四组 160 cm~165 cm 10人第五组 165 cm~170 cm 15人第六组 170 cm~175 cm 6人第七组 175 cm~180 cm 3人第八组 180 cm~185 cm 1人第九组 185 cm~190 cm 1人用条形统计图表示上述数据.(1)解析:由条形统计图可知,走路锻炼的有360人,且占总体的45%,所以抽查的总人数为=800(人),所以打球锻炼的人数为800-360-280-40=120(人).故答案为120.答案:120(2)解:条形统计图如图所示,以横坐标表示身高,纵坐标表示人数.研习 2 折线统计图与扇形统计图[典例2] 如图是根据某市3月1日至3月10日的最低气温(单位:℃)的情况绘制的折线统计图,试根据折线统计图反映的信息,绘制该市3月1日到10日最低气温(单位:℃)的扇形统计图.[解] 该城市3月1日至10日的最低气温(单位:℃)情况如下表:日期 1 2 3 4 5 6 7 8 9 10最低 气温 -3 -2 0 -1 1 2 0 -1 2 2扇形统计图如图所示:巧归纳(1)折线统计图根据数量的多少描出各点,然后把各点用线段顺次连接起来.折线统计图不但可以表示出数量的多少,而且能够清楚地表示数量增减变化的情况,即折线统计图能够清晰地反映数据的变化情况.(2)扇形统计图中,用圆面代表总体,圆面中的各个扇形分别代表总体中的不同部分,扇形的大小反映部分占总体的百分比的大小.扇形统计图可以很清楚地表示各部分数量同总数之间的关系,即扇形统计图能清楚地表示出各部分在总体中所占的百分比. [练习2] (1)我国在2020年开展了第七次全国人口普查,并于2021年5月11日公布了结果.自新中国成立以来,我国共进行了七次全国人口普查,下图为我国历次全国人口普查人口性别构成及总人口性别比(以女性为100,男性对女性的比例)统计图,则下列说法错误的是( )A.近三次全国人口普查总人口性别比呈递减趋势B.我国历次全国人口普查总人口数呈逐次递增C.第五次全国人口普查时,我国总人口数已经突破12亿D.第七次人口普查时,我国总人口性别比最高(2)如图所示的是某保险公司提供的资料,在1万元以上的保险单中,有少于2.5万元,那么不少于2.5万元的保险单有________万元.解析:(1)由统计图7次人口普查中,近三次普查总人口性别比呈递减趋势,A正确;人口总数逐次增加,B正确;第五次全国人口普查时,我国总人口数男女均超过6亿,总人口数已经突破12亿,C正确;我国总人口性别比最高是第一次人口普查,D错误.故选D.(2)不少于1万元的保单占700万元的21%,金额为700×21%=147(万元).1万元以上的保险单中,超过或等于2.5万元的保险单占,金额为×147=91(万元),故不少于2.5万元的保险单有91万元.答案:(1)D (2)91研习 3 频率分布表、频率分布直方图、频率折线图[典例3] (1)容量为20的样本数据,分组后的频数如表所示.分组 [10,20) [20,30) [30,40) [40,50) [50,60) [60,70]频数 2 3 4 5 4 2则样本数据落在区间[10,40)内的频率为( )A.0.35 B.0.45 C.0.55 D.0.65(2)山东省教育厅为了了解和掌握2019年高考考生的实际答卷情况,随机地取出了100名考生的数学成绩,数据如下:(单位:分)135 98 102 110 99 121 110 96 100 103125 97 117 113 110 92 102 109 104 112105 124 87 131 97 102 123 104 104 128109 123 111 103 105 92 114 108 104 102129 126 97 100 115 111 106 117 104 109111 89 110 121 80 120 121 104 108 118129 99 90 99 121 123 107 111 91 10099 101 116 97 102 108 101 95 107 101102 108 117 99 118 106 119 97 126 108123 119 98 121 101 113 102 103 104 108①列出频率分布表;②画出频率分布直方图和折线图;③估计该省考生数学成绩在[100,120)分之间的比例.[思路点拨] (1)首先确定[10,40)内的频数,再求频率.(2)频率分布直方图 先求极差,根据极差与数据个数确定组距、组数,然后画图并分析求解.(1)[解析] 样本数据落在区间[10,40)内的频数为2+3+4=9,故所求的频率为=0.45.[答案] B(2)[解] 100个数据中,最大值为135,最小值为80,极差为135-80=55.取组距为5,则组数为=11.①频率分布表如下:分组 频数 频率 频率/组距[80,85) 1 0.01 0.002[85,90) 2 0.02 0.004[90,95) 4 0.04 0.008[95,100) 14 0.14 0.028[100,105) 24 0.24 0.048[105,110) 15 0.15 0.030[110,115) 12 0.12 0.024[115,120) 9 0.09 0.018[120,125) 11 0.11 0.022[125,130) 6 0.06 0.012[130,135] 2 0.02 0.004合计 100 1 0.2注:表中加上“频率/组距”一列,这是为画频率分布直方图准备的,因为它是频率分布直方图的纵坐标.②根据频率分布表中的有关信息画出频率分布直方图及折线图,如图所示:③从频率分布表中可知,这100名考生的数学成绩在[100,120)分之间的频率为0.24+0.15+0.12+0.09=0.60,据此估计该省考生数学成绩在[100,120)分之间的比例为60%.巧归纳绘制频率分布直方图的注意事项(1)计算极差,需要找出这组数的最大值和最小值,当数据很多时,可选一个数当参照.(2)将一批数据分组,目的是要描述数据分布规律,要根据数据多少来确定分组数目,一般来说,数据越多,分组越多.(3)决定分点时,一般使分点比数据多一位小数,并且把第一组的起点稍微减小一点.(4)列频率分布表时,可通过逐一判断各个数据落在哪个小组内,以“正”字确定各个小组内数据的个数.(5)画频率分布直方图时,纵坐标表示频率与组距的比值,一定不能标成频率.提醒:每个小长方形的面积=组距×=频率.[练习3] 如图是一个容量为200的样本的频率分布直方图,请根据图形中的数据填空:(1)样本数据落在区间[5,9)内的频率为________;(2)样本数据落在区间[9,13)内的频数为________.解析:(1)0.08×4=0.32.(2)样本数据落在[9,13)内的频率为0.09×4=0.36,∴频数n=0.36×200=72.答案:(1)0.32 (2)72研习 4 频率分布直方图的应用[典例4] (2021·天津卷)从某网络平台推荐的影视作品中抽取400部,统计其评分数据,将所得400个评分数据分为8组:[66,70),[70,74),…,[94,98],并整理得到如下的频率分布直方图,则评分在区间[82,86)内的影视作品数量是( )A.20 B.40 C.64 D.80[解析] 由频率分布直方图可知,评分在区间[82,86)内的影视作品数量为400×0.050×4=80.故选D.[答案] D[延伸探究] 频率分布直方图中小长方形的高就是这一组的频率吗?[答案] 不是,频率分布直方图中小长方形的高是.巧归纳频率分布直方图的性质(1)因为小矩形的面积=组距×=频率,所以各小矩形的面积表示相应各组的频率.这样,频率分布直方图就以面积的形式反映了数据落在各个小组内的频率大小.(2)在频率分布直方图中,各小矩形的面积之和等于1.(3)=样本容量.[练习4] 某棉纺厂为了了解一批棉花的质量,从中随机抽取了100根棉花纤维的长度(棉花纤维的长度是棉花质量的重要指标),所得数据都在区间[5,40]中,其频率分布直方图如图所示,则在抽取的100根中,有________根棉花纤维的长度小于20 mm.解析:由题意知,棉花纤维的长度小于20 mm的频率为(0.01+0.01+0.04)×5=0.3,故抽测的100根中,棉花纤维的长度小于20 mm的有0.3×100=30(根).答案:301.(多选题)下图为某省高考数学理科试卷近三年难易程度的对比图(图中数据为分值).根据对比图,下列结论正确的有( )A.近三年容易题分值逐年增加B.近三年难题分值逐年减少C.近三年中档题分值所占比例最高的年份是2017年D.2018年的容易题与中档题的分值之和占总分的90%以上解析:对于A,由图可知,近三年容易题分值分别为40,55,96逐年增加,故选项A正确;对于B,由图可知,近三年难题分值先增加后减少,故选项B错误;对于C,由图可知,近三年中档题分值所占比例最高的年份是2016年,故选项C错误;对于D,由图可知,2018年的容易题与中档题的分值之和为96+42=138,所占比例为=92%>90%,D选项正确;故选AD.答案:AD2.为了解某校高三学生的视力情况,随机地抽查了该校100名高三学生的视力,得到频率分布直方图如图,由于不慎将部分数据丢失,但知道前4组的频数每一组与前一组的比是同一个常数,后6组的频数中每一组与前一组的差是同一个常数,设最大频率为a,视力在4.6到5.0之间的学生数为b,则a,b的值分别为( )A.0.27,78 B.0.27,83C.2.7,78 D.2.7,83解析:a=0.3×0.1×32=0.27,第一组人数:0.1×0.1×100=1;第二组人数:0.3×0.1×100=3;第三组人数:0.3×0.1×3×100=9;第四组人数:0.27×100=27,∵后6组共100-13=87(人),∴后6组人数分别是27,22,17,12,7,2,∴b=27+22+17+12=78.故选A.答案:A3.一个容量为100的样本,其数据的分组与各组的频数如下:组别 (0,10] (10,20] (20,30] (30,40] (40,50] (50,60] (60,70]频数 12 13 24 15 16 13 7则样本数据落在(10,40]内的频率为( )A.0.13 B.0.39C.0.52 D.0.64解析:由表知,(10,40]内的频数为52,故样本数据落在(10,40]内的频率为=0.52.故选C.答案:C4.抽样调查30个工人的家庭人均月收入,得到如下数据:(单位:元)4 040 4 440 5 560 4 300 3 800 4 200 5 0004 300 4 200 3 840 4 200 4 040 4 240 3 4004 240 4 120 3 880 4 720 3 580 4 760 3 7603 960 4 280 4 440 3 660 4 360 3 640 4 3803 300 4 260(1)取组距为600,起点为3 200,列出样本的频率分布表;(2)画出频率分布直方图.解:(1)频率分布表如表.分组 频数 频率[3 200,3 800) 6 0.20[3 800,4 400) 18 0.60[4 400,5 000) 4 0.13[5 000,5 600] 2 0.07合计 30 1.00(2)频率分布直方图如图.课时作业(四十六) 统计图表一、选择题1.已知某样本如下:那么频率为0.3的范围是( )A.5.5~7.5 B.7.5~9.5C.9.5~11.5 D.11.5~13.5解析:样本容量为20,频率为0.3,则此组的频数应为20×0.3=6.故选B.答案:B2.对某班40名同学的一次数学测试成绩进行统计,其中频率分布表中80.5~90.5这一组的频率是0.20,那么这40名同学的数学成绩在80.5~90.5这个分数段的人数是( )A.8 B.4 C.12 D.16解析:据题意数学成绩在80.5~90.5这个分数段的人数是40×0.20=8(人).故选A.答案:A3.2021年7月,中国青年报社社会调查中心通过问卷网,对2 047名14~35岁青少年进行的专项调查显示,对于神舟十二号航天员乘组出征太空,98.9%的受访青少年都表示了关注.针对两个问题“关于此次神舟十二号飞行乘组出征太空,你有什么感受(问题1)”和“青少年最关注哪些方面(问题2)”,问卷网统计了这2 047名青少年回答的情况,得到如图所示的两个统计图,据此可得到的正确结论为( )问题1问题2A.对于神舟十二号太空之旅,只有极少的受访青少年关注航天员是怎样选的B.对于神舟十二号飞行乘组出征太空,超过七成的受访青少年认为开启空间站新时代,“中国速度”令人瞩目C.对于神舟十二号太空之旅,青少年关注最多的是航天员在太空的工作和生活D.对于神舟十二号飞行乘组出征太空,超过八成的受访青少年充分感受到我国载人航天事业取得大发展、大进步解析:A,对于神舟十二号太空之旅,关注航天员是怎样选的占46.6%,不是极少数,故A错误;B,对于神舟十二号飞行乘组出征太空,受访青少年认为开启空间站新时代的占64.6%,没有超过七成,故B错误;C,对于神舟十二号太空之旅,青少年关注航天员在太空的工作和生活的比值最大,因此青少年关注最多,故C正确;D,对于神舟十二号飞行乘组出征太空,受访青少年充分感受到我国载人航天事业取得大发展、大进步占75.3%,没有超过八成,故D错误.故选C.答案:C4.一个容量为32的样本,已知某组样本的频率为0.125,则该组样本的频数为( )A.2 B.4 C.6 D.8解析:频率=,则频数=频率×样本量=0.125×32=4.答案:B5.(多选题)为征求个人所得税法修改建议,某机构调查了10 000名当地职工的月收入情况,并根据所得数据画出了样本的频率分布直方图.下列说法正确的是( )A.月收入低于5 000元的职工有5 500名B.如果个税起征点调整至5 000元,估计有50%的当地职工会被征税C.月收入高于或等于7 000元的职工约为当地职工的5%D.根据此次调查,为使60%以上的职工不用缴纳个税,起征点应位于[5 000,6 000)内解析:月收入低于5 000元的职工有10 000×(0.000 1+0.000 2+0.000 25)×1 000=5 500(名),A正确;如果个税起征点调整至5 000元,由(0.000 25+0.000 15+0.000 05)×1 000×100%=45%,可估计有45%的当地职工会被征税,B不正确;月收入高于或等于7 000元的职工约占0.000 05×1 000×100%=5%,C正确;月收入低于5 000元的频率为0.55,低于6 000元的频率为0.8,D正确.答案:ACD6.(多选题)2021年7月15日国家统计局发布了我国上半年国内经济数据,面对复杂多变的国内外环境,在以习近平同志为核心的党中央坚强领导下,我国经济发展呈现稳中加固、稳中向好态势.初步核算,上半年国内生产总值532 167亿元,市场销售逐步改善,消费升级类商品快速增长,上半年,社会消费品零售总额211 904亿元,同比增长23.0%.根据下图国家统计局发布的数据,以下说法正确的是( )A.近年来中国社会消费品零售总额逐年攀升B.2019年中国社会消费品零售总额达40.8万亿元,较2018年增加了3.02万亿元,同比增长7.99%C.2020年中国社会消费品零售总额同比增长率首次出现下滑D.2020年上半年社会消费品零售总额约172 279.7亿元解析:对于A:2019年中国社会消费品零售总额达40.8万亿元,2020年中国社会消费品零售总额达39.2万亿元,稍有下降.故A错误;对于B:从图中数据进行分析可得,2019年中国社会消费品零售总额达40.8万亿元,较2018年增加了3.02万亿元,同比增长×100%=7.99%.故B正确;对于C:从图中可以看出,中国社会消费品零售总额同比增长率在2014~2019一直缓慢下滑,而2019~2021下滑明显.故C错误;对于D:设2020年上半年社会消费品零售总额约x亿元,则x(1+0.23)=211 904,解得x≈172 279.7,即2020年上半年社会消费品零售总额约172 279.7亿元.故D正确.故选BD.答案:BD二、填空题7.将容量为100的样本数据,按从小到大的顺序分为8个组,如下表:组号 1 2 3 4 5 6 7 8频数 10 13 14 14 15 13 12 9则第3组的频率和前3组的频率分别为________.解析:第3组的频率为=0.14,前3组的频率为=0.37.答案:0.14和0.37三、解答题8.从高三学生中抽取50名同学参加数学竞赛,成绩的分组及各组的频数如下(单位:分):[40,50),2;[50,60),3;[60,70),10;[70,80),15;[80,90),12;[90,100],8.(1)列出样本的频率分布表;(2)画出频率分布直方图;(3)估计成绩在[60,90)内的学生比例;(4)估计成绩在85分以下的学生比例.解:(1)频率分布表如下:成绩分组 频数 频率[40,50) 2 0.04[50,60) 3 0.06[60,70) 10 0.2[70,80) 15 0.3[80,90) 12 0.24[90,100] 8 0.16合计 50 1.00(2)频率分布直方图如图所示.(3)成绩在[60,90)内的学生比例即学生成绩在[60,90)内的频率,故约为0.2+0.3+0.24=0.74=74%.(4)成绩在85分以下的学生比例即学生成绩不足85分的频率,设相应频率为b,则≈,故b≈0.72.估计成绩在85分以下的学生约占72%.6.4 用样本估计总体新课程标准 新学法解读1.理解平均数的定义和计算过程,了解众数、中位数的概念. 2.理解样本离散程度的特征量方差,标准差的概念. 3.理解样本百分位数的计算. 能利用样本数字特征估计总体的特征,重点提高数学运算,数学建模的核心素养.笔记 教材知识点一 总体平均数和样本平均数1.总体平均数一般地,总体中有N个个体,它们的变量值分别为Y1,Y2,…,YN,则称==i为总体均值,又称总体平均数.如果总体的N个变量值中,不同的值共有k(k≤N)个,不妨记为Y1,Y2,…,Yk,其中Yi出现的频数fi(i=1,2,…,k),则总体均值还可以写成加权平均数的形式=iYi.2.样本平均数如果从总体中抽取一个容量为n的样本,它们的变量值分别为y1,y2,…,yn,则称==i为样本均值,又称样本平均数.在简单随机抽样中,常用样本平均数去估计总体平均数.3.分层抽样下总体平均数的简单估计=w11+w2·2+…+wi·i,这里i为第i层样本的均值,wi=为第i层的层数.知识点二 众数、中位数1.众数、中位数的理解(1)一组数据中,某个数据出现的次数称为这个数据的频数,出现次数最多的数据称为这组数据的众数.说明:如果有几个数据出现的次数相同,并且比其他数据出现的次数都多,那么这几个数据都是这组数据的众数;若一组数据中,每个数据出现的次数一样多,则认为这组数据没有众数.(2)如果一组数有奇数个数,且按照从小到大排列后为x1,x2,…,x2n+1,则称xn+1为这组数的中位数;如果一组数有偶数个数,且按照从小到大排列后为x1,x2,…,x2n,则称为这组数的中位数.2.众数、中位数、平均数的比较名称 优点 缺点众 数 ①体现了样本数据的最大集中点; ②容易计算 ①它只能表达样本数据中很少的一部分信息; ②无法客观地反映总体的特征中 位 数 ①不受少数几个极端数据(即排序靠前或靠后的数据)的影响; ②容易计算,便于利用中间数据的信息 对极端值不敏感平 均 数 代表性较好,是反映数据集中趋势的量.一般情况下,可以反映出更多的关于样本数据全体的信息 任何一个数据的改变都会引起平均数的改变.数据越“离群”,对平均数的影响越大知识点三 方差、标准差1.(1)假设样本数据是x1,x2,…,xn,表示这组数据的平均数,则标准差s=,方差s2=[(x1-)2+(x2-)2+…+(xn-)2]=[(x+x+…+x)-n2].(2)与方差有关的性质①数据x1,x2,…,xn与数据x1′=x1+a,x2′=x2+a,…,xn′=xn+a的方差相等,即数据同时加上相同的数后方差不变.②若x1,x2,…,xn的平均数为,方差为s2,则ax1+b,ax2+b,…,axn+b的平均数为a+b,方差为a2s2.2.对方差、标准差的理解(1)标准差、方差描述了一组数据围绕平均数波动的大小.标准差、方差越大,数据的离散程度越大;标准差、方差越小,数据的离散程度越小.(2)标准差、方差的取值范围:[0,+∞).标准差、方差为0时,样本各数据全相等,表明数据没有波动幅度,数据没有离散性.(3)标准差的平方s2称为方差,有时用方差代替标准差测量样本数据的离散程度.方差与标准差的测量效果是一致的,在实际应用中一般多采用标准差.(4)标准差的单位与样本数据一致.(5)方差s2=-2.知识点四 百分位数1.第p百分位数一般地,一组数据的第p百分位数是这样一个值,它使得这组数据中至少有p%的数据小于或等于这个值,且至少有(100-p)%的数据大于或等于这个值.2.第p百分位数的计算计算一组n个数据的第p百分位数的步骤:第1步,按从小到大排列原始数据.第2步,计算i=n×p%.第3步,若i不是整数,而大于i的比邻整数为j,则第p百分位数为第j项数据;若i是整数,则第p百分位数为第i项与第(i+1)项数据的平均数.自我 检测1.已知一组数据从小到大排列为-1,0,4,x,6,15,且这组数据的中位数是5,那么这组数据的众数为( )A.5 B.6 C.4 D.5.5解析:由题意得(4+x)=5,得x=6.答案:B2.已知甲、乙两组按顺序排列的数据如下:甲组:27,28,37,m,40,50;乙组:24,n,34,43,48,52.若这两组数据的第30百分位数、第50百分位数分别对应相等,则=( )A. B.C. D.解析:因为30%×6=1.8,50%×6=3,所以第30百分位数为n=28,第50百分位数为=,所以m=40,所以==.故选B.答案:B3.(多选题)为了了解某校九年级1 600名学生的体能情况,随机抽查了部分学生,测试1分钟仰卧起坐的成绩(次数),将数据整理后绘制成如图所示的频率分布直方图.下列结论正确的是( )A.该校九年级学生1分钟仰卧起坐的次数的中位数为26.25次B.该校九年级学生1分钟仰卧起坐的次数的众数为27.5次C.该校九年级学生1分钟仰卧起坐的次数超过30次的人数约为320D.该校九年级学生1分钟仰卧起坐的次数少于20次的人数约为32解析:由0.1+0.3+(x-25)×0.08=0.5,解得中位数是26.25次,众数是27.5次.1分钟仰卧起坐的次数超过30次的频率为0.2,所以估计该校九年级学生1分钟仰卧起坐的次数超过30次的人数约为320;1分钟仰卧起坐的次数少于20次的频率为0.1,所以该校九年级学生1分钟仰卧起坐的次数少于20次的人数约为160.D错误.答案:ABC4.已知一组数据0,2,x,4,5的众数是4,那么这组数据的平均数是________.解析:∵数据0,2,x,4,5的众数是4,∴x=4,∴这组数据的平均数是×(0+2+4+4+5)=3.答案:35.已知一组数据1,10,5,2,x,2,且2解析:根据题意知,该组数据的众数是2,则中位数是2÷=3,把这组数据从小到大排列为1,2,2,x,5,10,则=3,解得x=4,所以这组数据的平均数为=×(1+2+2+4+5+10)=4.答案:4研习 1 众数、中位数、平均数的计算[典例1] (多选题)某篮球队甲、乙两名运动员练习罚球,每人练习10组,每组罚球40个,命中个数如下所示:甲:20,22,27,8,12,13,37,25,24,26乙:14,9,13,18,19,20,23,21,21,11则下面结论中正确的是( )A.甲的极差是29B.乙的众数是21C.甲的平均数为21.4D.甲的中位数是24[解析] 把两组数据按从小到大的顺序排列,得甲:8,12,13,20,22,24,25,26,27,37乙:9,11,13,14,18,19,20,21,21,23故甲的最大值为37,最小值为8,则极差为29,所以A正确;乙中出现最多的数据是21,所以B正确;甲的平均数为甲=×(8+12+13+20+22+24+25+26+27+37)=21.4,所以C正确;甲的中位数为×(22+24)=23,故D不正确.[答案] ABC巧归纳平均数、众数、中位数的计算方法平均数一般是根据公式来计算的;计算众数、中位数时,可先将这组数据按从小到大或从大到小的顺序排列,再根据各自的定义计算.[练习1] (1)某学习小组在一次数学测验中,得100分的有1人,95分的有1人,90分的有2人,85分的有4人,80分和75分的各有1人,则该小组成绩的平均数、众数、中位数分别是( )A.85,85,85 B.87,85,86C.87,85,85 D.87,85,90(2)已知一组数据x1,x2,x3,x4,x5的平均数是2,那么另一组数据2x1-3,2x2-3,2x3-3,2x4-3,2x5-3的平均数为( )A.1 B.2C.3 D.4解析:(1)从小到大列出所有数学成绩:75,80,85,85,85,85,90,90,95,100,观察知众数和中位数均为85,计算得平均数为87.(2)因为一组数据x1,x2,x3,x4,x5的平均数是2,所以另一组数据2x1-3,2x2-3,2x3-3,2x4-3,2x5-3的平均数为2×2-3=1.故选A.答案:(1)C (2)A研习 2 用频率分布直方图估计总体分布[典例2] 某校从参加高二年级学业水平测试的学生中抽出80名学生,其数学成绩(均为整数)的频率分布直方图如图所示.(1)求这次测试数学成绩的众数;(2)求这次测试数学成绩的中位数.[解] (1)由题干图知,众数为=75,则这80名学生的数学成绩的众数为75分.(2)由题干图知,设中位数为x,由于前三个矩形面积之和为0.4,第四个矩形面积为0.3,0.3+0.4>0.5,因此中位数位于第四个矩形内,得0.1=0.03×(x-70),所以x≈73.3,即这80名学生的数学成绩的中位数为73.3分.[延伸探究] (1)若本例的条件不变,求数学成绩的平均数.(2)若本例条件不变,求80分以下的学生人数.[解] (1)由题干图知,这次数学成绩的平均数为×0.005×10+×0.015×10+×0.02×10+×0.03×10+×0.025×10+×0.005×10=72(分).(2)分数在[40,80)内的频率为(0.005+0.015+0.020+0.030)×10=0.7,所以80分以下的学生人数为80×0.7=56.巧归纳用频率分布直方图估计众数、中位数、平均数(1)众数:取最高小长方形底边中点的横坐标作为众数;(2)中位数:在频率分布直方图中,把频率分布直方图划分为左右两个面积相等的部分的分界线与z轴交点的横坐标称为中位数;(3)平均数:平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和.[练习2] (2021·全国甲卷)为了解某地农村经济情况,对该地农户家庭年收入进行抽样调查,将农户家庭年收入的调查数据整理得到如下频率分布直方图:根据此频率分布直方图,下面结论中不正确的是( )A.该地农户家庭年收入低于4.5万元的农户比率估计为6%B.该地农户家庭年收入不低于10.5万元的农户比率估计为10%C.估计该地农户家庭年收入的平均值不超过6.5万元D.估计该地有一半以上的农户,其家庭年收入介于4.5万元至8.5万元之间解析:因为频率分布直方图中的组距为1,所以各组直方图的高度等于频率.样本频率分布直方图中的频率即可作为总体的相应比率的估计值.该地农户家庭年收入低于4.5万元的农户的比率估计值为0.02+0.04=0.06=6%,故A正确;该地农户家庭年收入不低于10.5万元的农户比率估计值为0.04+0.02×3=0.10=10%,故B正确;该地农户家庭年收入介于4.5万元至8.5万元之间的比率估计值为0.10+0.14+0.20×2=0.64=64%>50%,故D正确;该地农户家庭年收入的平均值的估计值为3×0.02+4×0.04+5×0.10+6×0.14+7×0.20+8×0.20+9×0.10+10×0.10+11×0.04+12×0.02+13×0.02+14×0.02=7.68(万元),超过6.5万元,故C错误.故选C.答案:C研习 3 标准差、方差的计算与应用[典例3] 我国棉花产量居世界首位,产棉省市区有22个,新疆是长绒棉的主产区,新疆棉区日照充足,气候干旱,雨量稀少,属灌溉棉区,所产的新疆长绒棉因质地光亮、有弹性,绒长质优,原棉色泽好,备受消费者的青睐.某科技公司欲进一步改良优质棉品质,对甲乙两块试验田种植的两种棉花新品种的棉绒长度进行测量,分别记录抽查数据如下(单位:mm):甲:102 101 99 98 103 98 99;乙:110 115 90 85 75 115 110.试从统计的角度分析说明哪个棉花新品种比较稳定.[解] 甲块试验田的平均数1==100,甲的方差为s=×[(102-100)2+(101-100)2+(99-100)2+(98-100)2+(103-100)2+(98-100)2+(99-100)2]=.乙块试验田的平均数2==100,乙的方差为s=×[(110-100)2+(115-100)2+(90-100)2+(85-100)2+(75-100)2+(115-100)2+(110-100)2]=.因为1=2,s<s,所以甲块试验田种植的棉花新品种的棉绒长度比较稳定.巧归纳用样本的标准差、方差估计总体的方法用样本估计总体时,样本的平均数、标准差只是总体的平均数、标准差的近似.在实际应用中,常常把平均数与标准差结合起来进行决策.在平均数相等的情况下,比较方差或标准差以确定稳定性.[练习3] (2021·全国乙卷)某厂研制了一种生产高精产品的设备,为检验新设备生产产品的某项指标有无提高,用一台旧设备和一台新设备各生产了10件产品,得到各件产品该项指标数据如下:旧设备 9.8 10.3 10.0 10.2 9.9 9.8 10.0 10.1 10.2 9.7新设备 10.1 10.4 10.1 10.0 10.1 10.3 10.6 10.5 10.4 10.5旧设备和新设备生产产品的该项指标的样本平均数分别记为和,样本方差分别记为s和s.(1)求,,s,s;(2)判断新设备生产产品的该项指标的均值较旧设备是否有显著提高.解:(1)==10,==10.3,s==0.036,s==0.04.(2)依题意,-=0.3=2×0.15=2=2,又2=2=2,所以->2,所以新设备生产产品的该项指标的均值较旧设备有显著提高.研习 4 分层抽样的方差[典例4] 甲、乙两支田径队的体检结果为:甲队体重的平均数为60 kg,方差为200,乙队体重的平均数为70 kg,方差为300,又已知甲、乙两队的队员人数之比为1∶4,那么甲、乙两队全部队员的平均体重和方差分别是多少?[解] 由题意可知,甲=60,甲队队员在所有队员中所占权重为w甲==,乙=70,乙队队员在所有队员中所占权重为w乙==,则甲、乙两队全部队员的平均体重为=w甲甲+w乙乙=×60+×70=68(kg),甲、乙两队全部队员的体重的方差为s2=w甲[s+(甲-)2]+w乙[s+(乙-)2]=[200+(60-68)2]+[300+(70-68)2]=296.巧归纳计算分层随机抽样的方差s2的步骤(1)确定1,2,s,s.(2)确定.(3)应用公式s2=[s+(1-)2]+[s+(2-)2],计算s2.[练习4] 某培训机构在假期招收了A,B两个数学补习班,A班10人,B班30人,经过一周的补习后进行了一次测试,在该测试中,A班的平均成绩为130分,方差为115,B班的平均成绩为110分,方差为215.求在这次测试中全体学生的平均成绩和方差.解:依题意A=130,s=115,B=110,s=215,∴=×130+×110=115,∴全体学生的平均成绩为115分.全体学生成绩的方差为s2=[s+(A-)2]+[s+(B-)2]=×(115+225)+×(215+25)=85+180=265.研习 5 总体百分位数的估计[典例5] 一组数据3,4,8,7,9,5,7,15,2,13的下四分位数是________.[解析] 将原始数据按从小到大的顺序排成一列:2,3,4,5,7,7,8,9,13,15,由于10×25%=2.5,故该组数据的下四分位数是4.[答案] 4巧归纳第25百分位数,第50百分位数,第75百分位数,这三个分位数把一组由小到大排列后的数据分成四等份,因此称为四分位数,其中第25百分位数也称为第一四分位数或下四分位数,第75百分位数也称为第三四分位数或上四分位数.[练习5] 下表是某公司的月固定工资统计表:总工 程师 工程 师 技术 员A 技术 员B 技术 员C 技术 员D 技术 员E 见习 技术员固定工 资(元) 9 000 7 000 4 000 3 200 2 600 2 000 1 500 1 000由该表能判断出该公司职工固定工资的第75百分位数是________元.解析:由于8×75%=6,所以该公司员工的月固定工资的第75百分位数为表中从右到左的6个数与第7个数的平均数,即=5 500(元).答案:5 5001.(多选题)(2021·全国Ⅰ卷)有一组样本数据x1,x2,…,xn,由这组数据得到新样本数据y1,y2,…,yn,其中yi=xi+c(i=1,2,…,n),c为非零常数,则( )A.两组样本数据的样本平均数相同B.两组样本数据的样本中位数相同C.两组样本数据的样本标准差相同D.两组样本数据的样本极差相同解析:A.E(y)=E(x+c)=E(x)+c且c≠0,故平均数不相同,错误;B.若第一组的中位数为xi,则第二组的中位数为yi=xi+c,显然不相同,错误;C.D(y)=D(x)+D(c)=D(x),故方差相同,正确;D.由极差的定义知:若第一组的极差为xmax-xmin,则第二组的极差为ymax-ymin=(xmax+c)-(xmin+c)=xmax-xmin,故极差相同,正确.故选CD.答案:CD2.(多选题)已知甲、乙两名同学在高三的6次数学测试的成绩统计如图,则下列说法正确的是( )A.若甲、乙两组数据的平均数分别为1,2,则1>2B.若甲、乙两组数据的方差分别为s,s,则s<sC.甲成绩的极差小于乙成绩的极差D.甲成绩比乙成绩稳定解析:A:甲测试成绩明显高于乙,所以1>2,因此本选项说法正确;B:根据数据的波动情况来看,甲的波动小,所以s<s成立,故本选项说法正确;C:通过图象可以看到甲成绩的极差小于乙成绩的极差,故本选项说法正确;D:根据数据的波动情况来看,甲的波动小,所以甲成绩比乙成绩稳定,故本选项说法正确.故选ABCD.答案:ABCD3.若样本数据2x1-1,2x2-1,…,2x10-1的标准差为16,则数据x1,x2,…,x10的标准差为________.解析:设数据x1,x2,…,x10的标准差为s,∵样本数据2x1-1,2x2-1,…,2x10-1的标准差为16,∴4s2=162,解得s=8.答案:84.在一次中学生田径运动会上,参加男子跳高的17名运动员的成绩如表所示:成绩(单位:m) 1.50 1.60 1.65 1.70 1.75 1.80 1.85 1.90人数 2 3 2 3 4 1 1 1分别求这些运动员成绩的众数、中位数与平均数.解:在17个数据中,1.75出现了4次,出现的次数最多,即这组数据的众数是1.75.表里的17个数据可看成是按从小到大的顺序排列的,其中第9个数据1.70是最中间的一个数据,即这组数据的中位数是1.70;这组数据的平均数是=×(1.50×2+1.60×3+…+1.90×1)=≈1.69(m).故17名运动员成绩的众数、中位数、平均数依次为1.75 m,1.70 m,1.69 m.5.甲、乙两机床同时加工直径为100 cm的零件,为检验质量,从中抽取6件,测量数据为:甲:99 100 98 100 100 103乙:99 100 102 99 100 100(1)分别计算两组数据的平均数及方差;(2)根据计算说明哪台机床加工零件的质量更稳定.解:(1)甲=×(99+100+98+100+100+103)=100,乙=×(99+100+102+99+100+100)=100,s=×[(99-100)2+(100-100)2+(98-100)2+(100-100)2+(100-100)2+(103-100)2]=,s=×[(99-100)2+(100-100)2+(102-100)2+(99-100)2+(100-100)2+(100-100)2]=1.(2)由(1)知,甲=乙,比较它们的方差,因为s>s,故乙机床加工零件的质量更稳定.课时作业(四十七) 用样本估计总体一、选择题1.(多选题)甲、乙两班举行电脑汉字录入比赛,参赛学生每分钟录入汉字的个数经统计计算后填入下表:班级 参加人数 中位数 方差 平均数甲 55 149 191 135乙 55 151 110 135下列结论中,正确的是( )A.甲、乙两班学生成绩的平均水平相同B.乙班优秀的人数多于甲班优秀的人数(每分钟输入汉字数≥150个为优秀)C.甲班的成绩波动情况比乙班的成绩波动大D.甲班成绩的众数小于乙班成绩的众数解析:甲、乙两班成绩的平均数都是135,故两班成绩的平均水平相同,∴A正确;s=191>110=s,∴甲班成绩不如乙班稳定,即甲班成绩波动较大,∴C正确;甲、乙两班人数相同,但甲班成绩的中位数为149,乙班成绩的中位数为151,从而易知乙班每分钟输入汉字数≥150个的人数要多于甲班,∴B正确;由题表看不出两班学生成绩的众数,D错误.答案:ABC2.(多选题)甲、乙两人在一次射击比赛中各射靶5次,两人成绩的条形统计图如图所示,则( )A.甲的成绩的平均数小于乙的成绩的平均数B.甲的成绩的中位数等于乙的成绩的中位数C.甲的成绩的第80百分位数等于乙的成绩的第80百分位数D.甲的成绩的极差等于乙的成绩的极差解析:由题图可得,甲==6,乙==6,A项错误;甲的成绩的中位数为6,乙的成绩的中位数为5,B项错误;甲的成绩的第80百分位数=7.5,乙的成绩的第80百分位数=7.5,所以二者相等,所以C项正确;甲的成绩的极差为4,乙的成绩的极差也为4,D项正确.答案:CD3.(多选题)经统计,某农户近5年的年收入分别为a1,a2,a3,a4,a5.下面给出的指标可以用来评估该农户年收入的稳定程度的是( )A.a1,a2,a3,a4,a5的平均数B.a1,a2,a3,a4,a5的标准差C.a1,a2,a3,a4,a5的最大值D.a1,a2,a3,a4,a5的方差解析:由平均数主要用于刻画样本数据的平均水平、方差、标准差主要用于刻画样本数据相对于平均水平的波动性,样本数据的最大值主要用于刻画样本数据的最大水平,所以正确选项为BD.故选BD.答案:BD4.统计某班学生体检中检查视力的结果如下表,从表中可以看出,全班视力数据的众数是( )视力 0.5以下 0.7 0.8 0.9 1.0 1.0以上占全班人数的百分比 2% 6% 3% 20% 65% 4%A.0.9 B.1.0 C.20% D.65%解析:一组数据中,出现次数最多的数据叫作这组数据的众数.从上表可看出,视力为1.0的人数占百分比最大,所以众数为1.0.故选B.答案:B5.某同学将全班某次数学考试成绩整理成频率分布直方图后,并将每个小矩形上方线段的中点连接起来得到频率分布折线图(如图所示),据此估计此次考试成绩的众数是( )A.100 B.110 C.115 D.120解析:根据频率分布折线图,得折线的最高点对应的值是115,据此估计此次考试成绩的众数是115.故选C.答案:C6.已知一个样本,样本容量为10,平均数为15,方差为3,现从样本中去掉一个数据15,此时样本的平均数为,方差为s2,则( )A.>15,s2<3 B.<15,s2>3C.=15,s2>3 D.=15,s2<3解析:设10个数据为x1,x2,…,x9,15,因为==15,所以=15;又因为s2=,且=3,所以s2=>3,故选C.答案:C7.某市2022年12个月的PM2.5平均浓度指数如图所示.由图判断,四个季度中PM2.5的平均浓度指数方差最小的是( )A.第一季度 B.第二季度C.第三季度 D.第四季度答案:B8.(多选题)某综艺节目为比较甲、乙两名选手的各项能力(每项能力的指标值满分均为5分,分值高者为优),绘制如图所示的六维能力雷达图,图中点A表示甲的创造能力指标值为4,点B表示乙的空间能力指标值为3,则下列叙述正确的是( )A.乙的记忆能力优于甲B.乙的观察能力优于创造能力C.甲的六大能力整体水平优于乙D.甲的六大能力比乙较均衡解析:由六维能力雷达图,知乙的记忆能力指标值是4,甲的记忆能力指标值是5,故甲的记忆能力优于乙的记忆能力,故A错误;乙的创造能力指标值是3,观察能力指标值是4,故乙的观察能力优于创造能力,故B正确;甲的六大能力之和为25,乙的六大能力之和为24,所以甲的六大能力整体水平优于乙,故C正确;甲的六大能力指标值的方差为s=,乙的六大能力指标值的方差为s=,所以s答案:BCD9.(多选题)某校高二(13)班某次测试数学成绩累积频数分布折线图如图所示,则下列说法正确的是( )A.没有人的成绩在30~40分这组内B.第50百分位数位于60~70分这组内C.第25百分位数位于40~50分这组内D.第75百分位数位于70~80分这组内解析:由题图知,没有人的成绩在30~40分这组内,故A正确;由40×25%=10,取第10、11项数据的平均数,所以第25百分位数位于40~50分这组内,故C正确;由40×50%=20,取第20、21项数据的平均数,所以第50百分位数位于60~70分这组内,故B正确;由40×75%=30,取第30,31项数据的平均数,所以第75百分位数位于60~70分这组内,故D不正确.故选ABC.答案:ABC10.甲、乙两名同学6次考试的成绩统计如图所示,设甲、乙两组数据的平均数分别为甲,乙,标准差分别为s甲,s乙,则( )A.甲<乙,s甲B.甲<乙,s甲>s乙C.甲>乙,s甲D.甲>乙,s甲>s乙解析:由题图可知,甲同学除第二次考试成绩略低于乙同学外,其他考试成绩都远高于乙同学,可知甲>乙.图中数据显示甲同学的成绩波动小,比乙同学稳定,故s甲答案:C二、填空题11.小明5次上学途中所花的时间(单位:分钟)分别为x,y,10,11,9.已知这组数据的平均数为10,方差为2,则|x-y|的值为________.解析:由题意可得x+y=20,(x-10)2+(y-10)2=8,设x=10+t,y=10-t,则t2=4,|t|=2,故|x-y|=2|t|=4.答案:412.已知总体的各个个体的值由小到大依次为2,3,3,7,a,b,12,13.7,18.3,21.且总体的中位数为10,若要使该总体的方差最小,则ab=________.解析:由题意得a+b=10×2=20,要使该总体的方差最小,方差化简后即满足(a-10)2+(b-10)2最小,故a=b=10,ab=100.答案:10013.有10种不同的零食,每100克可食部分包含的能量(单位:kJ)如下:100,120,125,165,430,190,175,234,425,310这10种零食每100克可食部分的能量的第60百分位数为________.解析:根据题意,将10个数据从小到大排列:100,120,125,165,175,190,234,310,425,430;又10×60%=6,则该组数据的第60百分位数为=212,故答案为212.答案:21214.一支球队在一个赛季的10场比赛中分别进球的个数是30,35,25,25,30,34,26,25,29,21,则该队平均每场进球=________个,众数是________.解析:由平均数的计算公式及众数的意义可得.答案:28 2515.已知一组正数x1,x2,x3,x4的方差s2=(x+x+x+x-16),则数据x1+2,x2+2,x3+2,x4+2的平均数为________.解析:设正数x1,x2,x3,x4的平均数为,则s2=[(x1-)2+(x2-)2+(x3-)2+(x4-)2],得s2=(x+x+x+x)-2.又已知s2=(x+x+x+x-16)=(x+x+x+x)-4,所以2=4,所以=2,故[(x1+2)+(x2+2)+(x3+2)+(x4+2)]=+2=4.答案:416.已知一组数据x1,x2,x3,x4,x5的方差是2,则数据2x1,2x2,2x3,2x4,2x5的标准差为________.解析:由s2=2,则数据2x1,2x2,2x3,2x4,2x5的方差是8,标准差为2.答案:217.某班有48名学生,在一次考试中统计出平均分为70分,方差为75,后来发现有2名同学的分数登记错了,甲实得80分,却记了50分,乙实得70分,却记了100分,更正后平均分和方差分别是________,________.解析:因为甲少记了30分,乙多记了30分,故平均分不变,设更正后的方差为s2,则由题意可得,s2=[(x1-70)2+(x2-70)2+…+(80-70)2+(70-70)2+…+(x48-70)2],而更正前有75=[(x1-70)2+(x2-70)2+…+(50-70)2+(100-70)2+…+(x48-70)2],化简整理得s2=50.答案:70 50三、解答题18.对甲、乙两名同学的学习成绩进行抽样分析,各抽5门功课,得到的观测值如下:甲 60 80 70 90 70乙 80 60 70 80 75(1)甲、乙的平均成绩谁更好?(2)谁的各门功课发展较平衡?解:(1)甲=×(60+80+70+90+70)=74,乙=×(80+60+70+80+75)=73,故甲的平均成绩较好.(2)s=×[(60-74)2+(80-74)2+(70-74)2+(90-74)2+(70-74)2]=104,s=×[(80-73)2+(60-73)2+(70-73)2+(80-73)2+(75-73)2]=56,由s>s,知乙的各门功课发展较平衡.19.为隆重纪念中国共产党成立100周年,进一步激发师生的爱党爱国热情,某校开展了四项庆祝活动:A、感党恩·我们诵;B、听党话·我们唱;C、跟党走·我们画;D、学党史·我们写.其中C项活动全体同学参与,预计成绩95<x≤100可获一等奖,成绩90<x≤95可获二等奖,现随机抽取50个同学的作品进行打分并对成绩进行整理、分析,得到频数分布直方图如下:其中收集90<x≤100这一组成绩如下:n 93 92 98 95 95 96 91 94 96整理该组数据得下表:组别 平均数 中位数 众数获奖组 94.5 95 95根据以上信息,回答下列问题:(1)频数分布直方图中,求m的值;(2)在90<x≤100组中,求n的值;(3)已知该校有1 200名学生,估计本次活动获一等奖的同学有多少人?解:(1)由4+m+24+10=50,解得m=12.(2)由90(3)∵抽取的50个同学的作品成绩中95<x≤100的人数为3,∴1 200×=72(人).20.某教育集团为了办好让人民满意的教育,每年年底都随机邀请8名学生家长代表对集团内甲、乙两所学校进行人民满意度的民主测评(满意度最高分110分,最低分0分,分数越高说明人民满意度越高,分数越低说明人民满意度越低).去年测评的数据如下:甲校:96,112,97,108,100,103,86,98;乙校:108,101,94,105,96,93,97,106.(1)分别计算甲、乙两所学校去年人民满意度测评数据的平均数、中位数;(2)分别计算甲、乙两所学校去年人民满意度测评数据的方差;(3)根据以上数据你认为甲、乙哪所学校人民满意度比较高?解:(1)甲学校人民满意度测评数据的平均数为甲=×(96+112+97+108+100+103+86+98)=100,中位数为=99,乙学校人民满意度测评数据的平均数为乙=×(108+101+94+105+96+93+97+106)=100,中位数为=99.(2)甲学校人民满意度测评数据的方差:s=×[(96-100)2+(112-100)2+…+(98-100)2]=55.25,乙学校人民满意度测评数据的方差:s=×[(108-100)2+(101-100)2+…+(106-100)2]=29.5.(3)由(1)(2)可知,甲、乙两学校人民满意度测评数据的平均数相同,中位数相同,而乙学校人民满意度测评数据的方差小于甲学校的方差,故乙学校人民满意度比较高.21.一个社会调查机构就某地居民的月收入调查了10 000人,并根据所得数据画了样本的频率分布直方图(如图).(1)计算居民月收入的平均数和众数;(2)为了分析居民的收入与年龄、学历、职业等方面的关系,要从这10 000人中再用分层抽样方法抽出80人作进一步调查,则月收入在[1 500,2 000)(元)段应抽出多少人.解:(1)由直方图可得,各组的频率从左往右依次为0.10,0.20,0.25,0.25,0.15,0.05,所以平均值为1 250×0.10+1 750×0.20+2 250×0.25+2 750×0.25+3 250×0.15+3 750×0.05=2 400,众数为2 250和2 750.(2)分层抽样的抽取比为=,数据在[1 500,2 000)的频率为0.20,所以总体中月收入在[1 500,2 000)(元)段的人数为10 000×0.20=2 000,所以应抽出的人数为2 000×=16(人).综合微评(六)时间:120分钟 满分:150分一、单项选择题:本大题共8小题,每小题5分,共40分.在每小题给出的四个选项中,只有一项是符合题目要求的.1.用简单随机抽样方法从含有10个个体的总体中,抽取一个容量为3的样本,其中某一个体a“第一次被抽到”的可能性,“第二次被抽到”的可能性分别是( )A., B.,C., D.,解析:根据简单随机抽样的定义知选A.答案:A2.在用样本的频率分布估计总体的频率分布的过程中,下列说法正确的是( )A.总体的容量越大,估计越准确B.总体的容量越小,估计越准确C.样本的样本量越大,估计越准确D.样本的样本量越小,估计越准确解析:根据样本的频率分布可知,样本的频率分布反映的是总体中部分个数的频率分布,只有当样本的样本量越大时,估计才越准确.故选C.答案:C3.某校为了丰富校园文化,举行初中生书法大赛,决赛设置了6个获奖名额,共有11名选手进入决赛,选手决赛得分均不相同.若知道某位选手的决赛的得分,要判断他是否获奖,只需知道这11名学生决赛得分的( )A.中位数 B.平均数C.众数 D.方差解析:由中位数的概念,即最中间一个或两个数据的平均数,可知11人成绩的中位数是第6名的得分.根据题意可得参赛选手要想知道自己是否能进入前6名,只需要了解自己的得分以及全部得分的中位数,比较即可.答案:A4.若甲组数据为:5,12,16,21,25,37,乙组数据为:1,6,14,18,38,39,则甲、乙的平均数、极差及中位数相同的是( )A.极差 B.平均数C.中位数 D.都不相同解析:由题中数据的分布,可知极差不同,甲的中位数为=18.5,乙的中位数为=16,所以中位数不同,甲==,乙==,所以甲、乙的平均数相同,故选B.答案:B5.某工厂甲、乙、丙三个车间生产了同一种产品,数量分别为120件,80件,60件.为了解它们的产品质量是否存在显著差异,用分层随机抽样的方法抽取了一个容量为n的样本进行调查,其中从丙车间的产品中抽取了3件,则n=( )A.9 B.10 C.12 D.13解析:由分层随机抽样可得=,解得n=13.答案:D6.某校为了解高三年级学生在线学习情况,统计了2020年4月18日~27日(共10天)学生在线学习人数及其增长比例数据,并制成如图所示的条形图与折线图的组合图,根据组合图判断,下列结论正确的是( )A.这10天学生在线学习人数的增长比例在逐日减小B.前5天在线学习人数的方差大于后5天在线学习人数的方差C.这10天学生在线学习人数在逐日增加D.前5天在线学习人数增长比例的极差大于后5天在线学习人数增长比例的极差解析:对选项A,由折线图可知,21日到23日的增长比例在增加,故A错误.对选项B,由条形图可知,前5天学习人数的变化幅度明显比后5天小,所以前5天的方差小于后5天的方差.故B错误.对选项C,由条形图可知,学习人数在逐日增加,故C正确.对选项D,前5天增长比例的极差大约为15%-5%=10%,后5天增长比例的极差大约为40%-5%=35%,所以前5天的增长比例极差小于后5天增长比例的极差,故D错误.故选C.答案:C7.为了了解某校高三学生的视力情况,随机地抽查了该校100名高三学生的视力,得到频率分布直方图如图所示,由于不慎将部分数据丢失,但知道后5组频数和为62,最大频率为0.32,设视力在4.6到4.8之间的学生数为a,则a的值为( )A.64 B.54C.48 D.27解析:前两组的频数为100×(0.05+0.11)=16.因为后五组频数和为62,所以前三组频数和为38.所以第三组频数为38-16=22.又最大频率为0.32,故第四组频数为0.32×100=32.所以a=22+32=54.故选B.答案:B8.已知样本量为9的四组数据,它们的平均数都是5,条形统计图如图所示,则标准差最大的是( )解析:选项A中,样本数据都为5,数据没有波动幅度;选项B中,样本数据为4,4,4,5,5,5,6,6,6;选项C中,样本数据为3,3,4,4,5,6 展开更多...... 收起↑ 资源列表 湘教版高中数学必修第一册第6章统计学初步学案.docx 湘教版高中数学必修第一册第6章统计学初步综合微评课件.ppt