资源简介 第十章 统计与统计案例第一节 随机抽样一、基础知识1.简单随机抽样(1)定义:一般地,设一个总体含有 N 个个体,从中逐个不放回地抽取 n 个个体作为样本(n≤N),如果每次抽取时总体内的各个个体被抽到的机会都相等,就把这种抽样方法叫做简单随机抽样.这样抽取的样本,叫做简单随机样本.(2)常用方法:抽签法和随机数法.2.分层抽样(1)在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法是一种分层抽样.(2)分层抽样的应用范围:当总体是由差异明显的几个部分组成时,往往选用分层抽样.3.系统抽样(1)定义:当总体中的个体数较多时,可以将总体分成均衡的几部分,然后按照预先制定的规则,从每一部分抽取一个个体,得到所需的样本,这种抽样的方法叫做系统抽样.(2)系统抽样的步骤假设要从容量为 N 的总体中抽取容量为 n 的样本.①先将总体的 N 个个体编号;N N②确定分段间隔 k,对编号进行分段.当 (n 是样本容量)是整数时,取 k= ;n n当总体中的个体数不能被样本容量整除时,可先用简单随机抽样的方法从总体中剔除几个个体,使剩下的个体数能被样本容量整除,然后再按系统抽样进行.这时在整个抽样过程中每个个体被抽取的可能性仍然相等.③在第 1 段用简单随机抽样确定第一个个体编号 l(l≤k);④按照一定的规则抽取样本.通常是将 l 加上间隔 k 得到第 2 个个体编号 l+k,再加 k得到第 3 个个体编号 l+2k,依次进行下去,直到获取整个样本.第 784页/共1004页二、常用结论(1)不论哪种抽样方法,总体中的每一个个体入样的概率都是相同的.(2)系统抽样一般也称为等距抽样,入样个体的编号相差分段间隔 k 的整数倍.(3)分层抽样是按比例抽样,每一层入样的个体数为该层的个体数乘抽样比.(4)三种抽样方法的特点、联系及适用范围类别 共同点 各自特点 联系 适用范围简单随 总体个数从总体中逐个抽取机抽样 较少①抽样过程中每将总体均分成几部分,按 在起始部分取样系统 个个体被抽到的 总 体 个 数预先定出的规则在各部 时,采用简单随抽样 可能性相等; 较多分中抽取 机抽样②每次抽出个体总 体 由 差后不再将它放回, 各层抽样时,采分层 将总体分成几层,分层进 异 明 显 的即不放回抽样 用简单随机抽样抽样 行抽取 几 部 分 组或系统抽样成考点一 简单随机抽样[典例] 下列抽取样本的方式属于简单随机抽样的个数有( )①从无限多个个体中抽取 100 个个体作为样本;②盒子里共有 80 个零件,从中选出 5 个零件进行质量检验.在抽样操作时,从中任意拿出一个零件进行质量检验后再把它放回盒子里;③用抽签方法从 10 件产品中选取 3 件进行质量检验;④某班有 56 名同学,指定个子最高的 5 名同学参加学校组织的篮球赛.A.0 个 B.1 个C.2 个 D.3 个[解析] ①不是简单随机抽样,因为被抽取样本的总体的个数是无限的,而不是有限的;②不是简单随机抽样,因为它是有放回抽样;③明显为简单随机抽样;④不是简单随机抽样,因为不是等可能抽样.[答案] B[解题技法] 应用简单随机抽样应注意的问题第 785页/共1004页(1)一个抽样试验能否用抽签法,关键看两点:一是抽签是否方便;二是号签是否易搅匀.一般地,当总体容量和样本容量都较小时可用抽签法.(2)在使用随机数法时,如遇到三位数或四位数,可从选择的随机数表中的某行某列的数字计起,每三个或四个作为一个单位,自左向右选取,有超过总体号码或出现重复号码的数字舍去.[题组训练]1.总体由编号为 01,02,…,19,20 的 20 个个体组成,利用下面的随机数表选取 5 个个体,选取方法是从随机数表第 1 行的第 5 列和第 6 列数字开始由左到右依次选取两个数字,则选出来的第 5 个个体的编号为( )7816 6572 0802 6314 0702 4369 9728 01983204 9234 4935 8200 3623 4869 6938 7481A.08 B.07C.02 D.01解析:选 D 由随机数法的随机抽样的过程可知选出的 5 个个体是 08,02,14,07,01,所以第 5 个个体的编号是 01.2.利用简单随机抽样,从 n 个个体中抽取一个容量为 10 的样本.若第二次抽取时,余1下的每个个体被抽到的概率为 ,则在整个抽样过程中,每个个体被抽到的概率为( )31 1A. B.4 35 10C. D.14 279 1解析:选 C 根据题意, = ,n-1 3解得 n=28.10 5故在整个抽样过程中每个个体被抽到的概率为 = .28 14考点二 系统抽样[典例] (1)某校为了解 1 000 名高一新生的身体生长状况,用系统抽样法(按等距的规则)抽取 40 名同学进行检查,将学生从 1~1 000 进行编号,现已知第 18 组抽取的号码为 443,则第一组用简单随机抽样抽取的号码为( )A.16 B.17C.18 D.19(2)中央电视台为了解观众对某综艺节目的意见,准备从 502 名现场观众中抽取 10%进行座谈,现用系统抽样的方法完成这一抽样,则在进行分组时,需剔除________个个体,抽第 786页/共1004页样间隔为________.[解析] (1)因为从 1 000 名学生中抽取一个容量为 40 的样本,所以系统抽样的分段间隔1 000为 =25,40设第一组随机抽取的号码为 x,则抽取的第 18 组编号为 x+17×25=443,所以 x=18.(2)把 502 名观众平均分成 50 组,由于 502 除以 50 的商是 10,余数是 2,所以每组有10 名观众,还剩 2 名观众,采用系统抽样的方法抽样时,应先用简单随机抽样的方法从 502名观众中抽取 2 名观众,这 2 名观众不参加座谈;再将剩下的 500 名观众编号为 1,2,3,…,500500,并均匀分成 50 段,每段含 =10 个个体.所以需剔除 2 个个体,抽样间隔为 10.50[答案] (1)C (2)2 10[变透练清]1.(变结论)若本例(1)的条件不变,则编号落入区间[501,750]的人数为________.1 000解析:从 1 000 名学生中抽取一个容量为 40 的样本,系统抽样分 40 组,每组 =2540个号码,每组抽取一个,从 501 到 750 恰好是第 21 组到第 30 组,共抽取 10 人.答案:102.(2018·南昌摸底调研)某校高三(2)班现有 64 名学生,随机编号为 0,1,2,…,63,依编号顺序平均分成 8 组,组号依次为 1,2,3,…,8.现用系统抽样方法抽取一个容量为 8 的样本,若在第 1 组中随机抽取的号码为 5,则在第 6 组中抽取的号码为________.64解析:由题知分组间隔为 =8,又第 1 组中抽取的号码为 5,所以第 6 组中抽取的号8码为 5×8+5=45.答案:45[解题技法] 系统抽样中所抽取编号的特点系统抽样又称等距抽样,所以依次抽取的样本对应的号码就是一个等差数列,首项就是第 1 组所抽取样本的号码,公差为间隔数,根据等差数列的通项公式就可以确定每一组内所要抽取的样本号码.[提醒] 系统抽样时,如果总体中的个数不能被样本容量整除时,可以先用简单随机抽样从总体中剔除几个个体,然后再按系统抽样进行.考点三 分层抽样第 787页/共1004页[典例] 某电视台在网上就观众对其某一节目的喜爱程度进行调查,参加调查的一共有 20 000 人,其中各种态度对应的人数如下表所示:最喜爱 喜爱 一般 不喜欢4 800 7 200 6 400 1 600电视台为了了解观众的具体想法和意见,打算从中抽取 100 人进行详细的调查,为此要进行分层抽样,那么在分层抽样时,每类人中应抽取的人数分别为( )A.25,25,25,25 B.48,72,64,16C.20,40,30,10 D.24,36,32,8100 1[解析 ] 法一:因为抽样比为 = ,所以每类人中应抽取的人数分别为20 000 2001 1 1 14 800× =24,7 200× =36,6 400× =32,1 600× =8.200 200 200 200法二:最喜爱、喜爱、一般、不喜欢的比例为 4 800∶7 200∶6 400∶1 600=6∶9∶8∶2,6 9所以每类人中应抽取的人数分别为 ×100=24, ×100=36,6+9+8+2 6+9+8+28 2×100=32, ×100=8.6+9+8+2 6+9+8+2[答案] D[解题技法] 分层抽样问题的类型及解题思路(1)求某层应抽个体数量:按该层所占总体的比例计算.(2)已知某层个体数量,求总体容量或反之求解:根据分层抽样就是按比例抽样,列比例式进行计算.样本容量(3)分层抽样的计算应根据抽样比构造方程求解,其中“抽样比= =总体容量各层样本数量”.各层个体数量[题组训练]1.(2019·山西五校联考)某校为了解学生的学习情况,采用分层抽样的方法从高一 1 000人、高二 1 200 人、高三 n 人中抽取 81 人进行问卷调查,若高二被抽取的人数为 30,则 n=( )A.860 B.720C.1 020 D.1 04030 1 81 1解析:选 D 由已知条件知抽样比为 = ,从而 = ,解得 n=1 200 40 1 000+1 200+n 401 040,故选 D.第 788页/共1004页2.(2018·广州高中综合测试)已知某地区中小学学生人数如图所示.为了解该区学生参加某项社会实践活动的意向,拟采用分层抽样的方法来进行调查.若高中需抽取 20 名学生,则小学与初中共需抽取的学生人数为________.1 200 20解析:设小学与初中共需抽取的学生人数为 x,依题意可得 = ,2 700+2 400+1 200 x+20解得 x=85.答案:85[课时跟踪检测]1.从 2 019 名学生中选取 50 名学生参加全国数学联赛,若采用以下方法选取:先用简单随机抽样法从 2 019 名学生中剔除 19 名学生,剩下的 2 000 名学生再按系统抽样的方法抽取,则每名学生入选的概率( )A.不全相等 B.均不相等50 1C.都相等,且为 D.都相等,且为2 019 40M解析:选 C 从 N 个个体中抽取 M 个个体,则每个个体被抽到的概率都等于 ,故每N50名学生入选的概率都相等,且为 .2 0192.福利彩票“双色球”中红球的号码可以从 01,02,03,…,32,33 这 33 个两位号码中选取,小明利用如下所示的随机数表选取红色球的 6 个号码,选取方法是从第 1 行第 9 列的数字开始,从左到右依次读取数据,则第四个被选中的红色球的号码为( )81 47 23 68 63 93 17 90 12 69 86 81 62 93 50 60 91 33 75 85 61 39 8506 32 35 92 46 22 54 10 02 78 49 82 18 86 70 48 05 46 88 15 19 20 49A.12 B.33C.06 D.16解析:选 C 被选中的红色球的号码依次为 17,12,33,06,32,22,所以第四个被选中的红色球的号码为 06.3.某班共有学生 52 人,现根据座号,用系统抽样的方法,抽取一个容量为 4 的样本.已知 5 号、18 号、44 号同学在样本中,那么样本中还有一个同学的座号是( )A.23 B.27C.31 D.33第 789页/共1004页52解析:选 C 分段间隔为 =13,故样本中还有一个同学的座号为 18+13=31.44.某工厂在 12 月份共生产了 3 600 双皮靴,在出厂前要检查这批产品的质量,决定采用分层抽样的方法进行抽取,若从一、二、三车间抽取的产品数分别为 a,b,c,且 a,b,c 构成等差数列,则第二车间生产的产品数为( )A.800 双 B.1 000 双C.1 200 双 D.1 500 双解析:选 C 因为 a,b,c 成等差数列,所以 2b=a+c,即第二车间抽取的产品数占抽样产品总数的三分之一,根据分层抽样的性质可知,第二车间生产的产品数占 12 月份生产总数的三分之一,即为 1 200 双皮靴.5.(2018·南宁摸底联考)已知某地区中小学生人数和近视情况分别如图甲和图乙所示.为了了解该地区中小学生的近视形成原因,用分层抽样的方法抽取 2%的学生进行调查,则样本容量和抽取的高中生近视人数分别为( )A.100,20 B.200,20C.200,10 D.100,10解析:选 B 由题图甲可知学生总人数是 10 000,样本容量为 10 000×2%=200,抽取的高中生人数是 2 000×2%=40,由题图乙可知高中生的近视率为 50%,所以抽取高中生的近视人数为 40×50%=20,故选 B.6.一个总体中有 100 个个体,随机编号为 0,1,2,…,99.依编号顺序平均分成 10 个小组,组号依次为 1,2,3,…,10.现用系统抽样方法抽取一个容量为 10 的样本,如果在第一组随机抽取的号码为 m,那么在第 k 组中抽取的号码个位数字与 m+k 的个位数字相同.若 m=6,则在第 7 组中抽取的号码是( )A.63 B.64C.65 D.66解析:选 A 若 m=6,则在第 7 组中抽取的号码个位数字与 13 的个位数字相同,而第7 组中的编号依次为 60,61,62,63,…,69,故在第 7 组中抽取的号码是 63.7.采用系统抽样方法从 960 人中抽取 32 人做问卷调查,为此将他们随机编号为 1,2,…,960,分组后在第一组采用简单随机抽样的方法抽到的号码为 9.抽到的 32 人中,编号落入区间[1,450]的人做问卷 A,编号落入区间(450,750]的人做问卷 B,其余的人做问卷 C.则抽到的人中,做问卷 B 的人数为( )第 790页/共1004页A.7 B.9C.10 D.15解析:选 C 960÷32=30,故由题意可得抽到的号码构成以 9 为首项,以 30 为公差的等差数列,其通项公式为 an=9+30(n-1)=30n-21.由 450<30n-21≤750,解得 15.7<n≤25.7.又 n 为正整数,所以 16≤n≤25,故做问卷 B 的人数为 25-16+1=10.故选 C.8.某企业三月中旬生产 A,B,C 三种产品共 3 000 件,根据分层抽样的结果,企业统计员制作了如下的统计表格:产品类别 A B C产品数量(件) 1 300样本容量(件) 130由于不小心,表格中 A,C 产品的有关数据已被污染看不清楚,统计员记得 A 产品的样本容量比 C 产品的样本容量多 10,根据以上信息,可得 C 的产品数量是________件.x解析:设样本容量为 x,则 ×1 300=130,∴x=300.3 000∴A 产品和 C 产品在样本中共有 300-130=170(件).设 C 产品的样本容量为 y,则 y+y+10=170,∴y=80.3 000∴C 产品的数量为 ×80=800(件).300答案:8009.某企业三个分厂生产同一种电子产品,三个分厂产量分布如图所示,现在用分层抽样方法从三个分厂生产的该产品中共抽取 100 件做使用寿命的测试,则第一分厂应抽取的件数为________;由所得样品的测试结果计算出一、二、三分厂取出的产品的使用寿命平均值分别为 1 020 小时、980 小时、1 030 小时,估计这个企业所生产的该产品的平均使用寿命为________小时.解析:第一分厂应抽取的件数为 100×50%=50;该产品的平均使用寿命为 1 020×0.5+980×0.2+1 030×0.3=1 015.答案:50 1 01510.将参加冬季越野跑的 600 名选手编号为:001,002,…,600,采用系统抽样方法抽取一个容量为 50 的样本,把编号分为 50 组后,在第一组的 001 到 012 这 12 个编号中随机抽得的号码为 004,这 600 名选手穿着三种颜色的衣服,从 001 到 301 穿红色衣服,从 302第 791页/共1004页到 496 穿白色衣服,从 497 到 600 穿黄色衣服,则抽到穿白色衣服的选手人数为________.解析:由题意及系统抽样的定义可知,将这 600 名学生按编号依次分成 50 组,每一组各有 12 名学生,第 k(k∈N*)组抽中的号码是 4+12(k-1).令 302≤4+12(k-1)≤496,得525 ≤k≤42,因此抽到穿白色衣服的选手人数为 42-25=17(人).6答案:1711.某初级中学共有学生 2 000 名,各年级男、女生人数如下表:初一年级 初二年级 初三年级女生 373 x y男生 377 370 z已知在全校学生中随机抽取 1 名,抽到初二年级女生的概率是 0.19.(1)求 x 的值;(2)现用分层抽样的方法在全校抽取 48 名学生,问应在初三年级抽取多少名?x解:(1)∵ =0.19,∴x=380.2 000(2)初三年级人数为 y+z=2 000-(373+377+380+370)=500,现用分层抽样的方法在48全校抽取 48 名学生,应在初三年级抽取的人数为 ×500=12(名).2 000第 792页/共1004页 展开更多...... 收起↑ 资源预览