资源简介 第二章 统计第一节 随机抽样考点汇集1、简单随机抽样的概念一般地,设一个总体含有N个个体,从中逐个不放回地抽取n个个体作为样本(n≤N),如果每次抽取时总体内的各个个体被抽到的机会都相等,就把这种抽样方法叫做简单随机抽样,这样抽取的样本,叫做简单随机样本。特点:(1)简单随机抽样要求被抽取的样本的总体个数N是有限的。(2)简单随机样本数n小于等于样本总体的个数N。(3)简单随机样本是从总体中逐个抽取的。(4)简单随机抽样是一种不放回的抽样。(5)简单随机抽样的每个个体入样的可能性均为n/N。2、系统抽样的定义:一般地,要从容量为N的总体中抽取容量为n的样本,可将总体分成均衡的若干部分,然后按照预先制定的规则,从每一部分抽取一个个体,得到所需要的样本,这种抽样的方法叫做系统抽样。特证:(1)当总体容量N较大时,采用系统抽样。(2)将总体分成均衡的若干部分指的是将总体分段,分段的间隔要求相等,因此,系统抽样又称等距抽样,这时间隔一般为k=[].(3)预先制定的规则指的是:在第1段内采用简单随机抽样确定一个起始编号,在此编号的基础上加上分段间隔的整倍数即为抽样编号。3、分层抽样的定义。一般地,在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样的方法叫分层抽样。步骤:(1)分层:按某种特征将总体分成若干部分。(2)按比例确定每层抽取个体的个数。(3)各层分别按简单随机抽样的方法抽取。(4)综合每层抽样,组成样本。4.简单随机抽样、系统抽样、分层抽样比较类 别共同点各自特点联 系适 用范 围简 单随 机抽 样(1)抽样过程中每个个体被抽到的可能性相等(2)每次抽出个体后不再将它放回,即不放回抽样从总体中逐个抽取总体个数较少将总体均分成几部 分,按预先制定的规则在各部分抽取在起始部分样时采用简随机抽样总体个数较多系 统抽 样将总体分成几层,分层进行抽取分层抽样时采用简单随机抽样或系统抽样总体由差异明显的几部分组成分 层抽 样自主反馈一、选择题:1.某校期末考试后,为了分析该校高一年级1000名学生的学习成绩,从中随机抽取了100名学生的成绩单,就这个问题来说,下面说法正确的是﹙ ﹚A.1000名学生是总体 B.每个学生是个体C.100名学生的成绩是一个个体 D.样本的容量是1002.对总数为的一批零件抽取一个容量为30的样本,若每个零件被抽取的可能性为25%,则为 ﹙ ﹚ A.150 B.200 C.100 D.1203.某工厂生产的产品,用速度恒定的传送带将产品送入包装车间之前,质检员每隔3分钟从传送带上是特定位置取一件产品进行检测,这种抽样方法是 ( ) A.简单随机抽样 B.系统抽样 C.分层抽样 D.其它抽样方法4.某公司在甲、乙、丙、丁四个地区分别有150个、120个、180个、150个销售点.公司为了调查产品销售情况,需从这600个销售点中抽取一个容量为100的样本,记这项调查为①;在丙地区有20个特大型销售点,要从中抽取7个调查其销售收入和售后服务等情况,记这项调查为②,则完成①、②这两项调查宜采用的抽样方法依次是 ( ) A.分层抽样法,系统抽样法 B.分层抽样法,简单随机抽样法 C.系统抽样法,分层抽样法 D.简单随机抽样法,分层抽样法5.我校高中生共有2700人,其中高一年级900人,高二年级1200人,高三年级600人,现采取分层抽样法抽取容量为135的样本,那么高一、高二、高三各年级抽取的人数分别为 ( ) A.45,75,15 B.45,45,45 C.30,90,15 D. 45,60,30 6.要从已编号(1,60)的枚最新研制的某型导弹中随机抽取枚来进行发射试验,用每部分选取的号码间隔一样的系统抽样方法确定所选取的枚导弹的编号可能是 ( )A. B. C. D.7.某企业有职工人,其中高级职称人,中级职称人,一般职员人,现抽取人进行分层抽样,则各职称人数分别为 ( )A. B. C. D.8. 从个编号中抽取个号码入样,若采用系统抽样方法进行抽取,则分段间隔应为 ( ) A. B. C. D.9. 有件产品编号从到,现在从中抽取件检验,用系统抽样确定所抽取的编号为 ( )A. B.C. D. 10.某单位有技工18人、技术员12人、工程师6人,需要从这些人中抽取一个容量为n的样本.如果采用系统抽样和分层抽样方法抽取,都不用剔除个体;如果容量增加一个,则在采用系统抽样时,需要在总体中剔除1个个体,则样本容量n为 ( ) A.4 B.5 C.6 D.无法确定11.某校有40个班,每班有50人,每班选派3人参加“学代会”,在这个问题中样本容量是 ( )A.40 B.50 C.120 D.15012.要从已编号(1-50)的50枚最新研制的某型号导弹中随机抽取5枚来进行发射试验,用每部分选取的号码间隔一样的系统抽样方法确定所选取的5枚导弹的编号可能是 ( )A.5,10,15,20,25 B.3,13,23,33,43C.1,2,3,4,5 D.2,4,8,16,3213.某单位有老年人27人,中年人54人,青年人81人,为了调查他们身体状况的某项指标,需从他们中抽取一个容量为36的样本,适合抽取样本的方法是 ( )A.抽签法 B.系统抽样 C.随机数表法 D.分层抽样二、填空题:1.从含有500个个体的总体中一次性地抽取25个个体,假定其中每个个体被抽到的概率相等,那么总体中的每个个体被抽取的概率等于_________.2.为了了解参加运动会的名运动员的年龄情况,从中抽取名运动员;就这个问题,下列说法中正确的有 ;(1)名运动员是总体; (2)每个运动员是个体;(3)所抽取的名运动员是一个样本; (4)样本容量为;(5)这个抽样采用按年龄进行分层抽样; (6)每个运动员被抽到的概率相等3.用随机数表法从名学生(男生人)中抽取人进行评教,某男生被抽取的机率是____________。 4.某单位有老年人人,中年人人,青年人人,为调查身体健康状况,需要从中抽取一个容量为的样本,用分层抽样方法应分别从老年人、中年人、青年人中各抽取 __人、 人、 人。5.为了了解名学生对学校某项教改试验的意见,打算从中抽取一个容量为的样考虑用系统抽样,则分段的间隔为_______________ 6.从个篮球中任取一个,检验其质量,则应采用的抽样方法为_____________。7.某种彩票编号为0000~9999,中奖规则规定末三位号码是123的为二等奖,则中二等奖的号码为_______________________ ;若将中二等奖的号码看作一个样本,则这里采用的抽样方法是 .8.某工厂生产 A,B,C 三种不同型号的产品,产品数量之比依次为 2∶3∶5.现用分层抽样方法抽出一个容量为n的样本,样本中A种型号的产品有16件,那么此样本的容量n=___9.若总体中含有1 650个个体,现在要采用系统抽样,从中抽取一个容量为35的样本,分段时应从总体中随机剔除________个个体,编号后应均分为_________段,每段有______个个体.三、解答题:1.一个单位的职工有500人,其中不到35岁的有125人,35~49岁的有280人,50岁以上的有95人.为了了解该单位职工年龄与身体状况的有关指标,从中抽取100名职工作为样本,应该怎样抽取?2.某校高中部有三个年级,其中高三有学生人,现采用分层抽样法抽取一个容量为的样本,已知在高一年级抽取了人,高二年级抽取了人,则高中部共有多少学生?3.某学校共有教师人,其中不到岁的有人,岁及以上的有人。为了了解普通话在该校中的推广普及情况,用分层抽样的方法,从全体教师中抽取一个容量为人的样本进行普通话水平测试,其中在不到岁的教师中应抽取的人数为多少人?4.某粮食生产基地为估算产量,先在高产田中收割1 m2作物,产量为980 g,又从低产田中收割1 m2作物,产量为430 g,(1亩=666.7 m2,1斤=500g)问:(1)总体、样本、样本容量各指什么?(2)分别估算出高产田、低产田的亩产量各是多少斤?(3)估算出该基地这种作物的亩产量(若高产田与低产田种植面积相近).5.某单位有118名员工,为了完成本月的生产任务,现要从中随机抽取16人加班.请用系统抽样法选出加班的人员.思考探究1.写出下列各题的抽样过程:(1)请从拥有500个分数的总体中用简单随机抽样方法抽取一个容量为30的样本.(2)某车间有189名职工,现在要按1∶21的比例选派质量检查员,采用系统抽样的方法进行.(3)一个电视台在因特网上就观众对某一节目喜爱的程度进行调查,被调查的总人数为12 000人,其中持各种态度的人数如下:很喜爱 喜爱 一般 不喜爱2 435 4 567 3 926 1 072打算从中抽取60人进行详细调查,如何抽取?第一节 随机抽样 答案一、选择题:1-5DDBBD 6-10 BBCC 11-13CBD二、填空题:1. 0.05 2 ④,⑤,⑥ 3. 4.5. 6.简单随机抽样 7. 0123,1123,2123,3123,4123,5123,6123,7123,8123,9123. 系统抽样. 8.80. 9. 5;35;47.三、解答题:1解:抽取人数与职工总数的比是100:500=1:5,则各年龄段(层)的职工人数依次是125:280:95=25:56:19,然后分别在各年龄段(层)运用简单随机抽样方法抽取.所以,在分层抽样时,不到35岁、35~49岁、50岁以上的三个年龄段分别抽取25人、56人和19人.2.解:从高三年级抽取的学生人数为而抽取的比例为,高中部共有的学生为3. 解:而抽取的比例为,在不到岁的教师中应抽取的人数为 4. 解(1)总体为该粮食基地的粮食总产量;样本为收割的两小块作物的产量;样本容量为2.(2)高产田亩产1306.7斤,低产田亩产573.3斤. (3)生产队亩产940斤.5.解析:(1)对这118名员工进行编号;(2)计算间隔k==7.375,由于k不是一个整数,我们从总体中随机剔除6个样本,再来进行系统抽样.例如我们随机剔除了3,46,59,57,112,93这6名员工,然后再对剩余的112位员工进行编号,计算间隔k=7;(3)在1~7之间随机选取一个数字,例如选5,将5加上间隔7得到第2个个体编号12,再加7得到第3个个体编号19,依次进行下去,直到获取整个样本.思考探究1.解析:(1)①将总体的500个分数从001开始编号,一直到500号;②从随机数表第1页第1行第2至第4列的347号开始使用该表;③抄录入样号码如下:347 437 386 469 011 410 145 073 245 276 329 050 176 099 061 030 227 482 378 096 164 001 068 047 025 212 016 105 443 212④按以上编号从总体中将相应的分数提取出来组成样本,抽样完毕.(2)采取系统抽样.189÷21=9,所以将189人分成9组,每组21人,在每一组中随机抽取1人,这9人组成样本.(3)采取分层抽样.总人数为12 000人,12 000÷60=200,=12…35(人),=22…167(人),=19…126(人),=5…72(人).所以从很喜爱的人中剔除35人,再抽取12人;从喜爱的人中剔除167人,再抽取22人;从一般喜爱的人中剔除126人,再抽取19人;从不喜爱的人中剔除72人,再抽取5人.第三节 变量间的相关关系考点汇集1.相关关系:变量间的确存在一定的关系,但又不具备函数所要求的确定性,即它们的关系带有不确定性,则称这两个变量具有相关关系.2.正相关与负相关:在两个具有相关关系的变量中一个变量的值由小到大,另一个变量的值总体也在变大,我们称这种相关为正相关,反之,若另一个变量的值总体上由大变小,我们称这种相关为负相关.3.线性相关关系:像能用直线方程近似表示的相关关系叫做线性相关关系.4.线性回归方程:一般地,设有个观察数据如下:……,(*) , 5.求线性回归方程的步骤:(4)将上述有关结果代入公式,求,写出回归直线方程.自主反馈一、选择题:1.下列两个变量之间的关系哪个不是函数关系 ( )A.角度和它的余弦值 B.正方形边长和面积C.正n边形的边数和它的内角和 D.人的年龄和身高2.下列两变量具有相关关系的是 ( )A .正方体的体积与边长 B.人的身高与体重C.匀速行驶车辆的行驶距离与时间 D.球的半径与体积3.下列说法中不正确的是 ( )A回归分析中,变量x和y都是普通变量B变量间的关系若是非确定性关系,那么因变量不能由自变量唯一确定C回归系数可能是正的也可能是负的D如果回归系数是负的,y的值随x的增大而减小4.线性回归方程=bx+a必过 ( )A、(0,0) B、(,0) C、(0,) D、(,)5.三点的线性回归方程是 ( )A. B. C. D.6..下面现象间的关系属于线性相关关系的是 ( )A.圆的周长和它的半径之间的关系B.价格不变条件下,商品销售额与销售量之间的关系C.家庭收入愈多,其消费支出也有增长的趋势D.正方形面积和它的边长之间的关系7...有关线性回归的说法中,下列不正确的是 ( )A.相关关系的两个变量不是因果关系B.散点图能直观地反映数据的相关程度C.回归直线最能代表线性相关的两个变量之间的关系D.任一组数据都有回归方程二、填空题:8.有下列关系:① 人的年龄与他(她)拥有的财富之间的关系;② 曲线上的点与该点的坐标之间的关系;③ 苹果的产量与气候之间的关系;④ 森林中的同一种树木,其断面直径与高度之间的关系;⑤ 学生与他(她)的学号之间的关系、其中有相关关系的是 .9.对于回归方程,当x=28时,y的估计值是 .三、解答题:10.给出施化肥量对水稻产量影响的试验数据:施化肥量x15202530354045水稻产量y330345365405445450455(1)画出上表的散点图;(2)求出回归直线并且画出图形 11.某种合金的抗拉强度y(kg/m)与其中的含碳量x(%)有关,今测得12对数据如下表所示:x0.100.110.120.130.140.15y42.043.545.045.545.047.5x0.160.170.180.200.210. 23y49.053.050.055.055.060.0利用上述资料:(1)作出抗拉强度y关于含碳量x的散点图;(2)建立y关于x的一元线性回归方程.12.为考虑广告费用x与销售额y之间的关系,抽取了5家餐厅,得到如下数据:广告费用(千元)1.04.06.010.014.0销售额(千元)19.044.040.052.053.0(1)在同一张图上画散点图,直线(1)=24+2.5x,(2)=;(2)比较所画直线与曲线,哪一条更能表现这组数据之间的关系?(3)分别计算用直线方程与曲线方程得到在5个x点处的销售额预测值、预测值与实际预测之间的误差,最后比较两个误差绝对值之和的大小.思考探究13.我们考虑两个表示变量与之间的关系的模型,为误差项,模型如下:模型1:;模型2:.(1)如果,分别求两个模型中的值;(2)分别说明以上两个模型是确定性模型还是随机模型.第三节 变量间的相关关系 答案一、选择题:1-5 D B A D D 6-7 C D二、填空题:8.①③④ 9.390三、解答题10. 解:(1)散点图(略).(2)表中的数据进行具体计算,列成以下表格i1234567xi15202530354045yi330345365405445450455xiyi49506900912512150155751800020475,故可得到 从而得回归直线方程是.(图形略)11. 解:(1)散点图略(2)从散点图看两变量x,y的线性关系,一元线性回归方程为:y=130、835x+28、49312.解:(1)所求图形如右图.(2)从图形上看,曲线(2)=比直线(1) =24+2.5x更能表现出这组数据之间的关系.(3)列表略:用直线(1)=24+2.5x近似数据时,误差绝对值的和为27.5.用曲线(2)=近似数据时,误差绝对值的和为12.5,比前者小得多13.(1)模型1:;模型2:(2)模型1中相同的值一定得到相同的值,所以是确定性模型;模型2中相同的值,因的不同,所得值不一定相同,且为误差项是随机的,所以模型2是随机性模型第二节 用样本估计总体考点汇集1.画频率分布直方图的一般步骤为:(1)计算一组数据中最大值与最小值的差,即求极差(2)决定组距与组数 (3)将数据分组(4)列频率分布表 (5)画频率分布直方图2.茎叶图的画法:一般地:当数据是一位和两位有效数字时,用中间的数字表示十位数,即第一个有效数字,两边的数字表示个位数,即第二个有效数字,它的中间部分像植物的茎,两边部分像植物茎上长出来的叶子,因此通常把这样的图叫做茎叶图。茎按从小到大的顺序从上向下列出,共茎的叶一般按从大到小(或从小到大)的顺序同行列出。3. 样本数据的标准差的算法:(1)算出样本数据的平均数。(2)算出每个样本数据与样本数据平均数的差:(3)算出(2)中的平方。(4)算出(3)中n个平方数的平均数,即为样本方差。(5)算出(4)中平均数的算术平方根,,即为样本标准差。其计算公式为:标准差较大,数据的离散程度较大;标准差较小,数据的离散程度较小。4. 方差 自主反馈一、选择题:1.下列说法错误的是 ( )A.在统计里,把所需考察对象的全体叫作总体B.一组数据的平均数一定大于这组数据中的每个数据C.平均数、众数与中位数从不同的角度描述了一组数据的集中趋势D.一组数据的方差越大,说明这组数据的波动越大2.下列说法中,正确的是 ( ) A.数据5,4,4,3,5,2的众数是4B.一组数据的标准差是这组数据的方差的平方C.数据2,3,4,5的标准差是数据4,6,8,10的标准差的一半D.频率分布直方图中各小长方形的面积等于相应各组的频数3.从甲、乙两班分别任意抽出10名学生进行英语口语测验,其测验成绩的方差分别为S12= 13.2,S22=26.26,则 ( ) A.甲班10名学生的成绩比乙班10名学生的成绩整齐 B.乙班10名学生的成绩比甲班10名学生的成绩整齐C.甲、乙两班10名学生的成绩一样整齐D.不能比较甲、乙两班10名学生成绩的整齐程度4.某同学使用计算器求30个数据的平均数时,错将其中一个数据105输人为15,那么由此求出的平均数与实际平均数的 ( ) A.3.5 B.-3 C.3 D.-0.55. 已知一组数据1、2、y的平均数为4,那么 ( ) A.y=7 B.y=8 C.y=9 D.y=106. 甲、乙、丙、丁四人的数学测验成绩分别为90分、90分、x分、80分,若这组数据的众数与平均数恰好相等,则这组数据的中位数是 ( ) A.100分 B.95分 C.90分 D.85分 7.如果一组数中每个数减去同一个非零常数,则这一组数的 ( ) A.平均数不变,方差不变 B.平均数改变,方差改变C.平均数不变,方差改变 D.平均数改变,方差不变8.从鱼塘捕得同一时间放养的草鱼240尾,从中任选9尾,称得每尾鱼的质量分别是1.5,1.6,1.4,1.6,1.3,1.4,1.2,1.7,1.8(单位:千克).依此估计这240尾鱼的总质量大约是 ( ).A.300克 B.360千克 C.36千克 D.30千克9.某篮球运动员在一个赛季的40场比赛中的得分的茎叶图如下图所示:则中位数与众数分别为 ( ) A.3与3 B.23与3 C.3与23 D.23与2310.为了了解某地区高三学生的身体发育情况,抽查了该地区100名年龄为17岁-18岁的男生体重(kg) ,得到频率分布直方图如下图.根据上图可得这100名学生中体重在〔56.5,64.5〕的学生人数是 ( )A.20 B.30 C.40 D.5011.从一群学生中抽取一个一定容量的样本对他们的学习成绩进行分析,已知不超过70分的人数为8人,其累计频率为0.4,则这样的样本容量是 ( ) A. 20人 B. 40人 C. 70人 D. 80人12.某农科所种植的甲、乙两种水稻,连续六年在面积相等的两块稻田中作对比试验,试验得出平均产量是==415㎏,方差是=794,=958,那么这两个水稻品种中产量比较稳定的是 ( ) A.甲 B.乙 C.甲、乙一样稳定 D.无法确定13. 一个容量为20的样本数据,分组后组距与频数如下:[10,20]2个,[20,30]3个,[30,40]4个,[40,50]5个,[50,60]4个,[60,70]2个,则样本在区间(-∞,50)上的频率为 ( )A.5% B.25% C.50% D.70%二、填空题:1.一个容量为n的样本,分成若干组,已知某组的频数和频率分别是40,0.125,则n=_____.2.管理人员从一池塘内捞出30条鱼,做上标记后放回池塘.10天后,又从池塘内捞出50条鱼,其中有标记的有2条.根据以上数据可以估计该池塘内共有_______条鱼.3 已知样本的平均数是,标准差是,则 4 一个容量为的样本,已知某组的频率为,则该组的频数为_________ 5.有6个数4,x,-1,y,z,6,它们的平均数为5,则x,y,z三个数的平均数为 . 6.有一个简单的随机样本10,12,9,14,13,则样本平均数= ,样本方差s2= .三、解答题:1.为了解某地初三年级男生的身高情况,从其中的一个学校选取容量为60的样本(60名男生的身高),分组情况如下:分组频数频率147.5~155.56155.5~163.52l163.5~171.5a171.5~179.5m0.1(1)求出表中a,m的值. (2)画出频率分布直方图和频率折线图2.某中学高二(2)班甲、乙两名同学自高中以来每场数学考试成绩如下:甲的得分:95,81,75,91,86,89,71,65,76,88,94,110,107;乙的得分:83,86,93,99,88,130,98,114,98,79,101.画出两人数学成绩茎叶图,请根据茎叶图对两人的成绩进行比较.3 已知辆汽车通过某一段公路时的时速的频率分布直方图如下图所示,求时速在的汽车大约有多少辆? 4 对甲、乙的学习成绩进行抽样分析,各抽门功课,得到的观测值如下: 问:甲、乙谁的平均成绩最好?谁的各门功课发展较平衡?5.从一台机器生产某零件中随机抽取5个,测得长度x分别为10.02,10.06,10.00,9.94,10.08(cm).该零件的标准长度为10 cm.(1)求出式子x=x′+10中的x′、、;(2)求方差和标准差.6.为了估计某产品寿命的分布,对产品进行追踪调查,记录如下:寿命100~200200~300300~400400~500500~600个 数2030804030(1)画出频率分布直方图;(2)估计产品在200~500以内的频率.思考探究1.甲、乙两人参加某体育项目训练,近期的五次测试成绩得分情况如下图所示.分别求出两人得分的平均数与方差; 根据图和上面算得的结果,对两人的训练成绩作出评价.第二节 用样本估计总体 答案一、选择题:1-5 BCABC 6-10 CDBDC 11-13AAD二、填空题:1、320 2、750 3、96 4、5 5、14.7 6、11.6, 3.44 三、解答题:1.(1)a=0.45,m=6 (2)略2. 图略从这个茎叶图上可看出,乙同学的得分情况是大致对称的,中位数是99;甲同学的得分情况除一个特殊得分外,也大致对称,中位数是89.因此乙同学发挥比较稳定,总体得分情况比甲同学好.3. 解:在的汽车的频率为,在的汽车有 4. ∵ ∴ 甲的平均成绩较好,乙的各门功课发展较平衡5. (1)x′分别为0.02,0.06,0.00,-0.06,0.08,=0.02,=10.02.(2)方差s2=0.0024,标准差s≈0.049(只需计算x′的方差和标准差).6. 解: (1)频率分布直方图如下.(2) 答案:0.75.思考探究1.解:(1)甲=13,乙=13,s甲2=4,s乙2=0.8,s甲2=4>s乙2=0.8,乙的成绩比较稳定.从折线图看,甲的成绩基本上是上升状态,而乙的成绩在水平线上、下波动,可知甲的成绩在不断提高,而乙的成绩则无明显提高. 展开更多...... 收起↑ 资源列表 第一节 随机抽样.doc 第三节 变量间的相关关系.doc 第二节 用样本估计总体.doc