资源简介 (共33张PPT)周测卷8 (范围:§4.1~§4.3)第4章 统计(时间:50分钟 满分:100分)√一、单选题(本题共6小题,每小题5分,共30分)1.下列两个变量之间的关系不是函数关系的是A.角度和它的余弦值 B.正方形的边长和面积C.正n边形的边数和内角度数和 D.人的年龄和身高函数关系就是变量之间的一种确定性关系.A,B,C三项中的两个变量之间都是函数关系,可以写出相应的函数表达式,分别为f(θ)=cos θ,g(a)=a2,h(n)=(n-2)·π.D选项中的两个变量之间不是函数关系,对于年龄确定的人群,仍可以有不同的身高,故选D.√2.对于给定的两个变量的统计数据,下列说法正确的是A.都可以分析出两个变量之间的关系B.都可以用一条直线近似地表示两者的关系C.都可以作出散点图D.都可以用确定的表达式表示两者的关系给出一组样本数据,不一定能分析出两个变量的关系,更不一定符合线性相关,不一定用一条直线近似地表示,故A,B不正确;但总可以作出相应的散点图,C正确;两个变量的统计数据不一定有函数关系,故D不正确.√3.下列关于回归分析与独立性检验的说法正确的是A.回归分析和独立性检验没有什么区别B.回归分析是对两个变量准确关系的分析,而独立性检验是分析两个变量之间的不确定关系C.回归分析研究两个变量之间的相关关系,独立性检验是对两个变量是否具有某种关系的一种检验D.独立性检验可以100%确定两个变量之间是否具有某种关系由回归分析及独立性检验的特点知,选项C正确.√4.某产品在某零售摊位的零售价x(单位:元)与每天的销售量y(单位:个)的统计资料如下表所示:x 16 17 18 19y 50 34 41 31√5.考察棉花种子经过处理跟生病之间的关系得到下表数据: 处理 未处理 合计得病 32 101 133不得病 61 213 274合计 93 314 407P(χ2≥x0) 0.050 0.010 0.005x0 3.841 6.635 7.879根据以上数据,可得出A.有99%的把握认为种子是否经过处理跟是否生病有关B.没有充分的证据认为种子是否经过处理跟是否生病有关C.有95%的把握认为种子是否经过处理跟是否生病有关D.以上都是错误的√√二、多选题(本题共2小题,每小题6分,共12分)7.对于分类变量X与Y的随机变量χ2的值,下列说法正确的是A.χ2越大,“X与Y有关系”的可信程度越小B.χ2越小,“X与Y有关系”的可信程度越小C.χ2越接近于0,“X与Y没有关系”的可信程度越小D.χ2越大,“X与Y没有关系”的可信程度越小√χ2越大,“X与Y没有关系”的可信程度越小,则“X与Y有关系”的可信程度越大;χ2越小,“X与Y有关系”的可信程度越小.√√A项,将一组数据中的每一个数据都加上或减去同一个常数后,方差不变,正确;三、填空题(本题共3小题,每小题5分,共15分)9.已知求得甲、乙、丙3组不同数据的线性相关系数分别为0.81,-0.98,0.63,其中________(填“甲、乙、丙”中的一个)组数据的线性相关性最强.乙两个变量y与x的相关系数的绝对值越接近于1,它的线性相关性越强.在甲、乙、丙中,所给的数值中-0.98是相关系数绝对值最大的值,即乙的线性相关性最强.711.对甲、乙两个班级学生的数学考试成绩按照优秀和不优秀统计人数后,得到如下列联表:①②④ 优秀 不优秀 合计甲班 10 b 10+b乙班 c 30 30+c合计 10+c 30+b 40+b+c四、解答题(本题共3小题,共43分)12.(13分)“开门大吉”是某电视台推出的游戏节目,选手面对1~8号8扇大门,依次按响门上的门铃,门铃会播放一段音乐(将一首经典流行歌曲以单音色旋律的方式演绎),选手需正确回答出这首歌的名字,方可获得该扇门对应的家庭梦想基金.在一次场外调查中,发现参赛选手多数分为两个年龄段:20~30;30~40(单位:岁),其猜对歌曲名称与否的人数如图所示.(1)写出2×2列联表;根据所给的二维条形图得到列联表: 猜对歌曲名称 猜错歌曲名称 合计20~30岁年龄段 10 30 4030~40岁年龄段 10 70 80合计 20 100 120(2)能否作出猜对歌曲名称与年龄有关的结论?(下面的临界值表供参考)先提出统计假设H0:猜对歌曲名称与年龄无关.P(χ2≥x0) 0.05 0.01 0.005x0 3.841 6.635 7.879(2)求样本(xi,yi)(i=1,2,…,20)的相关系数(精确到0.01);样本(xi,yi)(i=1,2,…,20)的相关系数为分层抽样,根据植物覆盖面积的大小对地块分层,再对200个地块进行分层抽样.理由如下:由(2)知各样区的这种野生动物数量与植物覆盖面积有很强的正相关关系.由于各地块间植物覆盖面积差异很大,从而各地块间这种野生动物数量差异也很大,采用分层抽样的方法较好地保持了样本结构与总体结构的一致性,提高了样本的代表性,从而可以获得该地区这种野生动物数量更准确的估计.14.(15分)某工厂有25周岁以上(含25周岁)工人300名,25周岁以下工人200名.为研究工人的日平均生产量是否与年龄有关,现采用分层抽样的方法,从中抽取了100名工人,先统计了他们某月的日平均生产件数,然后按工人年龄在“25周岁以上(含25周岁)”和“25周岁以下”分为两组,再将两组工人的日平均生产件数分成5组:[50,60),[60,70),[70,80),[80,90),[90,100]分别加以统计,得到如图所示的频率分布直方图.(1)从样本中日平均生产件数不足60件的工人中随机抽取2人,求至少抽到一名“25周岁以下组”工人的概率;由已知得,样本中有25周岁以上组工人60名,25周岁以下组工人40名.所以,样本中日平均生产件数不足60件的工人中,25周岁以上组工人有60×0.05=3(人),记为A1,A2,A3;25周岁以下组工人有40×0.05=2(人),记为B1,B2.从中随机抽取2名工人,所有的可能结果共有10种,它们是:(A1,A2),(A1,A3),(A2,A3),(A1,B1),(A1,B2),(A2,B1),(A2,B2),(A3,B1),(A3,B2),(B1,B2).由频率分布直方图可知,在抽取的100名工人中,“25周岁以上组”中的生产能手60×0.25=15(人),P(χ2≥x0) 0.050 0.010 0.005x0 3.841 6.635 7.879据此可得2×2列联表如下: 是生产能手 非生产能手 合计25周岁以上组 15 45 6025周岁以下组 16 24 40合计 31 69 100周测卷8(范围:§4.1~§4.3)(时间:50分钟 满分:100分) 一、单选题(本题共6小题,每小题5分,共30分)1.下列两个变量之间的关系不是函数关系的是 ( )角度和它的余弦值 正方形的边长和面积正n边形的边数和内角度数和 人的年龄和身高2.对于给定的两个变量的统计数据,下列说法正确的是 ( )都可以分析出两个变量之间的关系 都可以用一条直线近似地表示两者的关系都可以作出散点图 都可以用确定的表达式表示两者的关系3.下列关于回归分析与独立性检验的说法正确的是 ( )回归分析和独立性检验没有什么区别回归分析是对两个变量准确关系的分析,而独立性检验是分析两个变量之间的不确定关系回归分析研究两个变量之间的相关关系,独立性检验是对两个变量是否具有某种关系的一种检验独立性检验可以100%确定两个变量之间是否具有某种关系4.某产品在某零售摊位的零售价x(单位:元)与每天的销售量y(单位:个)的统计资料如下表所示:x 16 17 18 19y 50 34 41 31由上表可得线性回归方程=-5,据此模型预测当零售价为14.5元时,每天的销售量为 ( )51个 50个54个 48个5.考察棉花种子经过处理跟生病之间的关系得到下表数据:处理 未处理 合计得病 32 101 133不得病 61 213 274合计 93 314 407 P(χ2≥x0) 0.050 0.010 0.005x0 3.841 6.635 7.879根据以上数据,可得出 ( )有99%的把握认为种子是否经过处理跟是否生病有关没有充分的证据认为种子是否经过处理跟是否生病有关有95%的把握认为种子是否经过处理跟是否生病有关以上都是错误的6.针对“中学生追星问题”,某校团委对“学生性别和中学生追星是否有关联”进行了一次调查,其中女生人数是男生人数的,男生追星的人数占男生人数的,女生追星的人数占女生人数的.假设H0:追星和性别无关联.若有95%的把握认为追星和性别有关联,则男生的人数至少为 ( )参考数据及公式如下P(χ2≥x0) 0.050 0.010 0.001x0 3.841 6.635 10.828χ2=.12 1110 18二、多选题(本题共2小题,每小题6分,共12分)7.对于分类变量X与Y的随机变量χ2的值,下列说法正确的是 ( )χ2越大,“X与Y有关系”的可信程度越小 χ2越小,“X与Y有关系”的可信程度越小χ2越接近于0,“X与Y没有关系”的可信程度越小 χ2越大,“X与Y没有关系”的可信程度越小8.下列说法中错误的是 ( )将一组数据中的每一个数据都加上或减去同一个常数后,方差不变设有一个回归直线方程=3-5x,变量x增加1个单位时,y平均增加5个单位回归直线方程必过点(,)设具有相关关系的两个变量x,y的相关系数为r,则|r|越接近于0,x,y之间的线性相关程度越高三、填空题(本题共3小题,每小题5分,共15分)9.已知求得甲、乙、丙3组不同数据的线性相关系数分别为0.81,-0.98,0.63,其中 (填“甲、乙、丙”中的一个)组数据的线性相关性最强. 10.已知n组成对样本数据确定的线性回归方程为=-x+2,且=4,通过分析,发现两组成对样本数据(-1.7,2.9),(-2.3,5.1)随机误差较大,除去这两组成对样本数据后,重新求得线性回归直线的斜率估计值为-1.5,则当x=-4时,= . 11.对甲、乙两个班级学生的数学考试成绩按照优秀和不优秀统计人数后,得到列联表:优秀 不优秀 合计甲班 10 b 10+b乙班 c 30 30+c合计 10+c 30+b 40+b+c已知在全部105人中随机抽取1人,成绩优秀的概率为,则下列说法正确的有 .(填序号) ①列联表中c的值为20,b的值是45;②列联表中c的值为15,b的值为50;③有95%的把握认为成绩优秀与班级有关系;④没有95%的把握认为成绩优秀与班极有关系.四、解答题(本题共3小题,共43分)12.(13分)“开门大吉”是某电视台推出的游戏节目,选手面对1~8号8扇大门,依次按响门上的门铃,门铃会播放一段音乐(将一首经典流行歌曲以单音色旋律的方式演绎),选手需正确回答出这首歌的名字,方可获得该扇门对应的家庭梦想基金.在一次场外调查中,发现参赛选手多数分为两个年龄段:20~30;30~40(单位:岁),其猜对歌曲名称与否的人数如图所示.(1)写出2×2列联表;(2)能否作出猜对歌曲名称与年龄有关的结论 (下面的临界值表供参考)P(χ2≥x0) 0.05 0.01 0.005x0 3.841 6.635 7.87913.(15分)某沙漠地区经过治理,生态系统得到很大改善,野生动物数量有所增加.为调查该地区某种野生动物的数量,将其分成面积相近的200个地块,从这些地块中用简单随机抽样的方法抽取20个作为样区,调查得到样本数据(xi,yi)(i=1,2,…,20),其中xi和yi分别表示第i个样区的植物覆盖面积(单位:公顷)和这种野生动物的数量,并计算得xi=60,yi=1 200, (xi-)2=80, (yi-)2=9 000, (xi-)(yi-)=800.(1)求该地区这种野生动物数量的估计值(这种野生动物数量的估计值等于样区这种野生动物数量的平均数乘以地块数);(2)求样本(xi,yi)(i=1,2,…,20)的相关系数(精确到0.01);(3)根据现有统计资料,各地块间植物覆盖面积差异很大,为提高样本的代表性以获得该地区这种野生动物数量更准确的估计,请给出一种你认为更合理的抽样方法,并说明理由.附:相关系数r=,≈1.414.14.(15分)某工厂有25周岁以上(含25周岁)工人300名,25周岁以下工人200名.为研究工人的日平均生产量是否与年龄有关,现采用分层抽样的方法,从中抽取了100名工人,先统计了他们某月的日平均生产件数,然后按工人年龄在“25周岁以上(含25周岁)”和“25周岁以下”分为两组,再将两组工人的日平均生产件数分成5组:[50,60),[60,70),[70,80),[80,90),[90,100]分别加以统计,得到如图所示的频率分布直方图.(1)从样本中日平均生产件数不足60件的工人中随机抽取2人,求至少抽到一名“25周岁以下组”工人的概率;(2)规定日平均生产件数不少于80件者为“生产能手”,根据已知条件完成2×2列联表,能否作出“生产能手”与工人所在的年龄组有关的结论 附:χ2= P(χ2≥x0) 0.050 0.010 0.005x0 3.841 6.635 7.879周测卷8 (范围:§4.1~§4.3)1.D [函数关系就是变量之间的一种确定性关系.A,B,C三项中的两个变量之间都是函数关系,可以写出相应的函数表达式,分别为f(θ)=cos θ,g(a)=a2,h(n)=(n-2)·π.D选项中的两个变量之间不是函数关系,对于年龄确定的人群,仍可以有不同的身高,故选D.]2.C [给出一组样本数据,不一定能分析出两个变量的关系,更不一定符合线性相关,不一定用一条直线近似地表示,故A,B不正确;但总可以作出相应的散点图,C正确;两个变量的统计数据不一定有函数关系,故D不正确.]3.C [由回归分析及独立性检验的特点知,选项C正确.]4.C [由题意知=17.5,=39,代入线性回归方程得39=-5×17.5+,故=126.5,当x=14.5时,=-5×14.5+126.5=54.]5.B [由χ2=≈0.164<3.841,故没有充分的证据显示种子是否经过处理跟是否生病有关.]6.A [设男生人数为x,依题意可得如下2×2列联表喜欢追星 不喜欢追星 合计男生 x女生合计 x若有95%的把握认为追星和性别有关联,则χ2≥3.841.由χ2=≥3.841,解得x≥10.243.因为,为整数,所以男生的人数至少为12.故选A.]7.BD [χ2越大,“X与Y没有关系”的可信程度越小,则“X与Y有关系”的可信程度越大;χ2越小,“X与Y有关系”的可信程度越小.]8.BD [A项,将一组数据中的每一个数据都加上或减去同一个常数后,方差不变,正确;B项,设有一个回归直线方程=3-5x,变量x增加1个单位时,y平均减少5个单位,因此不正确;C项,回归直线方程必过点(,),正确;D项,设具有相关关系的两个变量x,y的相关系数为r,则|r|越接近于0,x,y之间的线性相关程度越弱,因此不正确.]9.乙 [两个变量y与x的相关系数的绝对值越接近于1,它的线性相关性越强.在甲、乙、丙中,所给的数值中-0.98是相关系数绝对值最大的值,即乙的线性相关性最强.]10.7 [由样本数据点集{(xi,yi)|i=1,2,…,n},求得的线性回归方程为=-x+2,且=4,所以=-2,故数据的样本中心点为(-2,4),去掉(-1.7,2.9),(-2.3,5.1),重新求得的线性回归直线的斜率估计值为-1.5,线性回归方程设为,代入(-2,4),求得=1,所以线性回归方程为y=-1.5x+1,将x=-4代入线性回归方程,求得y的估计值为-1.5×(-4)+1=7.]11.①②④ [由题意可得,成绩优秀的学生人数是105×=30,成绩不优秀的学生人数是105-30=75,所以c=20,b=45,故①正确,②错误;因为χ2=≈6.1>3.841,所以有95%的把握认为成绩优秀与班级有关系,③正确,④错误.故填①③.]12.解 (1)根据所给的二维条形图得到列联表:猜对歌曲名称 猜错歌曲名称 合计20~30岁年龄段 10 30 4030~40岁年龄段 10 70 80合计 20 100 120(2)先提出统计假设H0:猜对歌曲名称与年龄无关.根据列联表所给的数据计算得χ2==3<3.841,所以没有充分的证据显示猜对歌曲名称与年龄有关.13. 解 (1)由已知得样本平均数为=yi=60,从而该地区这种野生动物数量的估计值为60×200=12 000.(2)样本(xi,yi)(i=1,2,…,20)的相关系数为r===≈0.94.(3)分层抽样,根据植物覆盖面积的大小对地块分层,再对200个地块进行分层抽样.理由如下:由(2)知各样区的这种野生动物数量与植物覆盖面积有很强的正相关关系.由于各地块间植物覆盖面积差异很大,从而各地块间这种野生动物数量差异也很大,采用分层抽样的方法较好地保持了样本结构与总体结构的一致性,提高了样本的代表性,从而可以获得该地区这种野生动物数量更准确的估计.14.解 (1)由已知得,样本中有25周岁以上组工人60名,25周岁以下组工人40名.所以,样本中日平均生产件数不足60件的工人中,25周岁以上组工人有60×0.05=3(人),记为A1,A2,A3;25周岁以下组工人有40×0.05=2(人),记为B1,B2.从中随机抽取2名工人,所有的可能结果共有10种,它们是:(A1,A2),(A1,A3),(A2,A3),(A1,B1),(A1,B2),(A2,B1),(A2,B2),(A3,B1),(A3,B2),(B1,B2).其中,至少有1名“25周岁以下组”工人的可能结果共有7种,它们是:(A1,B1),(A1,B2),(A2,B1),(A2,B2),(A3,B1),(A3,B2),(B1,B2).故所求的概率P=.(2)由频率分布直方图可知,在抽取的100名工人中,“25周岁以上组”中的生产能手60×0.25=15(人),“25周岁以下组”中的生产能手40×10×(0.035+0.005)=16(人),据此可得2×2列联表如下:是生产能手 非生产能手 合计25周岁以上组 15 45 6025周岁以下组 16 24 40合计 31 69 100先提出统计假设H0:生产能手与工人所在的年龄组无关.由列联表得χ2=≈2.525<3.841.所以我们没有充分理由认为“生产能手”与工人所在年龄组有关. 展开更多...... 收起↑ 资源列表 周测卷8(范围§4.1~§4.3).docx 周测卷8 (范围:§4.1~§4.3).pptx