资源简介 第八章 成对数据的统计分析 单元测试一、单选题1.在研究肥胖与高血压的关系时,通过收集数据、整理分析数据得到“高血压与肥胖有关”的结论,并且在犯错误的概率不超过0.01的前提下认为这个结论是成立的.下列说法中正确的是( )A.在100个高血压患者中一定有肥胖的人B.在100个肥胖的人中至少有99人患有高血压C.在100个高血压患者中可能没有肥胖的人D.肥胖的人至少有99%的概率患有高血压2.为研究某咖啡店每日的热咖啡销售量和气温之间是否具有线性相关关系,统计该店2017年每周六的销售量及当天气温得到如图所示的散点图(轴表示气温,轴表示销售量),由散点图可知与的相关关系为( )A.正相关,相关系数的值为B.负相关,相关系数的值为C.负相关,相关系数的值为D.正相关,相关负数的值为3.已知变量与的数据如下表所示,若关于的经验回归方程是,则表中( )1 2 3 4 510 11 13 15A.11 B.12 C.12.5 D.134.甲、乙、丙、丁四位同学各自对,A,B两变量的线性相关性做试验,并用回归分析方法分别求得相关系数r与残差平方和m如下表:甲 乙 丙 丁r 0.82 0.78 0.69 0.85m 106 115 124 103则能体现A,B两变量有更强的线性相关性的是( )A.甲 B.乙 C.丙 D.丁5.在一组样本数据,,…,(,,…不全相等)的散点图中,若所有样本点都在直线上,则这组样本数据的样本相关系数为A.-3 B.0 C.-1 D.16.足球运动是深受学生喜爱的一项体育运动,为了研究是否喜爱足球运动与学生性别的关系,从某高校男女生中各随机抽取80名学生进行调查问卷,得到如下数据():喜爱 不喜爱男生女生若有90%以上的把握认为是否喜爱足球运动与学生性别有关,则m的最小值为( )附:.其中.0.25 0.10 0.05 0.001k 2.072 2.706 3.841 6.635A.17 B.15 C.13 D.117.某商场为了了解不同厂家生产的散装面包的月销售量(千克)与售价(元/千克)之间的关系,随机统计了某几个月的月销售量与当月各散装面包的售价,相关数据如下表:售价(元/千克)月销售量(千克)由表中数据算出线性回归方程为,则样本在处的残差为A. B. C. D.8.根据如下样本数据,得到线性回归方程为,若样本点的中心为,则当X每增加1个单位时,Y平均( )X 3 4 5 6 7Y 4.0 -0.5 0.5A.增加1.4个单位 B.减少1.4个单位C.增加7.9个单位 D.减少7.9个单位二、多选题9.在利用统计量来判断两个变量X与Y之间是否有关系时,下列说法正确的是( ).A.越大,“X与Y有关系”的可信程度越小B.越小,“X与Y有关系”的可信程度越小C.越接近于0,“X与Y没有关系”的可信程度越小D.越大,“X与Y没有关系”的可信程度越小10.给出以下四个说法,其中正确的说法有( )A.绘制频率分布直方图时,各小长方形的面积等于相应各组的组距B.在刻画回归模型的拟合效果时,的值越大,说明拟合的效果越好C.设随机变量服从正态分布,则D.对分类变量与,若计算出的越小,则判断“与有关系”的犯错误的概率越小11.有甲、乙两个班级共计105人进行数学考试,按照大于等于85分为优秀,85分以下为非优秀统计成绩,得到如下所示的列联表:参考公式:优秀 非优秀 总计甲班 10 b乙班 c 300.050 0.010 0.001k 3.841 6.635 10.828已知在全部105人中随机抽取1人,成绩优秀的概率为,则下列说法正确的是( )A.列联表中c的值为30,b的值为35B.列联表中c的值为20, b的值为45C.根据列联表中的数据,若按95%的可靠性要求,能认为“成绩与班级有关系”D.根据列联表中的数据,若按95%的可靠性要求,不能认为“成绩与班级有关系”三、填空题12.已知与之间的一组数据:1 2 3 43.2 4.8 7.5若关于的线性回归方程为,则的值为 .13.将两个变量x、y的n对样本数据,,,…,在平面直角坐标系中表示为散点图,根据x、y满足一元线性回归模型及最小二乘法,求得其经验回归方程为.设为回归直线上的点,则下列说法正确的是 .①越小,说明模型的拟合效果越好;②利用最小二乘法求出的线性回归直线一定经过散点图中的某些点;③相关系数r的绝对值越接近于1,说明成对样本数据的线性相关程度越强;④通过经验回归方程进行预报时,解释变量的取值不能距离样本数据的范围太远,求得的预报值不是相应变量的精确值.14.针对“中学生追星问题”,某校团委对“学生性别和中学生追星是否有关“作了一次调查,其中女生人数是男生人数的,男生追星的人数占男生人数的,女生追星的人数占女生人数的,若有的把握认为中学生追星与性别有关,则女生至少有 人.参考数据及公式如下:0.050 0.010 0.0013.841 6.635 10.828,.四、解答题15.春节期间,由于高速免费,车流量逐步增加,某高速口统计了5天中的车流量与空气质量指数的关系,所得数据如下表所示:车流量x(万辆) 12 12.5 13 13.5 14空气质量指数y 74 76 78 77 80(1)在下列网格纸中绘制出散点图;(2)观察散点图的趋势,如果能看成线性关系,请在图中画出一条直线来近似地表示这种关系,并计算车流量与空气质量指数的相关系数.16.下表提供了某厂进行技术改造后生产产品过程中记录的产能(单位:)与相应的生产能耗(单位:标准煤)的几组对应数据:3 4 5 6标准煤 3.5 4 5 5.5(1)求关于的经验回归方程;(2)已知该厂技术改造前产品的生产能耗为标准煤,试根据(1)中求出的经验回经验回归方程,预测该厂技术改造后产品的生产能耗比技术改造前降低了多少标准煤.参考公式:17.随机抽取10家航空公司,对其最近一年的航班正点率和顾客投诉次数进行调查,所得数据如下:航空公司编号 1 2 3 4 5 6 7 8 9 10航班正点率/% 81.8 76.8 76.6 75.7 73.8 72.2 71.2 70.8 91.4 68.5顾客投诉/次 21 58 85 68 74 93 72 122 18 125顾客投诉次数和航班正点率之间是否呈现出线性相关关系?它们之间的相关程度如何?变化趋势有何特征?18.某种产品的广告费支出x(单位:百万元)与销售额y(单位:百万元)之间有如下对应数据:x 2 4 5 6 8y 30 40 60 50 70(1)画出散点图;(2)求回归直线方程.参考公式19.随机抽取对成年母女的身高数据(单位:),试据此建立母亲身高与女儿身高的回归方程.母亲身高 154 157 158 159 160 161 162 163女儿身高 155 156 159 162 161 164 165 166《第八章 成对数据的统计分析 单元测试》参考答案题号 1 2 3 4 5 6 7 8 9 10答案 C C A D C B B B BD BC题号 11答案 BC1.C【分析】由独立性检验的含义进行分析判断即可得解.【详解】因为在犯错误的概率不超过0.01的前提下认为这个结论是成立的,得有99%的把握认为“高血压与肥胖有关”,只是结论成立的可能性,与有多少个人患高血压无关,更谈不上概率,A,B,D不正确,C正确.故选:C2.C【分析】根据正负相关的概念判断.【详解】由散点图知随着的增大而减小,因此是负相关.相关系数为负.故选:C.【点睛】本题考查变量的相关关系,考查正相关和负相关的区别.掌握正负相关的定义是解题基础.3.A【分析】利用样本中心点求解即可.【详解】,因为经验回归方程经过样本中心,所以,解得.故选:A.4.D【分析】在验证两个变量之间的线性相关关系中,相关系数的绝对值越接近于1,相关性越强,残差平方和越小,相关性越强,得到结果.【详解】在验证两个变量之间的线性相关关系中,相关系数的绝对值越接近于1,相关性越强,在四个选项中只有丁的相关系数最大,残差平方和越小,相关性越强,只有丁的残差平方和最小,综上可知丁的试验结果体现、两变量有更强的线性相关性,故选:D.5.C【详解】因为所有样本点都在直线上,所以回归直线方程是,可得这两个变量是负相关,故这组样本数据的样本相关系数为负值,且所有样本点,都在直线上,则有相关系数,故选C.6.B【分析】由列联表计算观测值,根据有90%以上的把握认为是否喜爱足球运动与学生性别有关列出不等式,求出m的最小值.【详解】因为有90%以上的把握认为是否喜爱足球运动与学生性别有关,所以,即,因为在,时单调递增,且,,所以m的最小值为15.故选:B.7.B【解析】根据表中的数据求出,利用回归直线方程经过样本中心点求出,把 代入回归直线方程求出,利用残差的定义即可求解.【详解】由表格得 为 ,又回归直线方程经过样本中心点,所以,解得,所以回归直线方程为,把 代入回归直线方程可得,,故样本在 处的残差为.故选:B【点睛】本题考查回归直线方程经过样本中心点和利用回归直线方程求某点处的残差;考查运算求解能力;熟练掌握回归直线方程经过样本中心点和残差的定义是求解本题的关键;属于中档题.8.B【分析】根据已知条件解出m和n,得到线性回归方程,即可得到答案.【详解】样本点的中心为,则,故,且,解得,,则,可知当X每增加1个单位时,Y平均减少1.4个单位.故选:B.9.BD【分析】根据独立性检验,得到越大,说明与“X与Y有关系”成立的可信程度越大,即可求解.【详解】根据独立性检验,可得当越大,说明与“X与Y有关系”成立的可信程度越大,反之越小.故选:BD.10.BC【分析】利用频率分布直方图相关知识可判断A选项;利用的值与回归模型的关系可判断B选项;利用正态分布密度曲线的对称性可判断C选项;利用独立型检验可判断D选项.【详解】对于A选项,绘制频率分布直方图时,各小长方形的面积等于相应各组矩形的面积,A错;对于B选项,在刻画回归模型的拟合效果时,的值越大,说明拟合的效果越差,B对;对于C选项,设随机变量服从正态分布,则,C对;对于D选项,对分类变量与,若计算出的越小,则判断“与有关系”的犯错误的概率越大,D错.故选:BC.11.BC【分析】由成绩优秀的概率,可求的成绩优秀的人数,进而求出非优秀人数,得到的值,计算的观测值,对照题目中的表格,即可得到统计的结论.【详解】由题意,在全部的105人中随机抽取1人,成绩优秀的概率为,所以成绩又由的人数为人,非优秀的人数为人,所以,则的观测值,若按95%的可靠性要求,能认为“成绩与班级有关系”.故选:BC.【点睛】本题主要考查了独立性检验的应用问题,同时考查了运算与求解能力,属于基础题.12.=4.5【解析】由题得,,解方程即得解.【详解】由题得,,所以,所以.故答案为:=4.5【点睛】结论点睛:回归方程经过样本中心点,这个结论是回归方程的一个重要知识点,要理解掌握并灵活运用.13.③④/【分析】根据已知条件,结合线性回归方程的性质逐个分析判断即可.【详解】对于①,对于线性回归方程,用相关系数来刻画回归效果,并非越小,模型的拟合效果就越好,所以①错误,对于②,利用最小二乘法求出的线性回归直线有可能不经过散点图中的所有点,所以②错误,对于③,相关系数r的绝对值越接近于1,说明成对样本数据的线性相关程度越强,所以③正确,对于④,若解释变量的取值超出样本数据范围太多,则导致预报值准确度降低,得到预报值已不是准确值,所以④正确,故答案为:③④14.20【分析】设男生人数为x,可得列联表,由此计算的表达式,根据有的把握认为中学生追星与性别有关,可得不等式,结合,可求得答案.【详解】设男生人数为x,则可得列联表如下:喜欢追星 不喜欢追星 合计男生女生合计则计算 ,若有的把握认为中学生追星与性别有关,则需,解得,又,故x至少为60,则女生至少有20人,即有 的把握认为中学生追星与性别有关时,女生至少有20人,故答案为︰20.15.(1)画图见解析(2)画图见解析,【分析】(1)根据表里数据标点即可;(2)根据公式计算相关系数;【详解】(1)(2)可以看成线性关系,如图所示,计算得:,;,;则.16.(1)(2)【分析】直接利用公式求解即可.【详解】(1)(2),即改造后预测生产能耗为.预测该厂改造后100t产品的生产能耗比技术改造前降低了标准煤.17.线性相关;;相关程度高,变化趋势是正点率提高一个百分点顾客投诉次数少约为.【分析】利用最小二乘法求出回归方程即可求解.【详解】设顾客投诉次数为,正点率为,,,设回归方程,,,将代入回归直线方程:可得,所以线性回归方程为:,相关系数,的绝对值越接近,相关性越强,所以相关程度高.变化趋势是正点率提高一个百分点顾客投诉次数少约为.18.(1)答案见解析(2)【分析】(1)直接描点,即可作出散点图;(2)根据所给的数据先求出横标和纵标的平均数,利用最小二乘法写出线性回归方程系数的表达式,把样本中心点代入求出a的值,得到线性回归方程;【详解】(1)散点图如图所示. 样本点分布在一条直线附近,y与x具有线性相关关系.(2)列出下表,并进行有关计算.1 2 3 4 52 4 5 6 830 40 60 50 7060 160 300 300 5604 16 25 36 64由题可得,,,,∴,∴,所以回归直线方程;19.【分析】设回归直线方程为,求出、的值,利用最小二乘法公式求出、的值,即可得出回归直线方程.【详解】解:设回归直线方程为,由表格中的数据可得,,所以,,,所以,,,因此,关于的回归方程为. 展开更多...... 收起↑ 资源预览