第八章 成对数据的统计分析 单元测试(含解析) 高中数学人教A版(2019)选择性必修第三册

资源下载
  1. 二一教育资源

第八章 成对数据的统计分析 单元测试(含解析) 高中数学人教A版(2019)选择性必修第三册

资源简介

第八章 成对数据的统计分析 单元测试卷
一、选择题:本题共8小题,每小题5分,共40分.在每小题给出的四个选项中,只有一项符合题目要求.
1.下列说法正确的是( )
A.任何两个变量都具有相关关系
B.球的体积与该球的半径具有相关关系
C.农作物的产量与施化肥量之间是一种确定性关系
D.一个学生的数学成绩与物理成绩之间是一种非确定性的关系
2.根据与之间的一组数据求得两个变量之间的线性回归方程为,已知:数据的平均值为,则此回归直线必过点( )
A. B. C. D.
3.关于线性回归的描述,下列表述错误的是( )
A.回归直线一定经过样本中心点
B.相关系数越大,相关性越强
C.决定系数越接近1,拟合效果越好
D.残差图的带状区域越窄,拟合效果越好
4.下列关于K2的说法正确的是(  )
A.K2在任何相互独立问题中都可以用来检验有关还是无关
B.K2的值越大,两个事件的相关性就越大
C.K2是用来判断两个分类变量是否有关系的,只对于两个分类变量适合
D.K2的观测值k的计算公式为
5.为了研究某大型超市开业天数与销售额的情况,随机抽取了5天,其开业天数与每天的销售额的情况如表所示,根据上表提供的数据,求得关于的线性回归方程为,请推断出数据m的值为( )
开业天数 10 20 30 40 50
销售额/天(万元) 62 m 75 81 89
A.68 B.68.3 C.71 D.71.3
6.某医疗研究所为了检验新开发的流感疫苗对流感的预防作用,根据1000名注射了疫苗的人与另外1000名未注射疫苗的人半年的感冒记录作出如下的的列联表,并提出假设“这种疫苗不能起到预防流感的作用”’则下列说法正确的是( )
患流感 未患流感 合计
注射疫苗 200 800 1000
未注射疫苗 260 740 1000
合计 460 1540 2000
附:.
0.100 0.050 0.025 0.010
2.706 3.841 5.024 6.635
A.这种疫苗能起到预防流感的有效率为99%;
B.若某人未使用该疫苗,则他在半年中有超过99%的可能性得流感;
C.有1%的把握认为“这种疫苗能起到预防流感的作用”;
D.有99%的把握认为“这种疫苗能起到预防流感的作用”.
7.收集一只棉铃虫的产卵数与温度的几组数据后发现两个变量有相关关系,按不同的曲线来拟合与之间的回归方程,并算出了对应的决定系数如下表:
拟合曲线 直线 指数曲线 抛物线 二次曲线
与的回归方程
0.746 0.996 0.902 0.002
则这组数据模型的回归方程的最好选择应是( )
A. B.
C. D.
8.已知变量x,y的关系可以用模型拟合,设,其变换后得到一组数据下:
16 17 18 19
50 34 41 31
由上表可得线性回归方程,则c=(  )
A. B. C.109 D.
二、选择题:本题共4小题,每小题5分,共20分.在每小题给出的选项中,有多项符合题目要求.全部选对的得5分,有选错的得0分,部分选对的得2分.
9.已知由样本数据,、、、、、求得的经验回归方程为,且.现发现一个样本数据误差较大,去除该数据后重新求得的经验回归直线的纵截距依然是,则下列说法正确的是( )
A.去除前变量每增加个单位,变量一定增加个单位
B.去除后剩余样本数据中的平均数为
C.去除后的经验回归方程为
D.去除后相关系数变大
10.为了研究演员上春晚次数与其粉丝数量(单位:百万人)的关系,某网站对其中一位演员上春晚次数与其相应的粉丝数量进行了统计,得到如下数据:
上春晚次数x 2 3 5 6
粉丝数量y 5 7 9 11
由表中数据,得经验回归直线l:,则下列结论错误的是( )
附:.
A. B.
C.直线l过点 D.直线l过点
11.下列说法正确的的有( )
A.已知一组数据,,,的方差为3,则,,,的方差也为3
B.对具有线性相关关系的变量x,y,其线性回归方程为,若样本点的中心为,则实数m的值是
C.已知随机变量X服从正态分布,若,则
D.已知随机变量X服从二项分布,若,则
12.下列命题正确的是( )
A.已知随机变量,若.则
B.已知分类变量与的随机变量的观察值为,则当的值越大时,“与有关”的可信度越小.
C.在线性回归模型中,计算其相关指数,则可以理解为:解析变量对预报变量的贡献率约为
D.若对于变量与的组统计数据的线性回归模型中,相关指数.又知残差平方和为.那么.(注意:)
三、填空题:本题共4小题,每小题5分,共20分.
13.某高校《统计》课程的教师随机调查了选该课的一些学生情况,具体数据如下表:为了判断主修统计专业是否与性别有关系,根据表中的数据,得到
专业 性别 非统计专业 统计专业
男 13 10
女 7 20
因为,所以有 的把握判定主修统计专业与性别有关系.
14.对于相关系数,下列说法中错误的是 .
①时,成对样本数据线性相关程度较弱;
②时,表明成对样本数据正相关;
③若线性回归方程中的回归系数,则相关系数;
④越接近1,线性相关程度越强,越接近0,线性相关程度越弱.
15.为了解某小区居民的家庭年收入(万元)与年支出(万元),随机调查了该小区的10户家庭,根据调查数据可得关于的回归直线方程为,,.若该小区某家庭的年收入为30万元,则估计该家庭的年支出为 万元.
16.某单位为了了解用电量与气温之间的关系,随机统计了某4天的用电量与当天的气温,并制作了对照表:
气温x() 2 16 12 4
用电量y(度) 14 28 44 62
由表中数据得到回归直线方程,则预测当气温为时,用电量的度数是 .
四、解答题:本题共6小题,共70分.解答应写出文字说明、证明过程或演算步骤.
17.现随机抽取了我校10名学生在入学考试中的数学成绩(x)与入学后的第一次考试数学成绩(y),数据如下表:
学生号 1 2 3 4 5 6 7 8 9 10
x 120 108 117 104 103 110 104 105 99 108
y 84 64 84 68 69 68 69 46 57 71
计算这10个学生的两次数学考试成绩的样本相关系数r,并判断两者是否具有线性相关关系.
18.每年的“双十一”既是旺季来临的标志,也是全年营销的大战役.不管是线上,还是线下都会有各种宣传广告推出各类特价商品,包括日用百货、食品、电器、服装、生鲜等等.据一商家统计,某商品的广告支出费用x(单位:万元)与相应利润y(单位:万元)的关系如下表格(变量x、y为线性相关关系).
x 2 4 6 8
y 20 35 61 80
(1)求y关于x的线性回归方程:
(2) 若要使利润不少于121.1万元,则广告支出费用至少要多少万元?
参考公式与数据:,,.
19.为了使人民群众认识到流感的严重性并能够自发进行防护,某单位进行流感防疫知识测试,满分100分,并从所有参加测试的职工中随机抽取80人,整理得到如下的频率分布直方图.
(1)求的值,并估计这80人的平均成绩.
(2)若不低于80分为优秀,其中男职工有60人且有42人成绩优秀,填写下面的列联表,并判断是否有95%的把握认为“成绩优秀与性别有关”.
男职工 女职工 总计
成绩优秀 42
成绩不优秀
总计 80
附:,.
0.050 0.010 0.001
3.841 6.635 10.828
20.为了对新产品进行合理定价,对该产品进行了试销试验,以观察需求量(单位:千件)对于价格(单位:千元)的反应,得数据如下:
/千元 50 70 80 40 30 90 95 97
/千件 100 80 60 120 135 55 50 48
(1)若与之间具有线性相关关系,求对的回归直线方程;
(2)若成本,试求:
①在盈亏平衡条件下(利润为零)的价格;
②在利润为最大的条件下,定价为多少?
21.某中学300名教师参加学校组织的“经典诵读”活动,按年龄分成5组:第一组[25,30),第二组[30,35),第三组[35,40),第四组[40,45),第五组[45,50].得到如下频率分布直方图:
(1)估计该校教师的平均年龄(同一组数据用该组区间的中点值作代表);
(2)为了了解该校教师的阅读喜好,现对该校所有教师按性别比例抽取50人进行“是否喜欢阅读国学经典”进行调查,得到如下2×2列联表:
喜欢阅读国学经典 不喜欢阅读国学经典 合计
男教师人数 16 8 24
女教师人数 10 16 26
合计 26 24 50
根据表中数据,我们能否有99%的把握认为该校教师是否喜欢阅读国学经典与性别有关?
附:,其中.
0.050 0.025 0.010 0.005 0.001
3.841 5.024 6.635 7.879 10.828
22.ChatGPT作为一个基于大型语言模型的聊天机器人,最近成为全球关注的焦点.ChatGPT是一个超强的AI,它能像人类一样聊天交流,甚至能完成撰写邮件、文案、写论文、答辩、编程等任务.专家预言,随着人工智能技术的发展,越来越多的职业可能会被ChatGPT或其他类似的人工智能工具所取代.某地区为了了解ChatGPT的普及情况,统计了该地区从2023年1月至5月使用ChatGPT的用户人数y(万人),详见下表:
x(月份) 1 2 3 4 5
y(万人) 3.6 6.4 11.7 18.8 27.5
(1)根据表中数据信息及模型①与模型②,判断哪一个模型更适合描述变量x和y的变化规律(无需说明理由),并求出y关于x的经验回归方程;
(2)为了进一步了解人们对适应人工智能所将带来的职业结构变化的自信程度(分为“基本适应”和“不适应”)是否跟年龄有关,某部门从该地区随机抽取300人进行调查,调查数据如下表:
基本适应 不适应
年龄小于30岁 100 50
年龄不小于30岁 75 75
根据小概率的独立性检验,分析该地区对职业结构变化的自信程度是否与年龄有关.
附参考数据:,;,.
15 55 979 68 264 1122
0.15 0.1 0.05 0.025 0.01 0.001
2.072 2.706 3.841 5.024 6.635 10.828
试卷第1页,共3页
试卷第1页,共3页
参考答案:
1.D
【分析】根据相关关系是一种不确定关系,函数关系是一种确定关系,可判断A;根据球的体积与半径之间的关系,可判断该关系为函数关系,可判断B;根据农作物的产量与施化肥量之间的关系可得该关系为一种相关关系,可判断C;根据学生的数学成绩与物理成绩之间是一种相关关系可判断D.
【详解】解:当两个变量之间具有确定的关系时,两个变量之间是函数关系,而不是相关关系,故A错误;
球的体积与该球的半径之间是函数关系,故B错误;
农作物的产量与施化肥量之间的关系是相关关系,是非确定性关系,故C错误;
学生的数学成绩与物理成绩之间的关系是相关关系,是非确定性关系,故D正确.
故选:D.
【点睛】关键点点睛:本题考查的知识点是变量间的相关关系,熟练掌握相关关系与函数关系之间的区别是解答的关键.
2.D
【分析】根据回归直线方程必过样本中心点,将代入回归方程计算可得.
【详解】解:依题意,代入得,
所以回归直线方程必过点.
故选:D
3.B
【分析】根据相关概念直接判断即可得解.
【详解】根据回归直线方程中知,回归直线一定经过样本中心点,故A正确;
相关系数越大,相关性越强,故B错误;
决定系数越接近1,拟合效果越好,故C正确;
残差图的带状区域越窄,说明拟合效果越好,故D正确.
故选:B
4.C
【分析】只适用于2×2型列联表问题,且只能推定两个分类变量相关,但不能推定两个变量不相关.
【详解】 只适用于2×2型列联表问题,且只能推定两个分类变量相关的大小,所以A错.
值越大时,只能说两个变量的相关程度高,不能推定两个变量相关.所以B错,
选项D中,所以D错.
故选:C.
5.A
【分析】根据回归直线经过样本中心可求的值.
【详解】,故,
所以,故,
故选:A.
6.D
【分析】根据计算出的临界值,同临界值表进行比较,得到假设不合理的程度约为99%,即这种疫苗不能起到预防甲型Hln1流感的作用不合理的程度约为99%,得到正确答案.
【详解】,
由临界值表可知,有99%的把握认为“这种疫苗能起到预防流感的作用”,
故选:D
7.B
【分析】根据决定系数的大小与拟合效果的关系判定即可.
【详解】由决定系数来刻画回归效果,的值越大越接近1,说明模型的拟合效果最好.由表可知指数模型的决定系数最接近1.
故选:B.
8.D
【分析】根据表格数据求,代入回归方程求参数a,结合得,由方程的形式可知,即可求c.
【详解】由表格数据知:.
由,得,则.
∴,
由,得,
∴,即.
故选:D.
9.BCD
【分析】求出去除后剩余样本数据中的平均数以及回归直线方程,可判断BC选项的正误;利用回归直线方程中两个变量的关系可判断A选项的正误;利用相关系数与相关性的关系可判断D选项的正误.
【详解】当时,,则,,
去除样本数据的新数据后,,,
设去除样本数据后重新求得的经验回归直线方程为,则,解得,故去除后的经验回归方程为,C对;
对于A选项,去除前变量每增加个单位,变量大约增加个单位,A错;
对于B选项,去除后剩余样本数据中的平均数为,B对;
对于D选项,去除了误差较大的样本数据后,线性相关性变强,
因为关于为正相关,则,所以,相关系数变大,D对.
故选:BCD.
10.AD
【分析】先求得,进而求得,得到回归直线方程,再逐项判断.
【详解】因为,,所以经验回归直线l过点,选项C中结论正确;
由题中数据,计算得,,选项A中结论错误,B中结论正确;
,因为,所以点不在直线l上,选项D中结论错误,
故选:AD.
11.BCD
【分析】根据方差的定义可判断A;根据样本点在回归直线上求得的值可判断B;根据可得,由对称性求出对称轴可得的值可判断C;根据二项分布方差的公式以及方差的性质可判断D,进而可得正确选项.
【详解】对于A:设的平均数为,方差为,
则,,
所以,,,的平均数为,
所以方差为
,故选项A不正确;
对于B:因为线性回归直线过样本点中心,所以,可得,
故选项B正确;
对于C:因为随机变量服从正态分布,所以对称轴为,又,
而,所以,
则,故选项C正确;
对于D:因为服从二项分布,所以,
所以,则,故选项D正确.
故选:BCD
12.ACD
【分析】选项A,根据正态分布曲线的特点,关于直线对称,求出,即可判断;
选项B,根据独立性检验的方法和步骤,即可判断;
选项C,根据相关指数的意义即可判断;
选项D,根据相关指数的计算公式即可判断.
【详解】解:对于选项A,曲线关于对称,由,则,则,选项A正确;
对于选项B,对分类变量与的随机变量的观察值来说,越大,“与有关”的可信度越大,选项B错误;
对于选项C,解析变量对预报变量的贡献率约为,选项C正确;
对于选项D,根据公式,其中,代入求出,选项D正确.
故选:ACD.
【点睛】本题考查回归分析的应用及正态分布曲线的应用,考查运算能力,属于基础题.
13.
【分析】根据独立性检验临界值表,即可得出答案.
【详解】,
故有的把握认为主修统计专业与性别有关,
故答案为:.
14.①③
【分析】根据样本相关系数的性质,逐一判断即可.
【详解】根据题意,依次分析4个命题:
对于①,当时,成对样本数据之间不存在任何关系,而不是较弱,错误;
对于②,当时,表明成对样本数据正相关,正确;
对于③,若线性回归方程中的回归系数,说明成对样本数据呈负相关,则相关系数,错误;
对于④,越接近1,线性相关程度越强,越接近0,线性相关程度越弱,正确.
故答案为:①③.
15..
【分析】根据回归直线恒过样本中心点,求得回归直线方程为,代入,即可求解.
【详解】由题意,回归直线恒过样本中心点,可得,解得,
即回归直线方程为,
当时,可得,
故估计该家庭的年支出为万元.
故答案为:.
16..
【分析】先求出样本中心点,然后将其代入,得到,从而得到线性回归方程,再把代入,求出即可得解.
【详解】,,
把样本中心点代入,
得,
所以,
即,
当时,
.
故答案为:.
【点睛】本题考查线性回归方程的特征,样本中心点一定在回归直线上.
17.两次数学考试成绩具有线性相关关系
【分析】根据相关系数的公式算出答案即可.
【详解】
=1202+1082+…+992+1082=116 584,
=842+642+…+572+712=47 384,
=120×84+108×64+…+108×71=73 796,
∴样本相关系数为
∴这10个学生的两次数学考试成绩具有线性相关关系.
18.(1);
(2)12万元.
【分析】(1)利用最小二乘法求y关于x的线性回归方程;
(2)解不等式即得解.
【详解】(1)解:由题意得:
,
.
.
所以线性回归方程为.
(2)解:由题可得
解得
所以广告费用支出至少要12万元.
19.(1),平均成绩为(分)
(2)填表见解析;没有95%的把握认为“成绩优秀与性别有关”
【分析】(1)根据直方图中矩形面积之和等于1可得a,然后根据平均数的估算方法计算可得;
(2)根据直方图算出优秀人数,然后可完成列联表,再计算出,对比概率表即可.
【详解】(1)由频率分布直方图,可得,
解得.
平均成绩为(分).
(2)由(1)知,优秀人数为人.
由题意可知,男职工有60人,女职工有20人,可得如下列联表:
男职工 女职工 总计
成绩优秀 42 10 52
成绩不优秀 18 10 28
总计 60 20 80
则,
所以没有95%的把握认为“成绩优秀与性别有关”.
20.(1) (2)①千元 ②千元
【分析】(1)画出散点图,结合散点图判断与之间具有线性相关关系,再用最小二乘法求出回归直线方程;
(2)①依题意可得,即可得到方程,解得即可;
②设利润为,则,根据二次函数的性质计算可得;
【详解】解:(1)依题意可得散点图如下:(图中个单位长度表示)
散点图近似在一条直线上下,所以与之间有线性相关关系,
依题意可得,

所以,
所以,
∴线性回归方程为.
(2)①在盈亏平衡条件下,,
即,

解得, (舍去),
∴此时新产品的价格为千元.
②设利润为,则
.
要使取得最大值,,即此时新产品应定价为千元.
21.(1)38.5;
(2)没有99%的把握认为该校教师是否喜欢阅读国学经典与性别有关.
【分析】(1)由频率分布直方图的平均数的计算方法即得;
(2)利用公式可求,进而即得.
【详解】(1)由频率分布直方图可知教师年龄在[35,40)这一组的频率为,
所以估计该校教师的平均年龄为.
(2)因为,
所以没有99%的把握认为该校教师是否喜欢阅读国学经典与性别有关.
22.(1)模型②,
(2)认为该地区对职业结构变化的自信程度与年龄有关
【分析】(1)根据数据分析,函数和一次函数模型差距较大,选择模型②:. 然后结合线性回归分析,求得函数;
(2)列联表,计算卡方,然后对比的数据,做出判断即可;
【详解】(1)选择模型②:.
记,则.
由题知,,,,,
所以,,
所以,即y关于x的回归方程为.
(2)由题意,得到列联表:
基本适应 不适应 合计
年龄不小于30岁 75 75 150
年龄小于30岁 100 50 150
合计 175 125 300

根据的独立性检验,认为该地区对职业结构变化的自信程度与年龄有关,此推断犯错误的概率不大于0.01.
答案第1页,共2页
答案第1页,共2页

展开更多......

收起↑

资源预览