第九章第03讲 成对数据的统计分析 (精练)(含解析)

资源下载
  1. 二一教育资源

第九章第03讲 成对数据的统计分析 (精练)(含解析)

资源简介

第03讲 成对数据的统计分析 (精练)
A夯实基础 B能力提升 C综合素养
A夯实基础
一、单选题
1.(2022·全国·高二课时练习)下列关于回归分析与独立性检验的说法正确的是( )
A.回归分析和独立性检验没有什么区别
B.回归分析是对两个变量准确关系的分析,而独立性检验是分析两个变量之间的不确定性关系
C.回归分析研究两个变量之间的相关关系,独立性检验是对两个变量是否具有某种关系的一种检验
D.独立性检验可以100%确定两个变量之间是否具有某种关系
【答案】C
【详解】回归分析是对两个变量之间的相关关系的一种分析,而相关关系是一种不确定关系,通过回归分析预测和估计两个变量之间具有的相关关系;
独立性检验是对两个变量之间是否具有某种关系的分析,并且可以分析这两个变量在多大程度上具有这种关系,但不能100%肯定这种关系.
故ABD错误,C正确.
故选:C.
2.(2022·陕西西安·高一期末)如图是根据的观测数据得到的散点图,可以判断变量具有线性相关关系的有( )
A.①② B.①③ C.②④ D.③④
【答案】D
【详解】由图可知,③,④中各点比较均匀的分布在一条直线附近,具有线性相关关系.
故选:D.
3.(2022·辽宁大连·高二期末)为考察一种新药预防疾病的效果,某科研小组进行动物实验,收集整理数据后将所得结果填入相应的列联表中.由列联表中的数据计算得.参照附表,下列结论正确的是( )
0.025 0.010 0.005 0.001
5.02 6.635 7.879 10.828
A.在犯错误的概率不超过0.1%的前提下,认为“药物有效”
B.在犯错误的概率不超过0.1%的前提下,认为“药物无效”
C.有99.99%以上的把握认为“药物有效”
D.有99.99%以上的把握认为“药物无效”
【答案】A
【详解】因为,即,
所以在犯错误的概率不超过0.1%的前提下,认为“药物有效”或有99.9%以上的把握认为“药物有效”.
故选:A.
4.(2022·全国·高二课时练习)如图是某地区2012年至2021年的空气污染天数Y(单位:天)与年份X的折线图.根据2012年至2016年的数据,2017年至2021年的数据,2012年至2021年的数据分别建立线性回归模型,,,则( )
A., B.,
C., D.,
【答案】C
【详解】记三条回归直线分别为,,,
画出这三条回归直线的大致图象,如图所示,
由图可知这三条回归直线的斜率大小关系为,
截距大小关系为.
故选:C.
5.(2022·安徽·歙县教研室高二期末)已知变量的成对样本数据的四个样本点,用最小二乘法得到回归方程 过点的直线方程为,给出下列4个命题:
①;
②;
③;
④点一定在直线上.
其中正确的命题的个数是( )
参考公式:,.
A.1个 B.2个 C.3个 D.4个
【答案】C
【详解】作出散点图,直观判断可知,,故①正确,②错误;
又,
所以,
所以
因为,所以
所以
所以的残差平方和较小,所以③正确;
由回归方程一定过样本点中心,所以④正确.
故选:C
6.(2022·山东滨州·高二期末)针对时下的“短视频热”,某高校团委对学生性别和喜欢短视频是否有关联进行了一次调查,其中被调查的男生 女生人数均为人,男生中喜欢短视频的人数占男生人数的,女生中喜欢短视频的人数占女生人数的.零假设为:喜欢短视频和性别相互独立.若依据的独立性检验认为喜欢短视频和性别不独立,则的最小值为( )
附:,附表:
0.05 0.01
3.841 6.635
A.7 B.8 C.9 D.10
【答案】C
【详解】根据题意,不妨设,于是,由于依据的独立性检验认为喜欢短视频和性别不独立,根据表格可知,解得,于是最小值为.
故选:C
7.(2022·辽宁·高三期末)某工厂为了对研发的一种产品进行合理定价,将该产品按事先拟定的价格进行试销,得到如下数据:
单价x元 9 9.2 9.4 9.6 9.8 10
销量y件 100 94 93 90 85 78
(附:对于一组数据(x1,y1),(x2,y2)…(xn,yn),其回归直线的斜率的最小二乘估计值为参考数值:,);预计在今后的销售中,销量与单价仍然服从这种线性相关关系,且该产品的成本是5元/件,为使工厂获得最大利润,该产品的单价应定为( )A.9.4元 B.9.5元 C.9.6元 D.9.7元
【答案】B
【详解】由题意

所以,则
设该产品的售价为元,工厂的利润为,则

当且仅当,即时等号成立.
所以时,工厂的利润的最大为405元
故选:B
8.(2022·山西省长治市第二中学校高二阶段练习)中国是茶的故乡,也是茶文化的发源地.茶的发现和利用已有四千七百多年的历史,且长盛不衰,传遍全球.为了弘扬中国茶文化,某酒店推出特色茶食品“金萱排骨茶”,为了解每壶“金萱排骨茶”中所放茶叶量x(单位:克)与食客的满意率y的关系,通过调查研究发现选择函数模型来拟合y与x的关系,根据以下数据:
茶叶量x/克 1 2 3 4 5
4.34 4.36 4.44 4.45 4.51
可求得y关于x的回归方程为( )
(附:对于一组数据,其回归直线的斜率和截距的最小二乘估计分别为,)
A. B.
C. D.
【答案】B
【详解】对等式两边同时取对数,可得:
易知:,

综上,可得:
又有:
可得:
故选:B
二、多选题
9.(2022·全国·高二课时练习)为了增强学生的身体素质,某校将冬天长跑作为一项制度固定下来,每天大课间例行跑操.为了调查学生喜欢跑步是否与性别有关,研究人员随机调查了相同人数的男、女学生,发现男生中有80%喜欢跑步,女生中有40%不喜欢跑步,且有95%的把握判断喜欢跑步与性别有关,但没有99%的把握判断喜欢跑步与性别有关,则被调查的男、女学生的总人数可能为( )
A.120 B.130 C.240 D.250
【答案】AB
【详解】依题意,设男、女学生的人数均为,则被调查的男、女学生的总人数为.建立如下列联表:
喜欢跑步 不喜欢跑步 总计


总计
则,又,
所以.
故选:AB.
10.(2022·山东聊城·高二期末)对具有相关关系的两个变量和进行回归分析时,经过随机抽样获得成对的样本数据,则下列说法正确的是( )
A.若两变量、具有线性相关关系,则回归直线至少经过一个样本点
B.变量、的线性相关系数的绝对值越接近,则两个变量与的线性相关程度越强
C.用残差平方和来比较两个模型的拟合效果时,残差平方和越小,模型的拟合效果越好
D.用来刻画回归模型的拟合效果时,若所有样本点都落在一条斜率为非零的直线上,则的值为
【答案】BCD
【详解】对于A选项,若两变量、具有线性相关关系,则回归直线过样本中心点,但不一定过样本点,A错;
对于B选项,若变量、的线性相关系数的绝对值越接近,则两个变量与的线性相关程度越强,B对;
对于C选项,用残差平方和来比较两个模型的拟合效果时,残差平方和越小,模型的拟合效果越好,C对;
对于D选项,用来刻画回归模型的拟合效果时,若所有样本点都落在一条斜率为非零的直线上,则的值为,D对.
故选:BCD.
三、填空题
11.(2022·内蒙古·满洲里市第一中学高一期末)某地,第x年该地人均收入y的部分数据如下表:
年份 2015 2016 2017 2018 2019
年份编号x 1 2 3 4 5
年人均收入y(万元) 0.5 0.6 1 1.4 m
根据表中所数据,求得y与x的线性回归方程为:,则2019年该地区实际年人均收入为___________万元.
【答案】##
【详解】解:依题意,,
因为回归直线方程必过样本中心点,
所以,解得,即2019年该地区实际年人均收入为万元;
故答案为:
12.(2022·全国·高三专题练习)和的散点图如图所示,则下列说法中所有正确命题的序号为______.
①,是负相关关系;
②,之间不能建立线性回归方程;
③在该相关关系中,若用拟合时的相关指数为,用拟合时的相关指数为,则.
【答案】①③
【详解】在散点图中,点散布在从左上角到右下角的区域,因此,是负相关关系,故①正确;
x,,y之间可以建立线性回归方程,但拟合效果不好,故②错误;
由散点图知用拟合比用拟合效果要好,则,故③正确.
故答案为:①③.
四、解答题
13.(2022·陕西渭南·高一期末)每到夏季,许多人选择到水上乐园游玩,某水上乐园统计了开业后第3~7天每天的游客人数(百人)的数据,得到下面的表格:
第天 3 4 5 6 7
游客人数(百人) 1.5 2 3 3.5 5
(1)若与具有线性相关关系,求关于的线性回归方程;
(2)已知该水上乐园每天最大的游客承载量为1000人,如果某天的游客数量预计会超过该水上乐园每天最大的游客承载量,则当天需采取限流措施,根据(1)中的回归方程估计:从第几天开始,该水上乐园需要采取限流措施?
附:线性回归方程的斜率和截距的最小二乘估计分别为,.
【答案】(1)
(2)从第14天开始.该水上乐园需要采取限流措施
(1)由表中数据得:,,计算得,∴,∴,∴,∴关于的线性回归方程为
(2)令得,解得,∴从第14天开始.该水上乐园需要采取限流措施.
14.(2022·全国·高二课时练习)某市自2021年1月启动对“车不让人行为”处罚以来,斑马线前机动车抢行不文明行为得以根本改变,但作为交通重要参与者的行人,闯红灯通行却频有发生,带来了较大的交通安全隐患,同时也使机动车的通畅率降低.该市交警部门在某十字路口根据以往的检测数据,得到行人闯红灯的概率约为0.4,并从穿越该路口的行人中随机抽取了200人进行调查,对是否存在闯红灯情况得到如下列联表:
30岁及以下 30岁以上 总计
闯红灯 60
未闯红灯 80
总计 200
近期,为了整顿“行人闯红灯”这一项不文明及违法行为,交警部门在该十字路口对闯红灯行人试行经济处罚,并在试行经济处罚后从穿越该路口的行人中随机抽取了200人进行调查,得到下表:
处罚金额(单位:元) 5 10 15 20
闯红灯的人数 50 40 20 0
将统计数据所得频率作为概率,完成下列问题.
(1)将列联表填写完整(不需写出填写过程),并根据表中数据分析,在未对闯红灯行人试行经济处罚前,是否有99.9%的把握认为闯红灯与年龄有关?
(2)当处罚金额为10元时,行人闯红灯的概率比不进行处罚降低多少?
(3)结合调查结果,谈谈如何治理行人闯红灯现象.
【答案】(1)表格见解析,有99.9%的把握认为闯红灯与年龄有关
(2)0.2
(3)答案见解析
(1) 30岁及以下 30岁以上 总计
闯红灯 20 60 80
未闯红灯 80 40 120
总计 100 100 200
由表中数据,得.∵,∴有99.9%的把握认为闯红灯与年龄有关.
(2)未进行处罚前,行人闯红灯的概率约为0.4,当处罚金额为10元时,行人闯红灯的概率约为,故当处罚金额为10元时,行人闯红灯的概率比不进行处罚降低0.2.
(3)①根据调查数据显示,行人闯红灯与年龄有明显关系,可以针对30岁以上人群开展“道路安全”宣传教育;②由于试行经济处罚可以明显降低行人闯红灯的概率,则可以进行适当经济处罚来降低行人闯红灯的概率.
B能力提升
1.(2022·江苏·盐城中学模拟预测)某抽奖系统中,抽得的物品可分为5星,4星和3星,其中一种抽奖种类中的抽奖系统的概率和相关保底机制如下:
物品类别 5星 4星 3星
基础概率 0.600% 5.100% 94.300%
基础概率:在没有任何其他机制的影响下,单次抽奖抽中指定类别奖品的概率.
保底机制:现假定玩家从未进行过抽奖,则玩家抽取5星(或4星)的概率会随者未抽中5星(或4星)的次数增加而改变,相关机制如下表所示:
连续未抽中4星的次数i
下一次抽中4星的概率 5.100%
连续未抽中5星的次数i
下一次抽中5星的概率 0.600%
注:①表示中的最小值:
②抽中4星的概率和抽中5星的概率的增加值从抽中3星的概率中等量扣除;
③若发现下一次抽奖中,抽中4星的概率和抽中5星的概率的和大于1,则下一次抽奖抽中5星的概率等于表中的值(记为p),而抽中4星的概率为.
现记玩家获得1个5星物品所需要的最大抽奖次数为N;
(1)统计10名玩家抽到第一个五星的总次数和中途抽到四星的次数如下表所示:
玩家序号 1 2 3 4 5 6 7 8 9 10
总次数y 30 78 64 80 85 79 55 83 66 81
四星个数x 4 8 7 9 9 8 6 9 8 9
计算得:,已知y与x之间存在很强的线性相关关系,求出其线性回归方程,并求出使得最小的x(回归方程中的和取两位小数)
参考公式:回归直线方程斜率和截距的最小二乘估计公式分别为:.
【答案】(1),
(1)因为,代入数据得:,所以,所以y与x的线性回归方程为.当连续未抽中5星的次数,下一次抽中5星的概率为0.600%,所以下一次可能抽不中5星;当连续未抽中5星的次数,下一次抽中5星的概率0.600%,由有:,所以玩家获得1个5星物品所需要的最大抽奖次数为73. 所以,由有:,所以使得最小的x为8.
2.(2022·河北唐山·高二期末)为过接2022年北京冬季奥运会,普及冬奥知识,某校开展了“冰雪答题王”冬奥知识竞赛活动,现从参加冬奥知识竞赛活动的学生中随机抽取了100名学生,将他们的比赛成绩(满分为100分)为6组:,,,,,,得到如图所示的频率分布直方图.
(1)求a的值;
(2)记A表示事件“从参加冬奥知识竞赛活动的学生中随机抽取一名学生,该学生的比赛成绩不低于80分”,估计A的概率;
(3)在抽取的100名学生中,规定:比赛成绩不低于80分为“优秀”,比赛成低于90分为“非优秀”,请将下面的列联表补充完整,并判断是否有99.9%的把握认为“比赛成绩是否优秀与性别有关”?
优秀 非优秀 合计
男生 40
女生 50
合计 100
参考公式及数据:,.
0.10 0.05 0.025 0.01 0.005 0.001
2.706 3.841 5.024 6.635 7.879 10.828
【答案】(1);
(2)0.35;
(3)列联表答案见解析,没有99.9%的把握认为比赛成绩优秀与性别有关.
(1)由频率分布直方图知,,解得:,所以a的值是0.025.
(2)由(1)知,则比赛成绩不低于80分的频率为,所以从参加冬奥知识竞赛活动的学生中随机抽取一名学生,该学生的比赛成绩不低于80分的概率约为0.35.
(3)由(2)知,在抽取的100名学生中,比赛成绩优秀的有人,由此可得完整的2×2列联表:
优秀 非优秀 合计
男生 10 40 50
女生 25 25 50
合计 35 65 100
零假设:比赛成绩优秀与性别无关,根据表中的数据,计算得到,依据小概率值的独立性检验,没有充分证据推断不成立,因此可以认为成立,即没有99.9%的把握认为比赛成绩优秀与性别有关.
C综合素养
1.(2022·黑龙江·哈尔滨三中三模(文))2022年春节前,受疫情影响,各地鼓励市民接种新冠疫苗第三针.某市统计了该市4个地区的疫苗接种人数与第三针接种人数(单位:万),得到如下表格:
A区 B区 C区 D区
疫苗接种人数x/万 6 8 10 12
第三针接种人数y/万 2 3 5 6
(1)请用相关系数说明y与x之间的关系可用线性回归模型拟合,并求y关于x的线性回归方程(若,则线性相关程度很高,可用直线拟合).
参考公式和数据:相关系数,回归方程中斜率和截距的最小二乘估计公式分别为,,.
【答案】(1)说明答案见解析,
由题:,,
,,,
所以相关系数,
说明y与x之间的性相关程度很高,所以可用线性回归模型拟合y与x之间的关系.

故y关于x的线性回归方程为.
2.(2022·河南新乡·高二期中(文))为研究男体育特长生的身高与体重之间的关系,从某校的男体育特长生中随机选取8名,其身高和体重的数据如表所示:
编号 1 2 3 4 5 6 7 8
身高x() 178 173 158 167 160 173 166 169
体重y() 66 61 50 58 53 66 57 57
(1)根据最小二乘法的思想与公式求得身高与体重的线性回归方程为.利用已经求得的线性回归方程,完善下列残差表,并求解释变量(身高)对于预报变量(体重)变化的贡献值(保留两位有效数字).
编号 1 2 3 4 5 6 7 8
体重y() 66 61 50 58 53 66 57 57
残差 -0.5 -1.5 -0.5 0.3 0.9
(2)通过残差分析,对于残差绝对值最大的那组数据,需要确认在样本点的采集中是否有人为的错误,已知通过重新采集发现,该组数据的体重应该为58kg.请重新根据最小二乘法的思想与公式,求出男体育特长生的身高与体重的线性回归方程.
参考公式:,,,.参考数据:,,,,.
【答案】(1)填表答案见解析,约为0.91
(2)
(1)解:对编号为6的数据:;
对编号为7的数据:;
对编号为8的数据:.
完成的残差表如下所示:
编号 1 2 3 4 5 6 7 8
体重y(kg) 66 61 50 58 53 66 57 57
残差 -0.5 -1.5 -0.5 0.3 0.9 3.5 0.1 -2.3


所以解释变量(身高)对于预报变量(体重)变化的贡献值约为0.91.
(2)由(1)可知,第六组数据的体重应为58,
此时,又,,,


所以重新采集数据后,男体育特长生的身高与体重的线性回归方程为.
3.(2022·山东淄博·模拟预测)小叶紫檀是珍稀树种,因其木质好备受玩家喜爱,其幼苗从观察之日起,第x天的高度为ycm,测得数据如下:
1 4 9 16 25 36 49
0 4 7 9 11 12 13
数据的散点图如图所示:
为近似描述y与x的关系,除了一次函数,还有和两个函数可选.
(1)从三个函数中选出“最好”的曲线拟合y与x的关系,并求出其回归方程(保留到小数点后1位);
(2)判断说法“高度从1000cm长到1001cm所需时间超过一年”是否成立,并给出理由.
参考公式:,.
参考数据(其中,):,,,, ,,,,,.
【答案】(1)选用;;
(2)说法“高度从1000cm长到1001cm所需时间超过一年”成立.理由见解析.
(1)由散点图可知,这些数据集中在图中曲线的附近,
而曲线的形状与函数的图象很相似,
因此可以用类似的表达式来描述y与x的关系,
即三个函数中的图象是拟合y与x的关系“最好”的曲线.
令,则,根据已知数据,
得,,
所以,
又回归直线经过点(4,8),所以,
所以y关于x的回归直线方程为,即;
(2)说法“高度从1000cm长到1001cm所需时间超过一年”成立.
设其幼苗从观察之日起,第m天的高度为1000cm,
有,解得,
第n天的高度为1001cm,
有,解得,
天,
所以说法“高度从1000cm长到1001cm所需时间超过一年”成立.第03讲 成对数据的统计分析 (精练)
A夯实基础 B能力提升 C综合素养
A夯实基础
一、单选题
1.(2022·全国·高二课时练习)下列关于回归分析与独立性检验的说法正确的是( )
A.回归分析和独立性检验没有什么区别
B.回归分析是对两个变量准确关系的分析,而独立性检验是分析两个变量之间的不确定性关系
C.回归分析研究两个变量之间的相关关系,独立性检验是对两个变量是否具有某种关系的一种检验
D.独立性检验可以100%确定两个变量之间是否具有某种关系
2.(2022·陕西西安·高一期末)如图是根据的观测数据得到的散点图,可以判断变量具有线性相关关系的有( )
A.①② B.①③ C.②④ D.③④
3.(2022·辽宁大连·高二期末)为考察一种新药预防疾病的效果,某科研小组进行动物实验,收集整理数据后将所得结果填入相应的列联表中.由列联表中的数据计算得.参照附表,下列结论正确的是( )
0.025 0.010 0.005 0.001
5.02 6.635 7.879 10.828
A.在犯错误的概率不超过0.1%的前提下,认为“药物有效”
B.在犯错误的概率不超过0.1%的前提下,认为“药物无效”
C.有99.99%以上的把握认为“药物有效”
D.有99.99%以上的把握认为“药物无效”
4.(2022·全国·高二课时练习)如图是某地区2012年至2021年的空气污染天数Y(单位:天)与年份X的折线图.根据2012年至2016年的数据,2017年至2021年的数据,2012年至2021年的数据分别建立线性回归模型,,,则( )
A., B.,
C., D.,
5.(2022·安徽·歙县教研室高二期末)已知变量的成对样本数据的四个样本点,用最小二乘法得到回归方程 过点的直线方程为,给出下列4个命题:
①;
②;
③;
④点一定在直线上.
其中正确的命题的个数是( )
参考公式:,.
A.1个 B.2个 C.3个 D.4个
6.(2022·山东滨州·高二期末)针对时下的“短视频热”,某高校团委对学生性别和喜欢短视频是否有关联进行了一次调查,其中被调查的男生 女生人数均为人,男生中喜欢短视频的人数占男生人数的,女生中喜欢短视频的人数占女生人数的.零假设为:喜欢短视频和性别相互独立.若依据的独立性检验认为喜欢短视频和性别不独立,则的最小值为( )
附:,附表:
0.05 0.01
3.841 6.635
A.7 B.8 C.9 D.10
7.(2022·辽宁·高三期末)某工厂为了对研发的一种产品进行合理定价,将该产品按事先拟定的价格进行试销,得到如下数据:
单价x元 9 9.2 9.4 9.6 9.8 10
销量y件 100 94 93 90 85 78
(附:对于一组数据(x1,y1),(x2,y2)…(xn,yn),其回归直线的斜率的最小二乘估计值为参考数值:,);预计在今后的销售中,销量与单价仍然服从这种线性相关关系,且该产品的成本是5元/件,为使工厂获得最大利润,该产品的单价应定为( )A.9.4元 B.9.5元 C.9.6元 D.9.7元
8.(2022·山西省长治市第二中学校高二阶段练习)中国是茶的故乡,也是茶文化的发源地.茶的发现和利用已有四千七百多年的历史,且长盛不衰,传遍全球.为了弘扬中国茶文化,某酒店推出特色茶食品“金萱排骨茶”,为了解每壶“金萱排骨茶”中所放茶叶量x(单位:克)与食客的满意率y的关系,通过调查研究发现选择函数模型来拟合y与x的关系,根据以下数据:
茶叶量x/克 1 2 3 4 5
4.34 4.36 4.44 4.45 4.51
可求得y关于x的回归方程为( )
(附:对于一组数据,其回归直线的斜率和截距的最小二乘估计分别为,)
A. B.
C. D.
二、多选题
9.(2022·全国·高二课时练习)为了增强学生的身体素质,某校将冬天长跑作为一项制度固定下来,每天大课间例行跑操.为了调查学生喜欢跑步是否与性别有关,研究人员随机调查了相同人数的男、女学生,发现男生中有80%喜欢跑步,女生中有40%不喜欢跑步,且有95%的把握判断喜欢跑步与性别有关,但没有99%的把握判断喜欢跑步与性别有关,则被调查的男、女学生的总人数可能为( )
A.120 B.130 C.240 D.250
10.(2022·山东聊城·高二期末)对具有相关关系的两个变量和进行回归分析时,经过随机抽样获得成对的样本数据,则下列说法正确的是( )
A.若两变量、具有线性相关关系,则回归直线至少经过一个样本点
B.变量、的线性相关系数的绝对值越接近,则两个变量与的线性相关程度越强
C.用残差平方和来比较两个模型的拟合效果时,残差平方和越小,模型的拟合效果越好
D.用来刻画回归模型的拟合效果时,若所有样本点都落在一条斜率为非零的直线上,则的值为
三、填空题
11.(2022·内蒙古·满洲里市第一中学高一期末)某地,第x年该地人均收入y的部分数据如下表:
年份 2015 2016 2017 2018 2019
年份编号x 1 2 3 4 5
年人均收入y(万元) 0.5 0.6 1 1.4 m
根据表中所数据,求得y与x的线性回归方程为:,则2019年该地区实际年人均收入为___________万元.
12.(2022·全国·高三专题练习)和的散点图如图所示,则下列说法中所有正确命题的序号为______.
①,是负相关关系;
②,之间不能建立线性回归方程;
③在该相关关系中,若用拟合时的相关指数为,用拟合时的相关指数为,则.
四、解答题
13.(2022·陕西渭南·高一期末)每到夏季,许多人选择到水上乐园游玩,某水上乐园统计了开业后第3~7天每天的游客人数(百人)的数据,得到下面的表格:
第天 3 4 5 6 7
游客人数(百人) 1.5 2 3 3.5 5
(1)若与具有线性相关关系,求关于的线性回归方程;
(2)已知该水上乐园每天最大的游客承载量为1000人,如果某天的游客数量预计会超过该水上乐园每天最大的游客承载量,则当天需采取限流措施,根据(1)中的回归方程估计:从第几天开始,该水上乐园需要采取限流措施?
附:线性回归方程的斜率和截距的最小二乘估计分别为,.
14.(2022·全国·高二课时练习)某市自2021年1月启动对“车不让人行为”处罚以来,斑马线前机动车抢行不文明行为得以根本改变,但作为交通重要参与者的行人,闯红灯通行却频有发生,带来了较大的交通安全隐患,同时也使机动车的通畅率降低.该市交警部门在某十字路口根据以往的检测数据,得到行人闯红灯的概率约为0.4,并从穿越该路口的行人中随机抽取了200人进行调查,对是否存在闯红灯情况得到如下列联表:
30岁及以下 30岁以上 总计
闯红灯 60
未闯红灯 80
总计 200
近期,为了整顿“行人闯红灯”这一项不文明及违法行为,交警部门在该十字路口对闯红灯行人试行经济处罚,并在试行经济处罚后从穿越该路口的行人中随机抽取了200人进行调查,得到下表:
处罚金额(单位:元) 5 10 15 20
闯红灯的人数 50 40 20 0
将统计数据所得频率作为概率,完成下列问题.
(1)将列联表填写完整(不需写出填写过程),并根据表中数据分析,在未对闯红灯行人试行经济处罚前,是否有99.9%的把握认为闯红灯与年龄有关?
(2)当处罚金额为10元时,行人闯红灯的概率比不进行处罚降低多少?
(3)结合调查结果,谈谈如何治理行人闯红灯现象.
B能力提升
1.(2022·江苏·盐城中学模拟预测)某抽奖系统中,抽得的物品可分为5星,4星和3星,其中一种抽奖种类中的抽奖系统的概率和相关保底机制如下:
物品类别 5星 4星 3星
基础概率 0.600% 5.100% 94.300%
基础概率:在没有任何其他机制的影响下,单次抽奖抽中指定类别奖品的概率.
保底机制:现假定玩家从未进行过抽奖,则玩家抽取5星(或4星)的概率会随者未抽中5星(或4星)的次数增加而改变,相关机制如下表所示:
连续未抽中4星的次数i
下一次抽中4星的概率 5.100%
连续未抽中5星的次数i
下一次抽中5星的概率 0.600%
注:①表示中的最小值:
②抽中4星的概率和抽中5星的概率的增加值从抽中3星的概率中等量扣除;
③若发现下一次抽奖中,抽中4星的概率和抽中5星的概率的和大于1,则下一次抽奖抽中5星的概率等于表中的值(记为p),而抽中4星的概率为.
现记玩家获得1个5星物品所需要的最大抽奖次数为N;
(1)统计10名玩家抽到第一个五星的总次数和中途抽到四星的次数如下表所示:
玩家序号 1 2 3 4 5 6 7 8 9 10
总次数y 30 78 64 80 85 79 55 83 66 81
四星个数x 4 8 7 9 9 8 6 9 8 9
计算得:,已知y与x之间存在很强的线性相关关系,求出其线性回归方程,并求出使得最小的x(回归方程中的和取两位小数)
参考公式:回归直线方程斜率和截距的最小二乘估计公式分别为:.
2.(2022·河北唐山·高二期末)为过接2022年北京冬季奥运会,普及冬奥知识,某校开展了“冰雪答题王”冬奥知识竞赛活动,现从参加冬奥知识竞赛活动的学生中随机抽取了100名学生,将他们的比赛成绩(满分为100分)为6组:,,,,,,得到如图所示的频率分布直方图.
(1)求a的值;
(2)记A表示事件“从参加冬奥知识竞赛活动的学生中随机抽取一名学生,该学生的比赛成绩不低于80分”,估计A的概率;
(3)在抽取的100名学生中,规定:比赛成绩不低于80分为“优秀”,比赛成低于90分为“非优秀”,请将下面的列联表补充完整,并判断是否有99.9%的把握认为“比赛成绩是否优秀与性别有关”?
优秀 非优秀 合计
男生 40
女生 50
合计 100
参考公式及数据:,.
0.10 0.05 0.025 0.01 0.005 0.001
2.706 3.841 5.024 6.635 7.879 10.828
C综合素养
1.(2022·黑龙江·哈尔滨三中三模(文))2022年春节前,受疫情影响,各地鼓励市民接种新冠疫苗第三针.某市统计了该市4个地区的疫苗接种人数与第三针接种人数(单位:万),得到如下表格:
A区 B区 C区 D区
疫苗接种人数x/万 6 8 10 12
第三针接种人数y/万 2 3 5 6
(1)请用相关系数说明y与x之间的关系可用线性回归模型拟合,并求y关于x的线性回归方程(若,则线性相关程度很高,可用直线拟合).
参考公式和数据:相关系数,回归方程中斜率和截距的最小二乘估计公式分别为,,.
2.(2022·河南新乡·高二期中(文))为研究男体育特长生的身高与体重之间的关系,从某校的男体育特长生中随机选取8名,其身高和体重的数据如表所示:
编号 1 2 3 4 5 6 7 8
身高x() 178 173 158 167 160 173 166 169
体重y() 66 61 50 58 53 66 57 57
(1)根据最小二乘法的思想与公式求得身高与体重的线性回归方程为.利用已经求得的线性回归方程,完善下列残差表,并求解释变量(身高)对于预报变量(体重)变化的贡献值(保留两位有效数字).
编号 1 2 3 4 5 6 7 8
体重y() 66 61 50 58 53 66 57 57
残差 -0.5 -1.5 -0.5 0.3 0.9
(2)通过残差分析,对于残差绝对值最大的那组数据,需要确认在样本点的采集中是否有人为的错误,已知通过重新采集发现,该组数据的体重应该为58kg.请重新根据最小二乘法的思想与公式,求出男体育特长生的身高与体重的线性回归方程.
参考公式:,,,.参考数据:,,,,.
3.(2022·山东淄博·模拟预测)小叶紫檀是珍稀树种,因其木质好备受玩家喜爱,其幼苗从观察之日起,第x天的高度为ycm,测得数据如下:
1 4 9 16 25 36 49
0 4 7 9 11 12 13
数据的散点图如图所示:
为近似描述y与x的关系,除了一次函数,还有和两个函数可选.
(1)从三个函数中选出“最好”的曲线拟合y与x的关系,并求出其回归方程(保留到小数点后1位);
(2)判断说法“高度从1000cm长到1001cm所需时间超过一年”是否成立,并给出理由.
参考公式:,.
参考数据(其中,):,,,, ,,,,,.

展开更多......

收起↑

资源列表