资源简介 第03讲 成对数据的统计分析 (精练)A夯实基础 B能力提升 C综合素养A夯实基础一、单选题1.(2022·全国·高二课时练习)下列关于回归分析与独立性检验的说法正确的是( )A.回归分析和独立性检验没有什么区别B.回归分析是对两个变量准确关系的分析,而独立性检验是分析两个变量之间的不确定性关系C.回归分析研究两个变量之间的相关关系,独立性检验是对两个变量是否具有某种关系的一种检验D.独立性检验可以100%确定两个变量之间是否具有某种关系【答案】C【详解】回归分析是对两个变量之间的相关关系的一种分析,而相关关系是一种不确定关系,通过回归分析预测和估计两个变量之间具有的相关关系;独立性检验是对两个变量之间是否具有某种关系的分析,并且可以分析这两个变量在多大程度上具有这种关系,但不能100%肯定这种关系.故ABD错误,C正确.故选:C.2.(2022·陕西西安·高一期末)如图是根据的观测数据得到的散点图,可以判断变量具有线性相关关系的有( )A.①② B.①③ C.②④ D.③④【答案】D【详解】由图可知,③,④中各点比较均匀的分布在一条直线附近,具有线性相关关系.故选:D.3.(2022·辽宁大连·高二期末)为考察一种新药预防疾病的效果,某科研小组进行动物实验,收集整理数据后将所得结果填入相应的列联表中.由列联表中的数据计算得.参照附表,下列结论正确的是( )0.025 0.010 0.005 0.0015.02 6.635 7.879 10.828A.在犯错误的概率不超过0.1%的前提下,认为“药物有效”B.在犯错误的概率不超过0.1%的前提下,认为“药物无效”C.有99.99%以上的把握认为“药物有效”D.有99.99%以上的把握认为“药物无效”【答案】A【详解】因为,即,所以在犯错误的概率不超过0.1%的前提下,认为“药物有效”或有99.9%以上的把握认为“药物有效”.故选:A.4.(2022·全国·高二课时练习)如图是某地区2012年至2021年的空气污染天数Y(单位:天)与年份X的折线图.根据2012年至2016年的数据,2017年至2021年的数据,2012年至2021年的数据分别建立线性回归模型,,,则( )A., B.,C., D.,【答案】C【详解】记三条回归直线分别为,,,画出这三条回归直线的大致图象,如图所示,由图可知这三条回归直线的斜率大小关系为,截距大小关系为.故选:C.5.(2022·安徽·歙县教研室高二期末)已知变量的成对样本数据的四个样本点,用最小二乘法得到回归方程 过点的直线方程为,给出下列4个命题:①;②;③;④点一定在直线上.其中正确的命题的个数是( )参考公式:,.A.1个 B.2个 C.3个 D.4个【答案】C【详解】作出散点图,直观判断可知,,故①正确,②错误;又,所以,所以因为,所以所以所以的残差平方和较小,所以③正确;由回归方程一定过样本点中心,所以④正确.故选:C6.(2022·山东滨州·高二期末)针对时下的“短视频热”,某高校团委对学生性别和喜欢短视频是否有关联进行了一次调查,其中被调查的男生 女生人数均为人,男生中喜欢短视频的人数占男生人数的,女生中喜欢短视频的人数占女生人数的.零假设为:喜欢短视频和性别相互独立.若依据的独立性检验认为喜欢短视频和性别不独立,则的最小值为( )附:,附表:0.05 0.013.841 6.635A.7 B.8 C.9 D.10【答案】C【详解】根据题意,不妨设,于是,由于依据的独立性检验认为喜欢短视频和性别不独立,根据表格可知,解得,于是最小值为.故选:C7.(2022·辽宁·高三期末)某工厂为了对研发的一种产品进行合理定价,将该产品按事先拟定的价格进行试销,得到如下数据:单价x元 9 9.2 9.4 9.6 9.8 10销量y件 100 94 93 90 85 78(附:对于一组数据(x1,y1),(x2,y2)…(xn,yn),其回归直线的斜率的最小二乘估计值为参考数值:,);预计在今后的销售中,销量与单价仍然服从这种线性相关关系,且该产品的成本是5元/件,为使工厂获得最大利润,该产品的单价应定为( )A.9.4元 B.9.5元 C.9.6元 D.9.7元【答案】B【详解】由题意由所以,则设该产品的售价为元,工厂的利润为,则由当且仅当,即时等号成立.所以时,工厂的利润的最大为405元故选:B8.(2022·山西省长治市第二中学校高二阶段练习)中国是茶的故乡,也是茶文化的发源地.茶的发现和利用已有四千七百多年的历史,且长盛不衰,传遍全球.为了弘扬中国茶文化,某酒店推出特色茶食品“金萱排骨茶”,为了解每壶“金萱排骨茶”中所放茶叶量x(单位:克)与食客的满意率y的关系,通过调查研究发现选择函数模型来拟合y与x的关系,根据以下数据:茶叶量x/克 1 2 3 4 54.34 4.36 4.44 4.45 4.51可求得y关于x的回归方程为( )(附:对于一组数据,其回归直线的斜率和截距的最小二乘估计分别为,)A. B.C. D.【答案】B【详解】对等式两边同时取对数,可得:易知:,则综上,可得:又有:可得:故选:B二、多选题9.(2022·全国·高二课时练习)为了增强学生的身体素质,某校将冬天长跑作为一项制度固定下来,每天大课间例行跑操.为了调查学生喜欢跑步是否与性别有关,研究人员随机调查了相同人数的男、女学生,发现男生中有80%喜欢跑步,女生中有40%不喜欢跑步,且有95%的把握判断喜欢跑步与性别有关,但没有99%的把握判断喜欢跑步与性别有关,则被调查的男、女学生的总人数可能为( )A.120 B.130 C.240 D.250【答案】AB【详解】依题意,设男、女学生的人数均为,则被调查的男、女学生的总人数为.建立如下列联表:喜欢跑步 不喜欢跑步 总计男女总计则,又,所以.故选:AB.10.(2022·山东聊城·高二期末)对具有相关关系的两个变量和进行回归分析时,经过随机抽样获得成对的样本数据,则下列说法正确的是( )A.若两变量、具有线性相关关系,则回归直线至少经过一个样本点B.变量、的线性相关系数的绝对值越接近,则两个变量与的线性相关程度越强C.用残差平方和来比较两个模型的拟合效果时,残差平方和越小,模型的拟合效果越好D.用来刻画回归模型的拟合效果时,若所有样本点都落在一条斜率为非零的直线上,则的值为【答案】BCD【详解】对于A选项,若两变量、具有线性相关关系,则回归直线过样本中心点,但不一定过样本点,A错;对于B选项,若变量、的线性相关系数的绝对值越接近,则两个变量与的线性相关程度越强,B对;对于C选项,用残差平方和来比较两个模型的拟合效果时,残差平方和越小,模型的拟合效果越好,C对;对于D选项,用来刻画回归模型的拟合效果时,若所有样本点都落在一条斜率为非零的直线上,则的值为,D对.故选:BCD.三、填空题11.(2022·内蒙古·满洲里市第一中学高一期末)某地,第x年该地人均收入y的部分数据如下表:年份 2015 2016 2017 2018 2019年份编号x 1 2 3 4 5年人均收入y(万元) 0.5 0.6 1 1.4 m根据表中所数据,求得y与x的线性回归方程为:,则2019年该地区实际年人均收入为___________万元.【答案】##【详解】解:依题意,,因为回归直线方程必过样本中心点,所以,解得,即2019年该地区实际年人均收入为万元;故答案为:12.(2022·全国·高三专题练习)和的散点图如图所示,则下列说法中所有正确命题的序号为______.①,是负相关关系;②,之间不能建立线性回归方程;③在该相关关系中,若用拟合时的相关指数为,用拟合时的相关指数为,则.【答案】①③【详解】在散点图中,点散布在从左上角到右下角的区域,因此,是负相关关系,故①正确;x,,y之间可以建立线性回归方程,但拟合效果不好,故②错误;由散点图知用拟合比用拟合效果要好,则,故③正确.故答案为:①③.四、解答题13.(2022·陕西渭南·高一期末)每到夏季,许多人选择到水上乐园游玩,某水上乐园统计了开业后第3~7天每天的游客人数(百人)的数据,得到下面的表格:第天 3 4 5 6 7游客人数(百人) 1.5 2 3 3.5 5(1)若与具有线性相关关系,求关于的线性回归方程;(2)已知该水上乐园每天最大的游客承载量为1000人,如果某天的游客数量预计会超过该水上乐园每天最大的游客承载量,则当天需采取限流措施,根据(1)中的回归方程估计:从第几天开始,该水上乐园需要采取限流措施?附:线性回归方程的斜率和截距的最小二乘估计分别为,.【答案】(1)(2)从第14天开始.该水上乐园需要采取限流措施(1)由表中数据得:,,计算得,∴,∴,∴,∴关于的线性回归方程为(2)令得,解得,∴从第14天开始.该水上乐园需要采取限流措施.14.(2022·全国·高二课时练习)某市自2021年1月启动对“车不让人行为”处罚以来,斑马线前机动车抢行不文明行为得以根本改变,但作为交通重要参与者的行人,闯红灯通行却频有发生,带来了较大的交通安全隐患,同时也使机动车的通畅率降低.该市交警部门在某十字路口根据以往的检测数据,得到行人闯红灯的概率约为0.4,并从穿越该路口的行人中随机抽取了200人进行调查,对是否存在闯红灯情况得到如下列联表:30岁及以下 30岁以上 总计闯红灯 60未闯红灯 80总计 200近期,为了整顿“行人闯红灯”这一项不文明及违法行为,交警部门在该十字路口对闯红灯行人试行经济处罚,并在试行经济处罚后从穿越该路口的行人中随机抽取了200人进行调查,得到下表:处罚金额(单位:元) 5 10 15 20闯红灯的人数 50 40 20 0将统计数据所得频率作为概率,完成下列问题.(1)将列联表填写完整(不需写出填写过程),并根据表中数据分析,在未对闯红灯行人试行经济处罚前,是否有99.9%的把握认为闯红灯与年龄有关?(2)当处罚金额为10元时,行人闯红灯的概率比不进行处罚降低多少?(3)结合调查结果,谈谈如何治理行人闯红灯现象.【答案】(1)表格见解析,有99.9%的把握认为闯红灯与年龄有关(2)0.2(3)答案见解析(1) 30岁及以下 30岁以上 总计闯红灯 20 60 80未闯红灯 80 40 120总计 100 100 200由表中数据,得.∵,∴有99.9%的把握认为闯红灯与年龄有关.(2)未进行处罚前,行人闯红灯的概率约为0.4,当处罚金额为10元时,行人闯红灯的概率约为,故当处罚金额为10元时,行人闯红灯的概率比不进行处罚降低0.2.(3)①根据调查数据显示,行人闯红灯与年龄有明显关系,可以针对30岁以上人群开展“道路安全”宣传教育;②由于试行经济处罚可以明显降低行人闯红灯的概率,则可以进行适当经济处罚来降低行人闯红灯的概率.B能力提升1.(2022·江苏·盐城中学模拟预测)某抽奖系统中,抽得的物品可分为5星,4星和3星,其中一种抽奖种类中的抽奖系统的概率和相关保底机制如下:物品类别 5星 4星 3星基础概率 0.600% 5.100% 94.300%基础概率:在没有任何其他机制的影响下,单次抽奖抽中指定类别奖品的概率.保底机制:现假定玩家从未进行过抽奖,则玩家抽取5星(或4星)的概率会随者未抽中5星(或4星)的次数增加而改变,相关机制如下表所示:连续未抽中4星的次数i下一次抽中4星的概率 5.100%连续未抽中5星的次数i下一次抽中5星的概率 0.600%注:①表示中的最小值:②抽中4星的概率和抽中5星的概率的增加值从抽中3星的概率中等量扣除;③若发现下一次抽奖中,抽中4星的概率和抽中5星的概率的和大于1,则下一次抽奖抽中5星的概率等于表中的值(记为p),而抽中4星的概率为.现记玩家获得1个5星物品所需要的最大抽奖次数为N;(1)统计10名玩家抽到第一个五星的总次数和中途抽到四星的次数如下表所示:玩家序号 1 2 3 4 5 6 7 8 9 10总次数y 30 78 64 80 85 79 55 83 66 81四星个数x 4 8 7 9 9 8 6 9 8 9计算得:,已知y与x之间存在很强的线性相关关系,求出其线性回归方程,并求出使得最小的x(回归方程中的和取两位小数)参考公式:回归直线方程斜率和截距的最小二乘估计公式分别为:.【答案】(1),(1)因为,代入数据得:,所以,所以y与x的线性回归方程为.当连续未抽中5星的次数,下一次抽中5星的概率为0.600%,所以下一次可能抽不中5星;当连续未抽中5星的次数,下一次抽中5星的概率0.600%,由有:,所以玩家获得1个5星物品所需要的最大抽奖次数为73. 所以,由有:,所以使得最小的x为8.2.(2022·河北唐山·高二期末)为过接2022年北京冬季奥运会,普及冬奥知识,某校开展了“冰雪答题王”冬奥知识竞赛活动,现从参加冬奥知识竞赛活动的学生中随机抽取了100名学生,将他们的比赛成绩(满分为100分)为6组:,,,,,,得到如图所示的频率分布直方图.(1)求a的值;(2)记A表示事件“从参加冬奥知识竞赛活动的学生中随机抽取一名学生,该学生的比赛成绩不低于80分”,估计A的概率;(3)在抽取的100名学生中,规定:比赛成绩不低于80分为“优秀”,比赛成低于90分为“非优秀”,请将下面的列联表补充完整,并判断是否有99.9%的把握认为“比赛成绩是否优秀与性别有关”?优秀 非优秀 合计男生 40女生 50合计 100参考公式及数据:,.0.10 0.05 0.025 0.01 0.005 0.0012.706 3.841 5.024 6.635 7.879 10.828【答案】(1);(2)0.35;(3)列联表答案见解析,没有99.9%的把握认为比赛成绩优秀与性别有关.(1)由频率分布直方图知,,解得:,所以a的值是0.025.(2)由(1)知,则比赛成绩不低于80分的频率为,所以从参加冬奥知识竞赛活动的学生中随机抽取一名学生,该学生的比赛成绩不低于80分的概率约为0.35.(3)由(2)知,在抽取的100名学生中,比赛成绩优秀的有人,由此可得完整的2×2列联表:优秀 非优秀 合计男生 10 40 50女生 25 25 50合计 35 65 100零假设:比赛成绩优秀与性别无关,根据表中的数据,计算得到,依据小概率值的独立性检验,没有充分证据推断不成立,因此可以认为成立,即没有99.9%的把握认为比赛成绩优秀与性别有关.C综合素养1.(2022·黑龙江·哈尔滨三中三模(文))2022年春节前,受疫情影响,各地鼓励市民接种新冠疫苗第三针.某市统计了该市4个地区的疫苗接种人数与第三针接种人数(单位:万),得到如下表格:A区 B区 C区 D区疫苗接种人数x/万 6 8 10 12第三针接种人数y/万 2 3 5 6(1)请用相关系数说明y与x之间的关系可用线性回归模型拟合,并求y关于x的线性回归方程(若,则线性相关程度很高,可用直线拟合).参考公式和数据:相关系数,回归方程中斜率和截距的最小二乘估计公式分别为,,.【答案】(1)说明答案见解析,由题:,,,,,所以相关系数,说明y与x之间的性相关程度很高,所以可用线性回归模型拟合y与x之间的关系.,故y关于x的线性回归方程为.2.(2022·河南新乡·高二期中(文))为研究男体育特长生的身高与体重之间的关系,从某校的男体育特长生中随机选取8名,其身高和体重的数据如表所示:编号 1 2 3 4 5 6 7 8身高x() 178 173 158 167 160 173 166 169体重y() 66 61 50 58 53 66 57 57(1)根据最小二乘法的思想与公式求得身高与体重的线性回归方程为.利用已经求得的线性回归方程,完善下列残差表,并求解释变量(身高)对于预报变量(体重)变化的贡献值(保留两位有效数字).编号 1 2 3 4 5 6 7 8体重y() 66 61 50 58 53 66 57 57残差 -0.5 -1.5 -0.5 0.3 0.9(2)通过残差分析,对于残差绝对值最大的那组数据,需要确认在样本点的采集中是否有人为的错误,已知通过重新采集发现,该组数据的体重应该为58kg.请重新根据最小二乘法的思想与公式,求出男体育特长生的身高与体重的线性回归方程.参考公式:,,,.参考数据:,,,,.【答案】(1)填表答案见解析,约为0.91(2)(1)解:对编号为6的数据:;对编号为7的数据:;对编号为8的数据:.完成的残差表如下所示:编号 1 2 3 4 5 6 7 8体重y(kg) 66 61 50 58 53 66 57 57残差 -0.5 -1.5 -0.5 0.3 0.9 3.5 0.1 -2.3,,所以解释变量(身高)对于预报变量(体重)变化的贡献值约为0.91.(2)由(1)可知,第六组数据的体重应为58,此时,又,,,,,所以重新采集数据后,男体育特长生的身高与体重的线性回归方程为.3.(2022·山东淄博·模拟预测)小叶紫檀是珍稀树种,因其木质好备受玩家喜爱,其幼苗从观察之日起,第x天的高度为ycm,测得数据如下:1 4 9 16 25 36 490 4 7 9 11 12 13数据的散点图如图所示:为近似描述y与x的关系,除了一次函数,还有和两个函数可选.(1)从三个函数中选出“最好”的曲线拟合y与x的关系,并求出其回归方程(保留到小数点后1位);(2)判断说法“高度从1000cm长到1001cm所需时间超过一年”是否成立,并给出理由.参考公式:,.参考数据(其中,):,,,, ,,,,,.【答案】(1)选用;;(2)说法“高度从1000cm长到1001cm所需时间超过一年”成立.理由见解析.(1)由散点图可知,这些数据集中在图中曲线的附近,而曲线的形状与函数的图象很相似,因此可以用类似的表达式来描述y与x的关系,即三个函数中的图象是拟合y与x的关系“最好”的曲线.令,则,根据已知数据,得,,所以,又回归直线经过点(4,8),所以,所以y关于x的回归直线方程为,即;(2)说法“高度从1000cm长到1001cm所需时间超过一年”成立.设其幼苗从观察之日起,第m天的高度为1000cm,有,解得,第n天的高度为1001cm,有,解得,天,所以说法“高度从1000cm长到1001cm所需时间超过一年”成立.第03讲 成对数据的统计分析 (精练)A夯实基础 B能力提升 C综合素养A夯实基础一、单选题1.(2022·全国·高二课时练习)下列关于回归分析与独立性检验的说法正确的是( )A.回归分析和独立性检验没有什么区别B.回归分析是对两个变量准确关系的分析,而独立性检验是分析两个变量之间的不确定性关系C.回归分析研究两个变量之间的相关关系,独立性检验是对两个变量是否具有某种关系的一种检验D.独立性检验可以100%确定两个变量之间是否具有某种关系2.(2022·陕西西安·高一期末)如图是根据的观测数据得到的散点图,可以判断变量具有线性相关关系的有( )A.①② B.①③ C.②④ D.③④3.(2022·辽宁大连·高二期末)为考察一种新药预防疾病的效果,某科研小组进行动物实验,收集整理数据后将所得结果填入相应的列联表中.由列联表中的数据计算得.参照附表,下列结论正确的是( )0.025 0.010 0.005 0.0015.02 6.635 7.879 10.828A.在犯错误的概率不超过0.1%的前提下,认为“药物有效”B.在犯错误的概率不超过0.1%的前提下,认为“药物无效”C.有99.99%以上的把握认为“药物有效”D.有99.99%以上的把握认为“药物无效”4.(2022·全国·高二课时练习)如图是某地区2012年至2021年的空气污染天数Y(单位:天)与年份X的折线图.根据2012年至2016年的数据,2017年至2021年的数据,2012年至2021年的数据分别建立线性回归模型,,,则( )A., B.,C., D.,5.(2022·安徽·歙县教研室高二期末)已知变量的成对样本数据的四个样本点,用最小二乘法得到回归方程 过点的直线方程为,给出下列4个命题:①;②;③;④点一定在直线上.其中正确的命题的个数是( )参考公式:,.A.1个 B.2个 C.3个 D.4个6.(2022·山东滨州·高二期末)针对时下的“短视频热”,某高校团委对学生性别和喜欢短视频是否有关联进行了一次调查,其中被调查的男生 女生人数均为人,男生中喜欢短视频的人数占男生人数的,女生中喜欢短视频的人数占女生人数的.零假设为:喜欢短视频和性别相互独立.若依据的独立性检验认为喜欢短视频和性别不独立,则的最小值为( )附:,附表:0.05 0.013.841 6.635A.7 B.8 C.9 D.107.(2022·辽宁·高三期末)某工厂为了对研发的一种产品进行合理定价,将该产品按事先拟定的价格进行试销,得到如下数据:单价x元 9 9.2 9.4 9.6 9.8 10销量y件 100 94 93 90 85 78(附:对于一组数据(x1,y1),(x2,y2)…(xn,yn),其回归直线的斜率的最小二乘估计值为参考数值:,);预计在今后的销售中,销量与单价仍然服从这种线性相关关系,且该产品的成本是5元/件,为使工厂获得最大利润,该产品的单价应定为( )A.9.4元 B.9.5元 C.9.6元 D.9.7元8.(2022·山西省长治市第二中学校高二阶段练习)中国是茶的故乡,也是茶文化的发源地.茶的发现和利用已有四千七百多年的历史,且长盛不衰,传遍全球.为了弘扬中国茶文化,某酒店推出特色茶食品“金萱排骨茶”,为了解每壶“金萱排骨茶”中所放茶叶量x(单位:克)与食客的满意率y的关系,通过调查研究发现选择函数模型来拟合y与x的关系,根据以下数据:茶叶量x/克 1 2 3 4 54.34 4.36 4.44 4.45 4.51可求得y关于x的回归方程为( )(附:对于一组数据,其回归直线的斜率和截距的最小二乘估计分别为,)A. B.C. D.二、多选题9.(2022·全国·高二课时练习)为了增强学生的身体素质,某校将冬天长跑作为一项制度固定下来,每天大课间例行跑操.为了调查学生喜欢跑步是否与性别有关,研究人员随机调查了相同人数的男、女学生,发现男生中有80%喜欢跑步,女生中有40%不喜欢跑步,且有95%的把握判断喜欢跑步与性别有关,但没有99%的把握判断喜欢跑步与性别有关,则被调查的男、女学生的总人数可能为( )A.120 B.130 C.240 D.25010.(2022·山东聊城·高二期末)对具有相关关系的两个变量和进行回归分析时,经过随机抽样获得成对的样本数据,则下列说法正确的是( )A.若两变量、具有线性相关关系,则回归直线至少经过一个样本点B.变量、的线性相关系数的绝对值越接近,则两个变量与的线性相关程度越强C.用残差平方和来比较两个模型的拟合效果时,残差平方和越小,模型的拟合效果越好D.用来刻画回归模型的拟合效果时,若所有样本点都落在一条斜率为非零的直线上,则的值为三、填空题11.(2022·内蒙古·满洲里市第一中学高一期末)某地,第x年该地人均收入y的部分数据如下表:年份 2015 2016 2017 2018 2019年份编号x 1 2 3 4 5年人均收入y(万元) 0.5 0.6 1 1.4 m根据表中所数据,求得y与x的线性回归方程为:,则2019年该地区实际年人均收入为___________万元.12.(2022·全国·高三专题练习)和的散点图如图所示,则下列说法中所有正确命题的序号为______.①,是负相关关系;②,之间不能建立线性回归方程;③在该相关关系中,若用拟合时的相关指数为,用拟合时的相关指数为,则.四、解答题13.(2022·陕西渭南·高一期末)每到夏季,许多人选择到水上乐园游玩,某水上乐园统计了开业后第3~7天每天的游客人数(百人)的数据,得到下面的表格:第天 3 4 5 6 7游客人数(百人) 1.5 2 3 3.5 5(1)若与具有线性相关关系,求关于的线性回归方程;(2)已知该水上乐园每天最大的游客承载量为1000人,如果某天的游客数量预计会超过该水上乐园每天最大的游客承载量,则当天需采取限流措施,根据(1)中的回归方程估计:从第几天开始,该水上乐园需要采取限流措施?附:线性回归方程的斜率和截距的最小二乘估计分别为,.14.(2022·全国·高二课时练习)某市自2021年1月启动对“车不让人行为”处罚以来,斑马线前机动车抢行不文明行为得以根本改变,但作为交通重要参与者的行人,闯红灯通行却频有发生,带来了较大的交通安全隐患,同时也使机动车的通畅率降低.该市交警部门在某十字路口根据以往的检测数据,得到行人闯红灯的概率约为0.4,并从穿越该路口的行人中随机抽取了200人进行调查,对是否存在闯红灯情况得到如下列联表:30岁及以下 30岁以上 总计闯红灯 60未闯红灯 80总计 200近期,为了整顿“行人闯红灯”这一项不文明及违法行为,交警部门在该十字路口对闯红灯行人试行经济处罚,并在试行经济处罚后从穿越该路口的行人中随机抽取了200人进行调查,得到下表:处罚金额(单位:元) 5 10 15 20闯红灯的人数 50 40 20 0将统计数据所得频率作为概率,完成下列问题.(1)将列联表填写完整(不需写出填写过程),并根据表中数据分析,在未对闯红灯行人试行经济处罚前,是否有99.9%的把握认为闯红灯与年龄有关?(2)当处罚金额为10元时,行人闯红灯的概率比不进行处罚降低多少?(3)结合调查结果,谈谈如何治理行人闯红灯现象.B能力提升1.(2022·江苏·盐城中学模拟预测)某抽奖系统中,抽得的物品可分为5星,4星和3星,其中一种抽奖种类中的抽奖系统的概率和相关保底机制如下:物品类别 5星 4星 3星基础概率 0.600% 5.100% 94.300%基础概率:在没有任何其他机制的影响下,单次抽奖抽中指定类别奖品的概率.保底机制:现假定玩家从未进行过抽奖,则玩家抽取5星(或4星)的概率会随者未抽中5星(或4星)的次数增加而改变,相关机制如下表所示:连续未抽中4星的次数i下一次抽中4星的概率 5.100%连续未抽中5星的次数i下一次抽中5星的概率 0.600%注:①表示中的最小值:②抽中4星的概率和抽中5星的概率的增加值从抽中3星的概率中等量扣除;③若发现下一次抽奖中,抽中4星的概率和抽中5星的概率的和大于1,则下一次抽奖抽中5星的概率等于表中的值(记为p),而抽中4星的概率为.现记玩家获得1个5星物品所需要的最大抽奖次数为N;(1)统计10名玩家抽到第一个五星的总次数和中途抽到四星的次数如下表所示:玩家序号 1 2 3 4 5 6 7 8 9 10总次数y 30 78 64 80 85 79 55 83 66 81四星个数x 4 8 7 9 9 8 6 9 8 9计算得:,已知y与x之间存在很强的线性相关关系,求出其线性回归方程,并求出使得最小的x(回归方程中的和取两位小数)参考公式:回归直线方程斜率和截距的最小二乘估计公式分别为:.2.(2022·河北唐山·高二期末)为过接2022年北京冬季奥运会,普及冬奥知识,某校开展了“冰雪答题王”冬奥知识竞赛活动,现从参加冬奥知识竞赛活动的学生中随机抽取了100名学生,将他们的比赛成绩(满分为100分)为6组:,,,,,,得到如图所示的频率分布直方图.(1)求a的值;(2)记A表示事件“从参加冬奥知识竞赛活动的学生中随机抽取一名学生,该学生的比赛成绩不低于80分”,估计A的概率;(3)在抽取的100名学生中,规定:比赛成绩不低于80分为“优秀”,比赛成低于90分为“非优秀”,请将下面的列联表补充完整,并判断是否有99.9%的把握认为“比赛成绩是否优秀与性别有关”?优秀 非优秀 合计男生 40女生 50合计 100参考公式及数据:,.0.10 0.05 0.025 0.01 0.005 0.0012.706 3.841 5.024 6.635 7.879 10.828C综合素养1.(2022·黑龙江·哈尔滨三中三模(文))2022年春节前,受疫情影响,各地鼓励市民接种新冠疫苗第三针.某市统计了该市4个地区的疫苗接种人数与第三针接种人数(单位:万),得到如下表格:A区 B区 C区 D区疫苗接种人数x/万 6 8 10 12第三针接种人数y/万 2 3 5 6(1)请用相关系数说明y与x之间的关系可用线性回归模型拟合,并求y关于x的线性回归方程(若,则线性相关程度很高,可用直线拟合).参考公式和数据:相关系数,回归方程中斜率和截距的最小二乘估计公式分别为,,.2.(2022·河南新乡·高二期中(文))为研究男体育特长生的身高与体重之间的关系,从某校的男体育特长生中随机选取8名,其身高和体重的数据如表所示:编号 1 2 3 4 5 6 7 8身高x() 178 173 158 167 160 173 166 169体重y() 66 61 50 58 53 66 57 57(1)根据最小二乘法的思想与公式求得身高与体重的线性回归方程为.利用已经求得的线性回归方程,完善下列残差表,并求解释变量(身高)对于预报变量(体重)变化的贡献值(保留两位有效数字).编号 1 2 3 4 5 6 7 8体重y() 66 61 50 58 53 66 57 57残差 -0.5 -1.5 -0.5 0.3 0.9(2)通过残差分析,对于残差绝对值最大的那组数据,需要确认在样本点的采集中是否有人为的错误,已知通过重新采集发现,该组数据的体重应该为58kg.请重新根据最小二乘法的思想与公式,求出男体育特长生的身高与体重的线性回归方程.参考公式:,,,.参考数据:,,,,.3.(2022·山东淄博·模拟预测)小叶紫檀是珍稀树种,因其木质好备受玩家喜爱,其幼苗从观察之日起,第x天的高度为ycm,测得数据如下:1 4 9 16 25 36 490 4 7 9 11 12 13数据的散点图如图所示:为近似描述y与x的关系,除了一次函数,还有和两个函数可选.(1)从三个函数中选出“最好”的曲线拟合y与x的关系,并求出其回归方程(保留到小数点后1位);(2)判断说法“高度从1000cm长到1001cm所需时间超过一年”是否成立,并给出理由.参考公式:,.参考数据(其中,):,,,, ,,,,,. 展开更多...... 收起↑ 资源列表 第九章第03讲 成对数据的统计分析 (精练)(原卷版).docx 第九章第03讲 成对数据的统计分析 (精练)(解析版).docx