资源简介 专题22 成对数据的统计问题探究1:成对数据的分析【典例剖析】例1.(2022·浙江省模拟) 创新是民族的灵魂,某大型企业对其产品进行研发与创新,根据市场调研与模拟,得到研发投入亿元与研发创新的直接收益亿元的数据统计如下:当时,建立了与的两个回归模型:模型①:;模型②:;当时,确定与满足的线性回归方程为:.根据下列表格中的数据,比较当时模型①、②的决定系数,并选择拟合精度更高、更可靠的模型,预测该企业对产品创新改造的投入为亿元时的直接收益.回归模型 模型① 模型②回归方程附:刻画回归效果的决定系数,,决定系数数值越大,说明拟合效果越好为鼓励科技创新,当研发的投入不少于亿元时,国家给予公司补贴收益亿元,以回归方程为预测依据,比较研发改造投入亿元与亿元时公司实际收益的大小.附:,研发改造后,该公司产品的效率大幅提高,服从正态分布,公司对研发团队的奖励方案如下:若产品的效率不超过,不予奖励;若产品的效率超过但不超过,每件产品奖励万元;若产品的效率超过,每件产品奖励万元.求每件产品获得奖励的数学期望.附:随机变量服从正态分布,则,【变式训练】练1-1(2022·福建省模拟·多选) 某班级学生开展课外数学探究活动,将一杯冷水从冰箱中取出后静置,在的室温下测量水温单位:随时间单位:的变化关系,在测量了个数据后,根据这些实验数据得到如下的散点图:现需要选择合适的回归方程进行回归分析,则根据散点图,合适的回归方程类型有( )A. B.C. D.练1-2(2022·湖北省武汉市联考)年月日,全国教育大会在北京召开,习近平总书记在会上提出“培养德智体美劳全面发展的社会主义建设者和接班人”某学校贯彻大会精神,为学生开设了一门模具加工课,经过一段时间的学习,拟举行一次模具加工大赛,学生小明、小红打算报名参加大赛.赛前,小明进行了一段时间的强化训练,加工完成一个模具的平均速度秒与训练天数天有关,经统计得到如下表数据:天秒经研究发现,可用作为回归方程模型,请利用表中数据,求出该回归方程,并预测小明经过天训练后,加工完成一个模具的平均速度约为多少秒?小明和小红拟先举行一次模拟赛,每局比赛各加工一个模具,先加工完成模具的人获胜,两人约定先胜局者赢得比赛.若小明每局获胜的概率为,已知在前局中小明胜局,小红胜局.若每局不存在平局,请你估计小明最终赢得比赛的概率,参考数据:其中参考公式:对于一组数据,,,,其回归直线的斜率和截距的最小二乘估计公式分别为,.【规律方法】1.判断相关关系的两种方法①散点图法:如果样本点的分布从整体上看大致在某一曲线附近,变量之间就有相关关系;如果样本点的分布从整体上看大致在某一直线附近,变量之间就有线性相关关系.②决定系数法:利用决定系数判定,越趋近1,拟合效果越好,相关性越强.2.求经验回归方程:①利用公式求;利用求,写出经验回归方程.②经验回归方程的拟合效果,可以利用相关系数判断,当越趋近于1时,两变量的线性相关性越强.或利用决定系数判断,越大,拟合效果越好.3.非线性经验回归方程转化为线性经验回归方程:①若,设,则;②若满足对数式:,设,则;③若满足指数式:,两边取对数,设,则.探究2:独立性检验【典例剖析】例2.(2022·湖北省联考) 为了检测某种抗病毒疫苗的免疫效果,需要进行动物与人体试验研究人员将疫苗注射到只小白鼠体内,一段时间后测量小白鼠的某项指标值,按,,,,分组,绘制频率分布直方图如图所示试验发现小白鼠体内产生抗体的共有只,其中该项指标值不小于的有只.假设小白鼠注射疫苗后是否产生抗体相互独立.填写下面的列联表,并根据列联表及的独立性检验,判断能否认为注射疫苗后小白鼠产生抗体与指标值不小于有关.单位:只指标值抗体 小于 不小于 合计有抗体没有抗体合计为检验疫苗二次接种的免疫抗体性,对第一次注射疫苗后没有产生抗体的只小白鼠进行第二次注射疫苗,结果又有只小白鼠产生抗体.用频率估计概率,求一只小白鼠注射次疫苗后产生抗体的概率以中确定的概率作为人体注射次疫苗后产生抗体的概率,进行人体接种试验,记个人注射次疫苗后产生抗体的数量为随机变量试验后统计数据显示,当时,取最大值,求参加人体接种试验的人数及.参考公式:其中为样本容量【变式训练】练2-1(2022·湖北省黄石市月考·多选) 为了增强学生体育锻炼的积极性,某中学需要了解性别因素与学生对体育锻炼的喜好是否有影响,为此对学生是否喜欢体育锻炼的情况进行普查得到下表:性别 合计男性 女性喜欢不喜欢合计附:,.已知男生喜欢该项运动的人数占男生人数的,女生喜欢该项运动的人数占女生人数的,则下列说法正确的是A. 列联表中的值为,的值为B. 随机对一名学生进行调查,此学生有的可能喜欢该项运动C. 有的把握认为学生的性别与其对该项运动的喜好有关系D. 没有的把握认为学生的性别与其对该项运动的喜好有关系练2-2(2022·山东省潍坊市模拟) 根据以往的经验,某工程施工期间的降水量单位:对工期的影响如下表:降水量工期延误天数历史气象资料表明:该工程施工期间降水量小于,,的概率分别为,,.求工期延误天数的均值与方差;求在降水量至少是的条件下,工期延误不超过天的概率;由于该工程在月施工,故当气温较高时,工人可能无法按时完成当日计划工作量.已知在某个天的施工周期内,有天的最高气温不低于,这其中仅有天完成了当日的工作量;剩余天中,有天完成了当日的工作量.依据小概率值的独立性检验,判断“当日最高气温不低于”和“工人能完成当日的工作量”是否相互独立,并写出零假设.附:,临界值.【规律方法】1.在列联表中,如果两个变量没有关系,则应满足.越小,说明两个变量之间关系越弱;越大,说明两个变量之间关系越强.2.解决独立性检验的应用问题,一定要按照独立性检验的步骤得出结论.独立性检验的一般步骤:(1)根据样本数据制成列联表:(2)根据公式计算;(3)通过比较与临界值的大小关系来作统计推断.探究3:概率与统计的综合问题【典例剖析】例3.( 2022·江西省景德镇市模拟) 十三届全国人大四次会议月日表决通过了关于国民经济和社会发展第十四个五年规划和年远景目标纲要的决议,纲要指出:“加强原创性引领性科技攻关”某企业集中科研骨干,攻克系列“卡脖子”技术,已成功实现离子注入机全谱系产品国产化,包括中束流、大束流、高能特种应用及第三代半导体等离子注入机,工艺段覆盖至,为我国芯片制造产业链补上重要一环,为全球芯片制造企业提供离子注入机一站式解决方案此次技术的突破可以说为国产芯片的制造做出了重大贡献,该企业使用新技术对某款芯片进行试生产,该款芯片的性能以某项指标值为衡量标准,性能指标的等级划分如表:性能指标值等级为了解该款芯片的生产效益,该企业从试生产的产品进行随机抽样并测量了每件产品的指标值,若以组距为画频率分布直方图时,发现设“”满足:.试确定的所有取值,并求;从样本性能指标值不小于的产品中釆用分层抽样的方法抽取件产品,求样本中等级产品与等级产品的件数然后从这件产品中一次性随机抽取件产品,并求出件都是级品的概率.【变式训练】练3-1(2022·广东省东莞市月考) 足球是一项大众喜爱的运动.卡塔尔世界杯揭幕战将在年月日打响,决赛定于月日晚进行,全程为期天.为了解喜爱足球运动是否与性别有关,随机抽取了男性和女性各名观众进行调查,得到列联表如下:喜爱足球运动 不喜爱足球运动 合计男性女性合计依据小概率值的独立性检验,能否认为喜爱足球运动与性别有关?校足球队中的甲、乙、丙、丁四名球员将进行传球训练,第次由甲将球传出,每次传球时,传球者都等可能的将球传给另外三个人中的任何一人,如此不停地传下去,且假定每次传球都能被接到.记开始传球的人为第次触球者,第次触球者是甲的概率记为,即.求直接写出结果即可;证明:数列为等比数列,并判断第次与第次触球者是甲的概率的大小.练3-2(2022·福建省联考) 近年来,我国大学生毕业人数呈逐年上升趋势,各省市出台优惠政策鼓励高校毕业生自主创业,以创业带动就业.某市统计了该市其中四所大学年的毕业生人数及自主创业人数单位:千人,得到如下表格:大学 大学 大学 大学当年毕业人数千人自主创业人数千人已知与具有较强的线性相关关系,求关于的线性回归方程;假设该市政府对选择自主创业的大学生每人发放万元的创业补贴.(ⅰ)若该市大学年毕业生人数为千人,根据的结论估计该市政府要给大学选择自主创业的毕业生创业补贴的总金额;(ⅱ)若大学的毕业生中小明、小红选择自主创业的概率分别为,,该市政府对小明、小红两人的自主创业的补贴总金额的期望不超过万元,求的取值范围.参考公式:回归方程中斜率和截距的最小二乘法估计公式分别为,.【规律方法】概率与统计作为考查考生应用意识的重要载体,已成为近几年高考的一大亮点和热点.它与其他知识融合、渗透,情境新颖,充分体现了概率与统计的工具性和交汇性.概率与统计案例的综合应用常涉及相互独立事件同时发生的概率、频率分布直方图的识别与应用、数字特征、独立性检验等基础知识,考查学生的阅读理解能力、数据处理能力、运算求解能力及应用意识.专题22 成对数据的统计问题—答案解析例1.【解析】由表格中的数据,有,即,所以模型①的小于模型②,说明回归模型②刻画的拟合效果更好,所以当亿元时,研发改造直接收益的预测值为亿元,由已知可得:,,所以,所以当亿元时,与满足的线性回归方程为,当亿元时,研发改造直接收益的预测值为;当亿元时,实际收益的预测值为亿元亿元,所以研发改造投入亿元时,公司的实际收益更大;因为,所以,,因为,所以,所以,设每件产品获得奖励为万元,则的分布列为: 所以每件产品获得奖励的期望值为:万元. 练1-1.【解析】散点图的特点是单调递增,增长速度越来越慢,且水温.对选项,符合散点图的特点;对选项,不符合散点图的特点;对选项,符合散点图的特点;对选项,的增长速度不变,不符合散点图的特点.故选:.练1-2.【解析】由题意,,令,设关于的线性回归方程为,则,则,,又,关于的回归方程为,故时,,经过天训练后,加工完成一个模具的平均速度约为秒设比赛再继续进行局小明最终赢得比赛,则最后一局一定是小明获胜,由题意知,最多再进行局就有胜负,可能的取值为、、.当时,小明胜,,当时,小明胜,,当时,小明胜,,小明最终赢得比赛的概率为. 例2. 【解析】由频率分布直方图,知只小白鼠按指标值分布为:在内有只在内有只在内有只在内有只在内有只.由题意,有抗体且指标值小于的有只;而指标值小于的小白鼠共有只,所以指标值小于且没有抗体的小白鼠有只,同理,指标值不小于且没有抗体的小白鼠有只,故列联表如下:单位:只抗体 指标值 合计小于 不小于有抗体没有抗体合计零假设为注射疫苗后小白鼠产生抗体与指标值不小于无关联.根据列联表中数据,得.根据的独立性检验,推断不成立,即认为注射疫苗后小白鼠产生抗体与指标值不小于有关,此推断犯错误的概率不大于.令事件“小白鼠第一次注射疫苗产生抗体”,事件“小白鼠第二次注射疫苗产生抗体”,事件“小白鼠注射次疫苗后产生抗体”.记事件,,发生的概率分别为,,,则,,.所以一只小白鼠注射次疫苗后产生抗体的概率.由题意,知随机变量,.因为最大,所以解得,因为是整数,所以或,所以接受接种试验的人数为或.①当接种人数为时,②当接种人数为时,.练2-1.【解析】男生喜欢该项运动的人数占男生人数的,解得,女生喜欢该项运动的人数占女生人数的,解得,故 A正确;随机对一名学生进行调查,此学生有的可能喜欢该项运动,故B错误;对于,性别 合计男性 女性喜欢不喜欢合计所以,所以有的把握认为学生的性别与其对该项运动的喜好有关系,故C正确;而,所以没有的把握认为学生的性别与其对该项运动的喜好有关系,故D正确.故选:.练2-2.【解析】由已知条件和概率的加法公式有:,,,,所以的分布列为:于是,,.故工期延误天数的均值为,方差为由对立事件的概率公式可得,又,由条件概率得,故在降水量至少是的条件下,工期延误不超过天的概率是.零假设“当日最高气温不低于”与“工人能完成当日工作量”相互独立,根据题意可得到如下的列联表:则,因而不能拒绝原假设,因此,可以认为“当日最高气温不低于”和“工人能完成当日的工作量”相互独立. 例3. 【解析】根据题意,,按组距为可分成个区间,分别是、、、、、因为,由,,可知的取值集合为,每个小区间对应的频率值为.所以,,解得.等级产品的频率为,等级产品的频率为,所以,等级产品和等级产品的频率之比为,所以,从样本性能指标值不小于的产品中釆用分层抽样的方法抽取件产品,等级产品的件数为,分别记为、、、,等级产品的件数为,记为,从这件产品中任意抽取件产品,所有的基本事件有:、、、、、、、、、,共种,其中,事件“所抽的件都是级品”包含的基本事件有:、、、、、,共种,故所求概率为.练3-1.【解析】假设:喜爱足球运动与性别独立,即喜爱足球运动与性别无关,,根据小概率值的独立性检验,我们推断不成立,即认为喜爱足球运动与性别有关,此推断犯错误的概率不超过.由题意;第次触球者是甲的概率记为,则当时,第次触球者是甲的概率为,第次触球者不是甲的概率为,则,从而,又,是以为首项,公比为的等比数列,则,,,,故第次触球者是甲的概率大. 练3-2.【解析】由题意得,,,,.所以.故得关于的线性回归方程为.将代入,所以估计该市政府雷要给大学毕业生选择自主创业的人员发放补贴金总额为万元,设小明、小红两人中选择自主创业的人数为,则的所有可能值为,,,可得,,,故的取值范围为 2 展开更多...... 收起↑ 资源预览