第八章 成对数据的统计分析总结 第三课(学案+练习)(含答案) 高中数学人教A版(2019)选择性必修第三册

资源下载
  1. 二一教育资源

第八章 成对数据的统计分析总结 第三课(学案+练习)(含答案) 高中数学人教A版(2019)选择性必修第三册

资源简介

第八章 成对数据的统计分析
第三练 方法提升应用
【试题来源】来自各地期中期末的联考试题,进行整理和改编;
【试题难度】本次训练试题难度较大,适合学完第三课后,起到提升解题能力和素养的目的.
【目标分析】
1.利用一元回归模型对实际问题进行决策,培养数据分析、数学建模、数学运算,如第3题.
2.利用独立性检验对实际问题进行决策,锻炼数学建模能力,运算求解能力,如第1题.
一、解答题
(23-24高三下·湖南湘潭·阶段练习)
1.2023年8月8日是我国第15个“全民健身日”,设立全民健身日(FitnessDay)是适应人民群众体育的需求,促进全民健身运动开展的需要.某学校为了提高学生的身体素质,举行了跑步竞赛活动,活动分为长跑 短跑两类项目,且该班级所有同学均参加活动,每位同学选择一项活动参加.
长跑 短跑
男同学 30 10
女同学 10
若采用分层抽样按性别从该班级中抽取6名同学,其中有男同学4名,女同学2名.
(1)求的值以及该班同学选择长跑的概率;
(2)依据小概率值的独立性检验,能否推断选择跑步项目的类别与其性别有关?
附:,其中.
0.05 0.01 0.001
3.841 6.635 10.828
(2024·全国·模拟预测)
2.按照男女生比例,某学校随机抽取了70名男生,50名女生,检测他们的视力情况,得到下面列联表:
性别 视力情况
近视 不近视
男生 30
女生 40
(1)根据上表,分别估计这所学校男生、女生近视的概率;
(2)能否有的把握认为近视与性别有关?
附:,其中.
0.10 0.05 0.010 0.005 0.001
2.706 3.841 6.635 7.879 10.828
(22-23高二上·四川攀枝花·期末)
3.攀枝花属于亚热带季风气候区,水果种类丰富.其中,“红格脐橙”已经“中华人民共和国农业部2010年第1364号公告”予以登记,根据其种植规模与以往的种植经验,产自该果园的单个“红格脐橙”的果径(最大横切面直径,单位:)在正常环境下服从正态分布.
(1)一顾客购买了10个该果园的“红格脐橙”,求会买到果径小于的概率;
(2)为了提高利润,该果园每年投入一定的资金,对种植、采摘、包装、宣传等环节进行改进.如图是2013年至2022年(单位:万元)与年利润增量y(单位:万元)的散点图:

该果园为了预测2023年投资金额为20万元时的年利润增量,建立了关于的两个回归模型;
模型①:由最小二乘公式可求得与的线性回归方程:;
模型②:由图中样本点的分布,可以认为样本点集中在曲线:的附近.对投资金额做交换,令,且有,,,.
(ⅰ)根据所给的统计量,求模型②中关于的回归方程;
(ⅱ)根据下列表格中的数据,比较两种模型的相关指数R2,并选择拟合精度更高、更可靠的模型,预测投资金额为20万元时的年利润增量(结果保留两位小数).
回归模型 模型① 模型②
回归方程
102.28 36.19
附:若随机变量,则,;
样本()的最小二乘估计公式为,;
相关指数.
参考数据:,,,.
(2024·上海·一模)
4.为帮助乡村脱贫,某勘探队计划了解当地矿脉某金属的分布情况,测得了平均金属含量(单位:克每立方米)与样本对原点的距离(单位:米)的数据,并作了初步处理,得到了下面的一些统计量的值.(表中).
6 97.90 0.21 240 0.14 14.12 26.13
(1)利用相关系数的知识,判断与哪一个更适宜作为平均金属含量关于样本对原点的距离的回归方程类型;
(2)根据(1)的结果建立关于的回归方程,并估计样本对原点的距离米时,平均金属含量是多少?
(23-24高二上·江西南昌·期末)
5.新冠肺炎疫情发生以来,中医药全面参与疫情防控救治,做出了重要贡献.某中医药企业根据市场调研与模拟,得到研发投入(亿元)与产品收益(亿元)的数据统计如下:
研发投入x(亿元) 1 2 3 4 5
产品收益y(亿元) 3 7 9 10 11
(1)计算的相关系数,并判断是否可以认为研发投入与产品收益具有较高的线性相关程度?(若,则线性相关程度一般,若,则线性相关程度较高)
(2)求出关于的线性回归方程,并预测若想收益超过50(亿元)则需研发投入至少多少亿元?(结果保留一位小数)
参考数据:;
附:相关系数公式:;
回归直线方程的斜率.
(2024·全国·模拟预测)
6.将氢储存在甲基环乙烷和甲苯等有机液体中是储氢和运输氢的重要方向.2023年12月俄罗斯科学院西伯利亚分院科研人员用镍和锡取代铂,研发出一种新型高效的脱氢催化剂,脱氢效率达,且对储氢载体没有破坏作用,可重复使用.近年来,我国氢能源汽车产业迅速发展,下表是某市氢能源乘用车的年销售量与年份的统计表:
年份 2018 2019 2020 2021 2022
销量(万台) 2 3.5 2.5 8 9
(1)求氢能源乘用车的销量关于年份的线性回归方程,并预测2024年氢能源乘用车的销量;
(2)为了研究不同性别的学生对氢能源的了解情况,某校组织了一次有关氢能源的知识竞赛活动,随机抽取了男生和女生各60名,得到如表所示的数据:
了解 不了解 合计
男生 25
女生 20
合计
(ⅰ)根据已知条件,填写上述列联表;
(ⅱ)依据的独立性检验,能否认为该校学生对氢能源的了解情况与性别有关?
参考公式:1.回归方程中斜率和截距的最小二乘法估计公式分别为;
2..
0.050 0.010 0.001
3.841 6.635 10.828
(23-24高二下·陕西西安·阶段练习)
7.近年来,长安区大力发展大花卉产业,其中玫瑰既有观赏价值也能加工成食品和高档化妆品而得到环山路一带农民大面种植.已知玫瑰的株高y(单位:cm)与一定范围内的温度x(单位:)有关,现收集了玫瑰的13组观测数据,得到如下的散点图:
现根据散点图利用或建立y关于x的回归方程,令,得到如下数据:
10.15 109.94 3.04 0.16
13.94 11.67 0.21 21.22
且与的相关系数分别为,,且.
(1)用相关系数说明哪种模型建立y与x的回归方程更合适;
(2)根据(1)的结果及表中数据,建立y关于x的回归方程;
(3)已知玫瑰的利润z与x、y的关系为,当x为何值时,z的预期最大.
参考数据和公式:,,,对于一组数据,其回归直线方程的斜率和截距的最小二乘法估计分别为,,相关系数.
(2024·云南红河·二模)
8.某网络购物平台专营店统计了某年2月15日至19日这5天在该店购物的人数(单位:人)的数据如下表:
日期 2月15日 2月16日 2月17日 2月18日 2月19日
日期代号 1 2 3 4 5
购物人数 77 84 93 96 100
(1)根据表中数据,建立关于的一元线性回归模型,并根据该回归模型预测当年2月21日在该店购物的人数(人数用四舍五入法取整数);
(2)为了了解参加网购人群的年龄分布,该店随机抽取了200人进行问卷调查.得到如下所示不完整的列联表:
年龄 不低于40岁 低于40岁 合计
参与过网上购物 30 150
未参与过网上购物 30
合计 200
将列联表补充完整,并依据表中数据及小概率值的独立性检验,能否认为“参与网上购物”与“年龄”有关.
附:回归直线的斜率和截距的最小二乘估计公式分别为
0.10 0.05 0.010 0.005 0.001
2.706 3.841 6.635 7.879 10.828
(23-24高三上·江苏苏州·阶段练习)
9.某学校研究性学习小组在学习生物遗传学的过程中,为验证高尔顿提出的关于儿子成年后身高(单位:)与父亲身高(单位:)之间的关系及存在的遗传规律,随机抽取了5对父子的身高数据,如下表:
父亲身高 160 170 175 185 190
儿子身高 170 174 175 180 186
参考数据及公式:,,,,,
(1)根据表中数据,求出y关于x的线性回归方程,并利用回归直线方程分别确定儿子比父亲高和儿子比父亲矮的条件,由此可得到怎样的遗传规律?
(2)记,,其中为观测值,为预测值,为对应的残差.求(1)中儿子身高的残差的和、并探究这个结果是否对任意具有线性相关关系的两个变量都成立?若成立加以证明;若不成立说明理由.
(2023·山东潍坊·模拟预测)
10.某地区未成年男性的身高(单位:cm)与体重平均值(单位:kg)的关系如下表1:
表1 未成年男性的身高与体重平均值
身高/cm 60 70 80 90 100 110 120 130 140 150 160 170
体重平均值/kg
直观分析数据的变化规律,可选择指数函数模型、二次函数模型、幂函数模型近似地描述未成年男性的身高与体重平均值之间的关系.为使函数拟合度更好,引入拟合函数和实际数据之间的误差平方和、拟合优度判断系数(如表2).误差平方和越小、拟合优度判断系数越接近1,拟合度越高.
表2 拟合函数对比
函数模型 函数解析式 误差平方和
指数函数
二次函数
幂函数
(1)问哪种模型是最优模型?并说明理由;
(2)若根据生物学知识,人体细胞是人体结构和生理功能的基本单位,是生长发育的基础.假设身高与骨细胞数量成正比,比例系数为;体重与肌肉细胞数量成正比,比例系数为.记时刻的未成年时期骨细胞数量,其中和分别表示人体出生时骨细胞数量和增长率,记时刻的未成年时期肌肉细胞数量,其中和分别表示人体出生时肌肉细胞数量和增长率.求体重关于身高的函数模型;
(3)在(2)的条件下,若,.当刚出生的婴儿身高为50cm时,与(1)的模型相比较,哪种模型跟实际情况更符合,试说明理由.
注:,;婴儿体重符合实际,婴儿体重较符合实际,婴儿体重不符合实际.
(23-24高三上·湖南衡阳·阶段练习)
11.为了加快实现我国高水平科技自立自强,某科技公司逐年加大高科技研发投入.下图1是该公司2013年至2022年的年份代码x和年研发投入y(单位:亿元)的散点图,其中年份代码1 10分别对应年份2013 2022.

根据散点图,分别用模型①,②作为年研发投入y(单位:亿元)关于年份代码x的经验回归方程模型,并进行残差分析,得到图2所示的残差图.结合数据,计算得到如下表所示的一些统计量的值:
75 2.25 82.5 4.5 120 28.35
表中,.
(1)根据残差图,判断模型①和模型②哪一个更适宜作为年研发投入y(单位:亿元)关于年份代码x的经验回归方程模型 并说明理由;
(2)(i)根据(1)中所选模型,求出y关于x的经验回归方程;
(ii)设该科技公司的年利润(单位:亿元)和年研发投入y(单位:亿元)满足(且),问该科技公司哪一年的年利润最大
附:对于一组数据,,…,,其经验回归直线的斜率和截距的最小二乘估计分别为,.
(22-23高二下·江西吉安·期末)
12.某乡镇为了提高乡镇居民收入,对山区进行大面积指导农民种植黄茋、党参、当归等药材,同时在种植药材附近种植草,让牛羊吃,发展畜牧业,第二年将种植药材的地改种草让牛羊吃,将牛羊吃过的草地改种药材,这样药材的生长主要依靠牛羊等有机肥来供给,提高药效,同时增加农民的经济收入.现将该乡镇某农户近7年(2016-2022年对应年份代码1-7)的种植药材的收入金额绘成折线图,同时统计出相关数据:,,,,.
(1)根据图中所给出的折线图,判断和哪一个更适合作为回归模型;(给出判断即可,不必说明理由)
(2)求相关系数(保留两位小数)并求药材种植收入关于年份代码的回归直线方程;
(3)若在生物学上将在药材附近同时种植草称作间作,将药材和草每年轮流种植称作轮作,根据题目所给信息,分析这两种种植方式对当地居民收入的影响.
附:相关系数,回归直线方程中斜率和截距的最小二乘估计公式分别为,.
试卷第1页,共3页
试卷第1页,共3页
参考答案:
1.(1);
(2)不能
【分析】(1)先由分层抽样得到男女同学的比例,从而求得,进而利用古典概型的概率公式即可得解;
(2)利用(1)中结论,完善列联表,再求得的值,从而得解.
【详解】(1)因为采用分层抽样按性别从该班级中抽取6名同学,其中有男同学4名,女同学2名
所以男女同学的比例为,则,故,
该班同学选择长跑的概率为.
(2)依题意,完善列联表,如下,
长跑 短跑 总计
男同学 30 10 40
女同学 10 10 20
总计 40 20 60
零假设选择跑步项目类别与学生性别无关,
根据小概率值的独立性检验,没有充分证据推断出不成立,
因此可以认为成立,即认为选择跑步项目类别与学生性别无关.
2.(1),;
(2)有.
【分析】(1)由已知及表格中数据,求出男女生近视的频率,再估计概率.
(2)完善列联表,再求出的观测值,与临界值表比对作答.
【详解】(1)依题意,样本中男生近视的频率为,所以估计这所学校男生近视的概率为;
样本中,近视的女生有10名,女生近视的频率为,所以估计这所学校女生近视的概率为.
(2)因为抽取的男生有70人,女生有50人,列联表如下:
性别 视力情况 合计
近视 不近视
男生 30 40 70
女生 10 40 50
合计 40 80 120
由列联表中的数据得,
所以有的把握认为近视与性别有关.
3.(1);
(2)(ⅰ);(ⅱ)模型②刻画的拟合效果更好,当时,模型②的年利润增量的预测值为万元.
【分析】(1)由正态分布的对称性结合法则求解;
(2)(ⅰ)由已知数据利用最小二乘法求解模型②中关于的回归方程;
(ⅱ)由已知表格中的数据,可得模型①的小于模型②,说明模型②刻画的拟合效果更好,再由(ⅰ)中求得线性回归方程求解.
【详解】(1)由题意,,,
由正态分布曲线的对称性可知,

设一顾客购买了10个该果园的“红格脐橙”,
其中果径小于的有个,,
故,
∴一顾客购买了10个该果园的“红格脐橙”,会买到果径小于的概率为;
(2)(ⅰ)由题中所给数据,可得,,
,.
∴模型②中关于的线性回归方程为;
(ⅱ)由表格中的数据,有,即,
∴模型①的小于模型②,说明模型②刻画的拟合效果更好.
当时,模型②的年利润增量的预测值为:
万元.
4.(1)更适宜作为回归方程类型;
(2),.
【分析】(1)根据题意,分别求得相关系数的值,结合和,结合,即可得到结论.
(2)(i)根据最小二乘法,求得回归系数,进而求得回归方程;(ii)当时,结合回归方程,即可求得预报值.
【详解】(1)因为的线性相关系数,
的线性相关系数,
因为,
所以更适宜作为平均金属含量关于样本对原点的距离的回归方程类型.
(2)依题意,,
则,于是,
所以关于的回归方程为.
当时,金属含量的预报值为.
5.(1),相关程度较高
(2);投入至少亿元
【分析】(1)直接通过计算相关系数来进行判断;
(2)先计算回归直线方程,然后再做出预测.
【详解】(1),



所以,所以相关程度较高;
(2)由(1)得,,
所以,,
所以,令,
得,所以研发投入至少亿元.
6.(1),12.4万台;
(2)(ⅰ)表格见解析;(ⅱ)该校学生对氢能源的了解情况与性别有关.
【分析】(1)利用已知数据和公式求线性回归方程,由方程进行数据预测;
(2)(ⅰ)根据男生和女生各60名补全列联表.
(ⅱ)计算,与临界值比较下结论.
【详解】(1)年份的平均数,销量的平均数,
所以,

所以,
所以,
所以氢能源乘用车的销量关于年份的线性回归方程为,
令,得,
所以预测2024年氢能源乘用车的销量约为12.4万台.
(2)(ⅰ)根据男生和女生各60名,补全列联表为:
了解 不了解 合计
男生 35 25 60
女生 20 40 60
合计 55 65 120
(ⅱ)零假设:该校学生对氢能源的了解情况与性别无关,
根据列联表中的数据可得,

依据的独立性检验,可以推断不成立,
即该校学生对氢能源的了解情况与性别有关.
7.(1)模型更合适
(2)
(3)当温度为时,z的预期最大
【分析】(1)求出,比较的大小即可判断哪个模型更合适;
(2)直接根据回归方程的公式求解即可;
(3)先写出利润函数,再利用基本不等式求最值以及最值的成立条件.
【详解】(1)由已知,
则,
所以利用模型建立y关于x的回归方程更合适;
(2)由(1)得,,
则y关于x的回归方程为;
(3)由已知,利润函数,
由基本不等式,当且仅当,即时等号成立,
所以当温度为时,z的预期最大.
8.(1),;
(2)表格见解析,有关.
【分析】(1)根据给定数表,求出相关量,再利用最小二乘法求出回归方程,并作出估计即得.
(2)完善列联表,再求出的观测值,与临界值表比对作答.
【详解】(1)由表中数据可得,,


则,,
所以关于的一元线性回归方程是,
令,得,
所以估计当年2月21日在该店购物的人数为人.
(2)列联表如下:
年龄 不低于岁 低于岁 合计
参与过网上购物
未参与过网上购物
合计 200
零假设为:参加网上购物和年龄无关,
根据数据,计算得到:,
所以根据小概率的独立性检验,我们推断不成立,
即认为参加网上购物和年龄有关,此推断犯错误的概率不大于.
9.(1),规律见解析
(2)残差和为0;成立,证明见解析
【分析】(1)计算,,根据公式计算,,得到回归方程,再根据不等式,,得到规律;
(2)依次计算残差得到残差和,确定对任意具有线性相关关系的变量,再根据证明即可.
【详解】(1),,
,,
故回归方程为:,
取,解得,即时,儿子比父亲高;
取,解得,即时,儿子比父亲矮;
父亲较高时,儿子平均身高要矮于父亲,父亲较矮时,儿子平均身高要高于父亲,
即儿子身高有一个回归,回归到全种群平均高度的趋势.
(2),;
,;
,;
,;
,;
故残差的和为.
对任意具有线性相关关系的变量.
证明如下:
.
10.(1)指数函数模型是最优模型;理由见解析
(2)
(3)(2)中幂函数模型更适合,理由见解析
【分析】(1)由表中数据比较指数函数模型误差平方和以及的大小,即得结论;
(2)根据身高与骨细胞数量以及体重与肌肉细胞数量的关系,结合已知数据,即可求得答案;
(3)分别计算出两种模型函数下的婴儿体重,比较大小,即得结论.
【详解】(1)因为,所以指数函数模型误差平方和最小,
因为,所以指数函数模型最大,
所以指数函数模型是最优模型;
(2)因为,所以,
因为,
所以,所以,
所以体重关于身高的函数模型为;
(3)把代入,得不符合实际,
把,代入得,
把代入,得符合实际,
所以(2)中幂函数模型更适合.
11.(1)选择模型②更适宜,理由见解析
(2)(i);(ii)该公司2028年的年利润最大
【分析】(1)根据残差图确定;
(2)根据最小二乘法求非线性回归方程即可求解;
【详解】(1)根据图2可知,模型①的残差波动性很大,说明拟合关系较差;
模型②的残差波动性很小,基本分布在0的附近,说明拟合关系很好,所以选择模型②更适宜.
(2)(i)设,所以,
所以,,
所以关于的经验回归方程为
(ii)由题设可得,
当取对称轴即,即时,年利润L有最大值,
故该公司2028年的年利润最大.
12.(1)
(2),
(3)答案见解析
【分析】(1)根据折线图作出判断即可;
(2)根据相关系数公式计算可得,根据公式计算和可得回归直线方程;
(3)①间作:从土地的利用率和居民收入最大化进行分析;②轮作:从提高乡镇居民收入和提高土地的生态效益和经济效益进行分析.
【详解】(1)因为折线图更接近直线,所以更适合作为回归模型.
(2),

相关系数,
根据题意,可得,
,.
种植药材收入金额关于年份代码的回归直线方程为.
(3)(答案不唯一,合理即可)①间作:药材和草的间作一方面可以同时发展畜牧业来增加居民收入,另一方面可以实现土地的利用率,实现单位面积内经济效益的最大化;
②轮作:一方面牛羊粪等有机肥可以用来供给药材的生长从而提高乡镇居民收入,另一方面可以调节土壤的肥沃能力,形成良性循环,进一步提高土地的生态效益和经济效益.
答案第1页,共2页
答案第1页,共2页第八章 成对数据的统计分析
第三课 汇总本章方法
扩展1:利用一元回归模型对实际问题进行决策
例1.(23-24高二下·河南·阶段练习)环境监测部门为调研汽车流量对空气质量的影响,在某监测点统计每日过往的汽车流量(单位:辆)和空气中的PM2.5的平均浓度(单位:).调研人员采集了50天的数据,制作了关于的散点图,并用直线与将散点图分成如图所示的四个区域I,II,III,IV,落入对应区域的样本点的个数依次为.
(1)完成下面的列联表,并判断至少有多大把握认为“PM2.5平均浓度不小于”与“汽车日流量不小于1500辆”有关;
汽车日流量 汽车日流量 合计
PM2.5的平均浓度
PM2.5的平均浓度
合计
(2)经计算得到回归方程为,且这50天的汽车日流量的标准差252,PM2.5的平均浓度的标准差,求相关系数,并判断该回归方程是否有价值.
参考公式:,其中.
0.100 0.050 0.010 0.001
2.706 3.841 6.635 10.828
回归方程,其中.
相关系数.若,则认为与有较强的线性相关性.
【答案】(1)列联表见解析,至少有的把握(但还不能有的把握)认为“PM2.5平均浓度不小于”与“汽车日流量不小于1500辆”有关
(2),该回归方程有价值
【分析】(1)列出列联表后进行独立性检验即可.
(2)求出回归方程后,再求出相关系数判断相关性即可.
【详解】(1)列联表如下:
汽车日流量 汽车日流量 合计
PM2.5的平均浓度 16 8 24
PM2.5的平均浓度 6 20 26
合计 22 28 50
零假设:“PM2.5平均浓度不小于”与“汽车日流量不小于1500辆”无关,
因为,
所以至少有的把握(但还不能有的把握)认为“PM2.5平均浓度不小于”与“汽车日流量不小于1500辆”有关;
(2)因为回归方程为,所以,
又因为,
所以.
与有较强的相关性,该回归方程有价值.
【方法总结】充分利用题目中提供的成对样本数据(散点图)做出判断,确定是线性问题还是非线性问题.求解时要充分利用已知数据,合理利用变形公式,以达到快速准确运算的目的;
利用经验回归方程进行预测,把经验回归方程看作一次函数,求函数值.经验回归方程的拟合效果可以利用相关系数判断,当|r|越趋近于1时,两变量的线性相关性越强.
【举一反三1-1】
(2024·内蒙古包头·二模)
1.某企业拟对某产品进行科技升级,根据市场调研与模拟,得到科技升级投入(万元)与科技升级直接收益(万元)的数据统计如下:
序号 1 2 3 4 5 6 7
2 3 4 6 8 10 13
13 22 31 42 50 56 58
根据表格中的数据,建立了与的两个回归模型:模型①:模型②:.
(1)根据下列表格中的数据,比较模型① ②的相关指数的大小,并选择拟合精度更高 更可靠的模型;
(2)根据(1)选择的模型,预测对该产品科技升级的投入为100万元时的直接收益.
回归模型 模型① 模型②
回归方程
182.4 79.2
(附:刻画回归效果的相关指数越大,模型的拟合效果越好)
【举一反三1-2】
(2024高三·全国·专题练习)
2.现阶段我国生活垃圾有填埋、焚烧、堆肥等三种处理方式,随着我国生态文明建设的不断深入,焚烧处理已逐渐成为主要方式.根据国家统计局公布的数据,对2013~2020年全国生活垃圾焚烧无害化处理厂的个数y(单位:座)进行统计,得到如下表格:
年份 2013 2014 2015 2016 2017 2018 2019 2020
年份代码x 1 2 3 4 5 6 7 8
垃圾焚烧无害化处理厂 的个数y 166 188 220 249 286 331 389 463
(1)根据表格中的数据,可用一元线性回归模型刻画变量y与变量x之间的线性相关关系,请用相关系数加以说明(精确到0.01).
(2)求出y关于x的线性回归方程,并预测2022年全国生活垃圾焚烧无害化处理厂的个数.
(3)对于2035年全国生活垃圾焚烧无害化处理厂的个数,还能用(2)所求的线性回归方程预测吗?请简要说明理由.
扩展2 :利用独立性检验对实际问题进行决策
例2.(23-24高三下·云南昆明·阶段练习)近两年来,自行车的市场占有率在不断提升,随着人们的健康意识不断增强,骑自行车不仅仅是人们出行的交通方式,也渐渐成为一种新颖的运动,越来越多的人加入了骑行一族.在某地区随机调查了100位自行车骑行者的年龄分布情况,得到如图所示的样本数据频率分布直方图.
(1)数据显示,该地区年龄在岁内的人口占比为12%,该地区自行车骑行率约为13%,从该地区任选一人,已知此人年龄在内,求此人是自行车骑行者的概率;
(2)对这100位自行车骑行者进行统计,骑行频率次/周的共有70人,其中年龄在40岁以下的占80%.请完成以下列联表,并根据小概率值的独立性检验,判断骑行频率与年龄是否有关联.
年龄
骑行频率 年龄 合计
岁 岁
次/周
次/周
合计
附:,其中.
0.050 0.010 0.001
3.841 6.635 10.828
【答案】(1)
(2)列联表见解析,有
【分析】
(1)结合频率分布直方图以及已知,由独立乘法以及条件概率公式即可求解.
(2)由频率分布直方图计算得各个分段的人数,完善列联表,进而计算卡方,与临界值比较大小,由此即可判断.
【详解】(1)设A=“此人年龄在[内”,B=“此人是自行车骑行者”,
则.
(2)由频率分布直方图可得,这100位自行车骑行者中,
年龄岁的共有(人),
其中骑行频率次/周的有(人),
年龄岁的有26人,骑行频率次/周的有(人),
列联表如下:
骑行频率 年龄 合计
岁 岁
次/周 18 12 30
次/周 56 14 70
合计 74 26 100
零假设为:骑行频率与年龄之间无关联.
根据列联表中的数据,
得,
根据小概率值的独立性检验,推断不成立,
即认为骑行频率与年龄之间有关联,此推断犯错误的概率不大于0.05.
【方法总结】独立性检验与概率综合问题的解题思路:本类题目以生活题材为背景,涉及独立性检验及概率问题的综合,解决该类问题首先收集数据列出2×2列联表,并按照公式求得χ2的值后进行比较,其次再按照随机变量满足的概率模型求解.
【举一反三2-1】
(2024高二下·江苏·专题练习)
3.考察小麦种子灭菌与否跟发生黑穗病的关系,经试验观察,得到数据如下表:
种子灭菌 种子未灭菌 合计
黑穗病 26 184 210
无黑穗病 50 200 250
合计 76 384 460
试分析种子灭菌与小麦发生黑穗病是否有关?
附:;
P(χ2≥x0) 0.15 0.1 0.05 0.025
x0 2.072 2.706 3.841 5.024
【举一反三2-2】
(2023·山东青岛模拟)
4.为进一步保护环境,加强治理空气污染,某市环保监测部门对市区空气质量进行调研,随机抽查了市区100天的空气质量等级与当天空气中SO2的浓度(单位:μg/m3),整理数据得到下表:
SO2的浓度 空气质量等级 [0,50] (50,150] (150,475]
1(优) 28 6 2
2(良) 5 7 8
3(轻度污染) 3 8 9
4(中度污染) 1 12 11
若某天的空气质量等级为1或2,则称这天“空气质量好”;若某天的空气质量等级为3或4,则称这天“空气质量不好”,根据上述数据,回答以下问题.
(1)估计事件“该市一天的空气质量好,且SO2的浓度不超过150”的概率;
(2)完成下面的2×2列联表,
SO2的浓度 空气质量 [0,150] (150,475] 总计
空气质量好
空气质量不好
总计
(3)根据(2)中的列联表,能否有99%的把握认为该市一天的空气质量与当天SO2的浓度有关?
试卷第1页,共3页
试卷第1页,共3页
参考答案:
1.(1)模型①的相关指数小于模型②的相关指数,即模型②的拟合效果精度更高 更可靠.
(2)198.6
【分析】(1)利用相关指数的定义判断相关性即可.
(2)将给定数值代入拟合模型中求预测值即可.
【详解】(1)由表格中的数据,,
所以,模型①的相关指数小于模型②的相关指数,
即模型②的拟合效果精度更高 更可靠.
(2)当万元时,科技升级直接收益的预测值为:
(万元)
2.(1)答案见解析
(2)=41.12x+101.46,个数为513
(3)不能,理由见解析
【详解】
解:(1)==,==,
相关系数

=≈≈0.98.
因为y与x的相关系数r=0.98,接近1,所以y与x的线性相关程度很高,可用线性回归模型拟合y与x的关系.
(2) 由题知
==≈41.12,
≈-41.12×=101.46,
所以y与x的线性回归方程为=41.12x+101.46.
又2 022年对应的年份代码x=10,当x=10时,=41.12×10+101.46=512.66≈513,
所以预测2022年全国生活垃圾焚烧无害化处理厂的个数为513.
(3) 对于2035年全国生活垃圾焚烧无害化处理厂的个数,不能由(2)所求的线性回归方程预测,理由如下(说出一点即可):
①线性回归方程具有时效性,不能预测较远情况;
②全国生活垃圾焚烧无害化处理厂的个数有可能达到上限,一段时间内不再新建;
③受国家政策的影响,可能产生新的生活垃圾无害化处理方式
3.有95%的把握认为种子灭菌与否与小麦发生黑穗病有关系
【分析】根据独立性检验的思想计算出的值,进一步分析即可.
【详解】提出假设 认为种子灭菌与否与小麦发生黑穗病无关系.
由列联表的数据可求得,
而,
当成立时,的概率约为0.05,
所以我们有95%的把握认为种子灭菌与否与小麦发生黑穗病有关系.
4.(1)0.46
(2)列联表见解析,
(3)有99%的把握认为该市一天的空气质量与当天SO2的浓度有关.
【分析】(1)求出该市一天的空气质量好,且的浓度不超过150的天数即可求出概率;(2)根据表中数据即可得出列联表,(3)求出卡方值,和6.635比较即可判断.
【详解】(1)由表格可知,该市一天的空气质量好,且的浓度不超过150的天数为天,则该市一天的空气质量好,且的浓度不超过150的概率为;
(2)由表格数据可得列联表如下,
SO2的浓度 空气质量 [0,150] (150,475] 总计
空气质量好 46 10 56
空气质量不好 24 20 44
总计 70 30 100
(3)由(2)知,
所以有99%的把握认为该市一天的空气质量与当天的浓度有关.
答案第1页,共2页
答案第1页,共2页

展开更多......

收起↑

资源列表