【备考2022 新高考】走向高考一轮复习03 变量间的相关关系、统计案例(学生版+教师版)

资源下载
  1. 二一教育资源

【备考2022 新高考】走向高考一轮复习03 变量间的相关关系、统计案例(学生版+教师版)

资源简介

中小学教育资源及组卷应用平台
专题七 概率与统计
03 变量间的相关关系、统计案例
考纲对本模块内容的具体要求如下:
变量间相关关系、统计案例是近几年高考出题率比 ( http: / / www.21cnjy.com )较高的知识点,这部分知识与实际结合比较密切,常与概率相结合,出题难度适中,关键是考查对题目的阅读分析,对数据的处理,对于回归分析,高考考查比较多,主要考查求回归方程、利用回归方程进行预测,一般以解答题的形式出现,难度中等,有时也以小题形式出现.2-1-c-n-j-y
数据分析:会利用散点图分析变量间的相关关系.
数学运算:1.了解独立性检验(只要求2×2列联表)的基本思想、方法及简单应用.
2.会根据给出的线性回归方程系数公式求线性回归方程.
1.两个变量的线性相关
(1)正相关
在散点图中,点散布在从_____到_____的区域,对于两个变量的这种相关关系,我们将它称为正相关.
(2)负相关
在散点图中,点散布在从_____到_____的区域,两个变量的这种相关关系称为负相关.
(3)线性相关关系、回归直线
如果散点图中点的分布从整体上看大致在__________,就称这两个变量之间具有线性相关关系,这条直线叫做回归直线.21教育网
2.回归方程
(1)最小二乘法:使得样本数据的点到回归直线的__________的方法叫做最小二乘法.
(2)回归方程:方程=x+是两个具有线性相关关系的变量的一组数据(x1,y1),(x2,y2),…,(xn,yn)的回归方程,其中,是待定参数.www.21-cn-jy.com
3.回归分析
(1)定义:对具有_____的两个变量进行统计分析的一种常用方法.
(2)样本点的中心
对于一组具有线性相关关系的数据(x1,y1),(x2,y2),…,(xn,yn),其中_____称为样本点的中心.
(3)相关系数
当r>0时,表明两个变量_____;
当r<0时,表明两个变量_____.
r的绝对值越接近于1,表明两个变量的线性相关 ( http: / / www.21cnjy.com )性_____.r的绝对值越接近于0,表明两个变量之间__________.通常|r|大于_____时,认为两个变量有很强的线性相关性.
4.独立性检验
(1)分类变量:变量的不同“值”表示个体所属的_____,像这类变量称为分类变量.
(2)列联表:列出两个分类变量的_____,称为列联表.假设有两个分类变量X和Y,它们的可能取值分别为{x1,x2}和{y1,y2},其样本频数列联表(称为2×2列联表)为
2×2列联表
y1 y2 总计
x1 a b a+b
x2 c d c+d
总计 a+c b+d a+b+c+d
构造一个随机变量K2=__________,其中n=__________为样本容量.
[常用结论]
1.回归直线必过样本点的中心(,).
2.当两个变量的相关系数|r|=1时,两个变量呈函数关系.
考点一 相关关系的判断
(1)(2021·安徽·定远县育才学校高二期中(理))如图,5个数据,去掉后,下列说法错误的是( )21世纪教育网版权所有
( http: / / www.21cnjy.com / )
A.相关系数r变大 B.残差平方和变大
C.R2变大 D.解释变量x与预报变量y的相关性变强
(2)(2021·江西丰城·模拟预测(理))对四组数据进行统计,获得以下散点图,关于其相关系数的比较,正确的是( )【出处:21教育名师】
( http: / / www.21cnjy.com / )
A. B.
C. D.
(3)(2021·全国·高二单元测试)对两个变量的相关系数,有下列说法:(1)越大,相关程度越大;(2)越小,相关程度越大;(3)趋近于0时,没有非线性相关系数;(4)越接近于1时,线性相关程度越强,其中正确的是___________.
【规律方法】
判定两个变量正、负相关性的方法
(1)画散点图:点的分布从左下角到右上角,两个变量正相关;点的分布从左上角到右下角,两个变量负相关.
(2)相关系数:r>0时,正相关;r<0时,负相关.
(3)线性回归直线方程中:
【跟踪练习】(1)(2021·广西·玉林市 ( http: / / www.21cnjy.com )育才中学高二月考)已知r1表示变量X与Y之间的线性相关系数,r2表示变量U与V之间的线性相关系数,且r1=0.837,r2=﹣0.957,则( )
A.变量X与Y之间呈正相关关系,且X与Y之间的相关性强于U与V之间的相关性
B.变量X与Y之间呈负相关关系,且X与Y之间的相关性强于U与V之间的相关性
C.变量U与V之间呈负相关关系,且X与Y之间的相关性弱于U与V之间的相关性
D.变量U与V之间呈正相关关系,且X与Y之间的相关性弱于U与V之间的相关性
(2)(2021·全国·高二单元测试)下列说法错误的是( )
A.正方体的体积与棱长之间的关系是函数关系
B.人的身高与视力之间的关系是相关关系
C.汽车的重量与汽车每消耗1升汽油所行驶的平均路程负相关
D.体重与学习成绩之间不具有相关关系
考点二 回归分析
(1)(2020全国高三专题练习)(多选题)下列说法正确的是( )
A.在回归直线方程中,当解释变量每增加1个单位时,预报变量平均减少2.3个单位
B.两个具有线性相关关系的变量,当相关指数的值越接近于0,则这两个变量的相关性就越强
C.若两个变量的相关指数,则说明预报变量的差异有88%是由解释变量引起的
D.在回归直线方程中,相对于样本点的残差为
(2)(2021·广东肇庆·模拟预测)某种兼职工作虽然以计件的方式计算工资,但是对于同一个人的工资与其工作时间还是存在一定的相关关系,已知小孙的工作时间(单位:小时)与工资(单位:元)之间的关系如下表:
若与的线性回归方程为,预测当工作时间为小时时,工资大约为( )
A.元 B.元 C.元 D.元
【跟踪练习】(1)(2021·福建厦门·二模)某种产品的价格x(单位:元/)与需求量y(单位:)之间的对应数据如下表所示:21·世纪*教育网
x 10 15 20 25 30
y 11 10 8 6 5
根据表中的数据可得回归直线方程,则以下正确的是( )
A.相关系数
B.
C.若该产品价格为35元,则日需求量大约为
D.第四个样本点对应的残差为
(2)(2020·全国·高二课时练习)下列命题中,正确的命题有_____.①回归直线恒过样本点中心,且至少过一个样本点;②用相关指数来刻画回归效果,表示预报变量对解释变量变化的贡献率,越接近于1说明模型的拟合效果越好;③残差图中残差点比较均匀的落在水平的带状区域中,说明选用的模型比较合适;④两个模型中残差平方和越大的模型的拟合效果越好.【来源:21·世纪·教育·网】
(3)(2021·四川省南充市白 ( http: / / www.21cnjy.com )塔中学模拟预测(理))随着我国经济的发展,人们生活水平的提高,汽车的保有量越来越高.汽车保险费是人们非常关心的话题.保险公司规定:上一年的出险次数决定了下一年的保费倍率,具体关系如下表:
上一年的出险次数 次以上(含次)
下一年的保费倍率
连续两年没有出险打折,连续三年没有出险打折
经验表明新车商业车险保费与购车价格有较强的线性相关关系,下面是随机采集的组数据(其中(万元)表示购车价格,(元)表示商业车险保费):,,,,,,,.设由这组数据得到的回归直线方程为.21cnjy.com
(1)求的值.
(2)某车主蔡先生购买一辆价值万元的新车.
①估计该车主蔡先生购车时的商业车险保费.
②若该车今年保险期间内已出过一次险,现在又被刮花了,蔡先生到店询价,预计修车费用为元,保险专员建议蔡先生自费(即不出险),你认为蔡先生是否应该接受建议?并说明理由.(假设该车辆下一年与上一年购买相同的商业车险产品进行续保).
【规律方法】
1.求回归直线方程的步骤
( http: / / www.21cnjy.com / )
2.(1)若已知回归直线方程(方程中无参数)进行预测时,把变量x代入回归直线方程即可对变量y进行估计.
(2)若回归直线方程中有参数,则根据回归直线一定经过点(,)求出参数值,得到回归直线方程,进而完成预测.
考点三 独立性检验
(1)(2021·全国·高二 ( http: / / www.21cnjy.com )学业考试)为大力提倡“厉行节约,反对浪费”,某大学通过随机询问100名学生能否做到“光盘”行动,得到如下列联表:
做不到“光盘”行动 能做到“光盘”行动
女 45 10
男 30 15
经计算:.
附:
0.1 0.05 0.01 0.005 0.001
2.706 3.841 6.635 7.879 10.828
参考附表,得到的正确结论是( )
A.有的把握认为“该校学生能否做到‘光盘’行动与性别有关”
B.有的把握认为“该校学生能否做到‘光盘’行动与性别无关”
C.有的把握认为“该校学生能否做到‘光盘’行动与性别有关”
D.有的把握认为“该校学生能否做到‘光盘’行动与性别无关”
(2)(2021·全国·高二单元测 ( http: / / www.21cnjy.com )试)2020年9月22日是第三个“中国农民丰收节”,全国处处五谷丰登、瓜果飘香,四川某地也是“小小花椒树种出致富路”!为更好提高花椒等级,该地组织了一次关于花椒田间种植技术学习时长的调查,随机收集了150户种植户的统计数据,以此研究种植户参与田间种植技术学习的时长和花椒等级的关系.21教育名师原创作品
一等 非一等 总计
三年 90 10 100
不足三年 30 20 50
总计 120 30 150
则认为种植户参与田间种植技术学习时长和花椒等级有关的把握为( )
参考公式:,
A.90% B.95%
C.99% D.99.9%
(3)(2021·全国·高二课时练习)有人发现,多看手机容易使人变近视,下表是一个调查机构对此现象的调查结果:2·1·c·n·j·y
近视 不近视 合计
少看手机 20 38 58
多看手机 68 42 110
合计 88 80 168
则在犯错误的概率不超过______的前提下,可以认为多看手机与人变近视有关系.
附:
0.005 0.001
7.879 10.828
【规律方法】
1.在2×2列联表中,如果两个变量没有关 ( http: / / www.21cnjy.com )系,则应满足ad-bc≈0. |ad-bc|越小,说明两个变量之间关系越弱;|ad-bc|越大,说明两个变量之间关系越强.【来源:21cnj*y.co*m】
2.解决独立性检验的应用问题,一定要按照独立性检验的步骤得出结论.独立性检验的一般步骤:
(1)根据样本数据制成2×2列联表;
(2)根据公式
(3)比较观测值k与临界值的大小关系,作统计推断.
【跟踪练习】(1)(2020湖南长沙市长郡中学高三月考)针对当下的“抖音热”,某校团委对“学生性别和喜欢抖音是否有关”作了一次调查,其中被调查的男女生人数相同,男生喜欢抖音的人数占男生人数的,女生喜欢抖音的人数占女生人数的,若有的把握认为是否喜欢抖音和性别有关,则调查人数中男生可能有( )
附表:
0.050 0.010
3.841 6.635
附:
A. B. C. D.
(2)(2021·新疆·阜康市第一中学高二期中(文))利用独立性检验的方法调查大学生的性别与爱好某项运动是否有关,通过随机询问名不同的大学生是否爱好某项运动,利用列联表,由计算可得.
0.10 0.05 0.025 0.010 0.005 0.001
2.706 3.841 5.024 6.635 7.879 10.828
参照附表,得到的正确结论是( )
A.有以上的把握认为“爱好该项运动与性别无关”
B.有以上的把握认为“爱好该项运动与性别有关”
C.在犯错误的概率不超过的前提下,认为“爱好该项运动与性别有关”
D.在犯错误的概率不超过的前提下,认为“爱好该项运动与性别无关”
1.(2022·全国·高三专题练习)某组织为研究爱好跑步是否与性别有关进行了一个调查,得到如下列联表,若这两个变量没有关系,则的值可能为( )www-2-1-cnjy-com
单位:人
跑步 性别 合计
男 女
爱好 100
不爱好 120 600 720
合计 220
A.720 B.500 C.300 D.200
2.(2022·全国·高三专题练习)某外语学校要求学生从德语和日语中选择一种作为“第二外语”进行学习,为了解选择第二外语的倾向与性别的关系,随机抽取名学生,得到下面的数据表:
选择德语 选择日语
男生
女生
根据表中提供的数据可知( )
附:,.
A.在犯错误的概率不超过的前提下,认为选择第二外语的倾向与性别无关
B.在犯错误的概率不超过的前提下,认为选择第二外语的倾向与性别有关
C.有的把握认为选择第二外语的倾向与性别无关
D.有的把握认为选择第二外语的倾向与性别有关
3.(2021·全国·高一课时练习)已知与之间的几组数据如表.
如表数据中的平均值为2.5,若某同学对赋了二个值分别为,得到二条线性回归直线方程分别为,对应的相关系数分别为,下列结论中错误的是( )21*cnjy*com
参考公式:线性回归方程中,其中,.相关系数.
A. B.相关系数中, C. D.
4.(2021·宁夏·银川一中三模(文))关于线性回归的描述,有下列命题:
①回归直线一定经过样本中心点;
②相关系数的绝对值越大,拟合效果越好;
③相关指数越接近1拟合效果越好;
④残差平方和越小,拟合效果越好.
其中正确的命题个数为( )
A.1 B.2 C.3 D.4
5.(2021·山东泰安·模拟预测)经研究,男子篮球运动员的身高y(cm)关于其父亲身高的经验回归方程为,已知姚明身高226cm,其父亲姚志源身高208cm,那么姚明身高的残差等于( )
A.-10.2cm B.-6cm C.6cm D.10.2cm
6.(2021·山西太原·三模(理))年初,新型冠状病毒()引起的肺炎疫情爆发以来,各地医疗机构采取了各种针对性的治疗方法,取得了不错的成效,某医疗机构开始使用中西医结合方法后,每周治愈的患者人数如下表所示:
第周
治愈人数(单位:十人)
由上表可得关于的线性回归方程为,则此回归模型第周的残差(实际值减去预报值)为( )
A. B.
C. D.
7.(2022·江苏·高三专题练习)以下结论正确的是( )
A.根据列联表中的数据计算得出,而,则有99%的把握认为两个分类变量有关系
B.的值越大,两个事件的相关性就越大
C.在回归分析中,相关指数越大,说明残差平方和越小,回归效果越好
D.在回归直线中,变量时,变量的值一定是15
8.(2021·广东惠州·高三月考)某种产品的价格(单位:元/)与需求量(单位:)之间的对应数据如下表所示:21·cn·jy·com
10 15 20 25 30
11 10 8 6 5
根据表中的数据可得回归直线方程为,则以下结论正确的是( )
A.与正相关 B.与负相关
C.样本中心为 D.该产品价格为35元/时,日需求量大约为
9.(2022·江苏·高三专题练习)某词汇研究机构为对某城市人们使用流行语的情况进行调查,随机抽取了200人进行调查统计得下方的列联表.则根据列联表可知:
年轻人 非年轻人 总计
经常用流行用 125 25 150
不常用流行用语 35 15 50
总计 160 40 200
参考公式:独立性检验统计量,其中.
下面的临界值表供参考:
0.15 0.10 0.05 0.025 0.010 0.005 0.001
2.072 2.706 3.841 5.024 6.635 7.879 10.828
有___________的把握认为“经常用流行用语”与“年轻人”有关系
10.(2021·江西·南昌市八一中学高二期末(理))下列说法正确的是___________
①方程(,其中为复数集)无解;
②若彼此相互独立,则;
③已知点,,且为原点,则向量在向量上的投影的数量为;
④通过最小二乘法以模型去拟合一组数据时,可知过点;
⑤通过最小二乘法以模型去拟合一组数据时,为了求出回归方程,设,将其变换后得到线性方程,则的值分别是和0.3.21*cnjy*com
11.(2020·江西修水·高二期末(理))下列说法正确的有______(填正确命题的序号)
①若函数在处导数不存在,则的函数图像在处无切线.
②若为离散型随机变量,则所有的取值构成的集合可能是无限数集.
③在对数据的相关性分析(回归分析)中,相关系数越大,两个变量的相关性越强.
④正态分布的密度曲线与轴所围成的区域的面积为1.
12.(2021·天津西青·高二期末)对两个变量x,y进行回归分析.
①残差的平方和越小,模型的拟合效果越好;
②相关系数的绝对值接近于0,两个随机变量的线性相关性越强;
③在经验回归方程中,当解释变量x每增加1个单位时,相应变量平均增加个单位;
④某人研究儿子身高与父亲身高的关系,得到经验回归方程,当时,,即:如果一个父亲的身高为,则儿子的升高一定为.
则以上结论中正确的序号为__________.
13.(2021·陕西·西安 ( http: / / www.21cnjy.com )中学高三月考(文))为调查某地区老人是否需要志愿者提供帮助,用简单随机抽样方法从该地区调查了500位老年人,结果如下:
是否需要志愿性别 男 女
需要 40 30
不需要 160 270
(1)估计该地区老年人中,需要志愿者提供帮助的老年人的比例;
(2)能否有99%的把握认为该地区的老年人是否需要志愿者提供帮助与性别有关?
附:.
0.050 0.010 0.001
k 3.841 6.635 10.828
14.(2021·辽宁丹东·高三期中)晚上睡眠充足是提高学习效率的必要条件,河北衡水某高中的高三年级学生晚上10点10分必须休息,中午强制午睡一个小时;另一所同类高中的高三年级学生晚上11点休息,并鼓励学生还可以继续进行夜自习,稍晚再休息,中午没有强制午睡要求.这两所高中早上起床时间相同.有关人员分别从这两所高中的高三年级学生中随机抽取名,进行学习效率问卷调查,其中衡水某高中有名学生的学习效率高,且从这名学生中随机抽取人,抽到学习效率高的学生的概率是.
(1)完成下面列联表:
学习效率高 学习效率不高 合计
衡水某高中
另一所同类高中
合计
(2)根据(1)中的列联表估计,两所同类高中高三年级学习效率高的学生的百分比分别是多少?并判断能否有的把握认为“学生学习效率高低与晚上睡眠是否充足”有关?
附:,
15.(2021·全国·高考真题(文)) ( http: / / www.21cnjy.com )甲、乙两台机床生产同种产品,产品按质量分为一级品和二级品,为了比较两台机床产品的质量,分别用两台机床各生产了200件产品,产品的质量情况统计如下表:
一级品 二级品 合计
甲机床 150 50 200
乙机床 120 80 200
合计 270 130 400
(1)甲机床、乙机床生产的产品中一级品的频率分别是多少
(2)能否有99%的把握认为甲机床的产品质量与乙机床的产品质量有差异
附:
0.050 0.010 0.001
k 3.841 6.635 10.828
16.(2021·山东菏泽·二模)“十四五”是我国全面建成小康社会、实现第一个百年奋斗目标之后,乘势而上开启全面建设社会主现代化国家新征程、向第二个百年奋斗目标进军的第一个五年,实施时间为2021年到2025年.某企业为响应国家号召,汇聚科研力量,加强科技创新,准备加大研发资金投入,为了解年研发资金投入额(单位:亿元)对年盈利额(单位:亿元)的影响,通过对“十二五”和“十三五”规划发展10年期间年研发资金投入额和年盈利额数据进行分析,建立了两个函数模型:【版权所有:21教育】
;,其中, ,, 均为常数,为自然对数的底数
令,经计算得如下数据:,,,,,,,,,,问:
(1)请从相关系数的角度,分析哪一个模型拟合度更好?
(2)根据(1)的选择及表中数据,建立,关于的回归方程(系数精确到0.01)
(3)若希望2021年盈利额y为500亿元,请预测2021年的研发资金投入额为多少亿元?(结果精确到0.01)
附:①相关系数r=
回归直线中:,
参考数据:,.
17.(2021·全国·模拟预测(文)) ( http: / / www.21cnjy.com )发展清洁能源,是改善能源结构、保障能源安全、推进生态文明建设的重要任务.十三五以来,我国加快调整能源结构,减少煤炭消费、稳定油气供应、大幅增加清洁能源比重,风电、光伏等可再生能源发电效率不断提高.据资料整理统计我国从2015年到2019年的年光伏发电量如表:
年份 2015 2016 2017 2018 2019
编号x 1 2 3 4 5
年光伏发电量(亿千瓦时) 395 665 1178 1775 2243
其中.
(1)请用相关系数r说明是否可用线性回归模型拟合年光伏发电量y与x的关系;
(2)建立年光伏发电量y关于x的线性回归方程,并预测2021年年光伏发电量(结果保留整数).
参考公式:相关系数,回归方程中斜率和截距的最小二乘估计公式分别为, ,
18.(2021·云南大理·模拟预测(理))2021年6月17日9时22分,我国酒泉卫星发射中心用长征遥十二运载火箭,成功将神舟十二号载人飞船送入预定轨道,顺利将聂海胜、刘伯明、汤洪波3名航天员送入太空,发射取得圆满成功,这标志着中国人首次进入自己的空间站.某公司负责生产的A型材料是神舟十二号的重要零件,该材料应用前景十分广泛.该公司为了将A型材料更好地投入商用,拟对A型材料进行应用改造、根据市场调研与模拟,得到应用改造投入x(亿元)与产品的直接收益y(亿元)的数据统计如下:
序号 1 2 3 4 5 6 7 8 9 10 11 12
x 2 3 4 6 8 10 13 21 22 23 24 25
y 15 22 27 40 48 54 60 68.5 68 67.5 66 65
当时,建立了y与x的两个回归模型:模型①:,模型②:;当时,确定y与x满足的线性回归方程为.
(1)根据下列表格中的数据,比较当时模型①,②的相关指数的大小,并选择拟合精度更高、更可靠的模型,预测对A型材料进行应用改造的投入为17亿元时的直接收益;
回归模型 模型① 模型②
回归方程
79.13 20.2
(2)为鼓励科技创新,当应用改造的投 ( http: / / www.21cnjy.com )入不少于20亿元时,国家给予公司补贴5亿元,以回归方程为预测依据,根据(1)中选择的拟合精度更高更可靠的模型,比较投入17亿元与20亿元时公司收益(直接收益+国家补贴)的大小.
附:刻画回归效果的相关指数,且当越大时,回归方程的拟合效果越好..
用最小二乘法求线性回归方程的截距:.
考纲解读
核心素养
知识梳理
高频考点
例1
例2
例3
真题演练
21世纪教育网 www.21cnjy.com 精品试卷·第 2 页 (共 2 页)
HYPERLINK "http://21世纪教育网(www.21cnjy.com)
" 21世纪教育网(www.21cnjy.com)中小学教育资源及组卷应用平台
专题七 概率与统计
03 变量间的相关关系、统计案例
考纲对本模块内容的具体要求如下:
变量间相关关系、统计案例是近几年高考出题率比 ( http: / / www.21cnjy.com )较高的知识点,这部分知识与实际结合比较密切,常与概率相结合,出题难度适中,关键是考查对题目的阅读分析,对数据的处理,对于回归分析,高考考查比较多,主要考查求回归方程、利用回归方程进行预测,一般以解答题的形式出现,难度中等,有时也以小题形式出现.21·cn·jy·com
数据分析:会利用散点图分析变量间的相关关系.
数学运算:1.了解独立性检验(只要求2×2列联表)的基本思想、方法及简单应用.
2.会根据给出的线性回归方程系数公式求线性回归方程.
1.两个变量的线性相关
(1)正相关
在散点图中,点散布在从左下角到右上角的区域,对于两个变量的这种相关关系,我们将它称为正相关.
(2)负相关
在散点图中,点散布在从左上角到右下角的区域,两个变量的这种相关关系称为负相关.
(3)线性相关关系、回归直线
如果散点图中点的分布从整体上看大致在一条直线附近,就称这两个变量之间具有线性相关关系,这条直线叫做回归直线.2·1·c·n·j·y
2.回归方程
(1)最小二乘法:使得样本数据的点到回归直线的距离的平方和最小的方法叫做最小二乘法.
(2)回归方程:方程=x+是两个具有线性相关关系的变量的一组数据(x1,y1),(x2,y2),…,(xn,yn)的回归方程,其中,是待定参数.
3.回归分析
(1)定义:对具有相关关系的两个变量进行统计分析的一种常用方法.
(2)样本点的中心
对于一组具有线性相关关系的数据(x1,y1),(x2,y2),…,(xn,yn),其中(,)称为样本点的中心.
(3)相关系数
当r>0时,表明两个变量正相关;
当r<0时,表明两个变量负相关.
r的绝对值越接近于1,表明两个变量的线 ( http: / / www.21cnjy.com )性相关性越强.r的绝对值越接近于0,表明两个变量之间几乎不存在线性相关关系.通常|r|大于0.75时,认为两个变量有很强的线性相关性.
4.独立性检验
(1)分类变量:变量的不同“值”表示个体所属的不同类别,像这类变量称为分类变量.
(2)列联表:列出两个分类变量的频数表,称为 ( http: / / www.21cnjy.com )列联表.假设有两个分类变量X和Y,它们的可能取值分别为{x1,x2}和{y1,y2},其样本频数列联表(称为2×2列联表)为
2×2列联表
y1 y2 总计
x1 a b a+b
x2 c d c+d
总计 a+c b+d a+b+c+d
构造一个随机变量K2=,其中n=a+b+c+d为样本容量.
[常用结论]
1.回归直线必过样本点的中心(,).
2.当两个变量的相关系数|r|=1时,两个变量呈函数关系.
考点一 相关关系的判断
(1)(2021·安徽·定远县育才学校高二期中(理))如图,5个数据,去掉后,下列说法错误的是( )
( http: / / www.21cnjy.com / )
A.相关系数r变大 B.残差平方和变大
C.R2变大 D.解释变量x与预报变量y的相关性变强
【答案】B
【分析】
根据图中的点,计算去掉前后的相关系数、残差平方和、,即可判断各选项的正误.
【详解】
由图,,,则,,,
∴相关系数.
令回归方程,则,
∴,即回归方程为,可得为,,,,,
∴残差平方和,故,
去掉后,
,,则,,,
∴相关系数.
∴,A、D正确;
令回归方程,则,
∴,即回归方程为,可得为,,,,
∴残差平方和,故,
∴,B错误,C正确;
故选:B
(2)(2021·江西丰城·模拟预测(理))对四组数据进行统计,获得以下散点图,关于其相关系数的比较,正确的是( )www.21-cn-jy.com
( http: / / www.21cnjy.com / )
A. B.
C. D.
【答案】A
【分析】
由给出的四组数据的散点图,结合相关系数的概念,逐图判定,即可求解.
【详解】
由给出的四组数据的散点图可以看出,题图1和题图3是正相关,相关系数大于0,
题图2和题图4是负相关,相关系数小于0,
题图1和题图2的点相对更加集中,所以相关性更强,所以接近于1,接近于,
由此可得.
故选:A.
(3)(2021·全国·高二单元测试)对两个变量的相关系数,有下列说法:(1)越大,相关程度越大;(2)越小,相关程度越大;(3)趋近于0时,没有非线性相关系数;(4)越接近于1时,线性相关程度越强,其中正确的是___________.
【答案】(1)、(4)
【分析】
利用相关系数的定义和性质逐一判断(1)(2)(3)(4)是否正确,即可得正确答案.
【详解】
用相关系数衡量两个变量之间的相关关系强弱时,
的绝对值越接近于1,表示两个变量的线性相关性越强,
的绝对值越接近于0,表示两个变量的线性相关性越弱,
对于(1),越大,相关程度越大,命题(1)正确;
对于(2),越小,相关程度越小,命题(2)错误;
对于(3),趋近于0时,线性相关关系越弱,命题(3)错误;
对于(4),越接近于1时,线性相关程度越强,命题(4)正确.
综上正确的命题是(1)、(4).
故答案为:(1)、(4).
【规律方法】
判定两个变量正、负相关性的方法
(1)画散点图:点的分布从左下角到右上角,两个变量正相关;点的分布从左上角到右下角,两个变量负相关.
(2)相关系数:r>0时,正相关;r<0时,负相关.
(3)线性回归直线方程中:
【跟踪练习】(1)(2021·广西·玉 ( http: / / www.21cnjy.com )林市育才中学高二月考)已知r1表示变量X与Y之间的线性相关系数,r2表示变量U与V之间的线性相关系数,且r1=0.837,r2=﹣0.957,则( )
A.变量X与Y之间呈正相关关系,且X与Y之间的相关性强于U与V之间的相关性
B.变量X与Y之间呈负相关关系,且X与Y之间的相关性强于U与V之间的相关性
C.变量U与V之间呈负相关关系,且X与Y之间的相关性弱于U与V之间的相关性
D.变量U与V之间呈正相关关系,且X与Y之间的相关性弱于U与V之间的相关性
【答案】C
【分析】
根据线性相关系数|r|越接近1,表示两个变量之间的相关性越强,线性相关系数r的正负表示两个变量之间呈正相关关系或负相关关系.
【详解】
因为线性相关系数r1=0.837,r2=﹣0.957,
所以变量X与Y之间呈正相关关系,变量U与V之间呈负相关关系,
X与Y之间的相关性弱于U与V之间的相关性.
故选:C
(2)(2021·全国·高二单元测试)下列说法错误的是( )
A.正方体的体积与棱长之间的关系是函数关系
B.人的身高与视力之间的关系是相关关系
C.汽车的重量与汽车每消耗1升汽油所行驶的平均路程负相关
D.体重与学习成绩之间不具有相关关系
【答案】B
【分析】
根据相关关系和正负相关的定义判断.
【详解】
正方体的体积与棱长之间的关系是函数关系,故A正确;
人的身高与视力之间不具有相关关系,故B错误;
汽车的重量与汽车每消耗1升汽油所行驶的平均路程负相关,故C正确;
体重与学习成绩之间不具有相关关系,故D正确.
故选:B.
考点二 回归分析
(1)(2020全国高三专题练习)(多选题)下列说法正确的是( )
A.在回归直线方程中,当解释变量每增加1个单位时,预报变量平均减少2.3个单位
B.两个具有线性相关关系的变量,当相关指数的值越接近于0,则这两个变量的相关性就越强
C.若两个变量的相关指数,则说明预报变量的差异有88%是由解释变量引起的
D.在回归直线方程中,相对于样本点的残差为
【答案】CD
【解析】对于,根据回归直线方程,当解释变量每增加1个单位时,预报变量平均减少个单位,错误;www-2-1-cnjy-com
对于,当相关指数的值越接近于,两个变量的相关性就越强,错误;
对于,由相关指数的意义可知正确;
对于,当解释变量时,预报变量,则样本点的残差为,正确.
故选:.
(2)(2021·广东肇庆·模拟预测)某种兼职工作虽然以计件的方式计算工资,但是对于同一个人的工资与其工作时间还是存在一定的相关关系,已知小孙的工作时间(单位:小时)与工资(单位:元)之间的关系如下表:21*cnjy*com
若与的线性回归方程为,预测当工作时间为小时时,工资大约为( )
A.元 B.元 C.元 D.元
【答案】B
【分析】
由样本中心点可求得,将代入回归直线即可求得结果.
【详解】
由表格数据知:,,
,线性回归方程为,
,即当工作时间为小时时,工资大约为元.
故选:B.
【跟踪练习】(1)(2021·福建厦门·二模)某种产品的价格x(单位:元/)与需求量y(单位:)之间的对应数据如下表所示:
x 10 15 20 25 30
y 11 10 8 6 5
根据表中的数据可得回归直线方程,则以下正确的是( )
A.相关系数
B.
C.若该产品价格为35元,则日需求量大约为
D.第四个样本点对应的残差为
【答案】BCD
【分析】
先根据回归直线必过样本中心求出,从而判断选项A、B,再根据回归直线方程即可求出预测值及第四个样本点对应的残差.
【详解】
解: 对A、B:由表中的数据,,,
将,代入得,所以A选项错误,B选项正确;
对C:由题意代入得,所以日需求量大约为,
所以C选项正确;
对D:第四个样本点对应的残差为,所以D选项正确;
故选:BCD.
(2)(2020·全国·高二课时练习)下列命题中,正确的命题有_____.①回归直线恒过样本点中心,且至少过一个样本点;②用相关指数来刻画回归效果,表示预报变量对解释变量变化的贡献率,越接近于1说明模型的拟合效果越好;③残差图中残差点比较均匀的落在水平的带状区域中,说明选用的模型比较合适;④两个模型中残差平方和越大的模型的拟合效果越好.
【答案】②③
【分析】
根据回归方程的知识依次分析即可.
【详解】
①回归直线恒过样本点中心, 但不一定过样本点,故错误;
②用相关指数来刻画回归效果.在线性回归模型中,表示预报变量对解释变量变化的贡献率,越接近于1说明模型的拟合效果越好,故正确;
③残差图中残差点比较均匀的落在水平的带状区域中,说明选用的模型比较合适;正确.
④两个模型中残差平方和越小的模型的拟合效果越好,故错误.
故答案为:②③
(3)(2021·四川省南充市 ( http: / / www.21cnjy.com )白塔中学模拟预测(理))随着我国经济的发展,人们生活水平的提高,汽车的保有量越来越高.汽车保险费是人们非常关心的话题.保险公司规定:上一年的出险次数决定了下一年的保费倍率,具体关系如下表:
上一年的出险次数 次以上(含次)
下一年的保费倍率
连续两年没有出险打折,连续三年没有出险打折
经验表明新车商业车险保费与购车价格有较强的线性相关关系,下面是随机采集的组数据(其中(万元)表示购车价格,(元)表示商业车险保费):,,,,,,,.设由这组数据得到的回归直线方程为.
(1)求的值.
(2)某车主蔡先生购买一辆价值万元的新车.
①估计该车主蔡先生购车时的商业车险保费.
②若该车今年保险期间内已出过一次险,现在又被刮花了,蔡先生到店询价,预计修车费用为元,保险专员建议蔡先生自费(即不出险),你认为蔡先生是否应该接受建议?并说明理由.(假设该车辆下一年与上一年购买相同的商业车险产品进行续保).
【答案】(1);(2)①3411(元);②应该接受建议;理由见解析.
【分析】
(1)先计算样本中心点,代入回归直线,即得解;
(2)①将代入回归直线,即得解;
②计算再出一次险增加的保费,与修车费用800元比较,即得解
【详解】
(1)(万元)
(元),
回归直线经过样本点的中心,即,
所以.
(2)①价值为万元的新车的商业车险保费预报值为(元).
②由于该车已出过一次险,若再出一次险,则保费增加,即增加(元).
因为,所以应该接受建议.
【规律方法】
1.求回归直线方程的步骤
( http: / / www.21cnjy.com / )
2.(1)若已知回归直线方程(方程中无参数)进行预测时,把变量x代入回归直线方程即可对变量y进行估计.
(2)若回归直线方程中有参数,则根据回归直线一定经过点(,)求出参数值,得到回归直线方程,进而完成预测.
考点三 独立性检验
(1)(2021·全国· ( http: / / www.21cnjy.com )高二学业考试)为大力提倡“厉行节约,反对浪费”,某大学通过随机询问100名学生能否做到“光盘”行动,得到如下列联表:
做不到“光盘”行动 能做到“光盘”行动
女 45 10
男 30 15
经计算:.
附:
0.1 0.05 0.01 0.005 0.001
2.706 3.841 6.635 7.879 10.828
参考附表,得到的正确结论是( )
A.有的把握认为“该校学生能否做到‘光盘’行动与性别有关”
B.有的把握认为“该校学生能否做到‘光盘’行动与性别无关”
C.有的把握认为“该校学生能否做到‘光盘’行动与性别有关”
D.有的把握认为“该校学生能否做到‘光盘’行动与性别无关”
【答案】C
【分析】
根据已知条件计算的值与临界值比较即可求解.
【详解】
由题意得
列联表如图:
做不到“光盘”行动 能做到“光盘”行动 总数
女 45 10
男 30 15
总数

所以有的把握认为“该校学生能否做到‘光盘’行动与性别有关”.
故选:C.
(2)(2021·全国·高二单元测试)20 ( http: / / www.21cnjy.com )20年9月22日是第三个“中国农民丰收节”,全国处处五谷丰登、瓜果飘香,四川某地也是“小小花椒树种出致富路”!为更好提高花椒等级,该地组织了一次关于花椒田间种植技术学习时长的调查,随机收集了150户种植户的统计数据,以此研究种植户参与田间种植技术学习的时长和花椒等级的关系.21cnjy.com
一等 非一等 总计
三年 90 10 100
不足三年 30 20 50
总计 120 30 150
则认为种植户参与田间种植技术学习时长和花椒等级有关的把握为( )
参考公式:,
A.90% B.95%
C.99% D.99.9%
【答案】D
【分析】
根据表格中数据算出,进而进行数据对比得到答案.
【详解】
由题知,,故有99.9%的把握认为种植户参与田间种植技术学习时长和花椒等级有关.
故选:D.
(3)(2021·全国·高二课时练习)有人发现,多看手机容易使人变近视,下表是一个调查机构对此现象的调查结果:21教育网
近视 不近视 合计
少看手机 20 38 58
多看手机 68 42 110
合计 88 80 168
则在犯错误的概率不超过______的前提下,可以认为多看手机与人变近视有关系.
附:
0.005 0.001
7.879 10.828
【答案】0.001
【分析】
根据公式求出,再对照临界值表即可得出结论
【详解】
由题意题中数据可得,,
由临界值表可得,所以在犯错误的概率不超过的前提下,可以认为多看手机与人变近视有关系.
故答案为:0.001.
【规律方法】
1.在2×2列联表中,如果两个变量没有关 ( http: / / www.21cnjy.com )系,则应满足ad-bc≈0. |ad-bc|越小,说明两个变量之间关系越弱;|ad-bc|越大,说明两个变量之间关系越强.【来源:21cnj*y.co*m】
2.解决独立性检验的应用问题,一定要按照独立性检验的步骤得出结论.独立性检验的一般步骤:
(1)根据样本数据制成2×2列联表;
(2)根据公式
(3)比较观测值k与临界值的大小关系,作统计推断.
【跟踪练习】(1)(2020湖南长沙市长郡中学高三月考)针对当下的“抖音热”,某校团委对“学生性别和喜欢抖音是否有关”作了一次调查,其中被调查的男女生人数相同,男生喜欢抖音的人数占男生人数的,女生喜欢抖音的人数占女生人数的,若有的把握认为是否喜欢抖音和性别有关,则调查人数中男生可能有( )【出处:21教育名师】
附表:
0.050 0.010
3.841 6.635
附:
A. B. C. D.
【答案】BC
【解析】设男生的人数为,根据题意列出列联表如下表所示:
男生 女生 合计
喜欢抖音
不喜欢抖音
合计
则,
由于有的把握认为是否喜欢抖音和性别有关,则,
即,得,
,则的可能取值有、、、,
因此,调查人数中男生人数的可能值为或.
故选:BC.
(2)(2021·新疆·阜康市第一中学高二期中(文))利用独立性检验的方法调查大学生的性别与爱好某项运动是否有关,通过随机询问名不同的大学生是否爱好某项运动,利用列联表,由计算可得.【版权所有:21教育】
0.10 0.05 0.025 0.010 0.005 0.001
2.706 3.841 5.024 6.635 7.879 10.828
参照附表,得到的正确结论是( )
A.有以上的把握认为“爱好该项运动与性别无关”
B.有以上的把握认为“爱好该项运动与性别有关”
C.在犯错误的概率不超过的前提下,认为“爱好该项运动与性别有关”
D.在犯错误的概率不超过的前提下,认为“爱好该项运动与性别无关”
【答案】B
【分析】
根据,再对照表格中的数据,即可判断
【详解】
由于
对照表中数据得出有0.005的几率说明这两个变量之间的关系是不可信的,
即有1 0.005=99.5%的把握说明两个变量之间有关系
故选:B
1.(2022·全国·高三专题练习)某组织为研究爱好跑步是否与性别有关进行了一个调查,得到如下列联表,若这两个变量没有关系,则的值可能为( )21·世纪*教育网
单位:人
跑步 性别 合计
男 女
爱好 100
不爱好 120 600 720
合计 220
A.720 B.500 C.300 D.200
【答案】B
【分析】
根据方程,计算的值,即可得到答案;
【详解】
因为两个变量没有关系,
所以,
解得:,
故选:B
2.(2022·全国·高三专题练习)某外语学校要求学生从德语和日语中选择一种作为“第二外语”进行学习,为了解选择第二外语的倾向与性别的关系,随机抽取名学生,得到下面的数据表:【来源:21·世纪·教育·网】
选择德语 选择日语
男生
女生
根据表中提供的数据可知( )
附:,.
A.在犯错误的概率不超过的前提下,认为选择第二外语的倾向与性别无关
B.在犯错误的概率不超过的前提下,认为选择第二外语的倾向与性别有关
C.有的把握认为选择第二外语的倾向与性别无关
D.有的把握认为选择第二外语的倾向与性别有关
【答案】D
【分析】
直接利用列联表中的数据和公式计算,再根据临界值表进行判断即可
【详解】
由题意得,
所以有的把握认为选择第二外语的倾向与性别有关,或在犯错误的概率不超过的前提下,认为选择第二外语的倾向与性别有关,
故选:D
3.(2021·全国·高一课时练习)已知与之间的几组数据如表.
如表数据中的平均值为2.5,若某同学对赋了二个值分别为,得到二条线性回归直线方程分别为,对应的相关系数分别为,下列结论中错误的是( )
参考公式:线性回归方程中,其中,.相关系数.
A. B.相关系数中, C. D.
【答案】D
【分析】
根据所给数据,分取,两个数值,进行分类讨论即可得解.
【详解】
根据图表可得
由的平均值为2.5,若取,则,
代入公式可得,,,
所取,则,
此时代入公式可得,,,
所以错误,
故选:D.
4.(2021·宁夏·银川一中三模(文))关于线性回归的描述,有下列命题:
①回归直线一定经过样本中心点;
②相关系数的绝对值越大,拟合效果越好;
③相关指数越接近1拟合效果越好;
④残差平方和越小,拟合效果越好.
其中正确的命题个数为( )
A.1 B.2 C.3 D.4
【答案】C
【分析】
根据回归直线方程的性质,相关系数、相关系数及残差平方和的意义判断各项的正误即可.
【详解】
对于①,回归直线一定经过样本中心点,故正确;
对于②,相关系数的绝对值越接近于1,相关性越强,故错误;
对于③,相关指数越接近1拟合效果越好,故正确;
对于④,残差平方和越小,拟合效果越好,故正确.
故选:C.
5.(2021·山东泰安·模拟预测)经研究,男子篮球运动员的身高y(cm)关于其父亲身高的经验回归方程为,已知姚明身高226cm,其父亲姚志源身高208cm,那么姚明身高的残差等于( )
A.-10.2cm B.-6cm C.6cm D.10.2cm
【答案】C
【分析】
求出当时,即得解.
【详解】
把代入得,
所以,姚明身高的残差等于.
故选:C
6.(2021·山西太原·三模(理))年初,新型冠状病毒()引起的肺炎疫情爆发以来,各地医疗机构采取了各种针对性的治疗方法,取得了不错的成效,某医疗机构开始使用中西医结合方法后,每周治愈的患者人数如下表所示:
第周
治愈人数(单位:十人)
由上表可得关于的线性回归方程为,则此回归模型第周的残差(实际值减去预报值)为( )
A. B.
C. D.
【答案】A
【分析】
将样本中心点的坐标代入回归直线方程,求出的值,可得出回归直线方程,再将代入回归直线方程,用减去所得结果即可得解.
【详解】
由表格中的数据可得,,
由于回归直线过样本的中心点,则,解得,回归直线方程为,
将代入回归直线方程可得,
因此,第周的残差为.
故选:A.
7.(2022·江苏·高三专题练习)以下结论正确的是( )
A.根据列联表中的数据计算得出,而,则有99%的把握认为两个分类变量有关系
B.的值越大,两个事件的相关性就越大
C.在回归分析中,相关指数越大,说明残差平方和越小,回归效果越好
D.在回归直线中,变量时,变量的值一定是15
【答案】ABC
【分析】
A选项,有把握;
B选项,越大越可靠;
C选项,残差平方和越小,回归效果越好;
D选项不能说一定是.
【详解】
对于A,,故有99%的把握认为两个分类变量有关系,即A正确:对于B,越大,“与有关系”可信程度越大,相关性就越大,即B正确;
对于C,在回归分析中,相关指数越大,说明残差平方和越小,回归效果越好,即C正确;
对于D,当回归直线方程中,当变量等于200时,的值平均是15,不能说一定是15,故D错误.
故选:ABC.
8.(2021·广东惠州·高三月考)某种产品的价格(单位:元/)与需求量(单位:)之间的对应数据如下表所示:
10 15 20 25 30
11 10 8 6 5
根据表中的数据可得回归直线方程为,则以下结论正确的是( )
A.与正相关 B.与负相关
C.样本中心为 D.该产品价格为35元/时,日需求量大约为
【答案】BC
【分析】
由表格数据的变化趋势可得与负相关,可判断AB;利用样本中心点公式可计算样本中心点坐标,可判断C;由回归直线过样本中心点,代入可计算,令,可得,可判断D
【详解】
由表格数据,随着价格的增加,需求量随之减少,所以与负相关.
因为,,
故样本中心为
由回归直线必过样本点的中心,
所以有,解得,
所以当时,,日需求量不为最大
故选:BC
9.(2022·江苏·高三专题练习)某词汇研究机构为对某城市人们使用流行语的情况进行调查,随机抽取了200人进行调查统计得下方的列联表.则根据列联表可知:
年轻人 非年轻人 总计
经常用流行用 125 25 150
不常用流行用语 35 15 50
总计 160 40 200
参考公式:独立性检验统计量,其中.
下面的临界值表供参考:
0.15 0.10 0.05 0.025 0.010 0.005 0.001
2.072 2.706 3.841 5.024 6.635 7.879 10.828
有___________的把握认为“经常用流行用语”与“年轻人”有关系
【答案】95%
【分析】
先求出,再与临界值比较,即可求解
【详解】

根据临界值知有95%的把握认为经常用流行语与年轻人有关系,
故答案为:95%
10.(2021·江西·南昌市八一中学高二期末(理))下列说法正确的是___________
①方程(,其中为复数集)无解;
②若彼此相互独立,则;
③已知点,,且为原点,则向量在向量上的投影的数量为;
④通过最小二乘法以模型去拟合一组数据时,可知过点;
⑤通过最小二乘法以模型去拟合一组数据时,为了求出回归方程,设,将其变换后得到线性方程,则的值分别是和0.3.21教育名师原创作品
【答案】②③⑤
【分析】
①因为,可以求解或;②根据独立事件的乘法公式可得即可判断;③因求出,,然后根据平面向量数量积的几何意义即可求解.;④设,则,根据回归直线方程过,但是,从而可以判断结果;⑤根据题意得到,求解即可判断.
【详解】
①:因为(,其中为复数集),所以或,故①错误;
②根据独立事件的乘法公式可得:彼此相互独立,则,故②正确;
③因为点,,且为原点,所以,,则向量在向量上的投影的数量为,故③正确;
④通过最小二乘法以模型去拟合一组数据时,设,则,所以回归直线方程过,而,所以不过点,故④错误;
⑤通过最小二乘法以模型去拟合一组数据时,为了求出回归方程,设,将其变换后得到线性方程,,所以的值分别是和0.3,故⑤正确.
故答案为:②③⑤
11.(2020·江西修水·高二期末(理))下列说法正确的有______(填正确命题的序号)
①若函数在处导数不存在,则的函数图像在处无切线.
②若为离散型随机变量,则所有的取值构成的集合可能是无限数集.
③在对数据的相关性分析(回归分析)中,相关系数越大,两个变量的相关性越强.
④正态分布的密度曲线与轴所围成的区域的面积为1.
【答案】②④
【分析】
对①,利用函数的导数与切线的斜 ( http: / / www.21cnjy.com )率之间的关系即可判断;对②,根据离散型随机变量的定义即可判断;对③,根据回归直线方程的应用即可判断;对④,根据正态分布的定义即可判断.
【详解】
解:对①,若函数在处导数不存在,说明在该点处的斜率不存在,
不是说函数图象在处无切线,故①错误;
对②,若为离散型随机变量,则所有的取值构成的集合可能是无限数集,故②正确;
对③,在对数据的相关性分析(回归分析)中,相关系数越大,两个变量的相关性越强,故③错误;
对④,正态分布的密度曲线与轴所围成的区域的面积为1,故④正确.
故答案为:②④.
12.(2021·天津西青·高二期末)对两个变量x,y进行回归分析.
①残差的平方和越小,模型的拟合效果越好;
②相关系数的绝对值接近于0,两个随机变量的线性相关性越强;
③在经验回归方程中,当解释变量x每增加1个单位时,相应变量平均增加个单位;
④某人研究儿子身高与父亲身高的关系,得到经验回归方程,当时,,即:如果一个父亲的身高为,则儿子的升高一定为.
则以上结论中正确的序号为__________.
【答案】①③
【分析】
根据残差和相关系数的意义判定①②;根据线性回归方程的意义判定③④.
【详解】
根据残差的定义,可知①正确;相关系数绝对值越接近于1,线性相关性越强,故②错误;
由回归方程的意义,根据回归方程的解释变量的系数为0.3, 变量平均增加个单位,
故③正确;
回归方程是表示一种统计规律,具有随机的不确定性,不能说一定是,故④错误;
故答案为:①③.
13.(2021·陕西·西安中学高三月考( ( http: / / www.21cnjy.com )文))为调查某地区老人是否需要志愿者提供帮助,用简单随机抽样方法从该地区调查了500位老年人,结果如下:
是否需要志愿性别 男 女
需要 40 30
不需要 160 270
(1)估计该地区老年人中,需要志愿者提供帮助的老年人的比例;
(2)能否有99%的把握认为该地区的老年人是否需要志愿者提供帮助与性别有关?
附:.
0.050 0.010 0.001
k 3.841 6.635 10.828
【答案】(1);(2)有99%的把握认为该地区的老年人是否需要帮助与性别有关.
【分析】
(1)计算出需要志愿者提供帮助的老年人的人数,从而可得出答案;
(2)根据公式求出,然后对照临界值表即可得出结论.
【详解】
解:(1)调查的500位老年人中有70位需要志愿者提供帮助,因此该地区老年人中,需要帮助的老年人的比例的估算值为;
(2),
由于,所以有99%的把握认为该地区的老年人是否需要帮助与性别有关;
14.(2021·辽宁丹东·高三期中)晚上睡眠充足是提高学习效率的必要条件,河北衡水某高中的高三年级学生晚上10点10分必须休息,中午强制午睡一个小时;另一所同类高中的高三年级学生晚上11点休息,并鼓励学生还可以继续进行夜自习,稍晚再休息,中午没有强制午睡要求.这两所高中早上起床时间相同.有关人员分别从这两所高中的高三年级学生中随机抽取名,进行学习效率问卷调查,其中衡水某高中有名学生的学习效率高,且从这名学生中随机抽取人,抽到学习效率高的学生的概率是.
(1)完成下面列联表:
学习效率高 学习效率不高 合计
衡水某高中
另一所同类高中
合计
(2)根据(1)中的列联表估计,两所同类高中高三年级学习效率高的学生的百分比分别是多少?并判断能否有的把握认为“学生学习效率高低与晚上睡眠是否充足”有关?
附:,
【答案】(1)列联表答案见解析;(2),,有的把握认为“学生学习效率高低与晚上睡眠是否充足”有关.
【分析】
(1)根据题目中的信息填出列联表即可;
(2)根据表中的信息可估计出两所同类高中高三年级学习效率高的学生的百分比;
(3)根据表中数据计算出K2,就可以下结论得出答案.
【详解】
解:(1)列联表如下:
学习效率高 学习效率不高 合计
衡水某高中
另一所同类高中
合计
(2)根据(1)中的列联表估计,衡水某高中高三年级学习效率高的学生的百分比为,另一所同类高中高三年级学习效率高的学生的百分比为.
.
因此有的把握认为“学生学习效率高低与晚上睡眠是否充足”有关.
15.(2021·全国·高 ( http: / / www.21cnjy.com )考真题(文))甲、乙两台机床生产同种产品,产品按质量分为一级品和二级品,为了比较两台机床产品的质量,分别用两台机床各生产了200件产品,产品的质量情况统计如下表:
一级品 二级品 合计
甲机床 150 50 200
乙机床 120 80 200
合计 270 130 400
(1)甲机床、乙机床生产的产品中一级品的频率分别是多少
(2)能否有99%的把握认为甲机床的产品质量与乙机床的产品质量有差异
附:
0.050 0.010 0.001
k 3.841 6.635 10.828
【答案】(1)75%;60%;
(2)能.
【分析】
根据给出公式计算即可
【详解】
(1)甲机床生产的产品中的一级品的频率为,
乙机床生产的产品中的一级品的频率为.
(2),
故能有99%的把握认为甲机床的产品与乙机床的产品质量有差异.
16.(2021·山东菏泽·二模)“十四五”是我国全面建成小康社会、实现第一个百年奋斗目标之后,乘势而上开启全面建设社会主现代化国家新征程、向第二个百年奋斗目标进军的第一个五年,实施时间为2021年到2025年.某企业为响应国家号召,汇聚科研力量,加强科技创新,准备加大研发资金投入,为了解年研发资金投入额(单位:亿元)对年盈利额(单位:亿元)的影响,通过对“十二五”和“十三五”规划发展10年期间年研发资金投入额和年盈利额数据进行分析,建立了两个函数模型:21世纪教育网版权所有
;,其中, ,, 均为常数,为自然对数的底数
令,经计算得如下数据:,,,,,,,,,,问:
(1)请从相关系数的角度,分析哪一个模型拟合度更好?
(2)根据(1)的选择及表中数据,建立,关于的回归方程(系数精确到0.01)
(3)若希望2021年盈利额y为500亿元,请预测2021年的研发资金投入额为多少亿元?(结果精确到0.01)
附:①相关系数r=
回归直线中:,
参考数据:,.
【答案】(1)模型的拟合程度更好;(2);(3)亿元.
【分析】
(1)分别计算两个函数模型的相关系数和,比较和的大小关系即可判断;
(2)由得,即,根据最小二乘法求和的值,即可求解;
(3)将代入(2)中的回归方程即可求解.
【详解】
(1)为了判断两个函数模型:;,拟合程度,只需要判断两个函数模型,拟合程度即可.
设和的相关系数为,和的相关系数为,
由题意


显然,因此从相关系数的角度,模型的拟合程度更好.
(2)先建立关于的线性回归方程,由得,,即,


所以关于的线性回归方程为,即,
所求回归方程为:,
(3)若2021年盈利额为500亿元,即为,
,,
解得:,
所以2021年的研发资金投入量约为亿元.
17.(2021·全国·模拟预测( ( http: / / www.21cnjy.com )文))发展清洁能源,是改善能源结构、保障能源安全、推进生态文明建设的重要任务.十三五以来,我国加快调整能源结构,减少煤炭消费、稳定油气供应、大幅增加清洁能源比重,风电、光伏等可再生能源发电效率不断提高.据资料整理统计我国从2015年到2019年的年光伏发电量如表:2-1-c-n-j-y
年份 2015 2016 2017 2018 2019
编号x 1 2 3 4 5
年光伏发电量(亿千瓦时) 395 665 1178 1775 2243
其中.
(1)请用相关系数r说明是否可用线性回归模型拟合年光伏发电量y与x的关系;
(2)建立年光伏发电量y关于x的线性回归方程,并预测2021年年光伏发电量(结果保留整数).
参考公式:相关系数,回归方程中斜率和截距的最小二乘估计公式分别为, ,
【答案】(1)可用线性回归模型进行拟合;(2)回归方程为,亿千瓦时
【分析】
(1)首先求出,再根据所给数据求出相关系数,即可判断;
(2)利用公式求出,,即可得出结论.
【详解】
解:(1)因为,
所以相关系数
所以与之间具有较强的线性相关关系,可用线性回归模型进行拟合;
(2)
所以
所以回归方程为,
因为2021年所对应的年份编号为,
当时,
故预计2021年年光伏发电量为亿千瓦时;
18.(2021·云南大理·模拟预测(理))2021年6月17日9时22分,我国酒泉卫星发射中心用长征遥十二运载火箭,成功将神舟十二号载人飞船送入预定轨道,顺利将聂海胜、刘伯明、汤洪波3名航天员送入太空,发射取得圆满成功,这标志着中国人首次进入自己的空间站.某公司负责生产的A型材料是神舟十二号的重要零件,该材料应用前景十分广泛.该公司为了将A型材料更好地投入商用,拟对A型材料进行应用改造、根据市场调研与模拟,得到应用改造投入x(亿元)与产品的直接收益y(亿元)的数据统计如下:
序号 1 2 3 4 5 6 7 8 9 10 11 12
x 2 3 4 6 8 10 13 21 22 23 24 25
y 15 22 27 40 48 54 60 68.5 68 67.5 66 65
当时,建立了y与x的两个回归模型:模型①:,模型②:;当时,确定y与x满足的线性回归方程为.
(1)根据下列表格中的数据,比较当时模型①,②的相关指数的大小,并选择拟合精度更高、更可靠的模型,预测对A型材料进行应用改造的投入为17亿元时的直接收益;21*cnjy*com
回归模型 模型① 模型②
回归方程
79.13 20.2
(2)为鼓励科技创新,当应用改 ( http: / / www.21cnjy.com )造的投入不少于20亿元时,国家给予公司补贴5亿元,以回归方程为预测依据,根据(1)中选择的拟合精度更高更可靠的模型,比较投入17亿元与20亿元时公司收益(直接收益+国家补贴)的大小.
附:刻画回归效果的相关指数,且当越大时,回归方程的拟合效果越好..
用最小二乘法求线性回归方程的截距:.
【答案】(1)模型②拟合精度更高、更可靠,亿;(2)投入17亿元比投入20亿元时收益小.
【分析】
(1)根据公式计算相关指数,再根据大小选择合适的模型,根据所得模型可求直接受益.
(2)根据(1)中的公式结合利润计算方法可求公司收益,从而可得两者的大小关系.
【详解】
(1)对于模型①,
对应的,
故对应的,
故对应的相关指数,
对于模型②,同理对应的相关指数,
故模型②拟合精度更高、更可靠.
故对A型材料进行应用改造的投入为17亿元时的直接收益为.
(2)当时,
后五组的,,
由最小二乘法可得,
故当投入20亿元时公司收益(直接收益+国家补贴)的大小为:

故投入17亿元比投入20亿元时收益小.
考纲解读
核心素养
知识梳理
高频考点
例1
例2
例3
真题演练
21世纪教育网 www.21cnjy.com 精品试卷·第 2 页 (共 2 页)
HYPERLINK "http://21世纪教育网(www.21cnjy.com)
" 21世纪教育网(www.21cnjy.com)

展开更多......

收起↑

资源列表