8.1 成对数据的统计相关性-2024-2025学年高二下学期数学《考点突破》(人教A版2019选择性必修三)

资源下载
  1. 二一教育资源

8.1 成对数据的统计相关性-2024-2025学年高二下学期数学《考点突破》(人教A版2019选择性必修三)

资源简介

中小学教育资源及组卷应用平台
8.1 成对数据的统计相关性
考点一 相关关系与函数关系的辨析
【例1】(24-25高二下·全国·课前预习)思考并判断下列几组变量之间有什么样的关系?
(1)圆的面积与半径之间的关系;
(2)16岁学生的体重与身高之间的关系;
(3)商品销售量与销售价格之间的关系;
(4)匀速运动的物体,其运动的路程与时间之间的关系;
(5)平均学习时间与学习成绩之间的关系;
(6)科技创新能力与人才培养近亲繁殖率之间的关系.
【答案】(1)函数关系
(2)相关关系
(3)相关关系
(4)函数关系
(5)相关关系
(6)相关关系
【解析】(1)因为,所以圆的面积与半径之间的关系为函数关系;
(2)因为体重除了与身高有关系,还和性别、遗传等因素有关系,
所以16岁学生的体重与身高之间的关系为相关关系;
(3)因为销售量除了与销售价格有关系,还和是否打广告等方面有关系,
所以商品销售量与销售价格之间的关系为相关关系;
(4)设匀速运动的物体的速度为,
所以运动的路程与时间之间的关系为,
因此匀速运动的物体,其运动的路程与时间之间的关系为函数关系;
(5)因为学习成绩除了与平均学习时间有关系外,还与学习方法等因素有关系,
所以平均学习时间与学习成绩之间的关系为相关关系;
(6)因为科技创新能力除了与人才培养近亲繁殖率有关系,还有教育等因素有关系,
所以科技创新能力与人才培养近亲繁殖率之间的关系为相关关系.
【一隅三反】
1(23-24高二上·上海·课后作业)两个变量x与y之间的回归方程( )
A.表示x与y之间的函数关系; B.表示x与y之间的不确定关系;
C.反映x与y之间的真实关系; D.是反映x与y之间的真实关系的一种最佳拟合.
【答案】D
【解析】根据回归方程的定义,可得两个变量x与y之间的回归方程是反映x与y之间的真实关系的一种最佳拟合.
故选:D.
2.(2024江苏·课后作业)(多选)下列两个变量之间的关系不是函数关系的是(  )
A.角度和它的余弦值
B.眼睛的近视程度与看手机的时间
C.正边形的边数和内角和的度数
D.人的年龄和身高
【答案】BD
【解析】对于A,角度和它的余弦值满足函数关系,A是函数关系;
对于B,眼睛的近视程度与看手机的事件是客观存在的相互依存的不确定性关系,B不是函数关系;
对于C,正边形的边数和内角和的度数满足函数关系,C是函数关系;
对于D,人的年龄和身高是客观存在的相互依存的不确定性关系,D不是函数关系.
故选:BD.
3.(2025湖北)判断下列变量间哪些能用函数模型刻画,哪些能用回归模型刻画.
回归模型: ;函数模型: .
①某公司的销售收入和广告支出;
②某城市写字楼的出租率和每平米月租金;
③航空公司的顾客投诉次数和航班正点率;
④某地区的人均消费水平和人均国内生产总值(GDP);
⑤学生期末考试成绩和考前用于复习的时间;
⑥一辆汽车在某段路程中的行驶速度和行驶时间;
⑦正方形的面积与周长.
【答案】 ①②③④⑤ ⑥⑦
【解析】对于①,销售收入虽然跟广告支出有关,但并不是广告打得多就对销售得多,还得看产品质量等其他因素,故其为回归模型;
对于②,某城市写字楼的出租率和每平米月租金有关,但写字楼的出租率还跟租户的收入、写字楼的地理位置等因素有关,故其为回归模型;
对于③,航空公司的顾客投诉次数和航班正点率有关,但航班正点率还跟天气等因素有关,故其为回归模型;
对于④,某地区的人均消费水平和人均国内生产总值(GDP)有关,但同样的GDP,一线城市与十八线城市的人均消费显然是不一样的,故其为回归模型;
对于⑤,学生期末考试成绩和考前用于复习的时间有关,但显然跟学生原本的知识基础、智商水平等因素有关,故其为回归模型;
对于⑥,一辆汽车在某段路程中的行驶速度和行驶时间,由可知其为函数模型;
对于⑦,正方形的面积为,周长为,故,故其为函数模型.
故答案为:①②③④⑤;⑥⑦
考点二 正负相关的判断
【例2-1】(24-25高二上·广西桂林·期末)根据如下两组数据,下列说法正确的是( )
5 6 7 8 9 10
Y 5 4.8 3.5 4 3 2
2 4 6 7 9
3 4 9 7 11
A.和呈正相关,和呈正相关
B.和呈负相关,和呈负相关
C.和呈正相关,和呈负相关
D.和呈负相关,和呈正相关
【答案】D
【解析】由所给数据可知,当增大时减小,和呈负相关;当增大时和增大,和呈正相关.
故选:D
【一隅三反】
1.(24-25高二下·全国·课后作业)为制定某种产品的生产计划,某工厂统计得到生产线条数与该种产品产量的数据如下表:
生产线条数 1 2 3 4 5
产量 21 39 64 87 104
则下列说法正确的是( )
A.与负相关 B.与正相关
C.与不相关 D.与成正比例关系
【答案】B
【解析】由题中数据可知,y随x的增大而增大,且不成比例关系,故y与x正相关.
故选:B
2.(24-25高二下·全国·课后作业)下列散点图中,两个变量呈负相关的个数是( )

A.1 B.2 C.3 D.4
【答案】B
【解析】从整体上看,当一个变量的值增加时,另一个变量的相应值呈现减少的趋势,则这两个变量为负相关.
结合散点图可知,①②满足题意,即两个变量呈负相关的个数为2个.
故选:B
3.(24-25高二下·全国·课后作业)下列两个变量中,成正相关的两个变量是( )
A.汽车自身的重量与行驶每公里的耗油量
B.正方形面积与边长
C.花费在体育活动上面的时间与期末考试数学成绩
D.期末考试随机编排的准考证号与期末考试成绩总分
【答案】A
【解析】对于A,一般情况下,汽车越重,则每公里耗油量越多,成正相关,故A正确;
对于B,正方形的面积与边长是函数关系,故B错误;
对于C,一般情况下,若花费在体育活动上面的时间越长,则期末考试数学成绩可能会降低,故不为正相关,故C错误;
对于D,期末考试随机编排的准考证号与期末考试成绩总分没有相关关系,故D错误.
故选:A.
考点三 相关系数
【例3-1】(2024河南)对四组数据进行统计,获得如图所示的散点图,关于其样本相关系数的比较,正确的是( )
A. B.
C. D.
【答案】A
【解析】由图知:(1)(3)变量呈正相关,且(1)的相关性比(3)要强,则,
(2)(4)变量呈负相关,且(2)的相关性比(4)要强,则,
所以.
故选:A
【例3-2】(24-25高二下·全国·课后作业)(多选)有变量与变量对应的4组样本数据,计算出它们的线性相关系数分别为,则与线性相关关系最弱的是( )
A. B. C. D.
【答案】BD
【解析】相关系数的绝对值越小,变量间的线性相关性越弱,
因为,所以与线性相关关系最弱的是.
故选:BD.
【例3-3】(24-2江苏)已知变量和变量的4对随机观测数据为,,计算成对样本数据的样本相关系数,并推断它们的相关程度(保留3位小数).
附:.
【答案】0.999,具有很强的相关性.
【解析】依题意,,



因此,
所以这组成对的样本数据相关系数为0.999,具有很强的相关性.
【一隅三反】
1(24-25四川成都·期中)(多选)对于样本相关系数,下列说法正确的是( )
A.样本相关系数可以用来判断成对样本数据相关的正负性
B.样本相关系数可以是正的,也可以是负的
C.样本相关系数越大,成对样本数据的线型相关程度越强
D.样本相关系数
【答案】ABD
【解析】对于A选项,样本相关系数可以用来判断成对样本数据相关的正负性,A对;
对于B选项,样本相关系数可以是正的,也可以是负的,B对;
对于C选项,样本相关系数的绝对值越大,成对样本数据的线性相关程度也越强,C错.
对于D选项,样本相关系数,D对;
故选:ABD
2.(23-24高二下·山西大同·期中)对两个变量进行线性相关性检验,得线性相关系数,对两个变量进行线性相关性检验,得线性相关系数,则下列判断正确的是( )
A.变量与变量正相关,变量与变量负相关,变量与变量的线性相关性更强
B.变量与变量负相关,变量与变量正相关,变量与变量的线性相关性更强
C.变量与变量负相关,变量与变量正相关,变量与变量的线性相关性更强
D.变量与变量正相关,变量与变量负相关,变量与变量的线性相关性更强
【答案】D
【解析】由线性相关系数知与正相关,
由线性相关系数知与负相关,
又,所以变量与变量的线性相关性比变量与变量的线性相关性更强.
故选:D.
3.(24-25湖北)某企业不断扩大规模,提高经营收入.统计得到该企业2018-2022年产值(单位:亿元)与企业员工数(单位:千人)之间的数据如下:
年份 2018 2019 2020 2021 2022
千人 1 2 3 4 5
亿元 5 8 10 24 28
从表中数据可知与呈线性相关,根据这5年的数据计算与的相关系数 (保留三位小数).
附:.
【答案】
【解析】由表格中的数据,可得,,
则,
,,
故.
故答案为:.
考点四 残差
【例4-1】(24-25高二上·吉林·期末)某地根据以往数据,得到当地16岁男性的身高与其父亲身高的经验回归方程为,当地人小王16岁时身高167cm,他父亲身高180cm,则小王身高的残差为( )
A. B. C.2cm D.3cm
【答案】A
【解析】当时,得,则(),
所以小王身高的残差为.
故选:A
【例4-2】(24-25四川自贡)根据变量和的成对样本数据,由一元线性回归模型得到经验回归模型,求得残差图.对于以下四幅残差图,满足一元线性回归模型中对随机误差假设的是( )
A. B.
C. D.
【答案】A
【解析】对于A,残差比较均匀地分布在以取值为0的横轴为对称轴的水平带状区域内,故A正确;
对于B,残差与观测时间有线性关系,故B错误;
对于C,残差的方差不是一个常数,随着观测时间变大而变小再变大,故C错误;
对于D,残差与观测时间是非线性关系,故D错误.
故选:A.
【一隅三反】
1.(2023·河南·模拟预测)已知一组样本数据,,,,根据这组数据的散点图分析与之间的线性相关关系,若求得其线性回归方程为,则在样本点处的残差为( )
A.38.1 B.22.6 C. D.91.1
【答案】C
【解析】因为观测值减去预测值称为残差,
所以当时,,
所以残差为.
故选:C.
2.(23-24高二下·黑龙江哈尔滨·期末)已知一系列样本点的一个经验回归方程为,若样本点的残差为1,则 .
【答案】
【解析】根据题意得,解得.
故答案为:.
3.(23-24高二下·安徽·阶段练习)设某制造公司进行技术升级后的第x个月()的利润为y(单位:百万元),根据统计数据,求得y关于x的经验回归方程为,若时的观测值,则时的残差为( )
A. B.1 C.3 D.6
【答案】B
【解析】因为时的预测值为,
所以残差为.
故选:B.
4.(23-24高二下·辽宁沈阳·阶段练习)已知5个成对数据的散点图如下、若去掉点,则下列说法错误的是( )
A.变量x与变量y呈负相关 B.变量x与变量y的相关性变强
C.残差平方和变小 D.样本相关系数r变大
【答案】D
【解析】由散点图可知,去掉点D后,与的线性相关加强,且为负相关,所以AB正确,
由于与的线性相关加强,所以残差平方和变小,所以C正确,
由于与的线性相关加强,且为负相关,所以相关系数的绝对值变大,而相关系数为负的,所以样本相关系数r变小,所以D错误,
故选:D.
单选题
1.(23-24高二下·四川眉山·期末)根据物理中的胡克定律,弹簧伸长的长度与所受的外力成正比.测得一根弹簧伸长长度x和相应所受外力F的一组数据如下:
编号 1 2 3 4 5 6
1 1.2 1.4 1.6 1.8 2.0
3.08 3.76 4.31 5.02 5.51 6.25
据此给出以下结论:
①这两变量不相关;②这两个变量负相关;③这两个变量正相关.
其中所有正确结论的个数是( )
A.3 B.2 C.1 D.0
【答案】C
【解析】画出弹簧伸长长度x和相应所受外力F的散点图,
可以判断这两变量相关,且为正相关,故①②错误,③正确.
故选:C
2.(23-24高二下·山西长治·期中)根据变量的观测数据,绘制成散点图1;根据变量的观测数据,绘制成散点图2.若用线性回归进行分析,设表示变量的样本相关系数,表示变量的样本相关系数,则( )

A. B.
C. D.
【答案】A
【解析】由图可得随增大而减小,随增大而减小,
所以与增呈负相关关系,与呈负相关关系,故,
又由图可知图1相关性更强,故更接近,
所以.
故选:A.
3.(24-25 上海 )已知变量X与Y相对应的一组数据为,,,,,变量U与V相对应的一组数据为,,,,.表示变量X与Y之间的线性相关系数,表示变量U与V之间的线性相关系数,则下列结论中正确的是( )
A. B. C. D.
【答案】C
【解析】由变量X与Y相对应的一组数据,可得变量X与Y之间正相关,∴;
由变量U与V相对应的一组数据,可知变量U与V之间负相关,∴;
综上所述:与的大小关系是.
故选:C.
4.(24-2 湖北·期中)已知变量x和变量y的一组成对样本数据为,其中,其回归直线方程为,当增加两个样本数据和后,重新得到的回归直线方程斜率为3,则在新的回归直线方程的估计下,样本数据所对应的残差为( )
A. B. C. D.
【答案】B
【解析】∵,∴增加两个样本点后的平均数为;
∵,∴,
∴增加两个样本点后y的平均数为,
∴,解得,
∴新的经验回归方程为,则当时,,
∴样本点的残差为
故选:B.
5(24-25高二下·全国·课后作业)给出下列两组数据,用分别表示与与的线性相关系数,则下列说法正确的是( )
2 4 6 7 9
3 4 7 9 11
2 4 6 7 9
10 9 8 5 2
A. B. C. D.
【答案】C
【解析】根据两组数据的可知,变量与呈现出正相关,变量与呈现出负相关,即.
故选:C.
6.(24-25浙江)为考察两个变量,的相关性,搜集数据如表,则两个变量的线性相关程度( )
5 10 15 20 25
103 105 110 111 114
(参考数据:,,)
A.很强 B.很弱 C.无相关 D.不确定
【答案】A
【解析】由题可得,,


因为相关系数很接近于1,故两个变量的线性相关程度很强.
故选:A.
7.(2024·浙江)为研究光照时长(小时)和种子发芽数量(颗)之间的关系,某课题研究小组采集了9组数据,绘制散点图如图所示,并对,进行线性回归分析.若在此图中加上点后,再次对,进行线性回归分析,则下列说法正确的是( )
A.,不具有线性相关性 B.决定系数变大
C.相关系数变小 D.残差平方和变小
【答案】C
【解析】对于A,加入点后,变量与预报变量相关性变弱,
但不能说,不具有线性相关性,所以A不正确
对于B,决定系数越接近于1,拟合效果越好,所以加上点后,决定系数变小,故B不正确;
对于C,从图中可以看出点较其他点,偏离直线远,所以加上点后,回归效果变差.
所以相关系数的绝对值越趋于0,故C正确;
对于D,残差平方和变大,拟合效果越差,所以加上点后,残差平方和变大,故D不正确;
故选:C.
8.(24-25高二下·全国·课后作业)某团队尝试用回归模型甲、乙、丙、丁描述人的1000米跑步成绩与肺活量的关系,已知模型甲、乙、丙、丁对应的决定系数分别为,则拟合效果最好的模型是( )
A.甲 B.乙 C.丙 D.丁
【答案】D
【解析】越大,则回归模型的拟合效果越好,
因为,所以拟合效果最好的是模型丁.
故选:D.
9.(23-24天津·期末)中国茶文化博大精深、茶水的口感与茶叶的类型和水的温度有关,某数学建模小组建立了茶水冷却时间和茶水温度的一组数据,经过分析,提出了四种回归模型,①②③④四种模型的残差平方和的值分别是.则拟合效果最好的模型是( )
A.模型① B.模型② C.模型③ D.模型④
【答案】B
【解析】对于回归模型,残差平方和越小,回归模型的拟合效果越好,故拟合效果最好的模型是模型②.
故选:B.
10.(24-25江苏)研究数据表明,某校高中生的数学成绩与物理成绩、物理成绩与化学成绩均有正相关关系.现从该校抽取某班50位同学的数学、物理、化学三科成绩作为样本,设数学、物理、化学成绩分别为变量x,y,z若x,y的样本相关系数为,y,z的样本相关系数为,则x、z的样本相关系数的最大值为( )
附:相关系数
A. B. C. D.1
【答案】B
【解析】设,,,
则有,,,
由相关系数公式可知:,
设与夹角为,与夹角为,
由x,y的样本相关系数为,所以,,
由这两个夹角均为锐角且,所以与夹角的可能性是,
则与夹角余弦值的最大值为,此时x与z样本相关系数最大,
即,
故选:B.
多选题
11(24-25高二下·全国·随堂练习)下列关系是相关关系的是( )
A.角度和它的正弦值之间的关系
B.某商场搞促销活动与销售量之间的关系
C.作文水平与课外阅读量之间的关系
D.底面积一定的三棱锥的体积与高之间的关系
【答案】BC
【解析】A,D选项两个变量之间的关系是函数关系,
B,C选项两个变量之间的关系是相关关系.
故选:BC.
12.(24-25福建)记变量与相对应的一组数据的样本相关系数为,变量与相对应的一组数据的样本相关系数为,则( )
A.当与不相关
B.当与呈函数关系
C.当与的相关性强于与的相关性
D.当与的相关性强弱等于与的相关性
【答案】BD
【解析】对于A中,当样本相关系数为0,只能说明两变量不是线性相关关系,不能说明两变量之间没有其他关系,所以A错误;
对于B中,当样本相关系数为1,两变量呈确定的函数关系,所以B正确;
对于C中,当与的相关性强于与的相关性,所以C错误;
对于D中,样本相关系数相等,说明相关性强弱相等,所以D正确.
故选:BD.
13.(23-24高二下·福建泉州·期末)某同学根据变量x与y的六组数据(,2,…,6)绘制了如下散点图,并选择一元线性回归模型进行拟合,若去掉B点,则下列说法正确的是( )
A.残差平方和变小 B.相关系数r越趋于1
C.决定系数变大 D.y与x线性相关程度变强
【答案】ACD
【解析】从图中可以看出B点较其他点,偏离直线远,所以去掉B点后,回归效果更好,
A.残差平方和变小,拟合效果越好,故正确,符合题意;
B.相关系数|r|越趋于1,拟合的回归方程越优,
所以去掉B点后,相关系数r的绝对值越趋于1,故B错误,不符合题意;
C.决定系数R2越接近于1,拟合的回归方程越优,
即去掉B点后,变大,越趋于1,故正确,符合题意;
D.解释变量x与预报变量y相关性增强,故正确,符合题意.
故选:ACD.
14(23-24 广西柳州 )两个具有线性相关关系的变量的一组数据可建立经验回归方程,下列说法正确的是( ).
A.相关系数越接近1,变量x,y相关性越强 .
B.落在回归直线方程上的样本点越多,回归直线方程拟合效果越好
C.残差
D.决定系数越小,残差平方和越大,即模型的拟合效果越差
【答案】AD
【解析】对于A:相关系数越接近1,相关性越强,故A正确;
对于B:回归直线方程拟合效果的强弱由决定系数,故B错误;
对于C:残差故C错误;
对于D:决定系数越小,残差平方和越大,效果越差,故D正确.
故选:AD.
15.(23-24高二下·湖北·期末)在成对数据的统计分析中,下列说法正确的是( )
A.经验回归直线过点
B.残差平方和越小,回归模型的拟合效果越好
C.若样本相关系数越大,则成对样本数据的线性相关程度越强
D.在回归方程中,当解释变量每增加1个单位时,预报变量平均增加2个单位
【答案】ABD
【解析】对于A:由经验回归直线过样本点中心,故A正确;
对于B:残差平方和越小的模型,拟合的效果越好,故B正确;
对于C:若样本相关系数的绝对值越接近于1,则样本数据的线性相关程度越强,故C错误;
对于D:在回归方程中,当解释变量每增加1个单位时,预报变量平均增加2个单位,故D正确;
故选:ABD
21世纪教育网(www.21cnjy.com)中小学教育资源及组卷应用平台
8.1 成对数据的统计相关性
考点一 相关关系与函数关系的辨析
【例1】(24-25高二下·全国·课前预习)思考并判断下列几组变量之间有什么样的关系?
(1)圆的面积与半径之间的关系;
(2)16岁学生的体重与身高之间的关系;
(3)商品销售量与销售价格之间的关系;
(4)匀速运动的物体,其运动的路程与时间之间的关系;
(5)平均学习时间与学习成绩之间的关系;
(6)科技创新能力与人才培养近亲繁殖率之间的关系.
【一隅三反】
1(23-24高二上·上海·课后作业)两个变量x与y之间的回归方程( )
A.表示x与y之间的函数关系; B.表示x与y之间的不确定关系;
C.反映x与y之间的真实关系; D.是反映x与y之间的真实关系的一种最佳拟合.
2.(2024江苏·课后作业)(多选)下列两个变量之间的关系不是函数关系的是(  )
A.角度和它的余弦值
B.眼睛的近视程度与看手机的时间
C.正边形的边数和内角和的度数
D.人的年龄和身高
3.(2025湖北)判断下列变量间哪些能用函数模型刻画,哪些能用回归模型刻画.
回归模型: ;函数模型: .
①某公司的销售收入和广告支出;
②某城市写字楼的出租率和每平米月租金;
③航空公司的顾客投诉次数和航班正点率;
④某地区的人均消费水平和人均国内生产总值(GDP);
⑤学生期末考试成绩和考前用于复习的时间;
⑥一辆汽车在某段路程中的行驶速度和行驶时间;
⑦正方形的面积与周长.
考点二 正负相关的判断
【例2-1】(24-25高二上·广西桂林·期末)根据如下两组数据,下列说法正确的是( )
5 6 7 8 9 10
Y 5 4.8 3.5 4 3 2
2 4 6 7 9
3 4 9 7 11
A.和呈正相关,和呈正相关
B.和呈负相关,和呈负相关
C.和呈正相关,和呈负相关
D.和呈负相关,和呈正相关
【一隅三反】
1.(24-25高二下·全国·课后作业)为制定某种产品的生产计划,某工厂统计得到生产线条数与该种产品产量的数据如下表:
生产线条数 1 2 3 4 5
产量 21 39 64 87 104
则下列说法正确的是( )
A.与负相关 B.与正相关
C.与不相关 D.与成正比例关系
2.(24-25高二下·全国·课后作业)下列散点图中,两个变量呈负相关的个数是( )

A.1 B.2 C.3 D.4
3.(24-25高二下·全国·课后作业)下列两个变量中,成正相关的两个变量是( )
A.汽车自身的重量与行驶每公里的耗油量
B.正方形面积与边长
C.花费在体育活动上面的时间与期末考试数学成绩
D.期末考试随机编排的准考证号与期末考试成绩总分
考点三 相关系数
【例3-1】(2024河南)对四组数据进行统计,获得如图所示的散点图,关于其样本相关系数的比较,正确的是( )
A. B.
C. D.
【例3-2】(24-25高二下·全国·课后作业)(多选)有变量与变量对应的4组样本数据,计算出它们的线性相关系数分别为,则与线性相关关系最弱的是( )
A. B. C. D.
【例3-3】(24-2江苏)已知变量和变量的4对随机观测数据为,,计算成对样本数据的样本相关系数,并推断它们的相关程度(保留3位小数).
附:.
【一隅三反】
1(24-25四川成都·期中)(多选)对于样本相关系数,下列说法正确的是( )
A.样本相关系数可以用来判断成对样本数据相关的正负性
B.样本相关系数可以是正的,也可以是负的
C.样本相关系数越大,成对样本数据的线型相关程度越强
D.样本相关系数
2.(23-24高二下·山西大同·期中)对两个变量进行线性相关性检验,得线性相关系数,对两个变量进行线性相关性检验,得线性相关系数,则下列判断正确的是( )
A.变量与变量正相关,变量与变量负相关,变量与变量的线性相关性更强
B.变量与变量负相关,变量与变量正相关,变量与变量的线性相关性更强
C.变量与变量负相关,变量与变量正相关,变量与变量的线性相关性更强
D.变量与变量正相关,变量与变量负相关,变量与变量的线性相关性更强
3.(24-25湖北)某企业不断扩大规模,提高经营收入.统计得到该企业2018-2022年产值(单位:亿元)与企业员工数(单位:千人)之间的数据如下:
年份 2018 2019 2020 2021 2022
千人 1 2 3 4 5
亿元 5 8 10 24 28
从表中数据可知与呈线性相关,根据这5年的数据计算与的相关系数 (保留三位小数).
附:.
考点四 残差
【例4-1】(24-25高二上·吉林·期末)某地根据以往数据,得到当地16岁男性的身高与其父亲身高的经验回归方程为,当地人小王16岁时身高167cm,他父亲身高180cm,则小王身高的残差为( )
A. B. C.2cm D.3cm
【例4-2】(24-25四川自贡)根据变量和的成对样本数据,由一元线性回归模型得到经验回归模型,求得残差图.对于以下四幅残差图,满足一元线性回归模型中对随机误差假设的是( )
A.B.C. D.
【一隅三反】
1.(2023·河南·模拟预测)已知一组样本数据,,,,根据这组数据的散点图分析与之间的线性相关关系,若求得其线性回归方程为,则在样本点处的残差为( )
A.38.1 B.22.6 C. D.91.1
2.(23-24高二下·黑龙江哈尔滨·期末)已知一系列样本点的一个经验回归方程为,若样本点的残差为1,则 .
3.(23-24高二下·安徽·阶段练习)设某制造公司进行技术升级后的第x个月()的利润为y(单位:百万元),根据统计数据,求得y关于x的经验回归方程为,若时的观测值,则时的残差为( )
A. B.1 C.3 D.6
4.(23-24高二下·辽宁沈阳·阶段练习)已知5个成对数据的散点图如下、若去掉点,则下列说法错误的是( )
A.变量x与变量y呈负相关 B.变量x与变量y的相关性变强
C.残差平方和变小 D.样本相关系数r变大
单选题
1.(23-24高二下·四川眉山·期末)根据物理中的胡克定律,弹簧伸长的长度与所受的外力成正比.测得一根弹簧伸长长度x和相应所受外力F的一组数据如下:
编号 1 2 3 4 5 6
1 1.2 1.4 1.6 1.8 2.0
3.08 3.76 4.31 5.02 5.51 6.25
据此给出以下结论:
①这两变量不相关;②这两个变量负相关;③这两个变量正相关.
其中所有正确结论的个数是( )
A.3 B.2 C.1 D.0
2.(23-24高二下·山西长治·期中)根据变量的观测数据,绘制成散点图1;根据变量的观测数据,绘制成散点图2.若用线性回归进行分析,设表示变量的样本相关系数,表示变量的样本相关系数,则( )

A. B.
C. D.
3.(24-25 上海 )已知变量X与Y相对应的一组数据为,,,,,变量U与V相对应的一组数据为,,,,.表示变量X与Y之间的线性相关系数,表示变量U与V之间的线性相关系数,则下列结论中正确的是( )
A. B. C. D.
4.(24-2 湖北·期中)已知变量x和变量y的一组成对样本数据为,其中,其回归直线方程为,当增加两个样本数据和后,重新得到的回归直线方程斜率为3,则在新的回归直线方程的估计下,样本数据所对应的残差为( )
A. B. C. D.
5(24-25高二下·全国·课后作业)给出下列两组数据,用分别表示与与的线性相关系数,则下列说法正确的是( )
2 4 6 7 9
3 4 7 9 11
2 4 6 7 9
10 9 8 5 2
A. B. C. D.
6.(24-25浙江)为考察两个变量,的相关性,搜集数据如表,则两个变量的线性相关程度( )
5 10 15 20 25
103 105 110 111 114
(参考数据:,,)
A.很强 B.很弱 C.无相关 D.不确定
7.(2024·浙江)为研究光照时长(小时)和种子发芽数量(颗)之间的关系,某课题研究小组采集了9组数据,绘制散点图如图所示,并对,进行线性回归分析.若在此图中加上点后,再次对,进行线性回归分析,则下列说法正确的是( )
A.,不具有线性相关性 B.决定系数变大
C.相关系数变小 D.残差平方和变小
8.(24-25高二下·全国·课后作业)某团队尝试用回归模型甲、乙、丙、丁描述人的1000米跑步成绩与肺活量的关系,已知模型甲、乙、丙、丁对应的决定系数分别为,则拟合效果最好的模型是( )
A.甲 B.乙 C.丙 D.丁
9.(23-24天津·期末)中国茶文化博大精深、茶水的口感与茶叶的类型和水的温度有关,某数学建模小组建立了茶水冷却时间和茶水温度的一组数据,经过分析,提出了四种回归模型,①②③④四种模型的残差平方和的值分别是.则拟合效果最好的模型是( )
A.模型① B.模型② C.模型③ D.模型④
10.(24-25江苏)研究数据表明,某校高中生的数学成绩与物理成绩、物理成绩与化学成绩均有正相关关系.现从该校抽取某班50位同学的数学、物理、化学三科成绩作为样本,设数学、物理、化学成绩分别为变量x,y,z若x,y的样本相关系数为,y,z的样本相关系数为,则x、z的样本相关系数的最大值为( )
附:相关系数
A. B. C. D.1
多选题
11(24-25高二下·全国·随堂练习)下列关系是相关关系的是( )
A.角度和它的正弦值之间的关系
B.某商场搞促销活动与销售量之间的关系
C.作文水平与课外阅读量之间的关系
D.底面积一定的三棱锥的体积与高之间的关系
12.(24-25福建)记变量与相对应的一组数据的样本相关系数为,变量与相对应的一组数据的样本相关系数为,则( )
A.当与不相关
B.当与呈函数关系
C.当与的相关性强于与的相关性
D.当与的相关性强弱等于与的相关性
13.(23-24高二下·福建泉州·期末)某同学根据变量x与y的六组数据(,2,…,6)绘制了如下散点图,并选择一元线性回归模型进行拟合,若去掉B点,则下列说法正确的是( )
A.残差平方和变小 B.相关系数r越趋于1
C.决定系数变大 D.y与x线性相关程度变强
14(23-24 广西柳州 )两个具有线性相关关系的变量的一组数据可建立经验回归方程,下列说法正确的是( ).
A.相关系数越接近1,变量x,y相关性越强 .
B.落在回归直线方程上的样本点越多,回归直线方程拟合效果越好
C.残差
D.决定系数越小,残差平方和越大,即模型的拟合效果越差
15.(23-24高二下·湖北·期末)在成对数据的统计分析中,下列说法正确的是( )
A.经验回归直线过点
B.残差平方和越小,回归模型的拟合效果越好
C.若样本相关系数越大,则成对样本数据的线性相关程度越强
D.在回归方程中,当解释变量每增加1个单位时,预报变量平均增加2个单位
21世纪教育网(www.21cnjy.com)

展开更多......

收起↑

资源列表