第七章 统计案例 §2 成对数据的线性相关性--2026北师大版高中数学选择性必修第一册同步练习(含解析)

资源下载
  1. 二一教育资源

第七章 统计案例 §2 成对数据的线性相关性--2026北师大版高中数学选择性必修第一册同步练习(含解析)

资源简介

中小学教育资源及组卷应用平台
2026北师大版高中数学选择性必修第一册
§2 成对数据的线性相关性
2.1 相关系数  2.2 成对数据的线性相关性分析
基础过关练
             
题组一 变量的相关关系
1.(2024安徽淮北国泰中学期末)根据变量x,y的不同成对数据,绘制了以下四个散点图,由这四个散点图可以判断变量x与y呈负相关关系的是(  )
    
    
2.(2024九省联考)已知变量x和y满足关系y=-x+1,变量y与z正相关,则(  )
A.x与y负相关,x与z负相关
B.x与y正相关,x与z正相关
C.x与y正相关,x与z负相关
D.x与y负相关,x与z正相关
题组二 样本相关系数
3.(2024福建宁化第一中学阶段测试)对四组数据进行统计,获得以下散点图,关于其样本相关系数的比较正确的是(  )
  
  
A.r2C.r24.(2024江西赣州期中联考)甲、乙、丙、丁各自研究两个随机变量的数据,若甲、乙、丙、丁计算得到各自研究的两个随机变量的线性相关系数分别为r1=0.66,r2=-0.97,r3=0.92,r4=0.89,则这四人中,    研究的两个随机变量的线性相关程度最强.
5.(2025江西上饶第四中学测试)在研究线性回归模型时,样本数据(xi,yi)(i=1,2,3,…,n)所对应的点均在直线y=-x+3上,用r表示变量x对于变量y变化的线性相关度,则r=    .
6.(2024陕西部分学校期中联考)人口结构的变化能明显影响住房需求.当一个地区青壮年人口占比高时,住房需求就会增加,而当一个地区老龄化严重时,住房需求就会下降.某机构随机选取了某个地区的10个城市,统计了每个城市的老龄化率x和空置率y,如下表所示:
城市 1 2 3 4 5 6 7 8 9 10
老龄 化率x 0.17 0.2 0.18 0.05 0.21 0.09 0.19 0.3 0.17 0.24 1.8
空置 率y 0.06 0.13 0.09 0.05 0.09 0.08 0.11 0.15 0.16 0.28 1.2
(1)若老龄化率不低于20%,则该城市为超级老龄化城市,根据表中数据,估计该地区城市为超级老龄化城市的概率;
(2)估计该地区城市的老龄化率x和空置率y的样本相关系数.(结果精确到0.01)
参考公式:样本相关系数
r=.
参考数据:≈0.04,≈0.04,xiyi=0.2413.
题组三 非线性回归分析
7.(2025广西南宁第三中学适应性测试)下列选项错误的是(  )
A.若样本数据x1,x2,x3,x4,x5,x6的方差为2,则数据2x1-1,2x2-1,2x3-1,2x4-1,2x5-1,2x6-1的方差为8
B.一组数据8,9,10,11,12的第80百分位数是11.5
C.一般来说,若一组数据的频率分布直方图为单峰且不对称,且直方图在左边“拖尾”,则这组数据的平均数小于中位数
D.以模型y=cekx去拟合一组数据时,为了求出线性回归方程,设z=lny,最终求得线性回归方程为=2x+0.4,则模型中c,k的值分别是0.4和2
8.(2025陕西西安中学月考)为践行“更快更高更强”的奥林匹克精神,落实全民健身国家战略,某校高三年级发起了“发扬奥林匹克精神,锻炼健康体魄”的年度主题活动,经过一段时间后,学生的身体素质明显提高.为了解活动效果,该年级对开展活动以来近6个月体重超标的人数进行了调查,调查结果统计如图,根据散点图可以认为散点集中在曲线y=ebx+a的附近,请根据下表中的数据回答下列问题.
月份x 1 2 3 4 5 6
体重超标 人数y 98 77 54 48 32 27
z=lny 4.58 4.34 3.98 3.87 3.46 3.29
(1)求该年级体重超标人数y关于月份x的回归方程(系数的最终结果精确到0.01);
(2)预测从开展活动以来第几个月开始该年级体重超标的人数降至10人以下.
附:线性回归方程中,.
参考数据:zi≈23.52,xizi≈77.72,=91,ln10≈2.30.
能力提升练
             
题组一 相关系数的综合应用
1.(2025广东七校联考)研究数据表明,某校高中生的数学成绩与物理成绩、物理成绩与化学成绩均有正相关关系.现从该校某班抽取50位同学的数学、物理、化学三科成绩作为样本,设数学、物理、化学成绩分别为变量x,y,z,若x,y的样本相关系数为,y,z的样本相关系数为,则x,z的样本相关系数的最大值为(  )
附:样本相关系数r=.
A.  B.  C.  D.1
2.(2025江西萍乡实验学校测试,)农民专业合作社是在农村家庭承包经营基础上,同类农产品的生产经营者或者同类农业生产经营服务的提供者、利用者,自愿联合、民主管理的互助性经济组织.国家给予农民专业合作社在生产、经营、销售等方面全方位的优惠政策.某地大型农民专业合作社不断探索优化生产、经营、销售等方面的科学方案,引入人工智能管理系统,合作社的市场营销研究人员调研该合作社的10个主体项目,统计分析人工智能管理的实际经济收益x(单位:万元)与市场预测的经济收益y(单位:万元)的相关数据如下表:(注:10个主体项目号分别记为i,i=1,2,3,4,5,6,7,8,9,10)
项目号i 1 2 3 4 5 6 7 8 9 10
实际收 益xi 5.38 7.99 6.37 6.71 7.53 5.53 4.18 4.04 6.02 4.23
预测收 益yi 5.43 8.07 6.57 6.14 7.95 5.56 4.27 4.15 6.04 4.49
|xi-yi| 0.05 0.08 0.2 0.57 0.42 0.03 0.09 0.11 0.02 0.26
(1)求该合作社的预测收益y与实际收益x的样本相关系数(精确到0.01),并判断它们是否具有较强的线性相关关系;
(2)规定:数组(xi,yi)满足|xi-yi|<0.1为“Ⅰ类营销误差”;满足0.1≤|xi-yi|<0.3为“Ⅱ类营销误差”;满足|xi-yi|≥0.3为“Ⅲ类营销误差”.为进一步研究,该合作社的市场营销研究人员从“Ⅰ类营销误差”和“Ⅱ类营销误差”中随机抽取3组数据与“Ⅲ类营销误差”数据进行对比,记抽到“Ⅰ类营销误差”的数据的组数为随机变量X,求X的分布列与数学期望.
附:样本相关系数
r=.
参考数据:≈353.6,≈361.7,xiyi≈357.3,≈33.62,≈34.42,≈34.02,≈17.4.
3.(2024江西新余期末)某地政府为解决空巢老人日常护理和社会照料的困境,大力培育发展养老护理服务市场,从2017年开始新建社区养老机构,下表为该地区近7年新建社区养老机构的数量对照表.
年份 2017 2018 2019 2020 2021 2022 2023
年份代码x 1 2 3 4 5 6 7
新建社区养 老机构数量y y1 y2 y3 y4 y5 y6 y7
(1)若该地区参与社区养老的老人的年龄X近似服从正态分布N(70,16),其中年龄X∈(78,82]的有54人,试估计该地参与社区养老的老人人数为多少;(结果按四舍五入取整数)
(2)已知变量x与y之间的样本相关系数r=,请求出y关于x的线性回归方程,并据此估计2024年该地区新建社区养老机构的数量.(结果按四舍五入取整数)
参考公式与数据:①,
r=;
②若随机变量X~N(μ,σ2),则P(μ-σ③=1597.
题组二 非线性回归分析
4.(2025重庆南开中学测试)某研发团队实现了从单点光谱仪到超光谱成像芯片的跨越.为制订下一年的研发投入计划,该研发团队需要了解年研发资金投入量x(单位:亿元)对年销售额y(单位:亿元)的影响.结合近12年的年研发资金投入量x和年销售额y,该团队建立了两个函数模型:①y=α+βx2,②y=eλx+t,其中α,β,λ,t均为常数,e为自然对数的底数.经过对历史数据的初步处理,得到散点图如图.令ui=,vi=lnyi(i=1,2,…,12),计算得到如下数据.
(xi-)(vi-)
20 66 770 200 14
(ui-)(yi-)
460 4.20 3125000 0.308 21500
(1)设变量u和变量y的样本相关系数为r1,变量x和变量v的样本相关系数为r2,请从样本相关系数的角度,选择一个y与x相关性较强的模型;
(2)(i)根据(1)的选择及表中数据,建立y关于x的回归方程(系数精确到0.01);
(ii)若下一年销售额需达到80亿元,预测下一年的研发资金投入量.
附:≈8.9443,e4.382≈80;样本相关系数r=;线性回归方程中,.
答案与分层梯度式解析
§2 成对数据的线性相关性
2.1 相关系数
2.2 成对数据的线性相关性分析
基础过关练
1.B A中,各点的分布没有明显相关性,不符合题意;
B中,各点分布在一条直线附近,且变量之间呈负相关关系,符合题意;
C中,各点分布在一条抛物线附近,表明两变量之间不是线性相关关系,不符合题意;
D中,各点分布在一条直线附近,且变量之间呈正相关关系,不符合题意.
2.A 由正相关、负相关的定义可知x与y负相关,x与z负相关.
3.A 由题中的散点图可以看出,图1和图3对应的两变量正相关,则样本相关系数大于0,即r1>0,r3>0;图2和图4对应的两变量负相关,则样本相关系数小于0,即r2<0,r4<0.又图1和图2中的点相对于图3和图4中的点更加集中,所以r1更接近1,r2更接近-1,所以r2解题模板 由散点图判断样本相关系数的大小关系时,一般先由点的分布(左下到右上、左上到右下)确定样本相关系数的符号,再由点是否集中在某条直线附近确定样本相关系数绝对值的大小.
4.答案 乙
解析 因为|r2|=0.97>|r3|>|r4|>|r1|,所以这四人中,乙研究的两个随机变量的线性相关程度最强.
5.答案 -1
解析 由已知样本数据(xi,yi)(i=1,2,3,…,n)所对应的点均在直线y=-x+3上,则|r|=1,
又-<0,所以r<0,即r=-1.
6.解析 (1)由题表中的数据可知,调查的10个城市中,老龄化率不低于20%的有4个,
故估计该地区城市为超级老龄化城市的概率为=0.4.
(2)由题表中的数据得,=0.12,
则r=
≈≈0.63.
故该地区城市的老龄化率x和空置率y的样本相关系数约为0.63.
7.D 对于A,所求数据的方差为22×2=8,故A正确;
对于B,5×80%=4,则其第80百分位数是=11.5,故B正确;易知C正确;
对于D,因为z=lny=lnc+lnekx=lnc+kx,且线性回归方程为=2x+0.4,所以lnc=0.4,k=2,故c,k的值分别是e0.4和2,故D错误.
8.解析 (1)由y=ebx+a得z=lny=bx+a,
由题中数据得×(1+2+3+4+5+6)=3.5,zi≈×23.52=3.92,
所以≈≈-0.26,
≈3.92-(-0.26)×3.5=4.83,
所以=-0.26x+4.83,
即y关于x的回归方程为=e-0.26x+4.83.
(2)令e-0.26x+4.83<10=eln10≈e2.3,所以-0.26x+4.83<2.3,
又x∈N,所以x≥10,且x∈N,
所以预测从第十个月开始,该年级体重超标的人数降至10人以下.
能力提升练
1.B 设a=(x1,x2,…,xn),b=(y1,y2,…,yn),c=(z1,z2,…,zn),
令a'=(x1-,…,xn-,…,yn-,…,zn-),
设a'与b'的夹角为α,b'与c'的夹角为β,
由样本相关系数公式及x,y的样本相关系数为,y,z的样本相关系数为,得cosα=,cosβ=,
易知α,β均为锐角且β>α,
所以a'与c'的夹角可能为β-α,α+β,
易得sinα=,sinβ=,
则a'与c'的夹角余弦值的最大值为cos(β-α),
即x与z的样本相关系数的最大值为cos(β-α)=
cosβcosα+sinβsinα=××.
2.解析 (1)r=

=≈≈0.98,
因为|r|接近于1,所以该合作社的预测收益y与实际收益x具有较强的线性相关关系.
(2)由题意得,“Ⅰ类营销误差”有5组,“Ⅱ类营销误差”有3组,则X的所有可能取值为0,1,2,3,则
P(X=0)=,
P(X=2)=,
所以X的分布列为
X 0 1 2 3
P
所以EX=0×+1×+2×+3×.
3.解析 (1)由题知μ=70,σ=4,则78=μ+2σ,82=μ+3σ,
所以P(78=[P(μ-3σ所以估计该地参与社区养老的老人人数为≈2512.
(2)由题表得=4,
所以)2=(1-4)2+(2-4)2+(3-4)2+(4-4)2+(5-4)2+(6-4)2+(7-4)2=28,
由已知条件可得r=,
所以×2×15=,
则,
因为=225,所以=196,
显然≥0,所以=14,
则×4=,
所以y关于x的线性回归方程为,
当x=8时,×8+=21.5≈22,
故2024年该地区新建社区养老机构的数量约为22个.
4.解析 (1)由题意知r1==0.86,
r2=≈0.91.
则0<|r1|<|r2|<1,
故从样本相关系数的角度分析,模型y=eλx+t中的y与x的相关性较强,所以应选择②.
(2)(i)由y=eλx+t,得lny=λx+t,即v=λx+t,
所以≈0.02,
×20≈3.84,
故v关于x的线性回归方程为=0.02x+3.84,
即ln=0.02x+3.84,所以=e0.02x+3.84.
(ii)将y=80代入=e0.02x+3.84,得80=e0.02x+3.84,
又e4.382≈80,所以0.02x+3.84≈4.382,解得x=27.1,
故预测下一年的研发资金投入量是27.1亿元.
21世纪教育网 www.21cnjy.com 精品试卷·第 2 页 (共 2 页)
21世纪教育网(www.21cnjy.com)

展开更多......

收起↑

资源预览