资源简介 中小学教育资源及组卷应用平台2026北师大版高中数学选择性必修第一册§2 成对数据的线性相关性2.1 相关系数 2.2 成对数据的线性相关性分析基础过关练 题组一 变量的相关关系1.(2024安徽淮北国泰中学期末)根据变量x,y的不同成对数据,绘制了以下四个散点图,由这四个散点图可以判断变量x与y呈负相关关系的是( ) 2.(2024九省联考)已知变量x和y满足关系y=-x+1,变量y与z正相关,则( )A.x与y负相关,x与z负相关B.x与y正相关,x与z正相关C.x与y正相关,x与z负相关D.x与y负相关,x与z正相关题组二 样本相关系数3.(2024福建宁化第一中学阶段测试)对四组数据进行统计,获得以下散点图,关于其样本相关系数的比较正确的是( ) A.r2C.r24.(2024江西赣州期中联考)甲、乙、丙、丁各自研究两个随机变量的数据,若甲、乙、丙、丁计算得到各自研究的两个随机变量的线性相关系数分别为r1=0.66,r2=-0.97,r3=0.92,r4=0.89,则这四人中, 研究的两个随机变量的线性相关程度最强. 5.(2025江西上饶第四中学测试)在研究线性回归模型时,样本数据(xi,yi)(i=1,2,3,…,n)所对应的点均在直线y=-x+3上,用r表示变量x对于变量y变化的线性相关度,则r= . 6.(2024陕西部分学校期中联考)人口结构的变化能明显影响住房需求.当一个地区青壮年人口占比高时,住房需求就会增加,而当一个地区老龄化严重时,住房需求就会下降.某机构随机选取了某个地区的10个城市,统计了每个城市的老龄化率x和空置率y,如下表所示:城市 1 2 3 4 5 6 7 8 9 10老龄 化率x 0.17 0.2 0.18 0.05 0.21 0.09 0.19 0.3 0.17 0.24 1.8空置 率y 0.06 0.13 0.09 0.05 0.09 0.08 0.11 0.15 0.16 0.28 1.2(1)若老龄化率不低于20%,则该城市为超级老龄化城市,根据表中数据,估计该地区城市为超级老龄化城市的概率;(2)估计该地区城市的老龄化率x和空置率y的样本相关系数.(结果精确到0.01)参考公式:样本相关系数r=.参考数据:≈0.04,≈0.04,xiyi=0.2413.题组三 非线性回归分析7.(2025广西南宁第三中学适应性测试)下列选项错误的是( )A.若样本数据x1,x2,x3,x4,x5,x6的方差为2,则数据2x1-1,2x2-1,2x3-1,2x4-1,2x5-1,2x6-1的方差为8B.一组数据8,9,10,11,12的第80百分位数是11.5C.一般来说,若一组数据的频率分布直方图为单峰且不对称,且直方图在左边“拖尾”,则这组数据的平均数小于中位数D.以模型y=cekx去拟合一组数据时,为了求出线性回归方程,设z=lny,最终求得线性回归方程为=2x+0.4,则模型中c,k的值分别是0.4和28.(2025陕西西安中学月考)为践行“更快更高更强”的奥林匹克精神,落实全民健身国家战略,某校高三年级发起了“发扬奥林匹克精神,锻炼健康体魄”的年度主题活动,经过一段时间后,学生的身体素质明显提高.为了解活动效果,该年级对开展活动以来近6个月体重超标的人数进行了调查,调查结果统计如图,根据散点图可以认为散点集中在曲线y=ebx+a的附近,请根据下表中的数据回答下列问题.月份x 1 2 3 4 5 6体重超标 人数y 98 77 54 48 32 27z=lny 4.58 4.34 3.98 3.87 3.46 3.29(1)求该年级体重超标人数y关于月份x的回归方程(系数的最终结果精确到0.01);(2)预测从开展活动以来第几个月开始该年级体重超标的人数降至10人以下.附:线性回归方程中,.参考数据:zi≈23.52,xizi≈77.72,=91,ln10≈2.30.能力提升练 题组一 相关系数的综合应用1.(2025广东七校联考)研究数据表明,某校高中生的数学成绩与物理成绩、物理成绩与化学成绩均有正相关关系.现从该校某班抽取50位同学的数学、物理、化学三科成绩作为样本,设数学、物理、化学成绩分别为变量x,y,z,若x,y的样本相关系数为,y,z的样本相关系数为,则x,z的样本相关系数的最大值为( )附:样本相关系数r=.A. B. C. D.12.(2025江西萍乡实验学校测试,)农民专业合作社是在农村家庭承包经营基础上,同类农产品的生产经营者或者同类农业生产经营服务的提供者、利用者,自愿联合、民主管理的互助性经济组织.国家给予农民专业合作社在生产、经营、销售等方面全方位的优惠政策.某地大型农民专业合作社不断探索优化生产、经营、销售等方面的科学方案,引入人工智能管理系统,合作社的市场营销研究人员调研该合作社的10个主体项目,统计分析人工智能管理的实际经济收益x(单位:万元)与市场预测的经济收益y(单位:万元)的相关数据如下表:(注:10个主体项目号分别记为i,i=1,2,3,4,5,6,7,8,9,10)项目号i 1 2 3 4 5 6 7 8 9 10实际收 益xi 5.38 7.99 6.37 6.71 7.53 5.53 4.18 4.04 6.02 4.23预测收 益yi 5.43 8.07 6.57 6.14 7.95 5.56 4.27 4.15 6.04 4.49|xi-yi| 0.05 0.08 0.2 0.57 0.42 0.03 0.09 0.11 0.02 0.26(1)求该合作社的预测收益y与实际收益x的样本相关系数(精确到0.01),并判断它们是否具有较强的线性相关关系;(2)规定:数组(xi,yi)满足|xi-yi|<0.1为“Ⅰ类营销误差”;满足0.1≤|xi-yi|<0.3为“Ⅱ类营销误差”;满足|xi-yi|≥0.3为“Ⅲ类营销误差”.为进一步研究,该合作社的市场营销研究人员从“Ⅰ类营销误差”和“Ⅱ类营销误差”中随机抽取3组数据与“Ⅲ类营销误差”数据进行对比,记抽到“Ⅰ类营销误差”的数据的组数为随机变量X,求X的分布列与数学期望.附:样本相关系数r=.参考数据:≈353.6,≈361.7,xiyi≈357.3,≈33.62,≈34.42,≈34.02,≈17.4.3.(2024江西新余期末)某地政府为解决空巢老人日常护理和社会照料的困境,大力培育发展养老护理服务市场,从2017年开始新建社区养老机构,下表为该地区近7年新建社区养老机构的数量对照表.年份 2017 2018 2019 2020 2021 2022 2023年份代码x 1 2 3 4 5 6 7新建社区养 老机构数量y y1 y2 y3 y4 y5 y6 y7(1)若该地区参与社区养老的老人的年龄X近似服从正态分布N(70,16),其中年龄X∈(78,82]的有54人,试估计该地参与社区养老的老人人数为多少;(结果按四舍五入取整数)(2)已知变量x与y之间的样本相关系数r=,请求出y关于x的线性回归方程,并据此估计2024年该地区新建社区养老机构的数量.(结果按四舍五入取整数)参考公式与数据:①,r=;②若随机变量X~N(μ,σ2),则P(μ-σ③=1597.题组二 非线性回归分析4.(2025重庆南开中学测试)某研发团队实现了从单点光谱仪到超光谱成像芯片的跨越.为制订下一年的研发投入计划,该研发团队需要了解年研发资金投入量x(单位:亿元)对年销售额y(单位:亿元)的影响.结合近12年的年研发资金投入量x和年销售额y,该团队建立了两个函数模型:①y=α+βx2,②y=eλx+t,其中α,β,λ,t均为常数,e为自然对数的底数.经过对历史数据的初步处理,得到散点图如图.令ui=,vi=lnyi(i=1,2,…,12),计算得到如下数据.(xi-)(vi-)20 66 770 200 14(ui-)(yi-)460 4.20 3125000 0.308 21500(1)设变量u和变量y的样本相关系数为r1,变量x和变量v的样本相关系数为r2,请从样本相关系数的角度,选择一个y与x相关性较强的模型;(2)(i)根据(1)的选择及表中数据,建立y关于x的回归方程(系数精确到0.01);(ii)若下一年销售额需达到80亿元,预测下一年的研发资金投入量.附:≈8.9443,e4.382≈80;样本相关系数r=;线性回归方程中,.答案与分层梯度式解析§2 成对数据的线性相关性2.1 相关系数2.2 成对数据的线性相关性分析基础过关练1.B A中,各点的分布没有明显相关性,不符合题意;B中,各点分布在一条直线附近,且变量之间呈负相关关系,符合题意;C中,各点分布在一条抛物线附近,表明两变量之间不是线性相关关系,不符合题意;D中,各点分布在一条直线附近,且变量之间呈正相关关系,不符合题意.2.A 由正相关、负相关的定义可知x与y负相关,x与z负相关.3.A 由题中的散点图可以看出,图1和图3对应的两变量正相关,则样本相关系数大于0,即r1>0,r3>0;图2和图4对应的两变量负相关,则样本相关系数小于0,即r2<0,r4<0.又图1和图2中的点相对于图3和图4中的点更加集中,所以r1更接近1,r2更接近-1,所以r2解题模板 由散点图判断样本相关系数的大小关系时,一般先由点的分布(左下到右上、左上到右下)确定样本相关系数的符号,再由点是否集中在某条直线附近确定样本相关系数绝对值的大小.4.答案 乙解析 因为|r2|=0.97>|r3|>|r4|>|r1|,所以这四人中,乙研究的两个随机变量的线性相关程度最强.5.答案 -1解析 由已知样本数据(xi,yi)(i=1,2,3,…,n)所对应的点均在直线y=-x+3上,则|r|=1,又-<0,所以r<0,即r=-1.6.解析 (1)由题表中的数据可知,调查的10个城市中,老龄化率不低于20%的有4个,故估计该地区城市为超级老龄化城市的概率为=0.4.(2)由题表中的数据得,=0.12,则r=≈≈0.63.故该地区城市的老龄化率x和空置率y的样本相关系数约为0.63.7.D 对于A,所求数据的方差为22×2=8,故A正确;对于B,5×80%=4,则其第80百分位数是=11.5,故B正确;易知C正确;对于D,因为z=lny=lnc+lnekx=lnc+kx,且线性回归方程为=2x+0.4,所以lnc=0.4,k=2,故c,k的值分别是e0.4和2,故D错误.8.解析 (1)由y=ebx+a得z=lny=bx+a,由题中数据得×(1+2+3+4+5+6)=3.5,zi≈×23.52=3.92,所以≈≈-0.26,≈3.92-(-0.26)×3.5=4.83,所以=-0.26x+4.83,即y关于x的回归方程为=e-0.26x+4.83.(2)令e-0.26x+4.83<10=eln10≈e2.3,所以-0.26x+4.83<2.3,又x∈N,所以x≥10,且x∈N,所以预测从第十个月开始,该年级体重超标的人数降至10人以下.能力提升练1.B 设a=(x1,x2,…,xn),b=(y1,y2,…,yn),c=(z1,z2,…,zn),令a'=(x1-,…,xn-,…,yn-,…,zn-),设a'与b'的夹角为α,b'与c'的夹角为β,由样本相关系数公式及x,y的样本相关系数为,y,z的样本相关系数为,得cosα=,cosβ=,易知α,β均为锐角且β>α,所以a'与c'的夹角可能为β-α,α+β,易得sinα=,sinβ=,则a'与c'的夹角余弦值的最大值为cos(β-α),即x与z的样本相关系数的最大值为cos(β-α)=cosβcosα+sinβsinα=××.2.解析 (1)r=≈=≈≈0.98,因为|r|接近于1,所以该合作社的预测收益y与实际收益x具有较强的线性相关关系.(2)由题意得,“Ⅰ类营销误差”有5组,“Ⅱ类营销误差”有3组,则X的所有可能取值为0,1,2,3,则P(X=0)=,P(X=2)=,所以X的分布列为X 0 1 2 3P所以EX=0×+1×+2×+3×.3.解析 (1)由题知μ=70,σ=4,则78=μ+2σ,82=μ+3σ,所以P(78=[P(μ-3σ所以估计该地参与社区养老的老人人数为≈2512.(2)由题表得=4,所以)2=(1-4)2+(2-4)2+(3-4)2+(4-4)2+(5-4)2+(6-4)2+(7-4)2=28,由已知条件可得r=,所以×2×15=,则,因为=225,所以=196,显然≥0,所以=14,则×4=,所以y关于x的线性回归方程为,当x=8时,×8+=21.5≈22,故2024年该地区新建社区养老机构的数量约为22个.4.解析 (1)由题意知r1==0.86,r2=≈0.91.则0<|r1|<|r2|<1,故从样本相关系数的角度分析,模型y=eλx+t中的y与x的相关性较强,所以应选择②.(2)(i)由y=eλx+t,得lny=λx+t,即v=λx+t,所以≈0.02,×20≈3.84,故v关于x的线性回归方程为=0.02x+3.84,即ln=0.02x+3.84,所以=e0.02x+3.84.(ii)将y=80代入=e0.02x+3.84,得80=e0.02x+3.84,又e4.382≈80,所以0.02x+3.84≈4.382,解得x=27.1,故预测下一年的研发资金投入量是27.1亿元.21世纪教育网 www.21cnjy.com 精品试卷·第 2 页 (共 2 页)21世纪教育网(www.21cnjy.com) 展开更多...... 收起↑ 资源预览