第十章 第3练 成对数据的统计分析 同步练习(含详解)2026届高中数学一轮复习

资源下载
  1. 二一教育资源

第十章 第3练 成对数据的统计分析 同步练习(含详解)2026届高中数学一轮复习

资源简介

数学
第3练 成对数据的统计分析(原卷版)
一、单项选择题
1.(2025·江苏盐城模拟)根据分类变量Ⅰ与Ⅱ的统计数据,计算得到χ2=2.954,则(  )
α 0.1 0.05 0.01 0.005 0.001
xα 2.706 3.841 6.635 7.879 10.828
A.变量Ⅰ与Ⅱ相关
B.变量Ⅰ与Ⅱ相关,这个结论犯错误的概率不超过0.1
C.变量Ⅰ与Ⅱ不相关
D.变量Ⅰ与Ⅱ不相关,这个结论犯错误的概率不超过0.1
2.调查某种群花萼长度和花瓣长度,所得数据如图所示.其中相关系数r=0.8245,下列说法正确的是(  )
A.花瓣长度和花萼长度没有相关性
B.花瓣长度和花萼长度呈负相关
C.花瓣长度和花萼长度呈正相关
D.若从样本中抽取一部分,则这部分的相关系数一定是0.8245
3.(2025·安徽蚌埠模拟)为维护市场秩序,保护消费者权益,在“五一”假期来临之际,我市物价部门对某商品在5家商场的售价x(单位:元)及其一天的销售量y(单位:件)进行调查,得到五对数据(xi,yi)(i=1,2,3,4,5),经过分析、计算,得=10,=8,y关于x的经验回归方程为=-3x+,则相应于点(9,10)的残差为(  )
A.-1 B.1
C.-3 D.3
4.(2025·辽宁葫芦岛模拟)已知变量y关于x的经验回归方程为=3x-1,变量y与z负相关,则(  )
A.x与y负相关,x与z负相关
B.x与y正相关,x与z正相关
C.x与y负相关,x与z正相关
D.x与y正相关,x与z负相关
5.(2024·上海闵行区二模)某疾病预防中心随机调查了339名50岁以上的公民,研究吸烟习惯与慢性气管炎患病的关系,调查数据如下表:
慢性气管炎患病情况 吸烟习惯 合计
不吸烟者 吸烟者
不患慢性气管炎者 121 162 283
患慢性气管炎者 13 43 56
合计 134 205 339
零假设为H0:患慢性气管炎与吸烟没有关系,即它们相互独立.
通过计算统计量χ2,得χ2≈7.469,根据χ2分布概率表:P(χ2≥7.829)≈0.005,
P(χ2≥6.635)≈0.01,P(χ2≥5.024)≈0.025,
P(χ2≥3.841)≈0.05,P(χ2≥2.706)≈0.1.
给出下列三个结论:
①“患慢性气管炎与吸烟没有关系”成立的可能性小于5%;②有99%的把握认为患慢性气管炎与吸烟有关;③在犯错误的概率不超过0.005的前提下,可以认为患慢性气管炎与吸烟有关.
其中正确结论的个数是(  )
A.0 B.1
C.2 D.3
6.用模型y=aebx+1(a>0)拟合一组数据时,令z=ln y,将其变换后得到经验回归方程=2x+a,则=(  )
A.e B.
C. D.2
7.(2025·辽宁重点中学模拟)某公司新产品的研发投入x(单位:百万)与该产品的收益y(单位:百万)的5组统计数据如下表所示.由表中数据求得研发投入x与收益y满足经验回归方程=x+2.6,则下列结论不正确的是(  )
x 5 6 8 9 12
y 16 20 25 28 36
A.x与y有正相关关系
B.经验回归直线经过点(8,25)
C.=2.4
D.当x=9时,残差为0.2
8.某高校开设了人工智能课程,该校团委对学生性别和喜欢人工智能课程是否有关联进行了一次调查,其中被调查的男生、女生人数均为5m(m∈N*),男生中喜欢人工智能课程的人数占男生人数的,女生中喜欢人工智能课程的人数占女生人数的.零假设为H0:喜欢人工智能课程和性别相互独立.若依据小概率值
α=0.05的独立性检验认为喜欢人工智能课程和性别不独立,则m的最小值为(  )
附:χ2=,
α 0.05 0.01
xα 3.841 6.635
A.7 B.8
C.9 D.10
二、多项选择题
9.(2025·浙江宁波模拟)已知具有相关关系的两个变量x,y的一组观测数据(x1,y1),(x2,y2),…,(xn,yn),由此得到的经验回归方程为=x+,则下列说法中正确的是(  )
A.经验回归直线=x+至少经过点(x1,y1),(x2,y2),…,(xn,yn)中的一个
B.若点(x1,y1),(x2,y2),…,(xn,yn)都落在直线x+y+2=0上,则变量x,y的样本相关系数r=-1
C.若散点图的散点均落在一条斜率非0的直线上,则决定系数R2=1
D.若y2=2022,2=2025,则相应于样本点(x2,y2)的残差为-3
10.自然环境中,大气压受到各种因素的影响,如温度、湿度、风速和海拔等方面的改变,都将导致大气压发生相应的变化,其中以海拔的影响最为显著.下图是根据一组观测数据得到的海拔6~15千米的大气压强散点图,根据一元线性回归模型得到的经验回归方程为1=-4.0x+68.5,决定系数为R=0.99;根据非线性回归模型得到的经验回归方程为2=132.9e-0.163x,决定系数为R=0.99,则下列说法正确的是(  )
A.由散点图可知,大气压强与海拔高度负相关
B.由方程1=-4.0x+68.5可知,海拔每升高1千米,大气压强必定降低4.0 kPa
C.由方程1=-4.0x+68.5可知,样本点(11,22.6)的残差为-1.9
D.对比两个回归模型,结合实际情况,方程2=132.9e-0.163x的预报效果更好
11.(2025·湖北八市模拟)某校为了解高一新生对数学是否感兴趣,从400名女生和600名男生中通过比例分配的分层随机抽样的方式随机抽取100名学生进行问卷调查,将调查的结果进行统计,得到如下等高堆积条形图和列联表,则(  )
性别 对数学的兴趣 合计
感兴趣 不感兴趣
女生 a b a+b
男生 c d c+d
合计 a+c b+d 100
参考数据:本题中χ2=
≈3.94,
α 0.1 0.05 0.01 0.005 0.001
xα 2.706 3.841 6.635 7.879 10.828
A.a=12,c=30
B.可以估计该校高一新生中对数学不感兴趣的女生人数比男生多
C.依据小概率值α=0.05的χ2独立性检验,可以认为对数学的兴趣与性别有关联
D.依据小概率值α=0.01的χ2独立性检验,可以认为对数学的兴趣与性别没有关联
三、填空题
12.新能源汽车的核心部件是动力电池,电池占了新能源整车成本的很大一部分,而其中的原材料碳酸锂又是电池的主要成分.从2020年底开始,碳酸锂的价格不断升高,下表是2024年某企业的前5个月碳酸锂的价格与月份的统计数据:
月份代码x 1 2 3 4 5
碳酸锂价格y(万元/kg) 0.5 0.6 1 m 1.5
根据表中数据,得出y关于x的经验回归方程为=0.28x+,根据数据计算出在样本点(5,1.5)处的残差为-0.06,则表中m=________.
13.(2025·天津模拟)学习于才干信仰,犹如运动于健康体魄,持之已久、行之愈远愈受益.为实现中华民族伟大复兴,全国各行各业掀起了“学习强国”的高潮.某老师很喜欢“学习强国”中“挑战答题”模块,他记录了自己连续七天每天一次最多答对的题数如下表(用x表示天数,y表示题数):
x 1 2 3 4 5 6 7
y 12 15 16 18 21 24 27
参考数据:=4,=19,x=140,y=2695,xiyi=600,≈2.45,
相关系数r=
=.
由表中数据可知该老师每天一次最多答对题数y与天数x之间是________(填“正”或“负”)相关,其相关系数r≈________(结果保留两位小数).
14.(2024·广东广州一模)某校数学建模兴趣小组收集了一组恒温动物体重W(单位:克)与脉搏率f(单位:心跳次数/分钟)的对应数据(Wi,fi)(i=1,2,…,8),根据生物学常识和散点图得出f与W近似满足f=cWk(c,k为参数).令xi=ln Wi,yi=ln fi,计算得=8,=5,y=214.由最小二乘法公式得经验回归方程为=x+7.4,则k的值为________;为判断拟合效果,通过经验回归方程求得预测值i(i=1,2,…,8),若残差平方和 (yi-i)2≈0.28,则决定系数R2≈________.
参考公式:决定系数R2=1-.
四、解答题
15.(2025·八省联考)为考察某种药物A对预防疾病B的效果,进行了动物(单位:只)试验,得到如下列联表:
药物 疾病 合计
未患病 患病
未服用 100 80 s
服用 150 70 220
合计 250 t 400
(1)求s,t;
(2)记未服用药物A的动物患疾病B的概率为P,给出P的估计值;
(3)根据小概率值α=0.01的独立性检验,能否认为药物A对预防疾病B有效?
附:χ2=,
α 0.050 0.010 0.001
xα 3.841 6.635 10.828
16.(2025·东北三省部分学校月考)某市为了解车主用车的能源类型与对该市交通拥堵感受的关系,共调查了100名车主,并得到如下的2×2列联表:
车主用车的能源类型 交通拥堵感受 合计
觉得交通拥堵 觉得交通不拥堵
燃油车车主 30 20 50
新能源车车主 25 25 50
合计 55 45 100
(1)将频率估计为概率,从该市燃油车和新能源车车主中随机抽取1名,记“抽取到燃油车车主”为事件A1,“抽取到新能源车车主”为事件A2,“抽取到的车主觉得交通拥堵”为事件B1,“抽取到的车主觉得交通不拥堵”为事件B2,计算P(B1|A1),P(B1|A2),比较它们的大小,并说明其意义;
(2)依据小概率值α=0.1的独立性检验,能否认为该市车主用车的能源类型与对该市交通拥堵的感受有关联?将分析结果与(1)中结论进行比较,并作出解释.
附:χ2=,n=a+b+c+d.
α 0.1 0.01 0.001
xα 2.706 6.635 10.828
17.(2025·湖南邵阳模拟)某市开展“安全随我行”活动,交警部门在某个交通路口增设电子抓拍眼,并记录了某月该路口连续10日骑电动摩托车未佩戴头盔的人数y与天数x的情况,对统计得到的样本数据(xi,yi)(i=1,2,…,10)作了初步处理,得到下面的散点图及一些统计量的值.
xiyi x xiYi
5.5 8.7 1.9 301 385 79.75
表中Yi=ln yi,=Yi.
(1)依据散点图推断,y=bx+a与y=ebx+a哪一个更适合作为未佩戴头盔人数y与天数x的经验回归方程类型?(给出判断即可,不必说明理由)
(2)依据(1)的结果和上表中的数据,求出y关于x的经验回归方程;
(3)为了解市民佩戴头盔情况与性别的关联性,交警对该路口骑电动摩托车的市民进行调查,得到如下列联表:
性别 佩戴头盔情况 合计
不佩戴 佩戴
女 8 12 20
男 14 6 20
合计 22 18 40
依据小概率值α=0.10的独立性检验,能否认为市民骑电动摩托车是否佩戴头盔与性别有关联?
参考公式:=,=-,χ2=,其中n=a+b+c+d.
α 0.15 0.10 0.05 0.025 0.010 0.005 0.001
xα 2.072 2.706 3.841 5.024 6.635 7.879 10.828
18.(2025·湖北武汉模拟)某乡政府为提高当地农民收入,指导农民种植药材,并在种植药材的土地附近种草放牧,发展畜牧业.牛粪、羊粪等有机肥可以促进药材的生长,发展生态循环农业.下图所示为某农户近7年种植药材的平均收入y(单位:千元)与年份代码x的折线图,并计算得到yi=480,xiyi=2052,≈25, (xi-)(yi-)=132,wi=140, (wi-)(yi-)=1048,≈43.3,其中wi=x.
(1)根据折线图判断,y=a+bx与y=c+dx2哪一个适宜作为平均收入y关于年份代码x的经验回归方程类型?并说明理由;
(2)根据(1)的判断结果及数据,建立y关于x的经验回归方程(精确到0.01),并预测2025年该农户种植药材的平均收入.
附:相关系数r=,
经验回归直线=x+的斜率和截距的最小二乘估计公式分别为=,
=-,≈2.65.
19.(2024·浙江台州二模)台州是全国三大电动车生产基地之一,拥有完整的产业链和突出的设计优势.某电动车公司为了抢占更多的市场份额,计划加大广告投入.该公司近5年的年广告费xi(单位:百万元)和年销售量yi(单位:百万辆)的关系如图所示.
令vi=ln xi(i=1,2,…,5),数据经过初步处理得:
yi vi (xi -)2 (yi -)2 (vi -)2 (xi-)· (yi-) (vi-)· (yi-)
44 4.8 10 40.3 1.612 19.5 8.06
现有①y=bx+a和②y=cln x+d两种方案作为年销售量y关于年广告费x的经验回归模型,其中a,b,c,d均为常数.
(1)请从相关系数的角度分析,哪一个模型拟合程度更好?
(2)根据(1)的分析选取拟合程度更好的经验回归模型及表中数据,求出y关于x的经验回归方程,并预测年广告费为6百万元时,产品的年销售量约为多少?
附:①相关系数r=,
经验回归直线=x+的斜率和截距的最小二乘估计公式分别为=,
=-;
②参考数据:=8.06,≈20.1,ln 6≈1.8.
第3练 成对数据的统计分析(解析版)
一、单项选择题
1.(2025·江苏盐城模拟)根据分类变量Ⅰ与Ⅱ的统计数据,计算得到χ2=2.954,则(  )
α 0.1 0.05 0.01 0.005 0.001
xα 2.706 3.841 6.635 7.879 10.828
A.变量Ⅰ与Ⅱ相关
B.变量Ⅰ与Ⅱ相关,这个结论犯错误的概率不超过0.1
C.变量Ⅰ与Ⅱ不相关
D.变量Ⅰ与Ⅱ不相关,这个结论犯错误的概率不超过0.1
答案:B
解析:零假设为H0:变量Ⅰ与Ⅱ不相关.因为χ2=2.954>2.706,依据小概率值α=0.1的独立性检验可推断H0不成立,即认为变量Ⅰ与Ⅱ相关,这个结论犯错误的概率不超过0.1.故选B.
2.调查某种群花萼长度和花瓣长度,所得数据如图所示.其中相关系数r=0.8245,下列说法正确的是(  )
A.花瓣长度和花萼长度没有相关性
B.花瓣长度和花萼长度呈负相关
C.花瓣长度和花萼长度呈正相关
D.若从样本中抽取一部分,则这部分的相关系数一定是0.8245
答案:C
解析:因为相关系数r=0.8245,接近1,所以花瓣长度和花萼长度的相关性较强,且呈正相关,所以A,B错误,C正确;因为相关系数与样本的数据有关,所以当样本发生变化时,相关系数也可能会发生变化,所以D错误.故选C.
3.(2025·安徽蚌埠模拟)为维护市场秩序,保护消费者权益,在“五一”假期来临之际,我市物价部门对某商品在5家商场的售价x(单位:元)及其一天的销售量y(单位:件)进行调查,得到五对数据(xi,yi)(i=1,2,3,4,5),经过分析、计算,得=10,=8,y关于x的经验回归方程为=-3x+,则相应于点(9,10)的残差为(  )
A.-1 B.1
C.-3 D.3
答案:A
解析:因为经验回归直线过点(,),即(10,8),将其代入=-3x+,可得8=-3×10+,解得=38,当x=9时,=-3×9+38=11,所以残差为10-11=-1.故选A.
4.(2025·辽宁葫芦岛模拟)已知变量y关于x的经验回归方程为=3x-1,变量y与z负相关,则(  )
A.x与y负相关,x与z负相关
B.x与y正相关,x与z正相关
C.x与y负相关,x与z正相关
D.x与y正相关,x与z负相关
答案:D
解析:因为变量y关于x的经验回归方程为=3x-1,则变量x与y正相关,又变量y与z负相关,则x与z负相关.故选D.
5.(2024·上海闵行区二模)某疾病预防中心随机调查了339名50岁以上的公民,研究吸烟习惯与慢性气管炎患病的关系,调查数据如下表:
慢性气管炎患病情况 吸烟习惯 合计
不吸烟者 吸烟者
不患慢性气管炎者 121 162 283
患慢性气管炎者 13 43 56
合计 134 205 339
零假设为H0:患慢性气管炎与吸烟没有关系,即它们相互独立.
通过计算统计量χ2,得χ2≈7.469,根据χ2分布概率表:P(χ2≥7.829)≈0.005,
P(χ2≥6.635)≈0.01,P(χ2≥5.024)≈0.025,
P(χ2≥3.841)≈0.05,P(χ2≥2.706)≈0.1.
给出下列三个结论:
①“患慢性气管炎与吸烟没有关系”成立的可能性小于5%;②有99%的把握认为患慢性气管炎与吸烟有关;③在犯错误的概率不超过0.005的前提下,可以认为患慢性气管炎与吸烟有关.
其中正确结论的个数是(  )
A.0 B.1
C.2 D.3
答案:C
解析:因为χ2≈7.469>6.635,所以有99%的把握认为患慢性气管炎与吸烟有关,即“患慢性气管炎与吸烟没有关系”成立的可能性小于1%,故①②正确;因为χ2≈7.469<7.829,所以在犯错误的概率不超过0.005的前提下,不能认为患慢性气管炎与吸烟有关,故③错误.故选C.
6.用模型y=aebx+1(a>0)拟合一组数据时,令z=ln y,将其变换后得到经验回归方程=2x+a,则=(  )
A.e B.
C. D.2
答案:D
解析:对y=aebx+1(a>0)两边同时取对数,则ln y=ln (aebx+1)=ln a+bx+1,令z=ln y,则=bx+ln a+1,所以解得所以=2.故选D.
7.(2025·辽宁重点中学模拟)某公司新产品的研发投入x(单位:百万)与该产品的收益y(单位:百万)的5组统计数据如下表所示.由表中数据求得研发投入x与收益y满足经验回归方程=x+2.6,则下列结论不正确的是(  )
x 5 6 8 9 12
y 16 20 25 28 36
A.x与y有正相关关系
B.经验回归直线经过点(8,25)
C.=2.4
D.当x=9时,残差为0.2
答案:C
解析:对于A,由表中数据可知,x越大,y越大,所以x与y有正相关关系,故A正确;对于B,因为==8,==25,所以经验回归直线经过点(8,25),故B正确;对于C,将点(8,25)代入直线方程,得25=8+2.6,所以=2.8,故C错误;对于D,因为=2.8x+2.6,当x=9时,=2.8×9+2.6=27.8,则残差为y-=28-27.8=0.2,故D正确.故选C.
8.某高校开设了人工智能课程,该校团委对学生性别和喜欢人工智能课程是否有关联进行了一次调查,其中被调查的男生、女生人数均为5m(m∈N*),男生中喜欢人工智能课程的人数占男生人数的,女生中喜欢人工智能课程的人数占女生人数的.零假设为H0:喜欢人工智能课程和性别相互独立.若依据小概率值
α=0.05的独立性检验认为喜欢人工智能课程和性别不独立,则m的最小值为(  )
附:χ2=,
α 0.05 0.01
xα 3.841 6.635
A.7 B.8
C.9 D.10
答案:C
解析:根据题意,建立如下2×2列联表:
性别 人工智能课程 合计
喜欢 不喜欢
男生 4m m 5m
女生 3m 2m 5m
合计 7m 3m 10m
由表可知,a=4m,b=m,c=3m,d=2m,
于是χ2===,由于依据小概率值α=0.05的独立性检验认为喜欢人工智能课程和性别不独立,根据表格可知≥3.841,解得m≥8.0661,于是m的最小值为9.故选C.
二、多项选择题
9.(2025·浙江宁波模拟)已知具有相关关系的两个变量x,y的一组观测数据(x1,y1),(x2,y2),…,(xn,yn),由此得到的经验回归方程为=x+,则下列说法中正确的是(  )
A.经验回归直线=x+至少经过点(x1,y1),(x2,y2),…,(xn,yn)中的一个
B.若点(x1,y1),(x2,y2),…,(xn,yn)都落在直线x+y+2=0上,则变量x,y的样本相关系数r=-1
C.若散点图的散点均落在一条斜率非0的直线上,则决定系数R2=1
D.若y2=2022,2=2025,则相应于样本点(x2,y2)的残差为-3
答案:BCD
解析:经验回归方程=x+不一定经过点(x1,y1),(x2,y2),…,(xn,yn)中的一个,但一定会经过点(,),故A错误;直线x+y+2=0的斜率k=-1,且所有样本点都落在直线x+y+2=0上,所以这组样本数据完全负相关,且相关系数达到最小值-1,即样本相关系数r=-1,故B正确;若散点图的散点均落在一条斜率非0的直线上,则残差平方和为0,决定系数R2=1,故C正确;样本点(x2,y2)的残差为y2-2=2022-2025=-3,故D正确.故选BCD.
10.自然环境中,大气压受到各种因素的影响,如温度、湿度、风速和海拔等方面的改变,都将导致大气压发生相应的变化,其中以海拔的影响最为显著.下图是根据一组观测数据得到的海拔6~15千米的大气压强散点图,根据一元线性回归模型得到的经验回归方程为1=-4.0x+68.5,决定系数为R=0.99;根据非线性回归模型得到的经验回归方程为2=132.9e-0.163x,决定系数为R=0.99,则下列说法正确的是(  )
A.由散点图可知,大气压强与海拔高度负相关
B.由方程1=-4.0x+68.5可知,海拔每升高1千米,大气压强必定降低4.0 kPa
C.由方程1=-4.0x+68.5可知,样本点(11,22.6)的残差为-1.9
D.对比两个回归模型,结合实际情况,方程2=132.9e-0.163x的预报效果更好
答案:ACD
解析:对于A,由散点图知,海拔高度越高,大气压强越低,所以大气压强与海拔高度负相关,故A正确;对于B,回归直线得到的数据为估计值,而非精确值,故B错误;对于C,当x=11时,1=-4.0×11+68.5=24.5,又由散点图知观测值为22.6,所以样本点(11,22.6)的残差为22.6-24.5=-1.9,故C正确;对于D,随着海拔高度的增加,大气压强越来越小,但不可能为负数,因此方程2=132.9e-0.163x的预报效果更好,故D正确.故选ACD.
11.(2025·湖北八市模拟)某校为了解高一新生对数学是否感兴趣,从400名女生和600名男生中通过比例分配的分层随机抽样的方式随机抽取100名学生进行问卷调查,将调查的结果进行统计,得到如下等高堆积条形图和列联表,则(  )
性别 对数学的兴趣 合计
感兴趣 不感兴趣
女生 a b a+b
男生 c d c+d
合计 a+c b+d 100
参考数据:本题中χ2=
≈3.94,
α 0.1 0.05 0.01 0.005 0.001
xα 2.706 3.841 6.635 7.879 10.828
A.a=12,c=30
B.可以估计该校高一新生中对数学不感兴趣的女生人数比男生多
C.依据小概率值α=0.05的χ2独立性检验,可以认为对数学的兴趣与性别有关联
D.依据小概率值α=0.01的χ2独立性检验,可以认为对数学的兴趣与性别没有关联
答案:ACD
解析:由题意可知,抽取的男生人数为600×=60,抽取的女生人数为400×=40,由等高堆积条形图知,抽取的男生中对数学感兴趣的人数为60×0.5=30,抽取的男生中对数学不感兴趣的人数为60×0.5=30,抽取的女生中对数学感兴趣的人数为40×0.3=12,抽取的女生中对数学不感兴趣的人数为40×0.7=28,2×2列联表如下:
性别 对数学的兴趣 合计
感兴趣 不感兴趣
女生 12 28 40
男生 30 30 60
合计 42 58 100
由此表可知,a=12,c=30,故A正确;女生对数学不感兴趣的人数约为400×=280,男生对数学不感兴趣的人数约为600×=300,所以估计该校高一新生中对数学不感兴趣的女生人数比男生少,故B错误;零假设为H0:对数学的兴趣与性别没有关联,χ2=≈3.941>3.841,依据小概率值α=0.05的独立性检验,有充分证据推断H0不成立,即可以认为对数学的兴趣与性别有关联,故C正确;由C项分析,可知χ2≈3.941<6.635,依据小概率值α=0.01的独立性检验,没有充分证据推断H0不成立,因此可以认为H0成立,即可以认为对数学的兴趣与性别没有关联,故D正确.故选ACD.
三、填空题
12.新能源汽车的核心部件是动力电池,电池占了新能源整车成本的很大一部分,而其中的原材料碳酸锂又是电池的主要成分.从2020年底开始,碳酸锂的价格不断升高,下表是2024年某企业的前5个月碳酸锂的价格与月份的统计数据:
月份代码x 1 2 3 4 5
碳酸锂价格y(万元/kg) 0.5 0.6 1 m 1.5
根据表中数据,得出y关于x的经验回归方程为=0.28x+,根据数据计算出在样本点(5,1.5)处的残差为-0.06,则表中m=________.
答案:1.4
解析:由题设,得1.5-=1.5-(0.28×5+)=-0.06,
解得=0.16.又==3,
==,所以0.28×3+0.16=,解得m=1.4.
13.(2025·天津模拟)学习于才干信仰,犹如运动于健康体魄,持之已久、行之愈远愈受益.为实现中华民族伟大复兴,全国各行各业掀起了“学习强国”的高潮.某老师很喜欢“学习强国”中“挑战答题”模块,他记录了自己连续七天每天一次最多答对的题数如下表(用x表示天数,y表示题数):
x 1 2 3 4 5 6 7
y 12 15 16 18 21 24 27
参考数据:=4,=19,x=140,y=2695,xiyi=600,≈2.45,
相关系数r=
=.
由表中数据可知该老师每天一次最多答对题数y与天数x之间是________(填“正”或“负”)相关,其相关系数r≈________(结果保留两位小数).
答案:正 0.99
解析:由表中数据知,y随x的增大而增大,所以该老师每天一次最多答对题数y与天数x之间是正相关;计算相关系数为
r=

=≈≈0.99.
14.(2024·广东广州一模)某校数学建模兴趣小组收集了一组恒温动物体重W(单位:克)与脉搏率f(单位:心跳次数/分钟)的对应数据(Wi,fi)(i=1,2,…,8),根据生物学常识和散点图得出f与W近似满足f=cWk(c,k为参数).令xi=ln Wi,yi=ln fi,计算得=8,=5,y=214.由最小二乘法公式得经验回归方程为=x+7.4,则k的值为________;为判断拟合效果,通过经验回归方程求得预测值i(i=1,2,…,8),若残差平方和 (yi-i)2≈0.28,则决定系数R2≈________.
参考公式:决定系数R2=1-.
答案:-0.3 0.98
解析:因为f=cWk,两边取对数可得ln f=ln c+kln W,又xi=ln Wi,yi=ln fi,依题意,经验回归直线=x+7.4必过点(,),所以5=8+7.4,解得=-0.3,所以k=-0.3,R2=1-=1-≈1-=0.98.
四、解答题
15.(2025·八省联考)为考察某种药物A对预防疾病B的效果,进行了动物(单位:只)试验,得到如下列联表:
药物 疾病 合计
未患病 患病
未服用 100 80 s
服用 150 70 220
合计 250 t 400
(1)求s,t;
(2)记未服用药物A的动物患疾病B的概率为P,给出P的估计值;
(3)根据小概率值α=0.01的独立性检验,能否认为药物A对预防疾病B有效?
附:χ2=,
α 0.050 0.010 0.001
xα 3.841 6.635 10.828
解:(1)由列联表知s=100+80=180,t=80+70=150.
(2)由列联表知,未服用药物A的动物有s=180(只),
未服用药物A且患疾病B的动物有80只,
所以未服用药物A的动物患疾病B的频率为=,
所以未服用药物A的动物患疾病B的概率P的估计值为.
(3)零假设为H0:药物A对预防疾病B无效,
由列联表得
χ2==≈6.734>6.635,
根据小概率值α=0.01的独立性检验,推断H0不成立,
所以能认为药物A对预防疾病B有效.
16.(2025·东北三省部分学校月考)某市为了解车主用车的能源类型与对该市交通拥堵感受的关系,共调查了100名车主,并得到如下的2×2列联表:
车主用车的能源类型 交通拥堵感受 合计
觉得交通拥堵 觉得交通不拥堵
燃油车车主 30 20 50
新能源车车主 25 25 50
合计 55 45 100
(1)将频率估计为概率,从该市燃油车和新能源车车主中随机抽取1名,记“抽取到燃油车车主”为事件A1,“抽取到新能源车车主”为事件A2,“抽取到的车主觉得交通拥堵”为事件B1,“抽取到的车主觉得交通不拥堵”为事件B2,计算P(B1|A1),P(B1|A2),比较它们的大小,并说明其意义;
(2)依据小概率值α=0.1的独立性检验,能否认为该市车主用车的能源类型与对该市交通拥堵的感受有关联?将分析结果与(1)中结论进行比较,并作出解释.
附:χ2=,n=a+b+c+d.
α 0.1 0.01 0.001
xα 2.706 6.635 10.828
解:(1)由题意,得P(B1|A1)=,
P(B1|A2)=,
P(B1|A1)>P(B1|A2),
说明从抽样情况来看,燃油车车主觉得交通拥堵的比例比新能源车车主觉得交通拥堵的比例更高.
(2)零假设为H0:该市车主用车的能源类型与对该市交通拥堵的感受无关联.
计算可得χ2===<2.706=x0.1,
依据小概率值α=0.1的独立性检验,没有充分证据推断H0不成立,因此我们可以认为H0成立,即认为该市车主用车的能源类型与对该市交通拥堵的感受无关联.
以上分析结果与(1)中结论不同,说明调查人数太少,(1)中的结论不具有说服力,需要调查更多车主.
17.(2025·湖南邵阳模拟)某市开展“安全随我行”活动,交警部门在某个交通路口增设电子抓拍眼,并记录了某月该路口连续10日骑电动摩托车未佩戴头盔的人数y与天数x的情况,对统计得到的样本数据(xi,yi)(i=1,2,…,10)作了初步处理,得到下面的散点图及一些统计量的值.
xiyi x xiYi
5.5 8.7 1.9 301 385 79.75
表中Yi=ln yi,=Yi.
(1)依据散点图推断,y=bx+a与y=ebx+a哪一个更适合作为未佩戴头盔人数y与天数x的经验回归方程类型?(给出判断即可,不必说明理由)
(2)依据(1)的结果和上表中的数据,求出y关于x的经验回归方程;
(3)为了解市民佩戴头盔情况与性别的关联性,交警对该路口骑电动摩托车的市民进行调查,得到如下列联表:
性别 佩戴头盔情况 合计
不佩戴 佩戴
女 8 12 20
男 14 6 20
合计 22 18 40
依据小概率值α=0.10的独立性检验,能否认为市民骑电动摩托车是否佩戴头盔与性别有关联?
参考公式:=,=-,χ2=,其中n=a+b+c+d.
α 0.15 0.10 0.05 0.025 0.010 0.005 0.001
xα 2.072 2.706 3.841 5.024 6.635 7.879 10.828
解:(1)y=ebx+a更适合.
(2)设y关于x的经验回归方程为=ex+,由Yi=ln yi,
得=ln ex+=x+,
依题意,得
==
=-=-0.3,
则=-=1.9-(-0.3)×5.5=3.55,
所以=-0.3x+3.55,即=e-0.3x+3.55.
(3)零假设为H0:市民骑电动摩托车是否佩戴头盔与性别无关联,
则χ2=
=≈3.636>2.706=x0.10,
依据小概率值α=0.10的独立性检验,我们推断H0不成立,即认为市民骑电动摩托车是否佩戴头盔与性别有关联.
18.(2025·湖北武汉模拟)某乡政府为提高当地农民收入,指导农民种植药材,并在种植药材的土地附近种草放牧,发展畜牧业.牛粪、羊粪等有机肥可以促进药材的生长,发展生态循环农业.下图所示为某农户近7年种植药材的平均收入y(单位:千元)与年份代码x的折线图,并计算得到yi=480,xiyi=2052,≈25, (xi-)(yi-)=132,wi=140, (wi-)(yi-)=1048,≈43.3,其中wi=x.
(1)根据折线图判断,y=a+bx与y=c+dx2哪一个适宜作为平均收入y关于年份代码x的经验回归方程类型?并说明理由;
(2)根据(1)的判断结果及数据,建立y关于x的经验回归方程(精确到0.01),并预测2025年该农户种植药材的平均收入.
附:相关系数r=,
经验回归直线=x+的斜率和截距的最小二乘估计公式分别为=,
=-,≈2.65.
解:(1)因为=×(1+2+3+4+5+6+7)=4,
(xi-)2=(1-4)2+(2-4)2+(3-4)2+(4-4)2+(5-4)2+(6-4)2+(7-4)2=28,
对于模型y=a+bx,
相关系数r=
≈≈0.996,
对于模型y=c+dx2,
相关系数r′=≈≈0.968,
因为0.996>0.968,
所以y=a+bx适宜作为平均收入y关于年份代码x的经验回归方程类型.
(2)由(1)可知,经验回归方程类型为y=a+bx,
由已知数据及公式可得
===≈4.71,
=-=-×4≈49.71,
所以y关于x的经验回归方程为=4.71x+49.71,
又年份代码1~7分别对应年份2018~2024,所以2025年对应的年份代码为8,
代入可得=4.71×8+49.71=87.39千元,
所以预测2025年该农户种植药材的平均收入为87.39千元.
19.(2024·浙江台州二模)台州是全国三大电动车生产基地之一,拥有完整的产业链和突出的设计优势.某电动车公司为了抢占更多的市场份额,计划加大广告投入.该公司近5年的年广告费xi(单位:百万元)和年销售量yi(单位:百万辆)的关系如图所示.
令vi=ln xi(i=1,2,…,5),数据经过初步处理得:
yi vi (xi -)2 (yi -)2 (vi -)2 (xi-)· (yi-) (vi-)· (yi-)
44 4.8 10 40.3 1.612 19.5 8.06
现有①y=bx+a和②y=cln x+d两种方案作为年销售量y关于年广告费x的经验回归模型,其中a,b,c,d均为常数.
(1)请从相关系数的角度分析,哪一个模型拟合程度更好?
(2)根据(1)的分析选取拟合程度更好的经验回归模型及表中数据,求出y关于x的经验回归方程,并预测年广告费为6百万元时,产品的年销售量约为多少?
附:①相关系数r=,
经验回归直线=x+的斜率和截距的最小二乘估计公式分别为=,
=-;
②参考数据:=8.06,≈20.1,ln 6≈1.8.
解:(1)设模型①和②的相关系数分别为r1,r2.
由题意可得,r1==≈≈0.97,
r2=
===1.
所以|r1|<|r2|,由相关系数的相关性质可得,模型②的拟合程度更好.
(2)因为===5,
又由=vi=0.96,=yi=8.8,得
=-5=8.8-5×0.96=4,
所以=5v+4,故y关于x的经验回归方程为=5ln x+4.
当x=6时,=5ln 6+4≈13,
因此当年广告费为6百万元时,产品的年销售量约为13百万辆.
27

展开更多......

收起↑

资源预览