第59练 成对数据的统计分析(含解析)2027届高考数学(通用版)一轮复习练习

资源下载
  1. 二一教育资源

第59练 成对数据的统计分析(含解析)2027届高考数学(通用版)一轮复习练习

资源简介

第59练 成对数据的统计分析
1.为了对变量x与y的线性相关程度进行检验,由样本点(x1,y1),(x2,y2),…,(x10,y10)求得两个变量的样本相关系数为r,则下列说法正确的是 (  )               
A.若所有样本点都在直线y=-2x+1上,则r=1
B.若所有样本点都在直线y=-2x+1上,则r=-2
C.若|r|越大,则变量x与y的线性相关程度越强
D.若|r|越小,则变量x与y的线性相关程度越强
2.[2026·湖北恩施模拟] 根据分类变量x与y的观测数据,计算得到χ2≈0.837,依据小概率值α=0.1(x0.1=2.706)的独立性检验,则 (  )
A.变量x与y不独立
B.变量x与y独立
C.变量x与y不独立,这个结论犯错误的概率不超过0.1
D.变量x与y独立,这个结论犯错误的概率不超过0.1
3.某科技公司对2012年至2024年的生产成本y(万元)进行统计,根据统计数据作出如图所示的散点图.
由此散点图,判断最适合作为该公司的生产成本y与时间变量x(x的值依次为1,2,…,13)的经验回归方程类型的是 (  )
A.y=ax2+b(a>0)
B.y=ax+b(a>0)
C.y=aln x+b(a<0)
D.y=+b(a<0)
4.[2025·江苏苏州八校三模] 某公司对100名员工进行了工作量的调查,数据如表:
单位:人
性别 工作量 合计
认为工作量大 认为工作量不大
男士 40 20 60
女士 20 20 40
合计 60 40 100
若推断“是否认为工作量大与员工的性别有关联”,则这种推断犯错误的概率不超过 (  )
附:χ2=,其中n=a+b+c+d.
α 0.15 0.1 0.05 0.025 0.01 0.001
xα 2.072 2.706 3.841 5.024 6.635 10.828
A.0.1 B.0.05 C.0.025 D.0.01
5.已知在一定范围内,水稻对氮元素的吸收量与它的根的长度具有线性相关关系.某盆栽水稻实验中,在确保土壤肥力及灌溉条件相对稳定的情况下,统计了根的长度x(单位:cm)与氮元素吸收量y(单位:mg/天)的相关数据,如下表所示:
x 9.9 12.1 14.8 18.2 19.9 21.8 25.1 27.7 30.4 32.1
y 0.30 0.34 0.42 0.50 0.55 0.60 0.71 0.74 0.78 0.86
根据表中数据可得=21.2,=0.58及经验回归方程为=0.025x+,则 (  )
A.=-0.05
B.变量y和变量x的样本相关系数r<0
C.当x=14.8时,残差为0
D.水稻根的长度每增加1 cm,一天的氮元素吸收量一定增加0.025 mg
6.(多选题)如图,某同学将搜集的六组成对数据(xi,yi)(i=1,2,3,4,5)绘制成散点图,若把图中的E点去掉,对比原数据重新进行线性回归分析,则下列结论正确的是 (  )
A.数据的残差平方和变大
B.数据的决定系数R2变大
C.解释变量x与响应变量y的线性相关程度变强
D.样本相关系数r的绝对值更趋于0
7.某企业为了调查其产品在国内和国际市场的发展情况,随机抽取国内、国外各100名客户代表,了解他们对该企业产品的发展前景所持的态度,得到如图所示的等高堆积条形图,则    (填“能”或“不能”)在犯错误的概率不超过0.01的前提下认为是否持乐观态度与国内外差异有关联.
附:χ2=,n=a+b+c+d.
8.[2025·沧州名校联考] 对具有线性相关的两个变量x和y进行统计分析时,得到一组样本数据(4,1),(m,2),(8,3),(10,5),(12,6),并由该组数据求得y关于x的经验回归方程=0.65x-1.8,则样本点(m,2)处的残差为    .
9.[2025·广东湛江二模] 为了研究观众对某档节目的喜爱情况与性别的关联性,分别调查了该档节目男、女观众各100人,发现共有70名观众喜爱该档节目,且不喜爱该档节目的女性观众人数是喜爱该档节目的男性观众人数的2倍.
(1)根据题中信息,完成下面2×2列联表;
单位:人
性别 喜爱情况 合计
喜爱 不喜爱


合计
(2)根据(1)中的列联表,依据小概率值α=0.1的独立性检验,能否认为观众对该档节目的喜爱情况与性别有关联
附:χ2=,n=a+b+c+d.
α 0.1 0.05 0.01
xα 2.706 3.841 6.635
10.已知关于变量x,y的一组数据如表所示:
x 6 8 10 12
y a 10 6 4
根据表中数据计算得到y关于x的经验回归方程为=-1.4x+20.6,变量x和变量y的样本相关系数为r,则 (  )
A.a=10 B.x与y正相关
C.r=- D.r=-
11.某医疗研究机构为了解某种地方性疾病与当地居民的生活习惯(生活习惯分良好和不够良好)的关系,现从该地区随机抽取4n(n∈N*)名居民,统计数据如下:
单位:人
患该疾病情况 生活习惯 合计
良好 不够良好
患有该疾病居民 0.6n 1.4n 2n
未患有该疾病居民 1.2n 0.8n 2n
合计 1.8n 2.2n 4n
若根据小概率值α=0.01(x0.01=6.635)的独立性检验,分析发现居民是否患有该疾病与生活习惯有关联,则从该地区抽取的居民人数至少为 (  )
附:χ2=,n=a+b+c+d.
A.60 B.76 C.80 D.100
12.(多选题)某同学经过随机抽样获得的成对样本数据为(x1,y1),(x2,y2),…,(x6,y6),数据(1,0.9)为其中一对样本数据,经统计分析,变量x和变量y具有线性相关关系,利用最小二乘法,计算得到经验回归方程为=3x-2,则下列结论正确的为 (  )
附:经验回归直线的斜率和截距的最小二乘估计公式分别为
A.
B.根据所求经验回归方程,数据(1,0.9)的残差值为0.1
C.若将样本数据(x1,y1),(x2,y2),…,(x6,y6)调整为(x1,y1+3),(x2,y2+3),…,(x6,y6+3),则调整数据后所得经验回归方程为=3x+1
D.若该同学将样本数据(1,0.9)错误地记为(1,-4),则样本相关系数r将变小
13.[2025·山东德州三模] 已知变量y与x线性相关,由样本点(1,y1),(2,y2),…,(5,y5)求得的经验回归方程为=x+.若点(1,y1)在经验回归直线上,且y1=2,=3,
14.为落实五育并举,同时增强高中生的综合素质,某校领导计划利用课间时间开展足球社团活动,为了使该活动顺利开展,了解学生是否对足球感兴趣与性别的关系,现从某年级的学生中随机抽取了男、女同学各50名,整理得到下列2×2列联表:
单位:人
性别 是否对足球感兴趣 合计
感兴趣 不感兴趣
男生 a 50-a 50
女生 80-a a-30 50
合计 80 20 100
使得“依据α=0.05的独立性检验,认为男、女同学对足球感兴趣有差异;依据α=0.01的独立性检验,认为男、女同学对足球感兴趣无差异”的a的一个值为    .
15.我国近几年着重强调可持续发展,加大新能源项目的支持力度,积极推动新能源汽车产业迅速发展.某汽车制造企业对某地区新能源汽车的销售情况进行调查,得到如下的统计表:
年份t 2019 2020 2021 2022 2023
年份代码x(x=t-2018) 1 2 3 4 5
销量y(万辆) 10 12 17 20 26
(1)计算销量y关于年份代码x的样本相关系数r,并判断是否可以认为y与x有较强的线性相关关系(若|r|≥0.75,则认为有较强的线性相关关系) 若是,求出y关于x的经验回归方程;若不是,说明理由.
(2)为了解购车车主的性别与购车种类(分为新能源汽车与传统燃油汽车)的情况,该企业又随机调查了该地区100位购车车主的购车情况,假设一位车主只购一辆车.男性车主中购置传统燃油汽车的有40位,购置新能源汽车的有30位;女性车主中有一半购置新能源汽车.将频率视为概率,已知一位车主购得新能源汽车,求这位车主是女性的概率.
第59练 成对数据的统计分析
1.C [解析] 若所有样本点都在直线y=-2x+1上,直线的斜率为负数,则变量x与y完全负相关,r=-1,故A,B选项错误;若|r|越大,则变量x与y的线性相关程度越强,故C选项正确,D选项错误.故选C.
2.B [解析] 因为χ2≈0.8373.C [解析] 根据图中散点图可知,散点大致分布在一条“对数型”函数图象的周围.A选项是“抛物线型”的拟合函数,且是增加的,故A错误;B选项是“直线型”的拟合函数,且是增加的,故B错误;D选项是“幂函数型”的拟合函数,且是增加的,故D错误;只有C选项的拟合函数符合题意,故C正确.故选C.
4.A [解析] 根据列联表中的数据,计算得到χ2=≈2.778>2.706=x0.1,所以这种推断犯错误的概率不超过0.1.故选A.
5.C [解析] 因为=21.2,=0.58,所以0.58=0.025×21.2+,可得=0.05,故A错误;=0.025x+0.05,因为0.025>0,所以y与x正相关,所以样本相关系数r>0,故B错误;当x=14.8时,=0.025×14.8+0.05=0.42,则残差为0.42-0.42=0,故C正确;由回归方程可以判断随x变化y值的变化趋势,但不能说变量x每增加一个单位,y的值一定增加0.025个单位,故D错误.故选C.
6.BC [解析] 由散点图可知,两变量x,y正相关,由于E点较其他点偏离程度大,删除点E后,拟合效果更好,所以决定系数R2变大,故B正确;从而样本相关系数r的绝对值更接近1,故D错误;由于拟合效果更好,则决定系数R2越接近1,所以新样本数据的残差平方和变小,故A错误;解释变量x与响应变量y的线性相关程度增强,故C正确.故选BC.
7.能 [解析] 根据题意得到如下2×2列联表:
单位:人
地区 态度 合计
乐观 不乐观
国内代表 60 40 100
国外代表 40 60 100
合计 100 100 200
零假设为H0:是否持乐观态度与国内外差异有关联.根据列联表中的数据,计算得χ2==8>6.635=x0.01,
根据小概率值α=0.01的独立性检验,我们推断H0不成立,即能在犯错误的概率不超过0.01的前提下认为是否持乐观态度与国内外差异有关联.
8.-0.1 [解析] 由题得=(4+m+8+10+12)=(34+m),=×(1+2+3+5+6)=,将其代入=0.65x-1.8,可得m=6,则当x=6时,=3.9-1.8=2.1,所以样本点(m,2)处的残差为2-2.1=-0.1.
9.解:(1)设喜爱该档节目的男性观众人数为x,则喜爱该档节目的女性观众人数为70-x,不喜爱该档节目的女性观众人数为2x,则70-x+2x=100,解得x=30.故2×2列联表如下.
单位:人
性别 喜爱情况 合计
喜爱 不喜爱
男 30 70 100
女 40 60 100
合计 70 130 200
(2)零假设为H0:观众对该档节目的喜爱情况与性别无关联.
根据(1)中列联表的数据,计算得到χ2==≈2.198<2.706=x0.1.
根据小概率值α=0.1的独立性检验,没有充分证据推断H0不成立,
因此可以认为H0成立,即认为观众对该档节目的喜爱情况与性别无关联.
10.C [解析] 因为经验回归直线必过点(,),=9,所以=-1.4+20.6=8=,解得a=12,故A错误;由经验回归方程可知,x与y负相关,故B错误;样本相关系数r=故C正确,D错误.故选C.
11.C [解析] 根据列联表中的数据,计算得χ2==
,由题知≥6.635,又n∈N*,所以n≥19,又0.6n,1.4n,1.2n,0.8n均为整数,所以n的最小值为20,所以从该地区抽取的居民人数至少为80.故选C.
12.ACD [解析] 对于A,由题得==3,所以=3×3-2=7,故A正确;对于B,由经验回归方程知,当x=1时,=3-2=1,因此残差为0.9-1=-0.1,故B错误;对于C,将样本数据(x1,y1),(x2,y2),…,(x6,y6)调整为(x1,y1+3),(x2,y2+3),…,(x6,y6+3),根据计算公式,经验回归方程中系数对于D,原经验回归直线中样本点(1,0.9)的预测点是(1,1),现变为(1,-4),远离了经验回归直线,因此线性相关程度减弱,样本相关系数的绝对值变小,又由题知变量x和y正相关,则r>0,因此样本相关系数r变小,故D正确.故选ACD.
13.12 [解析] 由点(1,y1)在经验回归直线=x+上,且y1=2,可得2=×1+,解得=,所以经验回归方程为=x+.又点(3,)在经验回归直线上,所以=+=×3+=,所以
14.35(或36或44或45,答案不唯一)
[解析] 由题可得χ2=
=
.依题意可知3.841≤<6.635,解得40-15.解:(1)由题意得=×(1+2+3+4+5)=3,=×(10+12+17+20+26)=17,
(2)由题意知,100位购车车主中,男性车主有70位,女性车主有30位,购置新能源汽车的男性车主有30位,购置新能源汽车的女性车主有15位.
设A=“一位车主购得新能源汽车”,B=“车主是女性”,
则一位车主购得新能源汽车,这位车主是女性的概率为P(B|A)===.

展开更多......

收起↑

资源预览