【备考2027】03 第54讲 成对数据的统计分析 分层练习 高三一轮总复习(基础版)

资源下载
  1. 二一教育资源

【备考2027】03 第54讲 成对数据的统计分析 分层练习 高三一轮总复习(基础版)

资源简介

第54讲 成对数据的统计分析 (时间:45分钟)
                 
1.[2026·天津滨海新区质检] 下列说法正确的是 (  )
A.点(,)不一定在经验回归直线上
B.残差平方和越小的模型拟合效果越好
C.经验回归直线就是散点图中经过样本数据点最多的那条直线
D.若两个变量的线性相关性越强,则样本相关系数r就越接近1
2.已知某企业对新品按事先拟定的价格进行试销,得到以下数据:
单价x(元) 40 50 60 70 80 90
y(件) 45 39 38 35 30 23
由表中数据,求得经验回归方程为=-0.4x+,则下列说法错误的是 (  )
A.产品的销售量和单价负相关
B.该经验回归直线过点(65,35)
C.样本点(60,38)的残差为-1
D.当单价定为100元时,销售量估计为21件
3.有下列四组成对数据:①(-2,-3),(-1,-1),(0,1),(1,3),(2,5);②(0,0),(1,1),(2,4),(3,9),(4,16);③(-3,3),(-2,2),(-1,1),(0,0),(1,-1);④(-2,0),(-1,),(0,2),(1,),(2,0).其中样本相关系数最小的是(  )
A.① B.②
C.③ D.④
4.[2026·山东潍坊模拟] 已知变量y与x的一组数据如表所示,根据数据得到y关于x的经验回归方程为=.
x 2 3 4 5
y e2 e3 e5 e6
若=e12.82,则x= (  )
A.6.8 B.7.8 C.8.8 D.9.8
5.已知两个变量x和y之间具有较强的线性相关关系,且y关于x的经验回归方程为=x+0.16,由它计算出成对样本数据(2,1.4)对应的残差为0.12,则= (  )
A.0.28 B.0.56
C.0.34 D.0.48
6.[2025·福建厦门质检] 为考察药物A对治疗疾病B的效果,在两个不同规模的动物种群中分别进行了试验,根据种群一的试验结果得到如下2×2列联表:
单位:只
药物A 疾病B 合计
未患病 患病
未服用 28 22 50
服用 34 16 50
合计 62 38 100
计算得到χ2≈1.528.假设种群二试验结果对应的列联表中,每个单元格的数据都为上表对应单元格数据的5倍,则根据小概率值α的独立性检验,下列说法正确的是 (  )
附:χ2=,n=a+b+c+d.
α 0.1 0.05 0.01 0.005
xα 2.706 3.841 6.635 7.879
A.当α=0.05时,种群一中药物A对预防疾病B有效,该推断犯错误的概率不超过5%
B.当α=0.05时,种群一中药物A对预防疾病B有效,该推断犯错误的概率不超过10%
C.当α=0.01时,种群二中药物A对预防疾病B有效,该推断犯错误的概率不超过1%
D.当α=0.005时,种群二中药物A对预防疾病B有效,该推断犯错误的概率不超过0.5%
7.(多选题)[2025·四川绵阳模拟] 某类商品在今年1至5月的销量y(单位:千辆)如下表所示(其中2月份销量未知):
月份x 1 2 3 4 5
月销量y 2.4 m 4 5 5.5
若变量y与x之间存在线性相关关系,且y关于x的经验回归方程为=0.81x+1.57,则下列说法正确的是 (  )
A.m=3.1
B.残差绝对值最大为0.19
C.样本相关系数r<0
D.当x每增加1时,y增加0.81
8.(多选题)随着科技的进步和人民生活水平的提高,电脑已经走进了千家万户,成为人们生活、学习、娱乐的常见物品,便携式电脑(俗称“笔记本”)也非常流行.某公司为了研究“台式机”与“笔记本”的受欢迎程度是否与性别有关,随机抽取了50人调查研究,调查数据如下表所示.
单位:人
性别 喜好情况 合计
喜欢“台式机” 喜欢“笔记本”
男性 18 9 27
女性 8 15 23
合计 26 24 50
由上述数据给出下列结论,其中正确的是 (  )
A.没有充分证据证明“台式机”与“笔记本”的受欢迎程度与性别有关
B.依据小概率值α=0.1的独立性检验,认为“台式机”与“笔记本”的受欢迎程度与性别有关
C.依据小概率值α=0.05的独立性检验,认为“台式机”与“笔记本”的受欢迎程度与性别无关
D.依据小概率值α=0.01的独立性检验,认为“台式机”与“笔记本”的受欢迎程度与性别无关
9.[2026·江苏镇江期末] 已知x,y的取值如下表:
x 0 1 3 4
y 4 4.5 5.5 6
从散点图分析,y与x线性相关,且经验回归方程为=0.5x+,则=    .
10.[2026·重庆七校联盟联考] 某景区自从实行门票打折、推出特色美食、不断提高服务质量等措施后,旅游人数明显增加.下表是该景区改进措施后,前5个月的旅游人数y(单位:十万)与第x个月的数据.
x 1 2 3 4 5
y 2 3 5 7 8
(1)已知可用经验回归模型拟合y与x的关系,请建立y关于x的经验回归方程 =x+,并预测第8个月的旅游人数.
(2)为了解景区游客性别与满意度的关系,随机抽查了200名游客,得到如下的列联表:
单位:人
性别 是否满意 合计
是 否
男 100 150
女 30
合计
请填写上表,并依据小概率值α=0.001的独立性检验判断能否认为游客是否满意与性别有关.
α 0.050 0.010 0.001
xα 3.841 6.635 10.828
11.(多选题)[2025·云南昆明质检] 已知由样本数据(xi,yi)(i=1,2,3,…,8)组成的一个样本,得到的经验回归方程为=1.5x-0.6且=2,去除两个异常数据(-2,7)和(2,-7)后,得到的新的经验回归直线的斜率为3,则 (  )
A.变量x,y正相关
B.去除异常数据后,新的一组数据的平均数'=2
C.去除异常数据后,新的一组数据的经验回归方程为=3x-4.8
D.去除异常数据后,随着x值的增加,的值增加速度变小
12.(多选题)[2026·陕西西安模拟] 下列说法正确的是 (  )
A.在经验回归方程中,若样本相关系数r越大,则两个变量的线性相关程度越强
B.数据1,3,4,5,7,9,11,16的第75百分位数为10
C.根据分类变量X与Y的成对样本数据,计算得到χ2=3.937,根据小概率值α=0.05的独立性检验(x0.05=3.841),可判断X与Y有关联,此推断犯错误的概率不超过0.05
D.样本甲中有m件样品,其方差为,样本乙中有n件样品,其方差为,则由甲、乙组成的总样本的方差为·+·
13.(多选题)某中学为更好地开展素质教育,现对选修外出研学课程是否和性别有关联进行调查,其中被调查的男生和女生人数相同,且男生中选修外出研学课程的人数占男生总人数的,女生中选修外出研学课程的人数占女生总人数的.若依据小概率值α=0.05的独立性检验认为选修外出研学课程与性别有关联,依据小概率值α=0.01的独立性检验认为选修外出研学课程与性别无关联,则调查的男生可能有 (  )
附:
α 0.05 0.01
xα 3.841 6.635
χ2=,其中n=a+b+c+d.
A.150人 B.220人
C.300人 D.350人
14.某部门在一次培训学习后,对同一工作小组中的5名员工采取如下考核制度:
①在本季度末,从部门中另抽120人,每人1票,对这5名员工进行投票;
②在本季度末,统计这5名员工本季度创造的营销收入.
记员工本季度创造的营销收入为y(单位:千元),所得票数为x,现将5人的情况用数对(x,y)表示:(19,75),(20,76),(34,90),(25,86),(22,78).y关于x的样本相关系数为r,部门规定:若|r|≥0.96,则认为本次统计数据异常.
(1)证明:本次统计数据异常;
(2)经查验,本季度创造的营销收入最少的员工的数据存在异常,将其剔除后,求y关于x的经验回归方程.(系数精确到个位数)第54讲 成对数据的统计分析
1.B [解析] 对于选项A,点(,)一定在经验回归直线上,故A错误;对于选项B,残差平方和越小的模型拟合效果越好,故B正确;对于选项C,经验回归直线在散点图中可能不经过任意一个样本数据点,故C错误;对于选项D,如果两个变量的线性相关性越强,则样本相关系数r的绝对值就越接近1,故D错误.故选B.
2.C [解析] 由-0.4<0,可知产品的销售量和单价负相关,故选项A中说法正确;由表中数据得==65,==35,所以该经验回归直线过点(65,35),故选项B中说法正确;由=-0.4+,得35=-0.4×65+,解得=61,所以=-0.4x+61,当x=60时,=-0.4×60+61=37,所以样本点(60,38)的残差为38-37=1,故选项C中说法错误;当x=100时,=-0.4×100+61=21,所以当单价定为100元时,销售量估计为21件,故选项D中说法正确.故选C.
3.C [解析] 对于①,数据均在y=2x+1上,故该组数据的样本相关系数为1;对于②,可看出其数据的两个变量正相关,故样本相关系数大于0;对于③,数据均在y=-x上,故该组数据的样本相关系数为-1;对于④,显然所有数据无法落在某一个一次函数的图象上,故-14.D [解析] 由题意可得ln =x-0.9,设z=ln y,则变量z与x的一组数据如下:
x 2 3 4 5
z 2 3 5 6
由表中数据可得=3.5,=4,故点(3.5,4)在直线z=x-0.9上,故4=3.5-0.9,故=1.4,则z=1.4x-0.9.当=e12.82,即z=12.82时,12.82=1.4x-0.9,解得x=9.8,故选D.
5.B [解析] 因为y关于x的经验回归方程为=x+0.16,所以当x=2时,=×2+0.16,又因为0.12=1.4-(2+0.16),所以=0.56.故选B.
6.C [解析] 对于A,B,因为χ2≈1.528<3.841,所以当α=0.05时,无法推断种群一中药物A对预防疾病B有效,故A,B错误;对于C,由χ2=,将各项数据变为原来的5倍,则χ'2===5χ2≈7.64>6.635,所以当α=0.01时,种群二中药物A对预防疾病B有效,该推断犯错误的概率不超过1%,故C正确;对于D,因为χ'2≈7.64<7.879,所以当α=0.005时,无法推断种群二中药物A对预防疾病B有效,故D错误.故选C.
7.AB [解析] 由题意知=0.81x+1.57,==3,代入方程得=0.81×3+1.57=4,所以=4,解得m=3.1,故A正确;1月份的残差为2.4-(0.81×1+1.57)=0.02,2月份的残差为3.1-(0.81×2+1.57)=-0.09,3月份的残差为4-(0.81×3+1.57)=0,4月份的残差为5-(0.81×4+1.57)=0.19,5月份的残差为5.5-(0.81×5+1.57)=-0.12,所以残差绝对值最大为0.19,故B正确;由表格可知变量y与x正相关,则r>0,故C不正确;当x每增加1时,y不一定增加0.81,故D不正确.故选AB.
8.BD [解析] 由表中数据可得χ2=≈5.059,因为3.841<5.059<6.635,所以依据小概率值α=0.1,α=0.05的独立性检验,认为“台式机”与“笔记本”的受欢迎程度与性别有关,依据小概率值α=0.01的独立性检验,认为“台式机”与“笔记本”的受欢迎程度与性别无关.故选BD.
9.4 [解析] 由表中数据计算得=×(0+1+3+4)=2,=×(4+4.5+5.5+6)=5,又经验回归直线=0.5x+过点(,),所以5=0.5×2+,解得=4.
10.解:(1)由已知得==3,==5,
(xi-)(yi-)=16,(xi-)2=10,则===1.6,故=-=5-3×1.6=0.2,
所以=1.6x+0.2,当x=8时,=13,故预测第8个月的旅游人数为130万人.
(2)补全列联表如下:
单位:人
性别 是否满意 合计
是 否
男 100 50 150
女 20 30 50
合计 120 80 200
零假设为H0:游客是否满意与性别无关,计算可得χ2=≈
11.111>10.828,所以依据小概率值α=0.001的独立性检验,我们推断H0不成立,即认为游客是否满意与性别有关.
11.AC [解析] A选项,因为1.5>0,所以变量x,y正相关,所以A正确;B选项,因为=2,所以去除两个异常数据(-2,7)和(2,-7)后,得到新数据的平均数'==,所以B错误;C选项,将=2代入=1.5x-0.6中,得=2.4,故去除两个异常数据(-2,7)和(2,-7)后,'==3.2,因为得到的新的一组数据的经验回归直线的斜率为3,所以'-3'=3.2-3×=-4.8,所以去除异常数据后的经验回归方程为=3x-4.8,所以C正确;D选项,因为经验回归直线=3x-4.8的斜率为正数,所以变量x,y正相关,且去除异常数据后,斜率由1.5增大到3,故的值增加的速度变大,所以D错误.故选AC.
12.BC [解析] 对于A,样本相关系数的绝对值越接近1,两个变量的线性相关程度越强,反之两个变量的线性相关程度越弱,故A错误;对于B,数据1,3,4,5,7,9,11,16是按从小到大的顺序排列的,由8×75%=6,得这组数据的第75百分位数为第6项数据与第7项数据的平均数,即为=10,故B正确;对于C,因为χ2=3.937>3.841,所以依据小概率值α=0.05的独立性检验判断分类变量X与Y有关联,此推断犯错误的概率不大于0.05,故C正确;对于D,设样本甲的平均数为,样本乙的平均数为,甲、乙组成的总样本的平均数为,所以甲、乙组成的总样本的方差为[+]+[+],故D错误.故选BC.
13.BC [解析] 设男生和女生人数均为5n(n∈N*),根据题意可得2×2列联表如下:
单位:人
是否选修 外出研学 课程 性别 合计
男生 女生
是 3n
否 2n
合计 5n 5n 10n
零假设为H0:选修外出研学课程与性别无关联,则χ2=
=,∵依据小概率值α=0.05的独立性检验认为选修外出研学课程与性别有关联,依据小概率值α=0.01的独立性检验认为选修外出研学课程与性别无关联,∴3.841≤<6.635,解得38.025 9≤n<65.686 5,则190.129 5≤5n<328.432 5,n∈N*.故选BC.
14.解:(1)证明:由已知得r==≈≈0.968>0.96,
故该工作小组本次统计数据异常.
(2)将本季度创造的营销收入最少,即营销收入为75千元的员工数据剔除,剔除数据后的'=25.25,'=82.5.
代入计算得xiyi=xiyi-19×75=9871-1425=8446,
4'·'=4×25.25×82.5=8332.5,
=-192=2665.
设剔除异常数据后,y关于x的经验回归方程为=x+,
则=≈1,所以=82.5-25.25≈57,
故所求经验回归方程为=x+57.

展开更多......

收起↑

资源列表