2024年高考数学二轮复习专题-统计案例 学案 (原卷版+解析版)

资源下载
  1. 二一教育资源

2024年高考数学二轮复习专题-统计案例 学案 (原卷版+解析版)

资源简介

2024年高考数学二轮复习专题-统计案例
1. 样本数据16,24,14,10,20,30,12,14,40的中位数为( )
A. 14 B. 16 C. 18 D. 20
【答案】B
【解析】
【详解】将这些数据从小到大排列可得:10,12,14,14,16,20,24,30,40,
则其中位数为16.
故选:B.
题型一:随机抽样、统计图表及样本估计总体
【典例例题】
例1.(2024春·吉林延边·一模)(多选)今年第5号台风“杜苏芮”于7月28日9时55分在福建晋江登陆,为1949年以来登陆福建的第二强台风,登陆后强度迅速减弱并一路北上影响黄淮、华北,给华北、黄淮等地带来较大范围的特大暴雨.华中地区某市受此次台风影响,最高气温同比有所下降,测得七天的最高气温分别是28,26,25,27,29,27,25(单位:℃),则( )
A.该组数据的极差为4 B.该组数据的众数为27
C.该组数据的中位数为27 D.该组数据的第70百分位数为28
【答案】AC
【详解】将这组数据按照从小到大的顺排列得,
则该组数据的极差为,故A正确;
该组数据的众数为和,故B错误;
该组数据的中位数为27,故C正确;
因为,
所以该组数据的第70百分位数为第个数据,即,故D错误.
故选:AC.
例2.(2024春·河南开封·二模)(多选)为了解某地农村经济情况,对该地农户家庭年收入进行抽样调查,将农户家庭年收入的调查数据整理得到如下频率分布直方图:

根据此频率分布直方图,下面结论中正确的是( )
A.该地农户家庭年收入的极差为12
B.估计该地农户家庭年收入的75%分位数约为9
C.估计该地有一半以上的农户,其家庭年收入介于4.5万元至8.5万元之间
D.估计该地农户家庭年收入的平均值超过6.5万元
【答案】BCD
【详解】观察频率分布直方图,
对于A,该地农户家庭年收入的极差约为,A错误;
对于B,数据在的频率为,
数据在的频率为,因此75%分位数,,解得,B正确;
对于C,数据在内的频率为,C正确;
对于D,庭年收入的平均值
(万元),D正确.
故选:BCD
【变式训练】
1.(2024春·广东省东莞市一模)数据2,3,5,5,6,7,8,8,9,10的分位数为( )
A.6 B.7 C.8 D.7.5
【答案】.D
【详解】,从小到大第6个数据为7,第7个数据为8,
故分位数为.
故选:D
2.(2024春·江西省模拟)一组数据按从小到大的顺序排列为2,4,m,12,16,17,若该组数据的中位数是极差的,则该组数据的第40百分位数是( )
A.4 B.5 C.6 D.9
【答案】C
【详解】根据题意,数据按从小到大的顺序排列为2,4,m,12,16,17,
则极差为,故该组数据的中位数是,
数据共6个,故中位数为,解得,
因为,所以该组数据的第40百分位数是第3个数6,
故选:C.
3.(2024春·辽宁抚顺·一模)(多选)采购经理指数(PMI)是国际上通用的监测宏观经济走势的指标,具有较强的预测、预警作用.2023年12月31日,国家统计局发布了中国制造业PMI指数(经季节调整)图,如下图所示,则下列说法正确的是( )
A.图中前三个数据的平均值为
B.2023年四个季度的PMI指数中,第一季度方差最大
C.图中PMI指数的极差为
D.2023年PMI指数的分位数为
【答案】AB
【详解】对于A,根据表中数据可知图中前三个数据的平均值为,可知A正确;
对于B,从表中数据可以看出2023年四个季度的PMI指数中,第一季度的波动性最大,稳定性最差,所以方差最大,即B正确;
对于C,易知图中PMI指数的极差为,即C错误;
对于D,易知,可知2023年PMI指数的分位数为从小到大排列的第9项和第10项的平均数,
即,即D错误;
故选:AB
4.(2024春·贵州毕节·二模)某地区工会利用“健步行APP”开展健步走活动.为了解会员的健步走情况,工会在某天从系统中抽取了100名会员,统计了当天他们的步数(千步为单位),并将样本数据分为,,,…,,九组,整理得到如图所示的频率分布直方图.
(1)根据频率分布直方图,估计样本数据的70%分位数;
(2)据统计,在样本数据,,的会员中体检为“健康”的比例分别为,,,以频率作为概率,估计在该地区工会会员中任取一人,体检为“健康”的概率.
【答案】(1)14.5 (2)0.38
【详解】(1)解:(1)由于在的样本数据比例为:
∴样本数据的70%分位数在内∴估计为:.
(2)(2)设任取的会员数据在,,中分别为事件,,,
∴,,
设事件在该地区工会会员中任取一人体检为“健康”
.
题型二:变量间的相关关系及回归方程
【典例例题】
例1.(2024春·浙江温州·二模)红旗淀粉厂2024年之前只生产食品淀粉,下表为年投入资金(万元)与年收益(万元)的8组数据:
10 20 30 40 50 60 70 80
12.8 16.5 19 20.9 21.5 21.9 23 25.4
(1)用模拟生产食品淀粉年收益与年投入资金的关系,求出回归方程;
(2)为响应国家“加快调整产业结构”的号召,该企业又自主研发出一种药用淀粉,预计其收益为投入的.2024年该企业计划投入200万元用于生产两种淀粉,求年收益的最大值.(精确到0.1万元)
附:①回归直线中斜率和截距的最小二乘估计公式分别为:,

161 29 20400 109 603

【答案】(1) (2)36.5
【详解】(1)
∴回归方程为:
(2)
2024年设该企业投入食品淀粉生产x万元,预计收益(万元)

,得
∴其在上递增,上递减
【变式训练】
1.(2024春·湖北省武汉市联考)对两个具有线性相关关系的变量x和y进行统计时,得到一组数据,通过这组数据求得回归直线方程为,则m的值为( )
A. 3 B. 5 C. 5.2 D. 6
【答案】A
【解析】
【分析】由数据得出样本中心点,再代入回归直线方程计算即可.
【详解】易知,代入得.
故选:A
2.(2024春·河北沧州·一模)(多选)下表是某地从2019年至2023年能源消费总量近似值(单位:千万吨标准煤)的数据表:
年份 2019 2020 2021 2022 2023
年份代号 1 2 3 4 5
能源消费总量近似值(单位:千万吨标准煤) 44.2 44.6 46.2 47.8 50.8
以为解释变量,为响应变量,若以为回归方程,则决定系数0.9298,若以为回归方程,则,则下面结论中正确的有( )
A.变量和变量的样本相关系数为正数
B.比的拟合效果好
C.由回归方程可准确预测2024年的能源消费总量
D.
【答案】ABD
【详解】对于A选项:随着变量的增加,变量也在增加,故变量和变量成正相关,即样本相关系数为正数,正确;
对于B选项:因为,故比的拟合效果好,正确;
对于C选项:回归方程可预测2024年的能源消费总量,不可准确预测,错误;
对于D选项:由回归方程必过样本中心点,可知,正确.
故选:ABD.
4.(2024·四川巴中·一模)下图是某市2016年至2022年生活垃圾无害化处理量y(单位:万吨)与年份t的散点图.
(1)根据散点图推断变量y与t是否线性相关,并用相关系数加以说明;
(2)建立y关于t的回归方程(系数精确到0.01),预测2024年该市生活垃圾无害化处理量.
参考数据:
,,,.
参考公式:,;相关系数.
【答案】(1)y与t线性相关,说明见解析 (2)1.84万吨
【详解】(1)
根据散点图推断变量y与t线性相关,说明如下:
由题意得,


故,
由y与t的相关系数约为0.97表明,y与t线性相关,相关程度相当高;
(2)
由以及(1)可得,
则,
故y关于t的回归方程为,
将2024年对应的年份代码代入回归方程得
故预测2024年该市生活垃圾无害化处理量约为1.84万吨.
题型三:列联表与独立性检验
【典例例题】
例1.(2024春·黑龙江吉林·二模)恰逢盛世,风调雨顺.某稻米产地今秋获得大丰收,为促进当地某品牌大米销售,甲、乙两位驻村干部通过直播宣传销售所驻村生产的该品牌大米.通过在某时段100名顾客在观看直播后选择在甲、乙两位驻村干部的直播间(下简称甲直播间、乙直播间)购买的情况进行调查(假定每人只在一个直播间购买大米),得到以下数据:
网民类型 在直播间购买大米的情况 合计
在甲直播间购买 在乙直播间购买
本地区网民 50 5 55
外地区网民 30 15 45
合计 80 20 100
(1)依据小概率值的独立性检验,能否认为网民选择在甲、乙直播间购买大米与网民所处地区有关;
(2)用样本分布的频率分布估计总体分布的概率,若共有名网民在甲、乙直播间购买大米,且网民选择在甲、乙两个直播间购买大米互不影响,记其中在甲直播间购买大米的网民数为X,求使事件“”的概率取最大值时k的值.
附:,其中.
0.1 0.05 0.01 0.005
2.706 3.841 6.635 7.879
【答案】(1)能认为网民选择在甲、乙直播间购买大米与网民所处地区有关 (2)
【详解】(1)提出零假设:网民选择在甲、乙直播间购买大米与网民所处地区没有关联,
经计算得,
依据小概率值的独立性检验,我们推断不成立,
即认为网民选择在甲、乙直播间购买大米与网民所处地区有关联.
(2)利用样本分布的频率估计总体分布的概率,
可知网民选择在甲直播间购买夏橙的概率为,
则,记,,
则,
则问题等价于求当取何值时取最大值,
因为,,
又,
所以当时,;
当时,;
当时,;
所以,

所以当时,取最大值,
即使事件“”的概率取最大值的的值为.
【变式训练】
1.(2024春·河南·一模)近年来,短视频作为以视频为载体的聚合平台,社交属性愈发突出,在用户生活中
覆盖面越来越广泛,针对短视频的碎片化缺陷,将短视频剪接成长视频势必成为一种新的技能.某机构在网上随机对1000人进行了一次市场调研,以决策是否开发将短视频剪接成长视频的APP,得到如下数据:
青年人 中年人 老年人
对短视频剪接成长视频的APP有需求 200
对短视频剪接成长视频的APP无需求 150
其中的数据为统计的人数,已知被调研的青年人数为400.
(1)求的值;
(2)根据小概率值的独立性检验,分析对短视频剪接成长视频的APP的需求,青年人与中老年人是否有差异?
参考公式:,其中.
临界值表:
0.1 0.05 0.01 0.005 0.001
2.706 3.841 6.635 7.879 10.828
【答案】(1) (2)有差异
【详解】(1)
由题意可得:,解得.
(2)
零假设为:对短视频剪接成长视频APP的需求,青年人与中老年人没有差异.
由已知得,如下列联表:
青年人 中老年人 合计
对短视频剪接成长视频的APP有需求 300 250 550
对短视频剪接成长视频的APP无需求 100 350 450
合计 400 600 1000
可得,
根据小概率值的独立性检验,我们推断不成立,
所以对短视频剪接成长视频的APP有需求,青年人与中老年人有差异.
2.(2024春·山东淄博·一模)为了解居民体育锻炼情况,某地区对辖区内居民体育锻炼进行抽样调查.统计其中400名居民体育锻炼的次数与年龄,得到如下的频数分布表.
年龄 次数 [20,30) [30,40) [40,50) [50,60]
每周0~2次 70 55 36 59
每周3~4次 25 40 44 31
每周5次及以上 5 5 20 10
(1)若把年龄在的锻炼者称为青年,年龄在的锻炼者称为中年,每周体育锻炼不超过2次的称为体育锻炼频率低,不低于3次的称为体育锻炼频率高,根据小概率值的独立性检验判断体育锻炼频率的高低与年龄是否有关联;
(2)从每周体育锻炼5次及以上的样本锻炼者中,按照表中年龄段采用按比例分配的分层随机抽样,抽取8人,再从这8人中随机抽取3人,记这3人中年龄在与的人数分别为,求ξ的分布列与期望;
(3)已知小明每周的星期六、星期天都进行体育锻炼,且两次锻炼均在跑步、篮球、羽毛球3种运动项目中选择一种,已知小明在某星期六等可能选择一种运动项目,如果星期六选择跑步、篮球、羽毛球,则星期天选择跑步的概率分别为 ,求小明星期天选择跑步的概率.
参考公式:
附:
α 0.10 0.05 0.01 0.005 0.001
2.706 3.841 6.635 7.879 10.828
【答案】(1)有关
(2)分布列见解析;期望为
(3)
【详解】(1)零假设:体育锻炼频率的高低与年龄无关,
由题得列联表如下:
青年 中年 合计
体育锻炼频率低 125 95 220
体育锻炼频率高 75 105 180
合计 200 200 400

根据小概率值的独立性检验推断不成立,
即认为体育锻炼频率的高低与年龄有关,此推断犯错误的概率不大于0.01.
(2)由数表知,利用分层抽样的方法抽取的8人中,年龄在内的人数分别为1,2,
依题意,的所有可能取值分别为为0,1,2,
所以,


所以的分布列::
0 1 2
所以的数学期望为.
(3)记小明在某一周星期六选择跑步、篮球、羽毛球,分别为事件A,B,C,
星期天选择跑步为事件,则,

所以
所以小明星期天选择跑步的概率为.
1.(2024春·广西南宁·一模)(多选)下列说法中,正确的是( )
A.一组数据的第40百分位数为12
B.若样本数据的方差为8,则数据的方差为2
C.已知随机变量服从正态分布,若,则
D.在独立性检验中,零假设为:分类变量和独立.基于小概率值的独立性检验规则是:当时,我们就推断不成立,即认为和不独立,该推断犯错误的概率不超过;当时,我们没有充分证据推断不成立,可以认为和独立
【答案】BC
【详解】对A,由于共10个数据,且,
故第40百分位数为第4,5个数据的平均数为,故A错误;
对B,设数据的平均数为,方差为,
则数据的平均数为,
方差为
,所以,故B正确;
对C,则,即,由正态分布的性质可得,故C正确;
对D,在独立性检验中,零假设为:分类变量和独立.基于小概率值的独立性检验规则是:当
时,我们就推断不成立,即认为和不独立,该推断犯错误的概率不超过;当时,我们没有充分证据推断不成立,可以认为和独立.故D错误.
故选:BC
2.(2024春·山东淄博·一模)(多选)下列命题为真命题的是( )
A.若样本数据的方差为2,则数据的方差为17
B.一组数据8,9,10,11,12的第80百分位数是11.5
C.用决定系数比较两个模型的拟合效果时,若越大,则相应模型的拟合效果越好
D.以模型 去拟合一组数据时,为了求出经验回归方程,设,求得线性回归方程为,则c,k的值分别是和2
【答案】BCD
【详解】对A:若样本数据的方差为2,则数据的方差为,故A错误;
对B:,则其第80百分位数是,故B正确;
对C,根据决定系数的含义知越大,则相应模型的拟合效果越好,故C正确;
对D,以模型去拟合一组数据时,为了求出经验回归方程,设,
则,由题线性回归方程为,则,故的值分别是和2,故D正确.
故选:BCD.
3.(2024春·广东广州·一模)某校数学建模兴趣小组收集了一组恒温动物体重(单位:克)与脉搏率(单位:心跳次数/分钟)的对应数据,根据生物学常识和散点图得出与近似满足(为参数).令,,计算得,,.由最小二乘法得经验回归方程为,则的值为 ;为判断拟合效果,通过经验回归方程求得预测值,若残差平方和,则决定系数 .(参考公式:决定系数)
【答案】
【详解】因为,两边取对数可得,
又,,
依题意回归直线方程必过样本中心点,
所以,解得,所以,
又.
故答案为:;
4.(2024春·宁夏银川·一模)已知某水果种植基地苹果的种植面积(单位:公顷)与其产量(单位:吨)呈线性相关关系,小王准备承包一块苹果种植地,为了解市场行情,在该基地调查了5家果农,统计得到了苹果种植面积与其产量的数据如表所示:
种植面积/公顷 1 2 3 4 5
产量/吨 20 38 64 78 100
(1)求关于的线性回归方程;
(2)若苹果的销量等于产量,且所种苹果的总利润(单位:千元)满足,苹果种植面积,请根据(1)的结果预测要使得单位面积的苹果利润最大,小王应该种植多少公顷的苹果?
附:回归方程中斜率和截距的最小二乘估计公式分别为,.
【答案】(1)
(2)10
【详解】(1)由题意可得:,


则,
所以关于的线性回归方程为.
(2)由题意可知:单位面积的苹果利润为,
因为,
可知当,即时,单位面积的苹果利润取到最大值181千元/公顷,
所以小王应该种植10公顷的苹果.
5.(2024春·陕西·模拟预测)随着人们对节日仪式的愈加重视及送礼需求的不断增加,中国礼物经济市场规模逐年增大,下表为2019-2023年中国礼物经济市场规模的数据(万亿元),其中2019-2023年的年份代码分别为1-5.
年份代码x 1 2 3 4 5
中国礼物经济市场规模y/万亿元 0.944 1.091 1.157 1.226 1.300
(1)由上表数据可知可用线性回归模型拟合y与x的关系,请用相关系数加以说明;
(2)求y关于的回归方程.(系数精确到0.001)
参考数据:.
参考公式:相关系数,回归方程中斜率和截距的最小二乘估计公式分别为.
【答案】(1),说明见解析
(2)
【详解】(1),


因为与的相关系数近似为,趋近于1,说明与的线性相关程度相当强,
从而可以用线性回归模型拟合与的关系;
(2),

故.
6.(2024春·陕西西安·二模)某工厂用A,B两台机器生产同一种产品,产品按质量分为一级品和二级品,为了比较两台机器生产的产品质量,分别用两台机器各生产了100件产品,产品的质量情况统计如表:
一级品 二级品 合计
A机器 70 30 100
B机器 80 20 100
合计 150 50 200
(1)若用A,B两台机器各生产该产品5万件,用频率估计概率,试估算此次生产的一级品的数量有多少万件?
(2)能否有90%的把握认为A机器生产的产品质量与B机器生产的产品质量有差异?
附:,其中.
0.15 0.10 0.05
2.072 2.706 3.841
【答案】(1)
(2)没有90%的把握认为机器的产品质量与机器的产品质量有差异.
【详解】(1)根据题表中数据知,
机器生产的产品中一级品的频率是,
机器生产的产品中一级品的频率是;
用频率估计概率,估算此次生产的一级品的数量有万件.
答:估算此次生产的一级品的数量有万件。
(2)根据题表中数据可得,
因为,
所以没有90%的把握认为机器的产品质量与机器的产品质量有差异.
7.(2024春·陕西安康·模拟预测)作为一个基于大型语言处理模型的文字聊天工具,ChatGPT走红后,大模型的热度持续不减,并日渐形成了“千模大战”的局面.百度的文心一言 阿里的通义千问 华为的盘古 腾讯的混元以及科大讯飞的星火等多种大模型正如火如茶的发布上线.现有某大模型给出了会员有效期30天的两种不同费用,100次的使用费为6元,500次的使用费为24元.后台调取了购买会员的200名用户基本信息,包括个人和公司两种用户,统计发现购买24元的用户数是140,其中个人用户数比公司用户数少20,购买6元的公司用户数是个人用户数的一半.
(1)完成如下用户类别与购买意向的列联表;
购买6元 购买24元 总计
个人用户
公司用户
总计
(2)能否有的把握认为购买意向与用户类别有关?(运算结果保留三位小数)
附:,
临界值表如下:
0.10 0.05 0.025 0.01 0.005 0.001
2.706 3.841 5.024 6.635 7.879 10.828
【答案】(1)列联表见解析
(2)有的把握认为用户类别与购买意向有关系
【详解】(1)解:设购买24元的个人用户数为,则购买24元的公司用户数为,
设购买6元的公司用户数为,则购买6元的个人用户数为,
则有,解得,
所以用户类别与购买意向列联表如下:
购买6元 购买24元 总计
个人用户 40 60 100
公司用户 20 80 100
总计 60 140 200
(2)解:由(1)中列联表,可得

所以有的把握认为用户类别与购买意向有关系.
8.(2024春·江苏徐州·一模)某中学对该校学生的学习兴趣和预习情况进行长期调查,学习兴趣分为兴趣高和兴趣一般两类,预习分为主动预习和不太主动预习两类,设事件A:学习兴趣高,事件B:主动预习.据统计显示,,,.
(1)计算和的值,并判断A与B是否为独立事件;
(2)为验证学习兴趣与主动预习是否有关,该校用分层抽样的方法抽取了一个容量为的样本,利用独立性检验,计算得.为提高检验结论的可靠性,现将样本容量调整为原来的倍,使得能有99.5%的把握认为学习兴趣与主动预习有关,试确定的最小值.
附:,其中.
0.10 0.05 0.010 0.005 0.001
k 2.706 3.841 6.635 7.879 10.828
【答案】(1),,不相互独立
(2)
【详解】(1)由已知,

又因为,所以,
所以,
又,
所以,
所以A与B不为独立事件;
(2)假设原列联表为
兴趣高 兴趣不高 总计
主动预习
不太主动预习
总计
根据原数据有
若将样本容量调整为原来的倍,
则新的列联表为:
兴趣高 兴趣不高 总计
主动预习
不太主动预习
总计

,解得,
又,所以的最小值为.2024年高考数学二轮复习专题-统计案例
1. 样本数据16,24,14,10,20,30,12,14,40的中位数为( )
A. 14 B. 16 C. 18 D. 20
题型一:随机抽样、统计图表及样本估计总体
【典例例题】
例1.(2024春·吉林延边·一模)(多选)今年第5号台风“杜苏芮”于7月28日9时55分在福建晋江登陆,为1949年以来登陆福建的第二强台风,登陆后强度迅速减弱并一路北上影响黄淮、华北,给华北、黄淮等地带来较大范围的特大暴雨.华中地区某市受此次台风影响,最高气温同比有所下降,测得七天的最高气温分别是28,26,25,27,29,27,25(单位:℃),则( )
A.该组数据的极差为4 B.该组数据的众数为27
C.该组数据的中位数为27 D.该组数据的第70百分位数为28
例2.(2024春·河南开封·二模)(多选)为了解某地农村经济情况,对该地农户家庭年收入进行抽样调查,将农户家庭年收入的调查数据整理得到如下频率分布直方图:

根据此频率分布直方图,下面结论中正确的是( )
A.该地农户家庭年收入的极差为12
B.估计该地农户家庭年收入的75%分位数约为9
C.估计该地有一半以上的农户,其家庭年收入介于4.5万元至8.5万元之间
D.估计该地农户家庭年收入的平均值超过6.5万元
【变式训练】
1.(2024春·广东省东莞市一模)数据2,3,5,5,6,7,8,8,9,10的分位数为( )
A.6 B.7 C.8 D.7.5
2.(2024春·江西省模拟)一组数据按从小到大的顺序排列为2,4,m,12,16,17,若该组数据的中位数是极差的,则该组数据的第40百分位数是( )
A.4 B.5 C.6 D.9
3.(2024春·辽宁抚顺·一模)(多选)采购经理指数(PMI)是国际上通用的监测宏观经济走势的指标,具有较强的预测、预警作用.2023年12月31日,国家统计局发布了中国制造业PMI指数(经季节调整)图,如下图所示,则下列说法正确的是( )
A.图中前三个数据的平均值为
B.2023年四个季度的PMI指数中,第一季度方差最大
C.图中PMI指数的极差为
D.2023年PMI指数的分位数为
4.(2024春·贵州毕节·二模)某地区工会利用“健步行APP”开展健步走活动.为了解会员的健步走情况,工会在某天从系统中抽取了100名会员,统计了当天他们的步数(千步为单位),并将样本数据分为,,,…,,九组,整理得到如图所示的频率分布直方图.
(1)根据频率分布直方图,估计样本数据的70%分位数;
(2)据统计,在样本数据,,的会员中体检为“健康”的比例分别为,,,以频率作为概率,估计在该地区工会会员中任取一人,体检为“健康”的概率.
题型二:变量间的相关关系及回归方程
【典例例题】
例1.(2024春·浙江温州·二模)红旗淀粉厂2024年之前只生产食品淀粉,下表为年投入资金(万元)与年收益(万元)的8组数据:
10 20 30 40 50 60 70 80
12.8 16.5 19 20.9 21.5 21.9 23 25.4
(1)用模拟生产食品淀粉年收益与年投入资金的关系,求出回归方程;
(2)为响应国家“加快调整产业结构”的号召,该企业又自主研发出一种药用淀粉,预计其收益为投入的.2024年该企业计划投入200万元用于生产两种淀粉,求年收益的最大值.(精确到0.1万元)
附:①回归直线中斜率和截距的最小二乘估计公式分别为:,

161 29 20400 109 603

【变式训练】
1.(2024春·湖北省武汉市联考)对两个具有线性相关关系的变量x和y进行统计时,得到一组数据,通过这组数据求得回归直线方程为,则m的值为( )
A. 3 B. 5 C. 5.2 D. 6
2.(2024春·河北沧州·一模)(多选)下表是某地从2019年至2023年能源消费总量近似值(单位:千万吨标准煤)的数据表:
年份 2019 2020 2021 2022 2023
年份代号 1 2 3 4 5
能源消费总量近似值(单位:千万吨标准煤) 44.2 44.6 46.2 47.8 50.8
以为解释变量,为响应变量,若以为回归方程,则决定系数0.9298,若以为回归方程,则,则下面结论中正确的有( )
A.变量和变量的样本相关系数为正数
B.比的拟合效果好
C.由回归方程可准确预测2024年的能源消费总量
D.
4.(2024·四川巴中·一模)下图是某市2016年至2022年生活垃圾无害化处理量y(单位:万吨)与年份t的散点图.
(1)根据散点图推断变量y与t是否线性相关,并用相关系数加以说明;
(2)建立y关于t的回归方程(系数精确到0.01),预测2024年该市生活垃圾无害化处理量.
参考数据:
,,,.
参考公式:,;相关系数.
题型三:列联表与独立性检验
【典例例题】
例1.(2024春·黑龙江吉林·二模)恰逢盛世,风调雨顺.某稻米产地今秋获得大丰收,为促进当地某品牌大米销售,甲、乙两位驻村干部通过直播宣传销售所驻村生产的该品牌大米.通过在某时段100名顾客在观看直播后选择在甲、乙两位驻村干部的直播间(下简称甲直播间、乙直播间)购买的情况进行调查(假定每人只在一个直播间购买大米),得到以下数据:
网民类型 在直播间购买大米的情况 合计
在甲直播间购买 在乙直播间购买
本地区网民 50 5 55
外地区网民 30 15 45
合计 80 20 100
(1)依据小概率值的独立性检验,能否认为网民选择在甲、乙直播间购买大米与网民所处地区有关;
(2)用样本分布的频率分布估计总体分布的概率,若共有名网民在甲、乙直播间购买大米,且网民选择在甲、乙两个直播间购买大米互不影响,记其中在甲直播间购买大米的网民数为X,求使事件“”的概率取最大值时k的值.
附:,其中.
0.1 0.05 0.01 0.005
2.706 3.841 6.635 7.879
【变式训练】
1.(2024春·河南·一模)近年来,短视频作为以视频为载体的聚合平台,社交属性愈发突出,在用户生活中覆盖面越来越广泛,针对短视频的碎片化缺陷,将短视频剪接成长视频势必成为一种新的技能.某机构在网上随机对1000人进行了一次市场调研,以决策是否开发将短视频剪接成长视频的APP,得到如下数据:
青年人 中年人 老年人
对短视频剪接成长视频的APP有需求 200
对短视频剪接成长视频的APP无需求 150
其中的数据为统计的人数,已知被调研的青年人数为400.
(1)求的值;
(2)根据小概率值的独立性检验,分析对短视频剪接成长视频的APP的需求,青年人与中老年人是否有差异?
参考公式:,其中.
临界值表:
0.1 0.05 0.01 0.005 0.001
2.706 3.841 6.635 7.879 10.828
2.(2024春·山东淄博·一模)为了解居民体育锻炼情况,某地区对辖区内居民体育锻炼进行抽样调查.统计其中400名居民体育锻炼的次数与年龄,得到如下的频数分布表.
年龄 次数 [20,30) [30,40) [40,50) [50,60]
每周0~2次 70 55 36 59
每周3~4次 25 40 44 31
每周5次及以上 5 5 20 10
(1)若把年龄在的锻炼者称为青年,年龄在的锻炼者称为中年,每周体育锻炼不超过2次的称为体育锻炼频率低,不低于3次的称为体育锻炼频率高,根据小概率值的独立性检验判断体育锻炼频率的高低与年龄是否有关联;
(2)从每周体育锻炼5次及以上的样本锻炼者中,按照表中年龄段采用按比例分配的分层随机抽样,抽取8人,再从这8人中随机抽取3人,记这3人中年龄在与的人数分别为,求ξ的分布列与期望;
(3)已知小明每周的星期六、星期天都进行体育锻炼,且两次锻炼均在跑步、篮球、羽毛球3种运动项目中选择一种,已知小明在某星期六等可能选择一种运动项目,如果星期六选择跑步、篮球、羽毛球,则星期天选择跑步的概率分别为 ,求小明星期天选择跑步的概率.
参考公式:
附:
α 0.10 0.05 0.01 0.005 0.001
2.706 3.841 6.635 7.879 10.828
1.(2024春·广西南宁·一模)(多选)下列说法中,正确的是( )
A.一组数据的第40百分位数为12
B.若样本数据的方差为8,则数据的方差为2
C.已知随机变量服从正态分布,若,则
D.在独立性检验中,零假设为:分类变量和独立.基于小概率值的独立性检验规则是:当时,我们就推断不成立,即认为和不独立,该推断犯错误的概率不超过;当时,我们没有充分证据推断不成立,可以认为和独立
2.(2024春·山东淄博·一模)(多选)下列命题为真命题的是( )
A.若样本数据的方差为2,则数据的方差为17
B.一组数据8,9,10,11,12的第80百分位数是11.5
C.用决定系数比较两个模型的拟合效果时,若越大,则相应模型的拟合效果越好
D.以模型 去拟合一组数据时,为了求出经验回归方程,设,求得线性回归方程为,则c,k的值分别是和2
3.(2024春·广东广州·一模)某校数学建模兴趣小组收集了一组恒温动物体重(单位:克)与脉搏率(单位:心跳次数/分钟)的对应数据,根据生物学常识和散点图得出与近似满足(为参数).令,,计算得,,.由最小二乘法得经验回归方程为,则的值为 ;为判断拟合效果,通过经验回归方程求得预测值,若残差平方和,则决定系数 .(参考公式:决定系数)
4.(2024春·宁夏银川·一模)已知某水果种植基地苹果的种植面积(单位:公顷)与其产量(单位:吨)呈线性相关关系,小王准备承包一块苹果种植地,为了解市场行情,在该基地调查了5家果农,统计得到了苹果种植面积与其产量的数据如表所示:
种植面积/公顷 1 2 3 4 5
产量/吨 20 38 64 78 100
(1)求关于的线性回归方程;
(2)若苹果的销量等于产量,且所种苹果的总利润(单位:千元)满足,苹果种植面积,请根据(1)的结果预测要使得单位面积的苹果利润最大,小王应该种植多少公顷的苹果?
附:回归方程中斜率和截距的最小二乘估计公式分别为,.
5.(2024春·陕西·模拟预测)随着人们对节日仪式的愈加重视及送礼需求的不断增加,中国礼物经济市场规模逐年增大,下表为2019-2023年中国礼物经济市场规模的数据(万亿元),其中2019-2023年的年份代码分别为1-5.
年份代码x 1 2 3 4 5
中国礼物经济市场规模y/万亿元 0.944 1.091 1.157 1.226 1.300
(1)由上表数据可知可用线性回归模型拟合y与x的关系,请用相关系数加以说明;
(2)求y关于的回归方程.(系数精确到0.001)
参考数据:.
参考公式:相关系数,回归方程中斜率和截距的最小二乘估计公式分别为.
6.(2024春·陕西西安·二模)某工厂用A,B两台机器生产同一种产品,产品按质量分为一级品和二级品,为了比较两台机器生产的产品质量,分别用两台机器各生产了100件产品,产品的质量情况统计如表:
一级品 二级品 合计
A机器 70 30 100
B机器 80 20 100
合计 150 50 200
(1)若用A,B两台机器各生产该产品5万件,用频率估计概率,试估算此次生产的一级品的数量有多少万件?
(2)能否有90%的把握认为A机器生产的产品质量与B机器生产的产品质量有差异?
附:,其中.
0.15 0.10 0.05
2.072 2.706 3.841
7.(2024春·陕西安康·模拟预测)作为一个基于大型语言处理模型的文字聊天工具,ChatGPT走红后,大模型的热度持续不减,并日渐形成了“千模大战”的局面.百度的文心一言 阿里的通义千问 华为的盘古 腾讯的混元以及科大讯飞的星火等多种大模型正如火如茶的发布上线.现有某大模型给出了会员有效期30天的两种不同费用,100次的使用费为6元,500次的使用费为24元.后台调取了购买会员的200名用户基本信息,包括个人和公司两种用户,统计发现购买24元的用户数是140,其中个人用户数比公司用户数少20,购买6元的公司用户数是个人用户数的一半.
(1)完成如下用户类别与购买意向的列联表;
购买6元 购买24元 总计
个人用户
公司用户
总计
(2)能否有的把握认为购买意向与用户类别有关?(运算结果保留三位小数)
附:,
临界值表如下:
0.10 0.05 0.025 0.01 0.005 0.001
2.706 3.841 5.024 6.635 7.879 10.828
8.(2024春·江苏徐州·一模)某中学对该校学生的学习兴趣和预习情况进行长期调查,学习兴趣分为兴趣高和兴趣一般两类,预习分为主动预习和不太主动预习两类,设事件A:学习兴趣高,事件B:主动预习.据统计显示,,,.
(1)计算和的值,并判断A与B是否为独立事件;
(2)为验证学习兴趣与主动预习是否有关,该校用分层抽样的方法抽取了一个容量为的样本,利用独立性检验,计算得.为提高检验结论的可靠性,现将样本容量调整为原来的倍,使得能有99.5%的把握认为学习兴趣与主动预习有关,试确定的最小值.
附:,其中.
0.10 0.05 0.010 0.005 0.001
k 2.706 3.841 6.635 7.879 10.828

展开更多......

收起↑

资源列表