专题8.4 统计分析大题专项训练【六大题型】(举一反三)(人教A版2019选择性必修第三册)(含答案)2024-2025学年高二数学举一反三系列(人教A版2019选择性必修第三册)

资源下载
  1. 二一教育资源

专题8.4 统计分析大题专项训练【六大题型】(举一反三)(人教A版2019选择性必修第三册)(含答案)2024-2025学年高二数学举一反三系列(人教A版2019选择性必修第三册)

资源简介

专题 8.4 统计分析大题专项训练【六大题型】
【人教 A 版(2019)】
姓名:___________班级:___________考号:___________
题型一 相关系数的计算及应用
1.(24-25 高二下·全国·课堂例题)某企业坚持以市场需求为导向,合理配置生产资源,不断探索、改革销
售模式.下表是该企业每月生产的一种核心产品的产量 (件)与相应的生产总成本 (万元)的五组对照
数据:
产量 (件) 1 2 3 4 5
生产总成本 (万元) 3 7 8 10 12
试求 与 的相关系数,并利用相关系数说明 与 是否高度正相关.(结果保留两位小数)

( ) ( )
=1
参考公式: = .
( )2 ( )2
=1 =1
参考数据: 115 ≈ 10.7.
2.(2025·河南·一模)某景区试卖一款纪念品,现统计了该款纪念品的定价 (单位:元)与销量 (单位:
百件)的对应数据,如下表所示:
12 12.5 13 13.5 14
14 13 11 9 8
(1)求该纪念品定价的平均值 和销量的平均值 ;
(2)计算 与 的相关系数;
(3)由(2)的计算结果,判断能否用线性回归模型拟合 与 的关系,并说明理由.
5
参考数据: ( )( ) = 8,
64 ≈ 0.992.
=1 65

( ) ( )
=1
参考公式:相关系数 = .
( )2 ( )2
=1 =1
3.(23-24 高二下·江苏·课前预习)维尼纶纤维的耐热水性能的好坏可以用指标“缩醛化度”y 来衡量,这个
指标越高,耐热水性能也越好,而甲醛浓度是影响缩醛化度的重要因素,在生产中常用甲醛浓度 x(克/升)去
控制这一指标,为此必须找出它们之间的关系,现安排一批实验,获得如下数据.
甲醛
浓度 18 20 22 24 26 28 30
x
缩醛
化度 26.86 28.35 28.75 28.87 29.75 30.00 30.36
(y)
求样本相关系数 r 并判断它们的相关程度.
4.(2024 高二下·全国·专题练习)某贫困县为了响应国家精准扶贫的号召,特地承包了一块土地,已知土
地的使用面 (单位:亩)与相应的管理时间 (单位:月)的关系如表所示:
土地使用面积 (单位:亩) 1 2 3 4 5
管理时间 (单位:月) 8 11 14 24 23
作出散点图,判断管理时间 与土地使用面积 是否线性相关,并根据相关系数 说明相关关系的强弱.(若
| | ≥ 0.75,认为两个变量有较强的线性相关性, 的值精确到 0.001)
注:亩,我国市制土地面积单位,1 亩≈666.7 平方米.

( )( )
=1
参考公式: = .
( )2 ( )2
=1 =1
5
参考数据: = 16, ( )2 = 206, 515 ≈ 22.7.
=1
5.(23-24 高二下·陕西·阶段练习)某地经过多年的环境治理,已将荒山改造成了绿水青山,为估计一林区
某种树木的总材积量.随机选取了 10 棵这种树木,测量每棵树的根部横截面积(单位:m2)和材积量(单
位:m3),得到如下数据:

样本号 i 1 2 3 4 5 6 7 8 9 10

根部横截面
0.04 0.06 0.04 0.03 0.08 0.05 0.05 0.07 0.07 0.06 0.6
积 1
材积量 1 0.25 0.40 0.22 0.54 0.51 0.34 0.36 0.46 0.42 0.40 3.9
10 10 10
并计算得 2i = 0.038, 2i = 1.6158, i i = 0.2474.
i=1 i=1 i=1
(1)估计该林区这种树木平均一棵的根部横截面积与平均一棵的材积量;
(2)求该林区这种树木的根部横截面积与材积量的样本相关系数(精确到 0.01).

( 1 )( 1 )
=1
附:相关系数 = , 1.896 ≈ 1.377.
( 1 )2 ( 1 )2
=1 =1
题型二 线性回归分析
6.(24-25 高二下·全国·课后作业)随着经济的发展某地居民收入逐年增长,下表是该地某银行连续五年的
储蓄存款(年底余额):
年份 2013 2014 2015 2016 2017
储蓄存款 (千亿元) 5 6 7 8 10
为了研究计算的方便,工作人员将上表的数据进行了处理, = 2012, = 5得到下表:
时间代号 1 2 3 4 5
0 1 2 3 5
(1)求 关于 的经验回归方程;
(2)通过(1)中的方程,求出 关于 的经验回归方程;
(3)用所求经验回归方程预测到 2021 年年底,该银行储蓄存款可达多少?


附:对于经验回归方程 = + ,其中 = =1 , = .
2 2
=1
7.(24-25 高三下·安徽·阶段练习)某健身俱乐部研究会员每周锻炼时长与体重减少量的关系,随机抽取
10 名会员的数据如下:

会员序号 1 2 3 4 5 6 7 8 9 10

锻炼时长 (小时) 3 4 2 5 6 4 5 3 4 4 40
体重减少量 (千
1.0 1.5 1.0 2.0 2.5 1.8 2.0 1.0 1.6 2.0 16.4
克)
10 10 10
并计算得: 2 2 = 172, = 29.3, = 70.6
=1 =1 =1
(1)根据表格中的数据,可用一元线性回归模型刻画变量 与变量 之间的线性相关关系,请用相关系数加以
说明;
(2)求经验回归方程 = + (结果精确到 0.01 );
(3)该俱乐部推广了一项激励措施后,发现会员平均每周锻炼时长增加 2 个小时,实际观测到的平均体重减
少量增加了 0.8 千克.请结合回归分析结果,判断该回归模型是否具有参考价值,并给出合理的解释.


=1
(参考公式:相关系数 = ,回归方程 = + 中斜率和截距的最小二乘法估计公
2 2 2 2
=1 =1


式分别为 = =1 , = . 参考值: 2.404 ≈ 1.550)
2 2
=1
8.(24-25 高二下·全国·课后作业)某视频博主加入了视频推流活动,通过投入资金对视频进行推广.通过
一段时间的推广,统计得到如下数据:
推流投入资金 /千元 8 9 10 11 12
视频浏览量 /万次 9 10 10 12 14
(1)求 关于 的经验回归方程;
(2)已知该博主商品橱窗中销售商品的利润 (单位:千元)与推流投入 (单位:千元)、浏览量 (单位:
万次)满足关系式 = 0.1 (30 ) +10,利用(1)中经验回归方程估计该博主投入多少元时,能获得最大
净利润,并求最大净利润(净利润 = 利润-投入,结果保留整数).

( ) ( )
附: = =1 = =1 , = .
( )2 2 2
=1 =1
9.(24-25 高二下·全国·课堂例题)偏差是指个别测定值与测定的平均值之差,在成绩统计中,我们把某个
同学的某科考试成绩与该科平均分的差叫某科偏差(实际成绩 平均分 = 偏差).在某次考试成绩统计中,
某老师为了对学生数学偏差 (单位:分)与物理偏差 (单位:分)之间的关系进行分析,随机挑选了 8
位同学,得到他们的两科成绩偏差数据如下:
学生序号 1 2 3 4 5 6 7 8
数学偏差 20 15 13 3 2 5 10 18
物理偏差 6.5 3.5 3.5 1.5 0.5 0.5 2.5 3.5
(1)若 与 之间具有线性相关关系,求 关于 的回归直线方程;
(2)若该次考试数学平均分为 120 分,物理平均分为 91.5 分,试由(1)的结论预测数学成绩为 128 分的同学
的物理成绩.
8 8
参考数据和参考公式: = 324, 2 = 1256,
=1 =1

( )( )
= + =
=1 = =1 ,
回归直线方程为 ,其中 2 2 ( )2
=1 =1
= .
10.(24-25 高二下·全国·单元测试)如图所示的是某高校 2016 至 2022 年高考报名学生人数(单位:千人)
的折线图.
(1)由折线图看出,可用线性回归模型拟合 和 的关系,请用相关系数加以说明(精确到 0.01);
(2)建立 关于 的回归直线方程,并预测 2023 年该高校高考报名人数.
7 7
参考数据: = 54, ( )( ) = 21, 14 ≈ 3.74, ( )2 = 18.
=1 =1

( ) ( )
=1
参考公式:相关系数 = ,回归直线方程 = + 中的系数分别为 =
( )2 ( )2
=1 =1

( ) ( )
=1
, = .
( )2
=1
题型三 非线性回归分析
11.(23-24 高二下·山西·期中)某生产制造企业统计了近 10 年的年利润 (千万元)与每年投入的某种材
料费用 (十万元)的相关数据,作出如下散点图:
选取函数 = ( > 0, > 0)作为每年该材料费用 和年利润 的回归模型.若令 = ln , = ln , = ln ,
= ln ,则 = + ln ,得到相关数据如表所示:
10 10 10 10
2
=1 =1 =1 =1
31.5 15 15 49.5
(1)求出 与 的回归方程;
(2) 10计划明年年利润额突破 1 亿,则该种材料应至少投入多少费用?(结果保留到万元)参考数据:e ≈ 3.679,
3.6792 ≈ 13.535,3.6793 ≈ 49.795.
12.(23-24 高二下·湖北·期末)某乡村企业希望通过技术革新增加产品收益,根据市场调研,技术革新投
入经费 (单位:万元)和增加收益 (单位:万元)的数据如下表:
4 6 8 10 12
27 42 55 56 60
为了进一步了解技术革新投入经费 对增加收益 的影响,通过对表中数据进行分析,分别提出了两个回归
模型:① = + ,② = + .
(1)根据以上数据,计算模型①中 与 的相关系数 (结果精确到 0.01);
(2)若0.95 ≤ | | ≤ 1,则选择模型①;否则选择模型②.根据(1)的结果,试建立增加收益 关于技术革新
投入经费 的回归模型,并预测 = 16时 的值(结果精确到 0.01).

( )( )
附:i)回归直线 = + 的斜率、截距的最小二乘估计以及相关系数分别为: = =1 =
( )2
=1


( )( ) =1
=1
, = , =
2 ( )2 ( )2 =1 =1 =1
5
ii)参考数据:设 = , 2936 ≈ 54.18, 29360 ≈ 171.35, ≈ 2.78, ( )2 ≈ 1.33,
=1
5
( )( ) ≈ 29.91.
=1
13.(23-24 高二下·江西萍乡·期中)某研发小组为了解年研发资金投入量 (单位:亿元)对年销售额 (单
位:亿元)的影响,结合近 10 年的年研发资金投入量 和年销售额 的数据( = 1,2, 10),建立了两个
函数模型:① = + 2,② = e + ,其中 , , , 均为常数,e为自然对数的底数.设 = 2 , = ln
( = 1,2, ,10),经过计算得如下数据.
10 10 10
( 2 2 ) ( ) ( ) ( )
=1 =1 =1
20 66 770 200 14
10 10 10
( )2 ( )2 ( ) ( )
=1 =1 =1
460 4.20 3125000 0.308 21500
(1)设{ }和{ }的相关系数为 1,{ }和{ }的相关系数为 2,请从相关系数的角度,选择一个拟合程度更好
的模型.
(2)根据(1)中选择的模型及表中数据,建立 关于 的线性回归方程(系数精确到 0.01),根据线性回归方
程,若当年的销售额大致为e4亿元,则估计当年的研发资金投入量为多少亿元.

( ) ( )
=1
参考公式:相关系数 = ,
( )2 ( )2
=1 =1


线性回归直线 = + 中斜率和截距的最小二乘法估计参数分别为 = =1
2
, = .

=1
14.(2025·河北承德·模拟预测)某公司研制了一种对人畜无害的灭草剂,为了解其效果,通过实验,收集
到其不同浓度 (mol/L)与灭死率 的数据,得下表:
浓度 (mol/L) 10 12 10 10 10 8 10 6 10 4
灭死率 0.1 0.24 0.46 0.76 0.94
(1)以 为解释变量, 为响应变量,在 = + 和 = 1 + 2lg 中选一个作为灭死率 关于浓度 (mol/L)
的经验回归方程,不用说明理由;
(2)(i)根据(1)的选择结果及表中数据,求出所选经验回归方程;
(ii)依据(i)中所求经验回归方程,要使灭死率不低于0.8,估计该灭草剂的浓度至少要达到多少mol/L?
参考公式:对于一组数据( 1, 1),( 2, 2), ,( , ),其经验回归直线 = + 的斜率和截距的最小二

( ) ( )
乘法估计分别为 = =1 =1 = , = .
( )2 2 2
=1 =1
15.(24-25 高二下·吉林长春·阶段练习)《中共中央国务院关于全面推进乡村振兴加快农业农村现代化的
意见》,这是 21 世纪以来第18个指导“三农”工作的中央一号文件.文件指出,民族要复兴,乡村必振兴,要
大力推进数字乡村建设,推进智慧农业发展.某乡村合作社借助互联网直播平台进行农产品销售,众多网红
主播参与到直播当中,在众多网红直播中,统计了10名网红直播的观看人次 和农产品销售量
( = 1,2,3, ,10)的数据,得到如图所示的散点图.
(1)利用散点图判断, = + 和 = + ln 哪一个更适合作为观看人次 和销售量 的回归方程类型;(只
要给出判断即可,不必说明理由)
(2)对数据作出如下处理:得到相关统计量的值如表:
10 10 10 10
2( 2 )
=1 =1 =1 =1
9.4 30.3 2 366 6.6 439.2 66
1 10
其中令 = ln , = 10 . =1
根据(1)的判断结果及表中数据,求 (单位:千件)关于 (单位:十万次)的回归方程,并预测当观看
人次为280万人时的销售量;
参考数据和公式:ln2 ≈ 0.69,ln7 ≈ 1.95
附:对于一组数据( 1, 1)、( 2, 2)、 、( , ),其回归线 = + 的斜率和截距的最小二乘估计分别为:


= =1 2 , = .
=1
题型四 回归分析与其他知识综合
16.(2025·河南信阳·一模)2025 年春节假期,文旅市场火爆.文化和旅游部公布的数据显示;春节假期 8
天,全国国内出游 5.01 亿人次,同比增长 5.9%;国内出游总花费 6770.02 亿元,同比增长 7.0%.某景区的某
网红饮品小店统计了春节假期前 7 天的营业额 (单位:千元),得到 与 的数据如表所示:
第 天 1 2 3 4 5 6 7
1
营业额 7 9 10 12 16 19
1
(1)已知 与 有较强的线性相关关系,求 关于 的线性回归方程,并预测春节假期第 8 天的营业额;
(2)如果该天营业额大于 10(单位:千元),则该天“达标”,从表格中的 7 组数据中随机选 4 组,设 表示“达
标”的数据组数,求 的分布列和数学期望.


参考公式:在线性回归方程 = + 中, = =1 , = .
2 2
=1
17.(23-24 高二下·河北·阶段练习)由于人们健康意识的提升,运动爱好者人群不断扩大,运动相关行业
得到快速发展.某运动品牌专卖店从 2019 年至 2023 年的年销售额如下表:
年份 2019 2020 2021 2022 2023
年份编号 1 2 3 4 5
年销售额 /万元 30 35 45 60 80
(1)请根据表中的数据用最小二乘法求 与 的经验回归方程 = + ,并预测 2024 年该店的年销售额.
(2)该专卖店为了回馈广大消费者,推出了消费抽奖返现活动,规则如下:凡一次性消费满 500 元可抽奖 1
次,满 1000 元可抽奖 2 次.其中一次抽奖返现金额及概率如下表:
返现金额 50 100
2 1
概率
3 3
3 1
已知一位消费者一次性消费满 500 元的概率为4,满 1000 元的概率为4,求这位消费者抽奖返现金额 的分
布列与期望.

( ) ( )
附:经验回归方程 = + 中, = =1 = =1 , = .
( )2 2 2
=1 =1
18.(2025 高三上·全国·专题练习)数独是源自 18 世纪瑞士的一种数学游戏,玩家需要根据9 × 9盘面上的
已知数字,推理出所有剩余空格的数字,并满足每一行、每一列、每一个粗线宫(3 × 3)内的数字均含 1~
9,且不重复.数独爱好者小明打算报名参加“丝路杯”全国数独大赛初级组的比赛.
1
参考数据: = 1
7 7
2 7 2
=1 =1
1750 0.37 0.55
参考公式:对于一组数据( 1, 1),( 2, 2), ,( , ),其经验回归方程 = + 的斜率和截距的最小二


乘估计分别为 = =1 , = .
2 2
=1
(1)赛前小明进行了一段时间的训练,每天解题的平均速度 y(秒/题)与训练天数 x(天)有关,经统计得到
如下数据:
x(天) 1 2 3 4 5 6 7
y(秒/题) 910 800 600 440 300 240 210
现用 = + 作为回归方程模型,请利用表中数据,求出该回归方程;(用分数表示)
(2)小明和小红玩“对战赛”,每局两人同时开始解一道数独题,先解出题的人获胜,不存在平局,两人约定
2
先胜 3 局者赢得比赛.若小明每局获胜的概率为3,且各局之间相互独立,设比赛 X 局后结束,求随机变量
X 的分布列及均值.
19.(23-24 高二下·内蒙古乌兰察布·期末)水果店的销售额与所售水果的价格、质量及该店被附近居民的
认可度密不可分.已知某水果店于 2023 年 1 月开张,前 6 个月的销售额(单位:万元)如下表所示:
1 2 3 4 5 6
月份
月 月 月 月 月 月
时间代码 1 2 3 4 5 6
销售额
2.0 4.0 5.2 6.1 6.8 7.4
(单位:万元)
(1)根据题目信息, = + 与 = + ln 哪一个更适合作为销售额 关于时间 的回归方程类型?(给出
判断即可,不必说明理由);
(2)根据(1)的判断结果,求出销售额 关于时间 的回归方程.(注:数据保留整数);
(3)为进一步了解该水果店的销售情况,从前 6 个月中任取 3 个月进行分析, 表示取到的 3 个月中每月销售
额不低于 5 万元的月份个数,求随机变量 的分布列和数学期望.
6 6 6 6
参考公式与数据: ln ≈ 6.6, ln ≈ 41.1, (ln )2 ≈ 9.4, = 128.4,
=1 =1 =1 =1
6 6
= 21, = 31.5
=1 =1
样本数据( , )( = 1,2, , )的线性回归方程 = + 的斜率和截距的最小二乘法估计分别为 =

( ) ( )
=1 = =1 , = .
( )2 2 2
=1 =1
20.(23-24 高二下·黑龙江大庆·期末)某学校为倡导全体学生为特困学生捐款,举行“一元钱,一片心,诚
信用水”活动,学生在购水处每领取一瓶矿泉水,便自觉向捐款箱中至少投入一元钱,现统计了连续 5 天的
售出和收益情况,如下表:
售出水量 (单位:箱) 7 6 6 5 6
收益 (单位:元) 165 142 148 125 150
(1)求收益 关于售出水量 的回归直线,并计算每天售出 8 箱水时预计收益是多少元?

5 5
附: = =1 , = , = 6, = 146, = 4420, 2 = 182
2 2 =1 =1
=1
(2)期中考试以后,学校决定将诚信用水的收益,以奖学金的形式奖励给品学兼优的特困生,规定:特困生
考入年级前 200 名,获一等奖学金 500 元;考入年级前 201~500 名,获二等奖学金 300 元;考入年级 501
. 2 1名以后的特困生不获得奖学金甲 乙两名学生获一等奖学金的概率均为5,获二等奖学金的概率均为3,不获
4
得奖学金的概率均为15.
①在学生甲获得奖学金的条件下,求他获得一等奖学金的概率;
②已知甲 乙两名学生获得哪个等第的奖学金是相互独立的,求甲 乙两名学生所获得奖学金总金额 的分布
列及数学期望.
题型五 独立性检验的实际应用
21.(24-25 高二下·河南驻马店·阶段练习)为了解学生性别与掌握消防安全知识情况的关系,某校组织了
消防安全知识测试,在高二年级中随机抽取 600 名学生统计其测试成绩,如下表(单位:人):
测试
良好 不够良好 总计
成绩性别
男生 150 300
女生 100
总计 350 600
(1)将上表中数据补充完整;
(2)从该校高二年级的学生中有放回地随机抽取 2 次,每次抽取 1 名学生,以频率作为概率,估计这 2 次抽
取的学生的测试成绩全都良好的概率;
(3)试问是否有 99.9%的把握判断消防安全知识测试成绩与性别有关?
2 = ( )
2
附: ( + )( + )( + )( + ), = + + + .
0.100 0.010 0.001
2.706 6.635 10.828
22.(2025·甘肃·一模)为了解高一学生整理数学错题与提高数学成绩的相关性,某小组通过随机抽样,获
得了每天整理错题和未每天整理错题的各 20 名学生 3 次数学考试成绩的平均分,绘制了如图 1,2 的频率
分布直方图,并且已知高一学生 3 次数学考试成绩的总体均分为 115 分.
(1)依据频率分布直方图,完成以下2 × 2列联表:
成绩不低于总体均分 成绩低于总体均分 合计
每天整理错题
未每天整理错题
合计
(2)依据小概率值 = 0.01的独立性检验,分析数学成绩不低于总体均分是否与每天整理数学错题有关.
2
附: 2 = ( )( + )( + )( + )( + )
0.10 0.01 0.001
2.706 6.635 10.828
23.(24-25 高二下·辽宁本溪·阶段练习)近年来,食品添加剂泛滥引起消费者关注,某媒体对消费者在购
买预包装食品时是否关注配料表进行调查,调查了 100 名男性消费者与 100 名女性消费者,关注配料表的
消费者共有 80 人,其中女性 30 人.
(1)用2 × 2列联表表示上述数据;
(2)是否有 99%的把握认为消费者购买预包装食品时是否关注配料表与性别有关?
( )2
附: 2 = ( + )( + )( + )( + ),其中 = + + + .
= ( 2 ≥ ) 0.1 0.05 0.025 0.010
2.706 3.841 5.024 6.635
24.(24-25 高二下·河南·阶段练习)某地区为了评估新课改对学生成绩的影响,对两个程度相近的学校的
高一年级的学生进行为期一个学期的实验.甲校高一年级采用新课改教学方法,乙校高一年级采用传统教学
方法.学期末,对两个学校的高一年级的学生期末考试成绩进行了分析,成绩分为优秀(550 分及以上)和
非优秀(550 分以下)两个等级,以下是实验结果的列联表:
成绩
学校 合计
优秀 非优秀
甲校 150
乙校 200
合计 270 400
(1)请根据以上信息,完成列联表;
(2)根据列联表中的数据,使用卡方检验判断是否有 99.5%的把握认为“推广新课改与成绩是否优秀”有关?
参考数据:
( 2 > 0) 0.10 0.05 0.010 0.005
0 2.706 3.841 6.635 7.879
2
2 = ( )( + )( + )( + )( + ),其中, 是总样本数.
25.(24-25 高二下·辽宁抚顺·开学考试)某校在两个班级进行教学方式对比试验,两个月后进行了一次检
测,试验班与对照班成绩统计如下表所示(单位:人):
80 分及 80 分以上 80 分以下 总计
实验班 35 15 50
对照班 20 m 50
总计 55 45 n
(1)求 m,n;
(2)根据表中数据回答:有99%的把握认为“教学方式与成绩有关系”吗?
总计
+

+
+

+
计 + + +
附:1.2 × 2列联表: 记 = + + + .
2
2. 2计算公式: 2 = ( )( + )( + )( + )( + )
3.常用的显著水平 以及相应的分位数 如下表所示.
= ( 2
0.1 0.05 0.01 0.005 0.001
≥ )
k 2.706 3.841 6.635 7.879 10.828
题型六 独立性检验与其他知识综合
26.(24-25 高二下·安徽亳州·阶段练习)随着科技的进步,近年来,我国新能源汽车产业迅速发展,各大
品牌新能源汽车除了靠不断提高汽车的性能和质量来提升品牌竞争力,在广告投放方面的花费也是逐年攀
升.小赵同学对某品牌新能源汽车近 5 年的广告费投入(单位:亿元)进行了统计,具体数据见下表:
年份代号 1 2 3 4 5
广告费投入 4.8 5.6 6.2 7.6 8.8
并随机调查了 200 名市民对该品牌新能源汽车的认可情况,得到的部分数据见下表:
认可 不认可
50 岁以下市民 70 30
50 岁以上市民 60 40
(1)求广告费投入 与年份代号 之间的线性回归方程;
(2)依据小概率值 = 0.10的独立性检验,能否认为市民的年龄与对该品牌新能源汽车的认可度有关?

( ) ( )
附:①回归直线中 = + , = =1 , = ;
( )2
=1
2
② 2 = ( )( + )( + )( + )( + ),其中 = + + + .
( 2 ≥ 0)0.15 0.10 0.05 0.025 0.010 0.065 0.001
0 2.072 2.706 3.841 5.024 6.635 7.879 10.828
27.(24-25 高二下·江西·阶段练习)某商场为改进服务质量,在进场购物的顾客中随机抽取了 100 人进行
问卷调查.调查后,就顾客购物体验的满意度统计如下:
满意 不满意 合计
男性 30 20 50
女性 40 10 50
合计 70 30 100
(1)请根据2 × 2列联表,试判断是否有95%的把握认为顾客购物体验的满意度与性别有关;
(2)根据满意度利用分层随机抽样的方法从男性顾客中随机抽取 5 人,再从这 5 人中选出 2 人进行深入交流,
记这 2 人中购物体验填写满意的人数为 ,求随机变量 的分布列及数学期望.
( )2
附参考公式: 2 = ( + )( + )( + )( + ),其中 = + + + .
当 2 ≤ 2.706时,没有充分的证据判断变量 , 有关联,可以认为变量 , 是没有关联的;
当 2 > 2.706时,有90%的把握判断变量 , 有关联;
当 2 > 3.841时,有95%的把握判断变量 , 有关联;
当 2 > 6.635时,有99%的把握判断变量 , 有关联.
28.(24-25 高二下·贵州遵义·阶段练习)某餐馆 2024 年 12 月份共有 800 个线上外卖订单,其中好评订单
有 600 个,其余均为非好评订单.为了提升菜品品质,增加营业额,该餐馆在 2025 年 1 月份更换了厨师,更
换厨师后该餐馆 2025 年 1 月份共有 2000 个线上外卖订单,其中好评订单有 1600 个,其余均为非好评订单.
(1)根据统计数据,完成下列2 × 2列联表,并判断是否有99%的把握认为该餐馆订单的好评率与更换厨师有
关联.
好评 非好评 合计
更换厨师前
更换厨师后
合计
(2)现从更换厨师前的订单中按好评和非好评,按比例用分层随机抽样法抽取 8 个订单进行电话回访,再从
这 8 个订单中随机抽取 3 个订单发放新品品尝券并让顾客评价,记抽取的 3 个订单中好评的订单个数为 ,
求 的分布列和数学期望.
(3)用样本频率估计总体概率,现从更换厨师后的所有订单中随机抽取 100 个订单,记其中好评的订单个数
为 ,求当事件“ = ”的概率最大时 的值.
2
附: 2 = ( )( + )( + )( + )( + ),其中 = + + + .
= ( 2 ≥ ) 0.1 0.05 0.01 0.005
2.706 3.841 6.635 7.879
29.(24-25 高二下·江西南昌·阶段练习)近期,流感在某小学肆意传播.流感病毒主要在学生之间传染,低
年龄段(一、二年级)的学生感染情况相对较多.病毒进入人体后存在潜伏期,潜伏期指病原体侵入人体至
最早出现临床症状的这段时间,潜伏期越长,传染给其他同学的可能性越高.学校对 300 个感染流感病例的
潜伏期(单位:天)进行调查,统计得出潜伏期的平均数为 2,方差0.92,若把超过 3 天的潜伏期视为长潜
伏期,按照年级统计样本,得到如下列联表:
年龄/人数 长潜伏期 非长潜伏期
低年龄段(一、二年级) 40 100
高年龄段(三~六年级) 30 130
(1)是否有 95%的把握认为“长潜伏期”与年级有关?
(2)假设潜伏期 服从正态分布 ( , 2),其中 近似样本平均数 , 2近似为样本方差 2
(i)学校现在对有流感症状学生的密切接触者一律要求隔离 5 天,请用概率知识解释其合理性.
(ii)以题目中的样本估计概率,设 800 个病例中恰有 ( ∈ )个属于“长潜伏期”的概率是 ( ),当 为何
值时, ( )取最大值.
( )2
(附: 2 = ( + )( + )( + )( + ), = + + + )
( 2 ≥ 0) 0.10 0.05 0.010
0 2.706 3.841 6.635
若 ( , 2),则 ( < ≤ + ) = 0.6826, ( 2 < ≤ + 2 ) = 0.9544, ( 3 < ≤ + 3 )
= 0.9974.
7075
参考数据:2254 ≈ 3.13
8075 9075
,2254 ≈ 3.58,2254 ≈ 4.03.
30.(24-25 高二下·江西宜春·阶段练习)随着互联网发展,网络已成为人们日常学习、工作和生活不可或
缺的部分,互联网在带给人们生活便捷与高效工作的同时,网络犯罪也日益增多,为了防范网络犯罪与网
络诈骗,学校举办“网络安全宣传倡议”活动.某学校从全体学生中随机抽取了 400 人对“网络安全宣传倡议”
的了解情况进行问卷调查,统计结果如下表所示:
(1)根据所提供的数据,完成2 × 2列联表,并依据小概率值 = 0.005的独立性检验,能否认为对“网络安全
宣传倡议”的了解情况与性别有关?
男 女 合计
了解 150 240
不了解 90
合计
2
参考公式: 2 = ( )( + )( + )( + )( + ), = + + + .
参考数据:
0.10 0.05 0.010 0.005
2.706 3.841 6.635 7.879
(2)对了解“网络安全宣传倡议”的人按性别用比例分配的分层抽样的方法抽取 8 人,再从这 8 人中随机抽取 3
人,记 为抽取的 3 人中女生的人数,求 的分布列和数学期望.专题 8.4 统计分析大题专项训练【六大题型】
【人教 A 版(2019)】
姓名:___________班级:___________考号:___________
题型一 相关系数的计算及应用
1.(24-25 高二下·全国·课堂例题)某企业坚持以市场需求为导向,合理配置生产资源,不断探索、改革销
售模式.下表是该企业每月生产的一种核心产品的产量 (件)与相应的生产总成本 (万元)的五组对照
数据:
产量 (件) 1 2 3 4 5
生产总成本 (万元) 3 7 8 10 12
试求 与 的相关系数,并利用相关系数说明 与 是否高度正相关.(结果保留两位小数)

( ) ( )
=1
参考公式: = .
( )2 ( )2
=1 =1
参考数据: 115 ≈ 10.7.
【解题思路】根据公式代入计算即可.
1+2+3+4+5
【解答过程】解: = 5 = 3,
= 3+7+8+10+125 = 8,
5
( )2 == (1 3)2 + (2 3)2 + (3 3)2 + (4 3)2 + (5 3)2 = 10,
=1
5
( )2 = (3 8)2 + (7 8)2 + (8 8)2 + (10 8)2 + (12 8)2 = 46,
=1
5
( ) ( )
=1
= (1 3) × (3 8) + (2 3) × (7 8) + (3 3) × (8 8) + (4 3) × (10 8) + (5 3) × (12 8)
= 21 ,
21
故相关系数 = ≈ 0.9810× 46 ,
∵ ≈ 0.98 > 0.8,
∴ 与 高度正相关.
2.(2025·河南·一模)某景区试卖一款纪念品,现统计了该款纪念品的定价 (单位:元)与销量 (单位:
百件)的对应数据,如下表所示:
12 12.5 13 13.5 14
14 13 11 9 8
(1)求该纪念品定价的平均值 和销量的平均值 ;
(2)计算 与 的相关系数;
(3)由(2)的计算结果,判断能否用线性回归模型拟合 与 的关系,并说明理由.
5
参考数据: ( )( ) = 8,
64 ≈ 0.992.
=1 65

( ) ( )
=1
参考公式:相关系数 = .
( )2 ( )2
=1 =1
【解题思路】(1)根据已知数据直接求平均值即可;
5 5
(2)分别求出 ( )2和 ( 2 ) ,再代入公式即可求解;
=1 =1
(3)根据相关系数的绝对值大于 0.75 且非常接近 1 判断即可.
1 1
【解答过程】(1)由题可知 = 5(12 + 12.5 + 13 + 13.5 + 14) = 13, = 5(14 + 13 + 11 + 9 + 8) = 11;
5 5
(2)计算得 ( )2 2 = 2.5, ( ) = 26,
=1 =1
5
( ) ( )
=1 8
故 = 5 5 = ≈ 0.992;
( 65 )2 ( )2
=1 =1
(3)由(2)可知, 与 的相关系数的绝对值近似为 0.992,大于 0.75 且非常接近 1,
说明 与 的线性相关性很强,从而可以用线性回归模型拟合 与 之间的关系.
3.(23-24 高二下·江苏·课前预习)维尼纶纤维的耐热水性能的好坏可以用指标“缩醛化度”y 来衡量,这个
指标越高,耐热水性能也越好,而甲醛浓度是影响缩醛化度的重要因素,在生产中常用甲醛浓度 x(克/升)去
控制这一指标,为此必须找出它们之间的关系,现安排一批实验,获得如下数据.
甲醛
浓度 18 20 22 24 26 28 30
x
缩醛 26.86 28.35 28.75 28.87 29.75 30.00 30.36
化度
(y)
求样本相关系数 r 并判断它们的相关程度.
【解题思路】根据题意列出表格,并结合相关系数公式求出 ,从而可求解.
【解答过程】列表如下
i 2 2
1 18 26.86 324 721.459 6 483.48
2 20 28.35 400 803.722 5 567
3 22 28.75 484 826.562 5 632.5
4 24 28.87 576 833.476 9 692.88
5 26 29.75 676 885.062 5 773.5
6 28 30.00 784 900 840
7 30 30.36 900 921.729 6 910.80
∑ 168 202.94 4 144 5892.013 6 4 900.16
= 1687 = 24
202.94
, = 7 ,
7
7 4900.16 7×24× 202.94 =1
则 =
7
7 7 = 2 ≈ 0.96.
∑ 2 7 2 ∑ 2 7 2 4144 7×242 5892.0136 7×
202.94
7
=1 =1
由此可知,甲醛浓度与缩醛化度之间有很强的正线性相关关系.
4.(2024 高二下·全国·专题练习)某贫困县为了响应国家精准扶贫的号召,特地承包了一块土地,已知土
地的使用面 (单位:亩)与相应的管理时间 (单位:月)的关系如表所示:
土地使用面积 (单位:亩) 1 2 3 4 5
管理时间 (单位:月) 8 11 14 24 23
作出散点图,判断管理时间 与土地使用面积 是否线性相关,并根据相关系数 说明相关关系的强弱.(若
| | ≥ 0.75,认为两个变量有较强的线性相关性, 的值精确到 0.001)
注:亩,我国市制土地面积单位,1 亩≈666.7 平方米.

( )( )
=1
参考公式: = .
( )2 ( )2
=1 =1
5
参考数据: = 16, ( )2 = 206, 515 ≈ 22.7.
=1
【解题思路】根据表格数据画出散点图,即可判断线性相关性,再根据所给公式计算出相关系数即可.
【解答过程】根据表格数据可得散点图如图所示.
由散点图可知,管理时间 与土地使用面积 线性相关.
1+2+3+4+5
依题意, = 5 = 3,又 = 16,
5
( )( ) = ( 2) × ( 8) + ( 1) × ( 5) +0 × ( 2) +1 × 8 + 2 × 7 = 43,
=1
5
( )2 = (1 3)2 + (2 3)2 + (3 3)2 + (4 3)2 + (5 3)2 = 10,
=1
5
( )2 = 206,
=1
5
( )( )
=1 43 43
= 43则 5 5 = = ≈ 45.4 ≈ 0.947.
( )2 ( )2
10×206 2 515
=1 =1
因为0.947 > 0.75,所以管理时间 与土地使用面积 线性相关性较强.
5.(23-24 高二下·陕西·阶段练习)某地经过多年的环境治理,已将荒山改造成了绿水青山,为估计一林区
某种树木的总材积量.随机选取了 10 棵这种树木,测量每棵树的根部横截面积(单位:m2)和材积量(单
位:m3),得到如下数据:

样本号 i 1 2 3 4 5 6 7 8 9 10

根部横截面
0.04 0.06 0.04 0.03 0.08 0.05 0.05 0.07 0.07 0.06 0.6
积 1
材积量 1 0.25 0.40 0.22 0.54 0.51 0.34 0.36 0.46 0.42 0.40 3.9
10 10 10
并计算得 2i = 0.038, 2i = 1.6158, i i = 0.2474.
i=1 i=1 i=1
(1)估计该林区这种树木平均一棵的根部横截面积与平均一棵的材积量;
(2)求该林区这种树木的根部横截面积与材积量的样本相关系数(精确到 0.01).

( 1 )( 1 )
=1
附:相关系数 = , 1.896 ≈ 1.377.
( 1 )2 ( 1 )2
=1 =1
【解题思路】(1)计算出样本的一棵根部横截面积的平均值及一棵材积量平均值,即可估计该林区这种树
木平均一棵的根部横截面积与平均一棵的材积量;
(2)代入题给相关系数公式去计算即可求得样本的相关系数值;
【解答过程】(1)样本中 10 0.6棵这种树木的根部横截面积的平均值 = 10 = 0.06,
3.9
样本中 10 棵这种树木的材积量的平均值 = 10 = 0.39,
据此可估计该林区这种树木平均一棵的根部横截面积为0.06m2,
平均一棵的材积量为0.39m3.
10 10
( i )( i ) i i 10
i=1 i=1
(2)(2) = 10 10 = 10 10
( i )2 ( i )2 i2 10 2 i2 10 2
i=1 i=1 i=1 i=1
0.2474 10×0.06×0.39 0.0134
= = ≈ 0.0134(0.038 10×0.062)(1.6158 10×0.392) 0.01377 ≈ 0.970.0001896 ,
则 ≈ 0.97.
题型二 线性回归分析
6.(24-25 高二下·全国·课后作业)随着经济的发展某地居民收入逐年增长,下表是该地某银行连续五年的
储蓄存款(年底余额):
年份 2013 2014 2015 2016 2017
储蓄存款 (千亿元) 5 6 7 8 10
为了研究计算的方便,工作人员将上表的数据进行了处理, = 2012, = 5得到下表:
时间代号 1 2 3 4 5
0 1 2 3 5
(1)求 关于 的经验回归方程;
(2)通过(1)中的方程,求出 关于 的经验回归方程;
(3)用所求经验回归方程预测到 2021 年年底,该银行储蓄存款可达多少?


附:对于经验回归方程 = + ,其中 = =1 , = .
2 2
=1
【解题思路】(1)利用最小二乘法求出 z 关于 t 的线性回归方程;
(2)通过 = 2012, = 5代入,把 z 关于 t 的线性回归方程化成 y 关于 x 的回归方程;
(3)利用回归方程代入求值.
【解答过程】(1)设 关于 的线性回归方程为 = + ,
= 1 1经计算得: 5(1 + 2 + 3 + 4 + 5) = 3, = 5(0 + 1 + 2 + 3 + 5) = 2.2,
5
= 1 × 0 + 2 × 1 + 3 × 2 + 4 × 3 + 5 × 5 = 45,
=1
5
2 = 12 + 22 + 32 + 42 + 52 = 55,
=1
∴ = 45 5×3×2.255 5×32 = 1.2, = = 2.2 1.2 × 3 = 1.4,
∴ = 1.2 1.4;
(2)将 = 2012, = 5代入 = 1.2 1.4得: 5 = 1.2 × ( 2012) 1.4,
即 = 1.2 2410.8;
(3) ∵ = 2021时, = 1.2 × 2021 2410.8 = 14.4(千亿元),
∴ 预测到2021年年底,该银行储蓄存款额可达14.4千亿元.
7.(24-25 高三下·安徽·阶段练习)某健身俱乐部研究会员每周锻炼时长与体重减少量的关系,随机抽取
10 名会员的数据如下:

会员序号 1 2 3 4 5 6 7 8 9 10

锻炼时长 (小时) 3 4 2 5 6 4 5 3 4 4 40
体重减少量 (千
1.0 1.5 1.0 2.0 2.5 1.8 2.0 1.0 1.6 2.0 16.4
克)
10 10 10
并计算得: 2 = 172, 2 = 29.3, = 70.6
=1 =1 =1
(1)根据表格中的数据,可用一元线性回归模型刻画变量 与变量 之间的线性相关关系,请用相关系数加以
说明;
(2)求经验回归方程 = + (结果精确到 0.01 );
(3)该俱乐部推广了一项激励措施后,发现会员平均每周锻炼时长增加 2 个小时,实际观测到的平均体重减
少量增加了 0.8 千克.请结合回归分析结果,判断该回归模型是否具有参考价值,并给出合理的解释.


=1
(参考公式:相关系数 = ,回归方程 = + 中斜率和截距的最小二乘法估计公
2 2 2 2
=1 =1


式分别为 = =1 , = . 参考值: 2.404 ≈ 1.550)
2 2
=1
【解题思路】(1) 利用相关系数公式直接代入数据求解即可;


(2) 利用公式 = =1 ,先求一次项系数,再利用经过样本中心点 , ,可求出 = ,从而可
2 2
=1
得回归直线方程;
(3)利用一次项系数 可解释会员平均每周锻炼时长增加 2 个小时,预测平均体重减少量增加 0.84 千克,与
实际效果相当,说明具有参考价价.
40
【解答过程】(1)由表可知: = 10 = 4 =
16.4
, 10 = 1.64


=1 70.6 10×4×1.64 5
所以 = = = ≈ 5 ≈ 0.93
2 2 2 2 172 10×4
2× 29.3 10×1.642 12× 2.404 5.37
,

=1 =1
因为 与 的相关系数 ≈ 0.93接近 1,
所以 与 的线性相关程度很高,可用线性回归模型拟合 与 的关系.


(2)由题可知: = =1 70.6 10×4×1.64 5 = = ≈ 0.42
2 2 172 10×4
2 12
=1
= = 1.64 512 × 4 ≈ 0.03,
所以 = 0.42 0.03
(3)由(2)可知:根据线性回归方程预测,会员平均每周锻炼时长增加 2 个小时,
预测平均体重减少量增加 0.84 千克,与实际增加值 0.8 千克较为接近,
因此实际结果与预测结果基本一致,说明该回归模型具有参考价值;
造成一定差异的原因可能是由于样本数据过少,
或者造成体重减少的原因还受其他因素影响,
比如睡眠,饮食、锻炼强度以及效果等.
8.(24-25 高二下·全国·课后作业)某视频博主加入了视频推流活动,通过投入资金对视频进行推广.通过
一段时间的推广,统计得到如下数据:
推流投入资金 /千元 8 9 10 11 12
视频浏览量 /万次 9 10 10 12 14
(1)求 关于 的经验回归方程;
(2)已知该博主商品橱窗中销售商品的利润 (单位:千元)与推流投入 (单位:千元)、浏览量 (单位:
万次)满足关系式 = 0.1 (30 ) +10,利用(1)中经验回归方程估计该博主投入多少元时,能获得最大
净利润,并求最大净利润(净利润 = 利润-投入,结果保留整数).

( ) ( )
附: = =1 = =1 , = .
( )2 2 2
=1 =1
【解题思路】(1)根据题中数据和公式求 , ,即可得回归方程;
(2)根据(1)中回归方程和题中公式求利润 = ( )的解析式,结合二次函数最值分析求解.
【解答过程】(1)由所给数据可得 = 10, = 11,
5 5
则 = 72 + 90 + 100 + 132 + 168 = 562, 2 = 64 + 81 + 100 + 121 + 144 = 510,
=1 =1
= 562 5×10×11可得 510 5×102 = 1.2, = 11 1.2 × 10 = 1,
所以 关于 的回归方程为 = 1.2 1.
(2)若推流投入 千元时,净利润估计为
( ) = 0.1 (30 ) +10 = (0.12 0.1)(30 ) +10 = 0.12 2 +2.7 + 7,
2.7
当 = 2×( 0.12) = 11.25时, ( )取得最大值,最大值为 22.1875 千元.
即该博主推流投入为 11250 元时,可以获得最大净利润 22188 元.
9.(24-25 高二下·全国·课堂例题)偏差是指个别测定值与测定的平均值之差,在成绩统计中,我们把某个
同学的某科考试成绩与该科平均分的差叫某科偏差(实际成绩 平均分 = 偏差).在某次考试成绩统计中,
某老师为了对学生数学偏差 (单位:分)与物理偏差 (单位:分)之间的关系进行分析,随机挑选了 8
位同学,得到他们的两科成绩偏差数据如下:
学生序号 1 2 3 4 5 6 7 8
数学偏差 20 15 13 3 2 5 10 18
物理偏差 6.5 3.5 3.5 1.5 0.5 0.5 2.5 3.5
(1)若 与 之间具有线性相关关系,求 关于 的回归直线方程;
(2)若该次考试数学平均分为 120 分,物理平均分为 91.5 分,试由(1)的结论预测数学成绩为 128 分的同学
的物理成绩.
8 8
参考数据和参考公式: = 324, 2 = 1256,
=1 =1

( )( )
=1 =1
= + = = ,回归直线方程为 ,其中 2 2 ( )2
=1 =1
= .
【解题思路】(1)利用最小二乘法即可求解,
(2)代入即可求解.
【解答过程】(1)由题意可得,
= 1 5[20 + 15 + 13 + 3 + 2 + ( 5) + ( 10) + ( 18)] × 8 = 2,
= 1 9[6.5 + 3.5 + 3.5 + 1.5 + 0.5 + ( 0.5) + ( 2.5) + ( 3.5)] × 8 = 8,
8
8 324 8× 5 × 9
= =1 = 2 88 2 =
1

2 8 2 1256 8×
5 4
2
=1
所以 = = 9 1 5 18 4 × 2 = 2,
1 1
故回归直线方程为 = 4 + 2.
(2)由题意,设该同学的物理成绩为 ,则物理偏差为 91.5.
而数学偏差为128 120 = 8,
1 1
所以 91.5 = 4 × 8 + 2,
解得 = 94,
所以,可以预测这位同学的物理成绩为 94 分.
10.(24-25 高二下·全国·单元测试)如图所示的是某高校 2016 至 2022 年高考报名学生人数(单位:千人)
的折线图.
(1)由折线图看出,可用线性回归模型拟合 和 的关系,请用相关系数加以说明(精确到 0.01);
(2)建立 关于 的回归直线方程,并预测 2023 年该高校高考报名人数.
7 7
参考数据: = 54, ( )( ) = 21, 14 ≈ 3.74, ( 2 ) = 18.
=1 =1

( ) ( )
=1
参考公式:相关系数 = ,回归直线方程 = + 中的系数分别为 =
( )2 ( )2
=1 =1

( ) ( )
=1
, = .
( )2
=1
【解题思路】(1)结合题意求得相关系数即可判断变量之间的相关程度;
(2)依次计算得 = 34, = 51,由此得线性回归方程,进一步即可预测.
7
【解答过程】(1)由图中数据可得, = 4, ( )2 = 28,
=1
7
又 ( )( ) = 21,
=1
∑7
∴ = =1
( ) ( )
∑7 2 ∑7 2
=1 ( ) =1 ( )
21
= ≈ 0.94
28×18 .
故 与 之间存在较强的正相关关系.
(2)由题意得, = 54,
7
( ) ( )
= =1 = 21 = 37
( 28 4

)2
=1
= = 54 34 × 4 = 51,
3
所以 关于 的回归直线方程为 = 4 + 51.
当 = 8 3时, = 4 × 8 + 51 = 57,
预测 2023 年该高校高考报名人数约为 57000 人.
题型三 非线性回归分析
11.(23-24 高二下·山西·期中)某生产制造企业统计了近 10 年的年利润 (千万元)与每年投入的某种材
料费用 (十万元)的相关数据,作出如下散点图:
选取函数 = ( > 0, > 0)作为每年该材料费用 和年利润 的回归模型.若令 = ln , = ln , = ln ,
= ln ,则 = + ln ,得到相关数据如表所示:
10 10 10 10
2
=1 =1 =1 =1
31.5 15 15 49.5
(1)求出 与 的回归方程;
(2) 10计划明年年利润额突破 1 亿,则该种材料应至少投入多少费用?(结果保留到万元)参考数据:e ≈ 3.679,
3.6792 ≈ 13.535,3.6793 ≈ 49.795.
【解题思路】(1)由表中数据代入最小二乘法公式计算即可;
(2)按照(1)中所求回归方程,结合参考数据,代入计算即可.
【解答过程】(1)因为 = ln , = ln , = + ln
10
10
= =1 = 31.5 10×1.5×1.5 1由表中数据得 10
2 10 2 49.5 10×1.5×1.5
= 3,

=1
所以ln = = 1.5 13 × 1.5 = 1,所以 = e,
1
所以年该材料费用 和年利润额 的回归方程为 = e 3;
1 1
(2)令 = e 3 > 10 10,得 3 > e ≈ 3.679,
所以 > 3.6793 ≈ 49.8(十万),
故下一年应至少投入 498 万元该材料费用.
12.(23-24 高二下·湖北·期末)某乡村企业希望通过技术革新增加产品收益,根据市场调研,技术革新投
入经费 (单位:万元)和增加收益 (单位:万元)的数据如下表:
4 6 8 10 12
27 42 55 56 60
为了进一步了解技术革新投入经费 对增加收益 的影响,通过对表中数据进行分析,分别提出了两个回归
模型:① = + ,② = + .
(1)根据以上数据,计算模型①中 与 的相关系数 (结果精确到 0.01);
(2)若0.95 ≤ | | ≤ 1,则选择模型①;否则选择模型②.根据(1)的结果,试建立增加收益 关于技术革新
投入经费 的回归模型,并预测 = 16时 的值(结果精确到 0.01).

( )( )
附:i)回归直线 = + 的斜率、截距的最小二乘估计以及相关系数分别为: = =1 =
( )2
=1



( )( )
=1
=1
, = , =
2 ( )2 ( )2 =1 =1 =1
5
ii)参考数据:设 = , 2936 ≈ 54.18, 29360 ≈ 171.35, ≈ 2.78, ( 2 ) ≈ 1.33,
=1
5
( )( ) ≈ 29.91.
=1
5 5 5
【解题思路】(1)根据所给数据求出
2
, , , ( )2, ( ),即可求
=1 =1 =1
出相关系数;
(2)根据(1)的结论,可判断选择模型②,令 = ,求出 关于 的线性回归方程,即可求出 关于 的
经验方程,再代入计算可得.
1
【解答过程】(1)因为 = 5(4 + 6 + 8 + 10 + 12) = 8,
= 15(27 + 42 + 55 + 56 + 60) = 48,
5 2
所以 = (4 8)2 + (6 8)2 + (8 8)2 + (10 8)2 + (12 8)2 = 40,
=1
5
( )2 = (27 48)2 + (42 48)2 + (55 48)2 + (56 48)2 + (60 48)2 = 734,
=1
5
( ) = (4 8) × (27 48) + (6 8) × (42 48) + (8 8) × (55 48)
=1
+ (10 8) × (56 48) + (12 8) × (60 48) = 160,
5
( )
=1 160
模型① 160中,相关系数 = 5 2 5 = 29360 ≈ 171.35 ≈ 0.93, ( )2
=1 =1
(2)因为 = 0.93 < 0.95,所以选择模型②,
令 = ,先建立 关于 的线性回归方程,
5
( ) ( )
= =1 = 29.91由于 5 1.33 ≈ 22.49,( )2
=1
= = 48 22.49 × 2.78 ≈ 14.52,
所以 关于 的线性回归方程为 = 14.52 + 22.49 ,
即 = 14.52 + 22.49 ,
当 = 16时, = 14.52 + 22.49 16 = 75.44(万元),
所以若投入经费16万元,收益约为75.44万元.
13.(23-24 高二下·江西萍乡·期中)某研发小组为了解年研发资金投入量 (单位:亿元)对年销售额 (单
位:亿元)的影响,结合近 10 年的年研发资金投入量 和年销售额 的数据( = 1,2, 10),建立了两个
函数模型:① = + 2,② = e + ,其中 , , , 均为常数,e为自然对数的底数.设 = 2 , = ln
( = 1,2, ,10),经过计算得如下数据.
10 10 10
( )2 ( )2 ( ) ( )
=1 =1 =1
20 66 770 200 14
10 10 10
( )2 ( )2 ( ) ( )
=1 =1 =1
460 4.20 3125000 0.308 21500
(1)设{ }和{ }的相关系数为 1,{ }和{ }的相关系数为 2,请从相关系数的角度,选择一个拟合程度更好
的模型.
(2)根据(1)中选择的模型及表中数据,建立 关于 的线性回归方程(系数精确到 0.01),根据线性回归方
程,若当年的销售额大致为e4亿元,则估计当年的研发资金投入量为多少亿元.

( ) ( )
=1
参考公式:相关系数 = ,
( )2 ( )2
=1 =1


线性回归直线 = + 中斜率和截距的最小二乘法估计参数分别为 = =1 2 , = .
=1
【解题思路】(1)根据题干所给数据求出相关系数为 1、 2即可判断;
(2)由(1)可得 = e + 两边取对数可得ln = + ,即 = + ,再由所给数据求出 、 ,即可得到
回归方程,再代入 = e4求出 即可.
10

=1 21500 21500 43
【解答过程】(1)由题意可知 1 = 10 10 = = = = 0.86,
2 2 3125000×200 25000 50
=1 =1
10
14 14 10
2 = =1 = = 77 × 0.2 = 11 ≈ 0.9110 10 770 × 0.308
2 2
=1 =1
因为| 1| < | 2|,所以从相关系数的角度,模型 = e + 的拟合程度更好.
(2)因为 = e + ,所以ln = + ,即 = + .
10

由题中数据可得 = =110 =
14 = 1
2 770 55
≈ 0.02,

=1
1
则 = = 4.20 55 × 20 = 3.84,从而 关于 的线性回归方程为 = 0.02 + 3.84,
故ln = 0.02 + 3.84,即 = e0.02 +3.84.
将年销售额 = e4亿元,代入 = e0.02 +3.84,得e4 = e0.02 +3.84,解得 = 8,
故估计当年的研发资金投入量为8亿元.
14.(2025·河北承德·模拟预测)某公司研制了一种对人畜无害的灭草剂,为了解其效果,通过实验,收集
到其不同浓度 (mol/L)与灭死率 的数据,得下表:
浓度 (mol/L) 10 12 10 10 10 8 10 6 10 4
灭死率 0.1 0.24 0.46 0.76 0.94
(1)以 为解释变量, 为响应变量,在 = + 和 = 1 + 2lg 中选一个作为灭死率 关于浓度 (mol/L)
的经验回归方程,不用说明理由;
(2)(i)根据(1)的选择结果及表中数据,求出所选经验回归方程;
(ii)依据(i)中所求经验回归方程,要使灭死率不低于0.8,估计该灭草剂的浓度至少要达到多少mol/L?
参考公式:对于一组数据( 1, 1),( 2, 2), ,( , ),其经验回归直线 = + 的斜率和截距的最小二

( ) ( )
乘法估计分别为 = =1 = =1 , = .
( 2 )2 2
=1 =1
【解题思路】(1)根据表格数据的特征选择回归模型;
5 5
(2)(i)令 = lg ,将所给数据处理,再求出 , , 2 , ,即可求出 2, 1,从而得到
=1 =1
回归方程;
(ii)令 ≥ 0.8,根据对数函数的性质解出不等式,即可得解.
【解答过程】(1)根据表格数据可知解析变量 呈现指数增长,而响应变量 增长幅度不大,且相应的增加
量大约相等,
故选 = 1 + 2lg .
(2)(i)令 = lg ,则 = 1 + 2 ,
所以可得如下数据
12 10 8 6 4
0.1 0.24 0.46 0.76 0.94
则 = 15( 12 10 8 6 4) = 8
1
, = 5(0.1 + 0.24 + 0.46 + 0.76 + 0.94) = 0.5,
5
2 2 2 = ( 12) + ( 10) + ( 8)2 + ( 6)2 + ( 4)2 = 360,
=1
5
= ( 12) × 0.1 + ( 10) × 0.24 + ( 8) × 0.46 + ( 6) × 0.76 + ( 4) × 0.94 = 15.6,
=1
15.6 5×( 8)×0.5
所以 2 = 360 5×( 8)2 = 0.11, 1 = 0.5 0.11 × ( 8) = 1.38,
所以 = 1.38 + 0.11 ,即 = 1.38 + 0.11lg ;
ii 58( )依题意 = 1.38 + 0.11lg ≥ 0.8,即0.11lg ≥ 0.58,即lg ≥ 11,
58
≥ 10 0.8 10
58
所以 11,即要使灭死率不低于 ,则该灭草剂的浓度至少要达到 11 mol/L.
15.(24-25 高二下·吉林长春·阶段练习)《中共中央国务院关于全面推进乡村振兴加快农业农村现代化的
意见》,这是 21 世纪以来第18个指导“三农”工作的中央一号文件.文件指出,民族要复兴,乡村必振兴,要
大力推进数字乡村建设,推进智慧农业发展.某乡村合作社借助互联网直播平台进行农产品销售,众多网红
主播参与到直播当中,在众多网红直播中,统计了10名网红直播的观看人次 和农产品销售量
( = 1,2,3, ,10)的数据,得到如图所示的散点图.
(1)利用散点图判断, = + 和 = + ln 哪一个更适合作为观看人次 和销售量 的回归方程类型;(只
要给出判断即可,不必说明理由)
(2)对数据作出如下处理:得到相关统计量的值如表:
10 10 10 10
( 2
2
)
=1 =1 =1 =1
9.4 30.3 2 366 6.6 439.2 66
1 10
其中令 = ln , = 10 . =1
根据(1)的判断结果及表中数据,求 (单位:千件)关于 (单位:十万次)的回归方程,并预测当观看
人次为280万人时的销售量;
参考数据和公式:ln2 ≈ 0.69,ln7 ≈ 1.95
附:对于一组数据( 1, 1)、( 2, 2)、 、( , ),其回归线 = + 的斜率和截距的最小二乘估计分别为:


= =1 2 , = .
=1
【解题思路】(1)根据散点图中散点的分布情况可选择合适的回归模型;
(2)令 = ln ,则 = + ,将表格中的数据代入最小二乘法公式,可求得 、 的值,进而可得出 关
于 的回归方程,将 = 28代入回归方程可得出销售量.
【解答过程】(1)解:由散点图可知,散点分布在一条对数型曲线附近,所以选择回归方程 = + ln 更
适合.
(2)解:令 = ln ,则 = + ,
10 10
因为 = 66
2
, = 6.6,
=1 =1
10

所以 = =1 6610 = = 10,

2 6.6
=1
又因为 = 30.3, = 2,所以 = = 30.3 10 × 2 = 10.3,
所以 与 的线性回归方程为 = 10.3 + 10 ,
故 关于 的回归方程为 = 10.3 + 10ln .
令 = 28,代入回归方程可得 = 10.3 + 10ln28 = 10.3 + 10 × (2ln2 + ln7) ≈ 43.6(千件)
所以预测观看人次为280万人时的销售量约为43600件.
题型四 回归分析与其他知识综合
16.(2025·河南信阳·一模)2025 年春节假期,文旅市场火爆.文化和旅游部公布的数据显示;春节假期 8
天,全国国内出游 5.01 亿人次,同比增长 5.9%;国内出游总花费 6770.02 亿元,同比增长 7.0%.某景区的某
网红饮品小店统计了春节假期前 7 天的营业额 (单位:千元),得到 与 的数据如表所示:
第 天 1 2 3 4 5 6 7
1
营业额 7 9 10 12 16 19
1
(1)已知 与 有较强的线性相关关系,求 关于 的线性回归方程,并预测春节假期第 8 天的营业额;
(2)如果该天营业额大于 10(单位:千元),则该天“达标”,从表格中的 7 组数据中随机选 4 组,设 表示“达
标”的数据组数,求 的分布列和数学期望.


参考公式:在线性回归方程 = + 中, = =1 , = .
2 2
=1
【解题思路】(1)利用最小二乘法求解即可;
(2)利用超几何分布求解即可.
1
【解答过程】(1) = 7(1 + 2 + 3 + 4 + 5 + 6 + 7) = 4,
= 17(7 + 9 + 10 + 12 + 16 + 19 + 11) = 12.
7
^ 7
= =1 = 374 7×4×12 197
2 7 2 140 7×4
2 = 14,

=1
19 46
= = 12 14 × 4 = 7
= 19 + 46线性回归方程为 14 7
= 8 = 19当 时, 14 × 8 +
46
7 =
122
7 .
122
即预测春节假期第 8 天的营业额为 7 千元.
(2)由题意可知 的所有可能取值为:1,2,3,4.
C1×C3 4
2 2
( = 1) = 4 3C4 = 35,
C ×C 18
( = 2) = 4 3C4 =7 7 35,
3 1 4
= C4×C3 12 C( = 3) 4C4 = , ( = 4) = 4 =
1
7 35 C7 35
的分布列为
1 2 3 4
4 18 12 1
35 35 35 35
= 1 × 4 +2 × 18 +3 × 12 +4 × 1 16的数学期望为 ( ) 35 35 35 35 = 7 .
17.(23-24 高二下·河北·阶段练习)由于人们健康意识的提升,运动爱好者人群不断扩大,运动相关行业
得到快速发展.某运动品牌专卖店从 2019 年至 2023 年的年销售额如下表:
年份 2019 2020 2021 2022 2023
年份编号 1 2 3 4 5
年销售额 /万元 30 35 45 60 80
(1)请根据表中的数据用最小二乘法求 与 的经验回归方程 = + ,并预测 2024 年该店的年销售额.
(2)该专卖店为了回馈广大消费者,推出了消费抽奖返现活动,规则如下:凡一次性消费满 500 元可抽奖 1
次,满 1000 元可抽奖 2 次.其中一次抽奖返现金额及概率如下表:
返现金额 50 100
2 1
概率
3 3
500 3 1已知一位消费者一次性消费满 元的概率为4,满 1000 元的概率为4,求这位消费者抽奖返现金额 的分
布列与期望.

( ) ( )
附:经验回归方程 = + 中, = =1 = =1 , = .
( )2 2 2
=1 =1
【解题思路】(1)分别求出 , ,再根据经验回归方程计算,并代入 = 6,即可求解;
(2)分别求出概率,并列出分布列,即可求解.
1 = 1+2+3+4+5 = 3, = 30+35+45+60+80【解答过程】解:( )因为 5 5 = 50,
5 5
= 1 × 30 + 2 × 35 + 3 × 45 + 4 × 60 + 5 × 80 = 875, 2 = 1 + 4 + 9 + 16 + 25 = 55,
=1 =1
5
5
= =1 = 875 5×3×50所以 5
2 5 2 55 5×9
= 12.5,,

=1
= = 50 12.5 × 3 = 12.5,
所以 与 的经验回归方程为 = 12.5 + 12.5.
当 = 6时, = 12.5 × 6 + 12.5 = 87.5,所以预测 2024 年该店的年销售额为 87.5 万元.
(2) 可以取50,100,150,200.
3 2 1 3 1 1
2 13
( = 50) = 24 × 3 = 2, ( = 100) = 4 × 3 + 4 × =3 36,
1 2 1 1 1 1 2 1
( = 150) = × C14 2 × 3 × 3 = 9 , ( = 200) = 4 × 3 = 36 ,
所以 的分布列为
50 100 150 200
1 13 1 1
2 36 9 36
= 50 × 1 +100 × 13 1 1 250所以 ( ) 2 36 +150 × 9 +200 × 36 = 3 .
18.(2025 高三上·全国·专题练习)数独是源自 18 世纪瑞士的一种数学游戏,玩家需要根据9 × 9盘面上的
已知数字,推理出所有剩余空格的数字,并满足每一行、每一列、每一个粗线宫(3 × 3)内的数字均含 1~
9,且不重复.数独爱好者小明打算报名参加“丝路杯”全国数独大赛初级组的比赛.
1
参考数据: = 1
7 7
2 2 7
=1 =1
1750 0.37 0.55
参考公式:对于一组数据( 1, 1),( 2, 2), ,( , ),其经验回归方程 = + 的斜率和截距的最小二


乘估计分别为 = =1 , = .
2 2
=1
(1)赛前小明进行了一段时间的训练,每天解题的平均速度 y(秒/题)与训练天数 x(天)有关,经统计得到
如下数据:
x(天) 1 2 3 4 5 6 7
y(秒/题) 910 800 600 440 300 240 210
现用 = + 作为回归方程模型,请利用表中数据,求出该回归方程;(用分数表示)
(2)小明和小红玩“对战赛”,每局两人同时开始解一道数独题,先解出题的人获胜,不存在平局,两人约定
3 2先胜 局者赢得比赛.若小明每局获胜的概率为3,且各局之间相互独立,设比赛 X 局后结束,求随机变量
X 的分布列及均值.
1 2133 9100
【解题思路】(1)由 = + = , 得出 = + ,由参考公式求解出 = 11 + 11 ,从而求出 和
的回归方程;
(2)根据随机变量 的可能取值逐一分析,当 = 3时,小明连胜 3 局或小红连胜 3 局;当 = 4时,小明前
3 局胜 2 局最后一局胜或小红前 3 局胜 2 局最后一局胜;当 = 5时,小明前 4 局胜 2 局最后一局胜或小红
前 4 局胜 2 局最后一局胜;分别求出每个取值的概率.最后代入期望公式计算即可.
1
【解答过程】(1)因为 = + = , ,
所以 = + ,
= 910+800+600+440+300+240+210因为, 7 = 500,
7
7
= =17 =
1750 7×0.37×500 455 9100
2 7 2 0.55
= 0.55 = 11 ,

=1
= = 500 9100所以 11 × 0.37 =
2133
11 ,
= 2133 + 9100所以 11 11 ,
2133 9100
所以所求回归方程为 = 11 + 11 ;
(2)随机变量 X 的所有可能取值为 3,4,5,
3
( = 3) = 2 + 1
3 1 2 2
则 = 3, ( = 4) = C
2 2
3 ×
1 × 2 + C2 1 × 2 × 1 = 10
3 3 3 3 3 3 3 3 3 27,
2 2 2 2
( = 5) = C2 24 ×
1 × 23 + C
2 1 × 2 × 1 = 8
3 3 4 3 3 3 27,
所以随机变量 X 的分布列为:
X 3 4 5
P 1 10 8
3 27 27
1 10 8 107
所以 ( ) = 3 × 3 +4 × 27 +5 × 27 = 27 .
19.(23-24 高二下·内蒙古乌兰察布·期末)水果店的销售额与所售水果的价格、质量及该店被附近居民的
认可度密不可分.已知某水果店于 2023 年 1 月开张,前 6 个月的销售额(单位:万元)如下表所示:
1 2 3 4 5 6
月份
月 月 月 月 月 月
时间代码 1 2 3 4 5 6
销售额
2.0 4.0 5.2 6.1 6.8 7.4
(单位:万元)
(1)根据题目信息, = + 与 = + ln 哪一个更适合作为销售额 关于时间 的回归方程类型?(给出
判断即可,不必说明理由);
(2)根据(1)的判断结果,求出销售额 关于时间 的回归方程.(注:数据保留整数);
(3)为进一步了解该水果店的销售情况,从前 6 个月中任取 3 个月进行分析, 表示取到的 3 个月中每月销售
额不低于 5 万元的月份个数,求随机变量 的分布列和数学期望.
6 6 6 6
参考公式与数据: ln ≈ 6.6, ln ≈ 41.1, (ln )2 ≈ 9.4, = 128.4,
=1 =1 =1 =1
6 6
= 21, = 31.5
=1 =1
样本数据( , )( = 1,2, , )的线性回归方程 = + 的斜率和截距的最小二乘法估计分别为 =

( ) ( )
=1 = =1 , = .
( )2 2 2
=1 =1
【解题思路】(1)根据表中的数据,可得 关于时间 的变化不是直线型,即可选择类型;
(2)根据已知数据求 , 的值,可得销售额 关于时间 的回归方程;
(3)随机变量 的所有可能取值为 1,2,3,计算每个可能取值的概率,并写出分布列及数学期望即可.
【解答过程】(1)根据表中的数据,可得 关于时间 的变化不是直线型,
所以 = + ln 更适合作为销售额 关于时间 的回归方程类型;
2 31.5( ) = 6 = 5.25,ln =
6.6
6 = 1.1,
6
ln 6ln
= =1 = 41.1 6×1.1×5.256 9.4 6×1.12 ≈ 3,(ln )2 6 ln 2
=1
= 5.25 3 × 1.1 ≈ 2,
所以,销售额 关于时间 的回归方程为 = 3ln + 2;
(3) 的所有可能取值为 1,2,3,
1 2
则 = C4C( = 1) 2C3 =
1

6 5
2
= C4C
1
2 = 3( = 2) C36 5,
= C
3 1
( = 3) 4C3 = 5.6
所以, 的分布列为
1 2 3
1 3 1
5 5 5
( ) = 1 ×
1 3 1
5 +2 × 5 +3 × 5 = 2,
即 的数学期望为 2.
20.(23-24 高二下·黑龙江大庆·期末)某学校为倡导全体学生为特困学生捐款,举行“一元钱,一片心,诚
信用水”活动,学生在购水处每领取一瓶矿泉水,便自觉向捐款箱中至少投入一元钱,现统计了连续 5 天的
售出和收益情况,如下表:
售出水量 (单位:箱) 7 6 6 5 6
收益 (单位:元) 165 142 148 125 150
(1)求收益 关于售出水量 的回归直线,并计算每天售出 8 箱水时预计收益是多少元?

5 5
附: = =1 , = , = 6, = 146, = 4420, 2 = 182
2 2

=1 =1
=1
(2)期中考试以后,学校决定将诚信用水的收益,以奖学金的形式奖励给品学兼优的特困生,规定:特困生
考入年级前 200 名,获一等奖学金 500 元;考入年级前 201~500 名,获二等奖学金 300 元;考入年级 501
2 1
名以后的特困生不获得奖学金.甲 乙两名学生获一等奖学金的概率均为5,获二等奖学金的概率均为3,不获
4
得奖学金的概率均为15.
①在学生甲获得奖学金的条件下,求他获得一等奖学金的概率;
②已知甲 乙两名学生获得哪个等第的奖学金是相互独立的,求甲 乙两名学生所获得奖学金总金额 的分布
列及数学期望.
【解题思路】(1)由题干所给数据及公式求出 , ,即可得到回归直线方程,再令 = 8计算可得;
(2)①根据条件概率公式计算可得;②依题意 的取值可能为0,300,500,600,800,1000,求出所对应的概
率,即可求出分布列与数学期望.
5
5 4420 5×6×146
【解答过程】(1)依题意可得 = =15 =
2 5 2 182 5×6
2 = 20,

=1
= = 146 20 × 6 = 26,
∴ = 20 + 26,
当 = 8时, = 20 × 8 + 26 = 186(元),
即某天售出 8 箱水的预计收益是 186 元.
(2)①设事件 为“学生甲获得奖学金”,事件 为“学生甲获得一等奖学金”,
则 ( ) =
2 1 11 2
5 + 3 = 15, ( ) = 5,
( ) 2
所以 ( | ) = ( ) =
5 6
11 = 11,
15
6
即学生甲获得奖学金的条件下,获得一等奖学金的概率为11.
②依题意 的取值可能为0,300,500,600,800,1000,
4 4 16 1 4 8所以 ( = 0) = 15 × 15 = 225, ( = 300) = C
1
2 × 3 × 15 = 45,
2 4 16
2 1
( = 500) = C12 × 5 × 15 = 75, ( = 600) =
1 =
3 9,
1 2 4 2 4( = 800) = C12 × 3 × 5 = 15, ( = 1000) =
2 =
5 25,
即 的分布列为
0 300 500 600 800 1000
16 8 16 1 4 4
225 45 75 9 15 25
则 的数学期望
16 8( ) = 0 × 225 +300 × 45 +500 ×
16 +600 × 175 9 +800 ×
4
15 +1000 ×
4
25 = 600(元).
题型五 独立性检验的实际应用
21.(24-25 高二下·河南驻马店·阶段练习)为了解学生性别与掌握消防安全知识情况的关系,某校组织了
消防安全知识测试,在高二年级中随机抽取 600 名学生统计其测试成绩,如下表(单位:人):
测试
良好 不够良好 总计
成绩性别
男生 150 300
女生 100
总计 350 600
(1)将上表中数据补充完整;
(2)从该校高二年级的学生中有放回地随机抽取 2 次,每次抽取 1 名学生,以频率作为概率,估计这 2 次抽
取的学生的测试成绩全都良好的概率;
(3)试问是否有 99.9%的把握判断消防安全知识测试成绩与性别有关?
( )2
附: 2 = ( + )( + )( + )( + ), = + + + .
0.100 0.010 0.001
2.706 6.635 10.828
【解题思路】(1)根据已知填写表格即可;
(2)应用独立事件概率乘积公式计算即可;
(3)先计算 2 = 1207 ≈ 17.143,再与临界值比较即可判断相关性即可.
【解答过程】(1)
测试成绩
良好 不够良好 总计
性别
男生 150 150 300
女生 200 100 300
总计 350 250 600
350 7 7 7 49
(2)该校高二年级 600 名学生中测试成绩良好的频率为600 = 12,12 × 12 = 144,
2 49故估计这 次抽取的学生的测试成绩全都良好的概率为144.
3 2 = 600×(150×100 150×200)
2 120
( )根据表中数据,计算 300×300×350×250 = 7 ≈ 17.143.
因为17.143 > 10.828,所以有 99.9%的把握判断消防安全知识测试成绩与性别有关.
22.(2025·甘肃·一模)为了解高一学生整理数学错题与提高数学成绩的相关性,某小组通过随机抽样,获
得了每天整理错题和未每天整理错题的各 20 名学生 3 次数学考试成绩的平均分,绘制了如图 1,2 的频率
分布直方图,并且已知高一学生 3 次数学考试成绩的总体均分为 115 分.
(1)依据频率分布直方图,完成以下2 × 2列联表:
成绩不低于总体均分 成绩低于总体均分 合计
每天整理错题
未每天整理错题
合计
(2)依据小概率值 = 0.01的独立性检验,分析数学成绩不低于总体均分是否与每天整理数学错题有关.
2
附: 2 = ( )( + )( + )( + )( + )
0.10 0.01 0.001
2.706 6.635 10.828
【解题思路】(1)根据数表分析计算即可完善列联表;
(2)利用卡方计算公式,及独立性检验思想分析即可;
【解答过程】(1)根据频率分布直方图,可得
成绩不低于总体均分 成绩低于总体均分 合计
每天整理错题 14 6 20
未每天整理错题 5 15 20
合计 19 21 40
(2)假设 0:数学成绩不低于总体均分与每天整理数学错题无关.
2 = 40(14×15 5×6)
2
计算可得 20×20×19×21 ≈ 8.120 > 6.635
根据小概率值 = 0.01的独立性检验,可推断 0不成立,
即认为数学成绩不低于总体均分与每天整理错题有关.
23.(24-25 高二下·辽宁本溪·阶段练习)近年来,食品添加剂泛滥引起消费者关注,某媒体对消费者在购
买预包装食品时是否关注配料表进行调查,调查了 100 名男性消费者与 100 名女性消费者,关注配料表的
消费者共有 80 人,其中女性 30 人.
(1)用2 × 2列联表表示上述数据;
(2)是否有 99%的把握认为消费者购买预包装食品时是否关注配料表与性别有关?
2
附: 2 = ( )( + )( + )( + )( + ),其中 = + + + .
= ( 2 ≥ ) 0.1 0.05 0.025 0.010
2.706 3.841 5.024 6.635
【解题思路】(1)根据给定的数据,列出2 × 2列联表.
(2)利用(1)中数据求出 2的观测值,再与临界值比对判断得解.
【解答过程】(1)依题意,2 × 2列联表如下:
关注 不关注 合计
男性消费者 50 50 100
女性消费者 30 70 100
合计 80 120 200
2
(2)由(1 200(50×70 30×50))得 2的观测值为 2 = 80×120×100×100 ≈ 8.333 > 6.635
所以有 99%的把握认为消费者购买预包装食品时是否关注配料表与性别有关.
24.(24-25 高二下·河南·阶段练习)某地区为了评估新课改对学生成绩的影响,对两个程度相近的学校的
高一年级的学生进行为期一个学期的实验.甲校高一年级采用新课改教学方法,乙校高一年级采用传统教学
方法.学期末,对两个学校的高一年级的学生期末考试成绩进行了分析,成绩分为优秀(550 分及以上)和
非优秀(550 分以下)两个等级,以下是实验结果的列联表:
成绩
学校 合计
优秀 非优秀
甲校 150
乙校 200
合计 270 400
(1)请根据以上信息,完成列联表;
(2)根据列联表中的数据,使用卡方检验判断是否有 99.5%的把握认为“推广新课改与成绩是否优秀”有关?
参考数据:
( 2 > 0) 0.10 0.05 0.010 0.005
0 2.706 3.841 6.635 7.879
2
2 = ( )( + )( + )( + )( + ),其中, 是总样本数.
【解题思路】(1)分析数据,完善列联表,得到答案;
(2)计算出卡方,与 7.879 比较后得到答案.
【解答过程】(1)
成绩
学校 合计
优秀 非优秀
甲校 150 50 200
乙校 120 80 200
合计 270 130 400
(2)根据列联表中的数据,得到
2 = 400×(150×80 120×50)
2
200×200×270×130 ≈ 10.256 > 7.879,
故有 99.5%的把握认为“推广新课改与成绩是否优秀”有关.
25.(24-25 高二下·辽宁抚顺·开学考试)某校在两个班级进行教学方式对比试验,两个月后进行了一次检
测,试验班与对照班成绩统计如下表所示(单位:人):
80 分及 80 分以上 80 分以下 总计
实验班 35 15 50
对照班 20 m 50
总计 55 45 n
(1)求 m,n;
(2)根据表中数据回答:有99%的把握认为“教学方式与成绩有关系”吗?
总计
+

+
+

+
计 + + +
附:1.2 × 2列联表: 记 = + + + .
2
2. 2计算公式: 2 = ( )( + )( + )( + )( + )
3.常用的显著水平 以及相应的分位数 如下表所示.
= ( 2
0.1 0.05 0.01 0.005 0.001
≥ )
k 2.706 3.841 6.635 7.879 10.828
【解题思路】(1)根据数据统计表中的数据可求;
(2)利用独立性检验的步骤求解.
【解答过程】(1) = 45 15 = 30, = 50 + 50 = 100;
2 100×(35×30 15×20)2(2) = 55×45×50×50
= (35×30 15×20)
2 2 2
55×45×25 =
(7×30 3×20) = 25×(7×6 12) 10055×45 55×45 = 11 ≈ 9.091,
因为9.091 > 6.635,所以有99%的把握认为“教学方式与成绩有关系”.
题型六 独立性检验与其他知识综合
26.(24-25 高二下·安徽亳州·阶段练习)随着科技的进步,近年来,我国新能源汽车产业迅速发展,各大
品牌新能源汽车除了靠不断提高汽车的性能和质量来提升品牌竞争力,在广告投放方面的花费也是逐年攀
升.小赵同学对某品牌新能源汽车近 5 年的广告费投入(单位:亿元)进行了统计,具体数据见下表:
年份代号 1 2 3 4 5
广告费投入 4.8 5.6 6.2 7.6 8.8
并随机调查了 200 名市民对该品牌新能源汽车的认可情况,得到的部分数据见下表:
认可 不认可
50 岁以下市民 70 30
50 岁以上市民 60 40
(1)求广告费投入 与年份代号 之间的线性回归方程;
(2)依据小概率值 = 0.10的独立性检验,能否认为市民的年龄与对该品牌新能源汽车的认可度有关?

( ) ( )
附:①回归直线中 = + , = =1 , = ;
( )2
=1
② 2 = ( )
2
( + )( + )( + )( + ),其中 = + + + .
( 2 ≥ 0)0.15 0.10 0.05 0.025 0.010 0.065 0.001
0 2.072 2.706 3.841 5.024 6.635 7.879 10.828
【解题思路】(1)计算出平均数后,结合所给公式计算即可得回归直线方程;
(2)结算出卡方结合临界值比较即可得解.
1 = 1+2+3+4+5 = 3 = 4.8+5.6+6.2+7.6+8.8【解答过程】( ) 5 , 5 = 6.6,
(1 3)×(4.8 6.6)+(2 3)×(5.6 6.6)+0+(4 3)×(7.6 6.6)+(5 3)×(8.8 6.6)
则 = 10(1 3)2+(2 3)2+0+(4 3)2+(5 3)2 = 10 = 1,
则 = 6.6 1 × 3 = 3.6,故 = + 3.6;
2 2 = ( )
2 (70+30+60+40)×(70×40 30×60)2
( )由题以可得 ( + )( + )( + )( + ) = (70+30)×(70+60)×(60+40)×(30+40)
= 200×1000
2 200
100×130×100×70 = 91 ≈ 2.198 < 2.706,
依据小概率值 = 0.10的独立性检验,没有90%的把握认为市民的年龄与对该品牌新能源汽车的认可度具有
相关性.
27.(24-25 高二下·江西·阶段练习)某商场为改进服务质量,在进场购物的顾客中随机抽取了 100 人进行
问卷调查.调查后,就顾客购物体验的满意度统计如下:
满意 不满意 合计
男性 30 20 50
女性 40 10 50
合计 70 30 100
(1)请根据2 × 2列联表,试判断是否有95%的把握认为顾客购物体验的满意度与性别有关;
(2)根据满意度利用分层随机抽样的方法从男性顾客中随机抽取 5 人,再从这 5 人中选出 2 人进行深入交流,
记这 2 人中购物体验填写满意的人数为 ,求随机变量 的分布列及数学期望.
( )2
附参考公式: 2 = ( + )( + )( + )( + ),其中 = + + + .
当 2 ≤ 2.706时,没有充分的证据判断变量 , 有关联,可以认为变量 , 是没有关联的;
当 2 > 2.706时,有90%的把握判断变量 , 有关联;
当 2 > 3.841时,有95%的把握判断变量 , 有关联;
当 2 > 6.635时,有99%的把握判断变量 , 有关联.
【解题思路】(1)利用独立性检验的公式求解即可;
(2)利用超几何分布的概率公式和期望公式求解即可.
1 2 = 100(30×10 20×40)
2
【解答过程】( )由题得: 50×50×70×30 ≈ 4.762>3.841,
所以有95%的把握认为顾客购物体验的满意度与性别有关.
(2)由分层抽样可知,选出的 5 人中购物体验填写满意的人数为 3 人,不满意的人数为 2 人,
故 的可能值为0,1,2,
C2 1 C1C1 3 C2 3
且 ( = 0) = 2 2 3 3C2 = 10, ( = 1) = C2 = 5, ( = 2) = C2 = 10,5 5 5
故分布列为:
0 1 2
1 3 3
10 5 10
= 0 × 1 +1 × 3 +2 × 3 = 6故期望: ( ) 5 5 10 5.
28.(24-25 高二下·贵州遵义·阶段练习)某餐馆 2024 年 12 月份共有 800 个线上外卖订单,其中好评订单
有 600 个,其余均为非好评订单.为了提升菜品品质,增加营业额,该餐馆在 2025 年 1 月份更换了厨师,更
换厨师后该餐馆 2025 年 1 月份共有 2000 个线上外卖订单,其中好评订单有 1600 个,其余均为非好评订单.
(1)根据统计数据,完成下列2 × 2列联表,并判断是否有99%的把握认为该餐馆订单的好评率与更换厨师有
关联.
好评 非好评 合计
更换厨师前
更换厨师后
合计
(2)现从更换厨师前的订单中按好评和非好评,按比例用分层随机抽样法抽取 8 个订单进行电话回访,再从
这 8 个订单中随机抽取 3 个订单发放新品品尝券并让顾客评价,记抽取的 3 个订单中好评的订单个数为 ,
求 的分布列和数学期望.
(3)用样本频率估计总体概率,现从更换厨师后的所有订单中随机抽取 100 个订单,记其中好评的订单个数
为 ,求当事件“ = ”的概率最大时 的值.
2
附: 2 = ( )( + )( + )( + )( + ),其中 = + + + .
= ( 2 ≥ ) 0.1 0.05 0.01 0.005
2.706 3.841 6.635 7.879
【解题思路】(1)完善列联表,计算 2的值,并与临界值对比分析即可;
(2)先算出抽取的 8 件产品中的合格品与不合格品的数目,再从中抽取 3 件,根据合格品件数 的可能值
运用超几何分布概率计算出概率,列出分布列计算数学期望即得;
(3)由已知可得 (100,0.8),利用二项分布概率公式求出概率表达式,再利用作商法求得使事件
“ = ”的概率最大时 的值.
【解答过程】(1)2 × 2列联表如下:
非好
好评 合计

更换厨
600 200 800
师前
更换厨
1600 400 2000
师后
合计 2200 600 2800
2 = 2800(600×400 1600×200)
2
根据列联表中数据,经计算得到 2200×600×800×2000 ≈ 8.485 > 6.635,
所以可以认为该餐馆订单的好评率与更换厨师有关联.
2 600( )依题意,用分层随机抽样法抽取的 8 个订单中,好评订单有8 × 800 = 6个,非好评有 2 个,
而从这 8 个订单中随机抽取 3 个,其中好评的订单个数 的可能值有1,2,3,
1 2 2 1 3 0
则 ( = 1) = C6C2 = 3 , ( = 2) = C6C2 = 15, ( = 3) = C6C2 10C3 28 C3 28 C3 =8 8 8 28,
所以 的分布列为:
1 2 3
3 15 10
28 28 28
3 15 10 9
数学期望 ( ) = 1 × 28 +2 × 28 +3 × 28 = 4.
3 1600( )依题意,更换厨师后好评率为2000 = 0.8,
从更换厨师后所有订单中随机抽取 100 个订单,则 (100,0.8),
于是 ( = ) = C 1000.8 × 0.2100 , ≤ 100, ∈ N,
( = +1) C +1= 100 0.8
+1×0.299 400 4
由 ( = ) C = ,1000.8 ×0.2100 +1
400 4
由 +1 > 1
4
,解得 < 795,而 ∈ N,则当0 ≤ ≤ 79时, ( = )单调递增;
400 4
由 +1 ≤ 1,解得 ≥ 79
4
5,则当 ≥ 80时, ( = )单调递减,
所以使事件“ = ”的概率最大时 的值为 80.
29.(24-25 高二下·江西南昌·阶段练习)近期,流感在某小学肆意传播.流感病毒主要在学生之间传染,低
年龄段(一、二年级)的学生感染情况相对较多.病毒进入人体后存在潜伏期,潜伏期指病原体侵入人体至
最早出现临床症状的这段时间,潜伏期越长,传染给其他同学的可能性越高.学校对 300 个感染流感病例的
潜伏期(单位:天)进行调查,统计得出潜伏期的平均数为 2,方差0.92,若把超过 3 天的潜伏期视为长潜
伏期,按照年级统计样本,得到如下列联表:
年龄/人数 长潜伏期 非长潜伏期
低年龄段(一、二年级) 40 100
高年龄段(三~六年级) 30 130
(1)是否有 95%的把握认为“长潜伏期”与年级有关?
(2)假设潜伏期 服从正态分布 ( , 2),其中 近似样本平均数 , 2近似为样本方差 2
(i)学校现在对有流感症状学生的密切接触者一律要求隔离 5 天,请用概率知识解释其合理性.
(ii)以题目中的样本估计概率,设 800 个病例中恰有 ( ∈ )个属于“长潜伏期”的概率是 ( ),当 为何
值时, ( )取最大值.
2 = ( )
2
(附: ( + )( + )( + )( + ), = + + + )
( 2 ≥ 0) 0.10 0.05 0.010
0 2.706 3.841 6.635
若 ( , 2),则 ( < ≤ + ) = 0.6826, ( 2 < ≤ + 2 ) = 0.9544, ( 3 < ≤ + 3 )
= 0.9974.
7075 ≈ 3.13 8075 ≈ 3.58 9075参考数据:2254 ,2254 ,2254 ≈ 4.03.
【解题思路】(1)由已知数据计算 2后与临界值比较可得;
2 7( )(i)由潜伏期 (2,0.92),利用小概率事件判断;(ii)求得 1 个人属于长潜伏期的概率为30,得
7 7 800 ( ) = C ( ) (1 ) ( ) ≥ ( 1)800 30 30 ,然后解不等式组 ( ) ≥ ( + 1) 可得.
300(40×130 100×30)2
【解答过程】(1)由题意 2 = 140×160×70×230 ≈ 4.026 > 3.841,
所以有 95%的把握认为“长潜伏期”与年级有关;
(2)(i)由题意,潜伏期 (2,0.92),
(2 3 × 0.9 ≤ ≤ 2 + 3 × 0.9) = 0.9974,
所以 ( > 4.7) = 1 0.9974 = 0.0026,
即潜伏期 5 天或以上的概率约为0.0026,非常的小,
所以隔离 5 天后,一般不会再传染,即隔离 5 天是合理的;
ii 70 7( )由题意,1 个人属于长潜伏期的概率为300 = 30,
800
所以 ( ) = C 800(
7 ) (1 7 )
30 30 ,
设 = 时 ( )最大,
C 7

( ) (1 7
800 1 7 1 7 801
800 ) ≥ C30 30 800 ( ) (1 )则 30 30800 +1 799 ,
C ( 7 ) (1 7 ) ≥ C +1( 7800 800 ) (1
7 )
30 30 30 30
解得185.9 ≤ ≤ 186.9,又 ∈ N ,所以 = 186,
所以 = 186时 ( )取得最大值.
30.(24-25 高二下·江西宜春·阶段练习)随着互联网发展,网络已成为人们日常学习、工作和生活不可或
缺的部分,互联网在带给人们生活便捷与高效工作的同时,网络犯罪也日益增多,为了防范网络犯罪与网
络诈骗,学校举办“网络安全宣传倡议”活动.某学校从全体学生中随机抽取了 400 人对“网络安全宣传倡议”
的了解情况进行问卷调查,统计结果如下表所示:
(1)根据所提供的数据,完成2 × 2列联表,并依据小概率值 = 0.005的独立性检验,能否认为对“网络安全
宣传倡议”的了解情况与性别有关?
男 女 合计
了解 150 240
不了解 90
合计
( )2
参考公式: 2 = ( + )( + )( + )( + ), = + + + .
参考数据:
0.10 0.05 0.010 0.005
2.706 3.841 6.635 7.879
(2)对了解“网络安全宣传倡议”的人按性别用比例分配的分层抽样的方法抽取 8 人,再从这 8 人中随机抽取 3
人,记 为抽取的 3 人中女生的人数,求 的分布列和数学期望.
【解题思路】(1)完成列联表,利用公式求解即可得结论.
(2)利用超几何分布求解对应概率,得出分布列即可得出结果.
【解答过程】(1)根据题意,得到2 × 2列联表为:
男 女 合计
了解 150 90 240
不了解 70 90 160
合计 220 180 400
零假设为 0:对“网络安全宣传倡议”的了解情况与性别无关联.
根据列联表中数据,可以求得:
2 = 400×(150×90 90×70)
2 150
220×180×160×240 = 11 ≈ 13.636 > 7.879 = 0.005,
根据小概率值 = 0.005的独立性检验,我们推断 0不成立,
即认为对“网络安全宣传倡议”的了解情况与性别有关.
150
(2)(2)从男生中抽取:8 × 150+90 = 5(人),
90
从女生中抽取:8 × 150+90 = 3(人).
的所有可能取值为0,1,2,3,
C3 5 2 1 ( = 0) = 5C3 = 28, ( = 1) =
C5C3 15
3 = ,
8 C8 28
1 2 3
C( = 2) = 5
C3 15 C 1
C3 = 56, ( = 3) =
3
C3 = 56,8 8
的分布列为:
0 1 2 3
5 15 15 1
28 28 56 56
5
所以 ( ) = 0 × 28 +1 ×
15 +2 × 15 1 928 56 +3 × 56 = 8.

展开更多......

收起↑

资源列表