专题02 统计模型(回归方程、独立性检验)--高二数学下学期期中真题分类汇编(黑吉辽蒙版)(含解析)

资源下载
  1. 二一教育资源

专题02 统计模型(回归方程、独立性检验)--高二数学下学期期中真题分类汇编(黑吉辽蒙版)(含解析)

资源简介

中小学教育资源及组卷应用平台
专题02 统计模型(回归方程、独立性检验)
3大高频考点概览
考点01线性回归方程
考点02非线性回归方程
考点03独立性检验
一、单选题
1.(24-25高二下·内蒙古自治区呼和浩特市剑桥中学·期中)已知变量和的统计数据如下表.
80 90 100 110 120
y 120 140 165 180
若,线性相关,经验回归方程为,则( )
A.155 B.158 C.160 D.162
【答案】A
【分析】根据样本中心点在回归直线方程上,得到,求出.
【详解】由表中数据可得,
代入经验回归方程可得,
则.
故选:A
2.(24-25高二·辽宁抚顺六校协作体·期中)某公司近几年投入A款产品的年研发费用与年利润的统计数据如下表:
年研发费用 5 4 6 3 4 2
年利润 12 10 13 9 11 5
若与的回归直线方程为,则( )
A.2.1 B.2.2 C.2.3 D.2.4
【答案】D
【分析】根据回归直线方程的性质求解样本中心点,代入方程即可得的值.
【详解】由表可知,,
则样本中心点为,代入回归直线方程得:
,解得.
故选:D.
3.(24-25高二下·辽宁沈阳重点高中联合体·期中)某人工智能公司从某年起7年的利润情况如下表所示,关于的回归直线方程是,预测该人工智能公司第8年的利润是多少亿元( )
第年 1 2 3 4 5 6 7
利润/亿元 2.9 3.3 3.6 4.4 4.8 5.2 5.9
A.6.2 B.6.3 C.6.4 D.6.5
【答案】B
【分析】根据已知条件,求得,,再结合线性回归方程一定经过样本中心点,可求得,进而得到关于的回归直线方程,将代入即可.
【详解】由题意,,,
所以,
所以关于的回归直线方程为,
当时,.
故选:B.
4.(24-25高二下·辽宁大连第二十四中学·期中)下列说法中错误的是( )
A.回归直线恒过样本点的中心
B.两个变量线性相关性越强,则相关系数就越接近1
C.在线性回归方程中,当变量每增加一个单位时,平均减少0.5个单位
D.某7个数的平均数为4,方差为2,现加入一个新数据4,此时这8个数的方差不变
【答案】D
【分析】根据回归直线方程恒过样本中心点,A正确;根据相关系数的绝对值越趋近于1,相关性越强,B正确;根据线性回归方程中,回归系数的含义可得C正确;根据平均数计算公式和方差计算公式计算可得D错误.
【详解】对于A,回归直线恒过样本点的中心,正确;
对于B,两个变量线性相关性越强,则相关系数就越接近1,正确;
对于C,根据回归系数的含义,线性回归方程,当变量每增加一个单位时,平均减少0.5个单位,正确;
对于D,根据平均数的计算公式得,由方差公式可得,,故错误;
故选:D
5.(24-25高二下·辽宁省沈阳市第一二0中学·期中)已知变量之间的线性回归方程为且变量之间的一组相关数据如图所示,则下列说法错误的是( )
6 8 10 12
6 3 2
A.变量x,y之间呈负相关关系
B.可以预测,当时,
C.
D.该回归直线必过点
【答案】C
【分析】根据题意,结合线性回归分析,一一判断即可求解.
【详解】对于选线A,因,所以变量x,y之间呈负相关关系,故A正确;
对于选项B,当时,,故B正确;
对于选项C,由题意可知,,故,
又因,所以,故C错;
对于选项D,由C可知,样本中心点为,因此该回归直线必过点,故D正确.
故选:C.
6.(24-25高二下·辽宁沈阳东北育才学校·期中)某公司为了增加某商品的销售利润,调查了该商品投入的广告费用x(万元)与销售利润y(万元)的统计数据如下表,由表中数据,得线性回归直线l:,则下列结论正确的是( )附:,
广告费用x(万元) 2 3 5 6
7销售利润y(万元) 5 7 9 11
A.直线l过点 B.直线l过点
C. D.变量y和x呈负相关
【答案】B
【分析】求出回归方程,对于A:求出l经过,即可判断;对于B:直线l过样本中心点;对于C:计算出,即可判断;对于D:由判断正相关.
【详解】由表中数据计算,,所以线性回归直线经过样本中心点,所以B正确;
又,
,所以,
所以变量y和x呈正相关.故D错误;
所以,所以C错误;
所以回归方程为,当时,.所以直线过点,故A错误.
故选:B.
7.观察下列散点图,其中两个变量的相关关系判断一定正确的是( )
A.图1中y与x呈正相关
B.图2中y与x不相关
C.图3中y与x的线性相关系数小于0
D.图1中y与x的线性相关系数小于图2中y与x的线性相关系数
【答案】D
【分析】根据给定的散点图,利用正负相关的意义、相关系数的意义逐项判断.
【详解】对于A,图1中随增大而减小, y与x呈负相关,A错误;
对于B,图2中各点较分散,y与x的相关性不强,不能肯定不相关,B错误;
对于C,图3中随增大而增大,y与x呈正相关,相关系数大于0,C错误;
对于D,图1与图2,y与x都呈负相关,相关系数为负,
而图1中y与x的线性相关性较图2中y与x的线性相关性强,
所以,图1中y与x的线性相关系数小于图2中y与x的线性相关系数,D正确.
故选:D
8.(24-25高二下·辽宁省凤城市第二中学·期中)人工智能技术(简称AI技术)已成为引领世界新一轮科技革命和产业改革的战略性技术,AI技术加持的电脑(以下简称AI电脑)也在全国各地逐渐热销起来.下表为市统计的2024年11月至2025年3月这5个月该市AI电脑的月销量,其中为月份代号,(单位:万台)为AI电脑的月销量.
月份 2024年11月 2024年12月 2025年1月 2025年2月 2025年3月
月份代号 1 2 3 4 5
月销量 0.5 0.9 1 1.2 1.4
经过分析,与线性相关,且其线性回归方程为,则2025年3月的残差为( )(实际值与预计值之差)
A. B. C.0.02 D.0.04
【答案】B
【分析】求出样本中心点,带入回归方程求出,在求出对应的月销量预测值,结合月销量求出残差
【详解】因为,
所以,所以关于的线性回归方程为,
2025年3月对应的,故此时残差为.
故选:B.
二、填空题
9.(24-25高二下·辽宁重点中学协作校·期中)某公司从某年起年的利润情况如下表所示.
第年
利润/亿元
且关于的回归直线方程是,则的值为__________.
【答案】
【分析】求,的平均值,,根据点在直线上列方程求即可.
【详解】由已知的平均值,
的平均值,
因为点在直线上,
所以,
所以,
故答案为:.
三、解答题
10.(24-25高二下·内蒙古呼和浩特市林格尔县民族中学·期中)哈三中高二数学备课组对学生的记忆力和判断力进行统计分析,所得数据如下表所示:
4 6 8 10
2 3 5 6
(1)请根据上表提供的数据,用最小二乘法求出关于的线性回归方程;
(2)根据(1)中求出的线性回归方程,预测记忆力为9的学生的判断力.
(参考公式:,)
【答案】(1);(2)判断力为5.4.
【分析】(1)直接利用公式求解即可
(2)把代入回归方程中求解
【详解】解:(1)由表中数据可得,


所以,
所以,
所以关于的线性回归方程为,
(2)当时,,
所以记忆力为9的学生的判断力约为5.4
11.(24-25高二下·辽宁县域重点高中·期中)某课外实验小组通过实验统计了某种子的发芽率y%与土壤的湿度x%的相关数据如下表:
x 40 45 50 55 60
y 50 56 64 72 83
(1)求y关于x的相关系数r(精确到0.001),并判断它们是否具有较强的线性相关关系?
(2)求y关于x的回归直线方程,并预测当土壤的湿度为70%时,种子的发芽率y%的值.
参考公式及数据:对于一组数据,,…,,回归直线方程的斜率和截距的最小二乘估计公式分别为,,相关系数,,,.
【答案】(1),具有较强的线性相关关系
(2),发芽率的预测值为
【分析】(1)由题,计算,由相关系数得公式运算判断;
(2)根据题意,求出,得到回归直线方程,得解.
【详解】(1)由题,,,
所以关于的相关系数,
所以与具有较强的线性相关关系.
(2)由(1),,则,
所以关于的回归直线方程为,
当时,,
所以当土壤的湿度为70%时,种子的发芽率y%的预测值为.
12.(24-25高二下·内蒙古自治区呼和浩特市剑桥中学·期中)某运动服饰公司对产品研发的年投资额(单位:十万元)与年销售量(单位:万件)的数据进行统计,整理后得到如下统计表:
1 2 3 4 5
35 40 50 55 70
(1)求和的样本相关系数(精确到0.01),并推断和的线性相关程度;(若,则线性相关程度很强;若,则线性相关程度一般;若,则线性相关程度很弱)
(2)求年销售量关于年投资额的回归直线方程,并据此预测年投资额为60万元时的年销售量.
参考数据:.
参考公式:相关系数;
回归直线方程中,.
【答案】(1)0.98,变量和的线性相关程度很强;
(2),75.5万件.
【分析】(1)计算出相关系数所需的数据,根据公式即可求出;
(2)根据公式即可求出与的值,即可得出回归方程,令代入计算即可.
【详解】(1)由题可知,

所以,
因为,所以变量和的线性相关程度很强.
(2),

所以关于的回归直线方程为.
当时,,
所以研发的年投资额为60万元时,预测产品的年销售星为75.5万件.
一、单选题
1.(24-25高二下·辽宁省实验中学·期中)已知变量与变量的关系可以用模型(,为常数)拟合,设,变换后得到一组数据如下:
2 3 4 5 6
1.02 1.20 1.42 1.62 1.84
由上表可得经验回归方程为,则( )
A.0.206 B. C.0.596 D.
【答案】D
【分析】先根据线性回归方程必过样本中心点,可求,再推导出,可求的值.
【详解】由表格中数据得,

代入方程得,,解得,因此.
由两边取对数,得.
又,所以,,即.
故选:D
2.(24-25高二下·辽宁大连滨城高中联盟·期中)下表为某外来生物物种入侵某河流生态后的前3个月繁殖数量(单位:百只)的数据,通过相关理论进行分析,知可用回归模型对与的关系进行拟合,则根据该回归模型,预测第7个月该物种的繁殖数量为( )
第个月 1 2 3
繁殖数量
A.百只 B.百只 C.百只 D.百只
【答案】B
【分析】对两边取自然对数得,令,则,由回归直线必过样本点的中心即可求得,进而得解.
【详解】由两边取自然对数得,令,
则,即与呈线性相关关系,
,,
回归直线必过样本点的中心,,解得,
,则,当时,.
故选:B
二、填空题
3.(24-25高二下·内蒙古自治区呼和浩特市剑桥中学·期中)以模型去拟合一组数据时,为了求出回归方程,设,其变换后得到线性回归方程,则______.
【答案】
【分析】两边取对数,对照系数,求出
【详解】,即,
∴,.
故答案为:
三、解答题
4.(24-25高二下·辽宁重点中学协作校·期中)已知与及与的成对数据如下,且关于的回归直线方程为,
(1)求关于的回归直线方程;
(2)由散点图发现可以用指数型函数模型拟合与的关系,请建立关于的回归方程(,的值精确到);
(3)又得到一组新数据,,根据这对数据残差的绝对值的大小判断(1)、(2)两个方程哪个拟合效果更好.
参考数据:
其中,.
参考公式:对于一组数据,,,,
其回归直线方程为,其中,.
【答案】(1)
(2),
(3)指数函数模型拟合效果更好.
【分析】(1)方法一:设关于的回归直线方程为,由条件求,,,,再由公式求,,由此可得结论;
方法二:由条件可得,,结合关于的回归直线方程为,可求结论;
(2)由条件可得,设,,,则,利用公式求,由此可得结论;
(3)结合(1),(2)分别求当时,两个回归方程对应的残差,比较残差的大小判断结论.
【详解】(1)方法一:设关于的回归直线方程为,
由已知,,


所以,

所以关于的回归直线方程为,
方法二:因为关于的回归直线方程为,
因为,,
所以,,
则,
所以关于的回归直线方程为,
(2)若用指数型函数模型拟合与的关系,则有,
设,,,
则,


所以,
所以,
所以关于的回归方程为,
(3)由(1)关于的回归直线方程为,
所以时,,
残差为,
由(2)关于的指数函数模型的回归方程为,
所以时,,
残差为,
因为,所以指数函数模型拟合效果更好.
5.(24-25高二下·辽宁省七校协作体·期中)当前,人工智能技术以前所未有的速度迅猛发展,并逐步影响我们的方方面面,人工智能被认为是推动未来社会发展和解决人类面临的全球性问题的重要手段.某公司在这个领域逐年加大投入,以下是近年来该公司对产品研发年投入额(单位:百万元)与其年销售量y(单位:千件)的数据统计表.
1 2 3 4 5 6
1 1.5 3 6 12
(1)公司拟分别用①和②两种方案作为年销售量关于年投入额的回归分析模型,请根据已知数据,确定方案①和②的经验回归方程;(计算过程保留到小数点后两位,最后结果保留到小数点后一位)
(2)根据下表数据,用决定系数(只需比较出大小)比较两种模型的拟合效果哪种更好,并选择拟合精度更高的模型,预测年投入额为百万元时,产品的销售量是多少
经验回归方程
残差平方和
参考公式及数据:,,,,,,,, .
【答案】(1),
(2)②的拟合效果好,预测销售量是千件
【分析】(1)根据经验回归方程的求法求得正确答案.
(2)通过计算决定系数确定拟合效果较好的方案,并由此进行预测.
【详解】(1),
所以,
所以.
由,两边取以为底的对数得,即,

所以,所以.
(2),
对于,;对于,,
所以②的拟合效果好,当时,预测值千件.
一、单选题
1.(24-25高二下·辽宁省七校协作体·期中)针对2025年第九届亚冬会在哈尔滨举办,校团委对“是否喜欢冰雪运动与学生性别的关系”进行了一次调查,其中被调查的男、女生人数相同,男生中喜欢冰雪运动的人数占男生人数的,女生中喜欢冰雪运动的人数占女生人数的,若依据的独立性检验,认为是否喜欢冰雪运动与学生性别有关,则被调查的学生中男生的人数不可能是( )
附:.
0.1 0.05 0.01 0.005 0.001
2.706 3.841 6.635 7.879 10.828
A.48 B.54 C.60 D.66
【答案】A
【分析】根据已知条件设男生人数为 ,结合独立性检验公式得出不等式,根据的取值,即可求解.
【详解】设男生人数为 ,因为被调查的男、女生人数相同,
所以女生人数也为 ,根据题意列出列联表:
男生 女生 合计
喜欢冰雪运动
不喜欢冰雪运动
合计
则,
因为依据的独立性检验,认为是否喜欢冰雪运动与学生性别有关,
所以,即,解得,又,
所以B、C、D正确,A错误.
故选:A
2.(24-25高二下·辽宁重点中学协作校·期中)为了了解性别与视力之间的关系,一个调查机构得到列联表如图,则当取下面何值时,性别与视力无关的可能性最大( )
男 女
近视 240 200
不近视 50
A.40 B.60 C.100 D.240
【答案】B
【分析】根据相关性的概念求解即可.
【详解】根据相关性的概念可知当,即近视与不近视的男女比例相同时,性别与视力无关的可能性最大,解得,
故选:B
二、多选题
3.(24-25高二下·内蒙古呼和浩特和林格尔县民族中学·期中)下列的叙述正确的有( )
A.关于一元线性回归,若相关系数,则y与x的相关程度很强
B.关于一元线性回归,若决定系数的越大,模型拟合效果越差
C.关于独立性检验,随机变量的值越大,认为“两个分类变量有关系”的把握性越大
D.关于独立性检验,若的观测值满足,依据小概率值的独立性检验,认为“两个分类变量无关”(参考数据:)
【答案】ACD
【分析】根据一元线性回归的相关系数和决定系数的定义即可判断AB,根据独立性检验中随机变量的值的意义即可判断CD.
【详解】对于A,相关系数很接近1,则随机变量y与x的相关程度很强,故A正确;
对于B,关于一元线性回归,若决定系数的越大,模型拟合效果越好,故B错误.
对于C,关于独立性检验,随机变量的值越大,可判断“两个分类变量有关系”的把握性越大,故C正确;
对于D,因的观测值满足,则零假设成立,即在犯错概率不超过的情形下,可认为“两个分类变量无关”,故D正确.
故选:ACD
4.(24-25高二下·辽宁重点中学协作校·期中)统计学中,常用的显著性水平以及对应的分位数如下表所示.
在检验与是否有关的过程中,根据已知数据计算得,则( )
A.若,则在犯错误的概率不超过的前提下认为与有关
B.若,则在犯错误的概率不超过的前提下认为与无关
C.若,则有的把握认为与有关
D.若,,则
【答案】ACD
【分析】根据的计算结果与常用的显著性水平的对应的分位数大小关系,判断ABC,结合的性质判断D.
【详解】对于A,因为,,,
所以根据小概率值的独立性检验,推断零假设不成立,
即在犯错误的概率不超过的前提下认为与有关,A正确;
对于B,因为,,,
所以根据小概率值的独立性检验,推断零假设不成立,
即在犯错误的概率不超过的前提下认为与有关,B错误;
对于C,因为,,,
所以根据小概率值的独立性检验,推断零假设不成立,
即在犯错误的概率不超过的前提下认为与有关,C正确;
对于D,因为分布是单调递增的累积分布函数,所以,
所以,D正确;
故选:ACD.
三、解答题
5.(24-25高二下·内蒙古呼和浩特市林格尔县民族中学·期中)某学校为全面提高学生的语文素养和阅读水平,构建“书香校园”,特举办“课外阅读知识竞赛”,为了调查学生对这次活动的满意程度,在所有参加“课外阅读知识竞赛”的同学中抽取容量为300的样本进行调查,并得到如下列联表:
单位:人
满意程度 性别 合计
男生 女生
满意 120
不满意 150
合计 200
请补全上面的列联表,依据小概率值的独立性检验,能否认为满意程度与性别有关系.
附:,其中.
0.1 0.05 0.01 0.001
2.706 3.841 6.635 10.828
【答案】列联表见解析,能认为满意程度与性别有关,且犯错误的概率不大于0.001
【分析】完成列联表,并利用独立性检验的步骤完成计算即可.
【详解】列联表如下:
单位:人
满意程度 性别 合计
男生 女生
满意 120 30 150
不满意 80 70 150
合计 200 100 300
零假设为:满意程度与性别无关,,
所以依据小概率值的独立性检验,推断不成立,
即能认为满意程度与性别有关系,此推断犯错误的概率不大于0.001.
6.(24-25高二下·辽宁大连第二十四中学·期中)研究表明,春季早晚温差大,由于个人体质不同,可能会导致感冒患病. 某医学研究小组为了解20-30岁年轻人的体质健康是否与性别有关,在4月感冒易发季节对某一小区中该年龄段的年轻人进行了随机抽样,得到如2×2列联表.
性别 健康状况
感冒 不感冒
男 8 14
女 4 24
(1)在上述感冒的年轻人中按照性别采用分层抽样的方法抽取6人,再从这6人中随机选取3人访谈,记参与访谈的男性人数为X,求X的分布和期望;
(2)依据表中数据,在犯错误的概率不超过0.05的前提下,20-30岁年轻人的体质健康与性别是否有关 若把表中所有数据都扩大到原来的10倍,此时结论还一样吗 请解释其中原因,并简要说明应如何调整调查可使此研究更具有严谨性.
参考数据:
参考公式:,其中.
【答案】(1)分布列见解析,
(2)答案见解析
【分析】(1)利用分层抽样的方法抽取6人,则抽取男性4人,女性 2人,随机变量的所有取值为,求出对应概率,即可列出分布列,求出期望;
(2)根据列联表中的数据, 经计算得到,再和参考数据表中对应的数据比较,即可得到结论.
【详解】(1)样本中感冒的男性有8人,女性有 4人,比例为,
按照性别采用分层抽样的方法抽取6人,则抽取男性4人,女性 2人,
随机变量的所有取值为.
, , ,
所以的分布列为
1 2 3
所以.
(2)提出统计假设:20-30岁年轻人的体质健康与性别无关.
根据列联表中的数据,经计算得到,
因为,假设成立,
所以在犯错误的概率不超过0.05的前提下,认为20-30岁年轻人的体质健康与性别无关.
如果把所有数据都扩大10倍后,
,,
即在犯错误的概率不超过0.05的前提下,认为20-30岁年轻人的体质健康与性别有关.
所以扩大10倍后,数据改变,结论也会发生变化,
为使此研究更具有严谨性,可以扩大调查的样本容量.
7.(24-25高二·辽宁抚顺六校协作体·期中)为了研究学生每天整理数学错题的情况,某校数学建模兴趣小组在本校某年级学生中随机抽取了200名学生,调查他们平时的数学成绩和整理数学错题的情况,现统计的部分数据如下表:
数学成绩总评优秀的人数 数学成绩总评非优秀的人数 合计
每天都整理数学错题的人数 90
不是每天都整理数学错题的人数 40 100
合计 200
(1)完成上述样本数据的列联表,并判断是否有的把握认为学生的数学成绩总评优秀与每天都整理数学错题有关;
(2)按照比例采用分层随机抽样的方法从不是每天都整理数学错题的学生中随机抽取5名学生,再从这5名学生中选3名做进一步访谈,设这3人中数学成绩总评非优秀的人数为,求的分布列和期望.
附:,其中.
0.1 0.05 0.01 0.005 0.001
2.706 3.841 6.635 7.879 10.828
【答案】(1)列联表见解析,有把握.
(2)分布列见解析,期望为.
【分析】(1)求出的观测值,与临界值对比即可.
(2)先通过采用分层随机抽样得抽取的成绩优秀与不优秀人数,求出所有可能的取值,及对应的概率,列出分布列并求出期望.
【详解】(1)完善列联表,如下:
数学成绩总评优秀的人数 数学成绩总评非优秀的人数 合计
每天都整理数学错题的人数 90 10 100
不是每天都整理数学错题的人数 60 40 100
合计 150 50 200
零假设为::学生的数学成绩总评优秀与每天都整理数学错题相互独立,即学生的数学成绩总评优秀与每天都整理数学错题无关,
根据列联表数据计算可得,
根据小概率的独立性检验,我们推断不成立,所以有的把握认为学生的数学成绩总评优秀与每天都整理数学错题有关.
(2)由分层随机抽样可知,抽取的5名学生中有2名数学成绩总评非优秀.
所有可能的取值为0,1,2,
知,,,
所以的分布列为:
0 1 2
故.
8.(24-25高二下·辽宁重点高中沈阳郊联体·期中)近年来,随着智能手机的普及,网上买菜迅速进入了我们的生活.现将一周网上买菜次数超过3次的市民认定为“喜欢网上买菜”,不超过3次甚至从不在网上买菜的市民认定为“不喜欢网上买菜”.某市M社区为了解该社区市民网上买菜情况,随机抽取了该社区100名市民,得到的统计数据如下表所示:
喜欢网上买菜 不喜欢网上买菜 合计
年龄不超过45岁的市民 40 10 50
年龄超过45岁的市民 20 30 50
合计 60 40 100
(1)是否有的把握认为社区的市民喜欢网上买菜与年龄有关?
(2)社区的市民小张周一 二均在网上买菜,且周一等可能地从两个买菜平台随机选择一个下单买菜如果周一选平台买菜,那么周二选平台买菜的概率为,如果周一选每平台买菜,那么周二选择平合买菜的概率为,求小张周二选择平台买菜的概率;
(3)用频率估计概率,现从社区随机抽取25名市民,记其中喜欢网上买菜的市民人数为随机变量,求的期望和方差.
附:.
0.100 0.050 0.010 0.005 0.001
2.706 3.841 6.635 7.879 10.828
【答案】(1)有的把握认为社区的市民喜欢网上买菜与年龄有关;
(2)
(3)
【分析】(1)提出零假设,计算,根据计算结果判断结论;
(2)设事件小张周二选择平台买菜为,小张周一选择平台买菜为,由条件可得,,,结合全概率公式求结论;
(3)由条件求喜欢网上买菜的概率,由此可得,结合二项分布期望和方差公式求结论.
【详解】(1)零假设为:社区的市民喜欢网上买菜与年龄无关,
根据列联表中数据,计算得到,

所以根据小概率值的独立性检验,推断不成立,即认为社区的市民喜欢网上买菜与年龄有关,此推断犯错误的概率不大于,
所以有的把握认为社区的市民喜欢网上买菜与年龄有关;
(2)设事件小张周二选择平台买菜为,小张周一选择平台买菜为,
则小张周一选择平台买菜为,则,
,,
所以;
(3)由已知喜欢网上买菜的概率,
所以,
由二项分布期望和方差公式可得.
9.(24-25高二下·辽宁省东北育才中学·期中)游泳是一种高效的锻炼方法,坚持游泳可以增强体质,提高免疫力.某游泳馆为了了解是否喜欢游泳与性别有关联,随机在某小区调查了200人,得到的数据如表所示:
性别 游泳 合计
喜欢 不喜欢
男 80 40 120
女 32 48 80
合计 112 88 200
(1)依据小概率值的独立性检验,能否认为是否喜欢游泳与性别有关联?
(2)为分析喜欢游泳的原因,在喜欢游泳的人中采用分层抽样的方法随机抽取7人,再从这7人中随机抽取3人进行调查,记随机变量X为这3人中女性的人数,求X的分布列与数学期望.
附:,其中.
0.1 0.05 0.01 0.005 0.001
2.706 3.841 6.635 7.879 10.828
【答案】(1)认为是否喜欢游泳与性别有关联
(2)分布列见解析,
【分析】(1)根据列联表中的数据,计算得到,结合附表,即可得到答案.
(2)根据题意,求得抽取的男大学生有5人,女大学生有2人,得到的所有可能取值,求得相应的概率,列出分布列,结合期望的公式,即可求解.
【详解】(1)零假设为:是否喜欢游泳与性别无关联.
根据列联表中的数据,计算得到,
所以根据小概率值的独立性检验,我们推断不成立,
即认为是否喜欢游泳与性别有关联,此推断犯错误的概率不大于0.001.
(2)由题意可知抽取的男性有人,女性有人,
随机变量X的所有可能取值为0,1,2,
且,,.
所以X的分布列为:
X 0 1 2
P
所以.
10.(24-25高二下·辽宁沈阳重点高中联合体·期中)电视台对某时段收看综艺节目和新闻节目的观众进行抽样调查,随机抽取了100名电视观众,相关的数据如下表所示(单位:人).
收看综艺节目 收看新闻节目
20~40岁 45 10
40岁及以上 30 15
(1)从表中数据分析,是否有95%的把握认为在这一时段观众选择收看综艺节目还是新闻节目与年龄有关.
(2)现从所抽取的40岁及以上的电视观众中利用分层抽样的方法抽取9人,再从这9人中随机选取3人做访谈,求选取的3人中至少有2人在这一时段收看综艺节目的概率.
(3)将频率视为概率,从我市所有在这一时段收看综艺节目和新闻节目的观众中随机抽取20人,记其中收看新闻节目的观众数为X,求随机变量X的数学期望和方差.
参考公式:,其中.
临界值表:
0.1 0.05 0.01 0.005 0.001
2.706 3.811 6.635 7.879 10.828
【答案】(1)没有的把握认为在这一时段观众选择收看综艺节目还是新闻节目与年龄有关
(2)
(3),
【分析】(1)根据列联表计算卡方的值后结合临界值表可得判断;
(2)根据古典概型结合组合计数可得概率;
(3)由可求期望和方差.
【详解】(1)
所以没有的把握认为在这一时段观众选择收看综艺节目还是新闻节目与年龄有关.
(2)由题意,抽取的这9人中有6人在这一时段收看综艺节目,有3人收看新闻节目
记事件“选取的3人中至少有2人在这一时段收看综艺节目”,

(3)由题意,随机变量,所以,
.
11.(24-25高二下·辽宁沈阳五校协作体·期中)为了研究高中学生每天整理数学错题的情况,沈阳市某校数学建模兴趣小组的同学在本校高二年级学生中采用随机抽样的方法抽取了40名学生,调查他们平时的数学成绩和整理数学错题的情况,现统计得部分数据如下:
数学成绩总评优秀人数 数学成绩总评非优秀人数 合计
每天都整理数学错题人数 14 a
不是每天都整理数学错题人数 b 15 20
合计 40
(1)计算a,b的值,并判断是否有99%的把握认为“数学成绩总评优秀与每天都整理数学错题有关”?
附:
0.10 0.01 0.001
2.706 6.635 10.828
(2)从样本中不是每天都整理数学错题的学生中随机抽取3名学生做进一步访谈,设恰好抽取到数学成绩总评优秀的人数为X,求X的分布列和期望.
【答案】(1),,有把握
(2)分布列见解析,
【分析】(1)先算出,再计算卡方对比临界值即可得解.
(2)由题意可得X的所有可能值为0,1,2,3,计算出对应的概率即可得分布列,进一步即可求解数学期望.
【详解】(1)依题意,,,
数学成绩总评优秀人数 数学成绩总评非优秀人数 合计
每天都整理数学错题人数 14 6 20
不是每天都整理数学错题人数 5 15 20
合计 19 21 40
所以有99%的把握认为“数学成绩总评优秀与每天都整理数学错题有关”.
(2)不是每天都整理数学错题的学生有20人,其中数学成绩总评优秀人数为5,X的所有可能值为0,1,2,3,
,,
,,
所以X的分布列为:
X 0 1 2 3
P
期望.
12.(24-25高二下·辽宁实验中学·期中)为调查某地区老年人是否需要志愿者提供帮助,用简单随机抽样方法从该地区调查了500位老人,结果如下面表中所示:
男 女 合计
需要 50 25 s
不需要 200 225 425
合计 250 t 500
(1)求s,t;
(2)能否有99%的把握认为该地老年人是否需要帮助与性别有关?
(3)根据(2)的结论,你能否提出更好的调查方法来估计该地区的老年人中,需要志愿者提供帮助的老年人的比例?说明理由.
附:,
0.050 0.010 0.001
k 3.841 6.635 10.828
【答案】(1),
(2)有
(3)采用分层抽样,理由见解析
【分析】(1)根据表格中的数据完善列联表.
(2)计算后与临界值比较即可判断.
(3)根据(2)知该地区的老年人是否需要帮助与性别有关,并且从样本数据能看出该地区男性老年人与女性老年人中需要帮助的比例有明显差异,故选择分层抽样.
【详解】(1)由列联表知,.
(2)由列联表得,
由于,所以有99%的把握认为该地老年人是否需要帮助与性别有关.
(3)采用分层抽样,理由如下:
由(2)的结论知,该地区的老年人是否需要帮助与性别有关,并且从样本数据能看出该地区男性老年人与女性老年人中需要帮助的比例有明显差异,
因此在调查时,先确定该地区老年人中男、女的比例,再把老年人分成男女两层并采用分层抽样方法比采用简单随机抽样方法更好.
13.(24-25高二下·辽宁县域重点高中·期中)某医疗机构为了解某种地方性疾病与饮食习惯间的关系(饮食习惯分为良好与不良),从该地区随机抽取300名居民,得到如下2×2列联表:
饮食习惯 合计
良好 不良
患有这种地方性疾病 40
未患有这种地方性疾病 200
合计 220
(1)请补充上面2×2列联表,并判断是否有99.9%的把握认为居民是否患有这种地方性疾病与饮食习惯有关联?
(2)通过抽血化验的方式进行这种地方性疾病的检验,随机地将k个人的血样混合再化验,如果混管血样呈阴性,说明这k个人全部阴性;如果混管血样呈阳性,说明这k个人中至少一人血样呈阳性,需要对每个人再分别化验一次.已知5人的混管血样呈阳性.
(ⅰ)若这5人中有2人患有这种地方性疾病,现将这5人每个人的血样逐个化验,直到查出患有这种地方性疾病的2人为止,设X表示所需化验次数,求X的分布列与数学期望;
(ⅱ)若这5人中有1人患有这种地方性疾病,从这5人中取出3人的血样混合一起化验,若呈阳性,则对这3人的血样再逐一化验,直到查出患有这种地方性疾病的人为止;若呈阴性,则对剩下2人的血样逐一化验,直到查出患有这种地方性疾病的人为止.设Y表示所需化验次数,求.
附:,其中.
0.1 0.01 0.001
k 2.706 6.635 10.828
【答案】(1)答案见详解
(2)(i)答案见详解,(ii).
【分析】(1)根据题意,完成列联表,利用卡方公式计算,依次判断;
(2)(i)的可能取值为,求出相应的概率,列出分布列并求出期望;(ii)的可能取值为,求出相应的概率,求出期望和方差.
【详解】(1)
饮食习惯 合计
良好 不良
患有这种地方性疾病 20 40 60
未患有这种地方性疾病 200 40 240
合计 220 80 300

所以有的把握认为居民是否患有这种地方性疾病与饮食习惯有关联.
(2)(i)的可能取值为,



所以的分布列为
2 3 4
所以.
(ii)的可能取值为,


所以,
.
14.(24-25高二下·辽宁大连滨城高中联盟·期中)某观影平台为了解观众对最近上映的某部影片的评价情况(评价结果仅有“好评”、“差评”),从平台所有参与评价的观众中随机抽取216人进行调查,部分数据如下表所示(单位:人):
好评 差评 合计
男性 40 68 108
女性 60 48 108
合计 100 116 216
(1)判断是否有的把握认为“对该部影片的评价与性别有关”
(2)若将频率视为概率,从观影平台的所有给出“好评”的观众中随机抽取3人,用随机变量表示被抽到的男性观众的人数,求的分布列;
(3)在抽出的216人中,从给出“好评”的观众中利用分层抽样的方法抽取10人,从给出“差评”的观众中抽取人.现从这人中,随机抽出2人,用随机变量表示被抽到的给出“好评”的女性观众的人数.若随机变量的数学期望不小于1,求的最大值.
参考公式:,其中.
参考数据:
0.10 0.05 0.025 0.010 0.005 0.001
2.706 3.841 5.024 6.635 7.879 10.828
【答案】(1)有
(2)答案见解析
(3)2
【分析】(1)根据列联表,求出,再根据参考数据可判断;
(2)先求出随机抽取1人为男性的概率,由题意,由二项分布可得答案;
(3)Y的可能取值为0,1,2,求出概率,求出期望,建立不等式,可得答案.
【详解】(1)

所以有的把握认为“观影评价与性别有关”.
(2)从观影平台的所有给出“好评”的观众中随机抽取1人为男性的概率为,且各次抽取之间相互独立,所以,
所以,

故的分布列为
0 1 2 3
(3)从给出“好评”的观众中利用分层抽样的方法抽取10人,则男性4人,女性6人.则的可能取值为0,1,2,
所以.
所以,即
即,解得,又,所以的最大值为2.
21世纪教育网 www.21cnjy.com 精品试卷·第 2 页 (共 2 页)
21世纪教育网(www.21cnjy.com)中小学教育资源及组卷应用平台
专题02 统计模型(回归方程、独立性检验)
3大高频考点概览
考点01线性回归方程
考点02非线性回归方程
考点03独立性检验
一、单选题
1.(24-25高二下·内蒙古自治区呼和浩特市剑桥中学·期中)已知变量和的统计数据如下表.
80 90 100 110 120
y 120 140 165 180
若,线性相关,经验回归方程为,则( )
A.155 B.158 C.160 D.162
2.(24-25高二·辽宁抚顺六校协作体·期中)某公司近几年投入A款产品的年研发费用与年利润的统计数据如下表:
年研发费用 5 4 6 3 4 2
年利润 12 10 13 9 11 5
若与的回归直线方程为,则( )
A.2.1 B.2.2 C.2.3 D.2.4
3.(24-25高二下·辽宁沈阳重点高中联合体·期中)某人工智能公司从某年起7年的利润情况如下表所示,关于的回归直线方程是,预测该人工智能公司第8年的利润是多少亿元( )
第年 1 2 3 4 5 6 7
利润/亿元 2.9 3.3 3.6 4.4 4.8 5.2 5.9
A.6.2 B.6.3 C.6.4 D.6.5
4.(24-25高二下·辽宁大连第二十四中学·期中)下列说法中错误的是( )
A.回归直线恒过样本点的中心
B.两个变量线性相关性越强,则相关系数就越接近1
C.在线性回归方程中,当变量每增加一个单位时,平均减少0.5个单位
D.某7个数的平均数为4,方差为2,现加入一个新数据4,此时这8个数的方差不变
5.(24-25高二下·辽宁省沈阳市第一二0中学·期中)已知变量之间的线性回归方程为且变量之间的一组相关数据如图所示,则下列说法错误的是( )
6 8 10 12
6 3 2
A.变量x,y之间呈负相关关系
B.可以预测,当时,
C.
D.该回归直线必过点
6.(24-25高二下·辽宁沈阳东北育才学校·期中)某公司为了增加某商品的销售利润,调查了该商品投入的广告费用x(万元)与销售利润y(万元)的统计数据如下表,由表中数据,得线性回归直线l:,则下列结论正确的是( )附:,
广告费用x(万元) 2 3 5 6
7销售利润y(万元) 5 7 9 11
A.直线l过点 B.直线l过点
C. D.变量y和x呈负相关
7.观察下列散点图,其中两个变量的相关关系判断一定正确的是( )
A.图1中y与x呈正相关
B.图2中y与x不相关
C.图3中y与x的线性相关系数小于0
D.图1中y与x的线性相关系数小于图2中y与x的线性相关系数
8.(24-25高二下·辽宁省凤城市第二中学·期中)人工智能技术(简称AI技术)已成为引领世界新一轮科技革命和产业改革的战略性技术,AI技术加持的电脑(以下简称AI电脑)也在全国各地逐渐热销起来.下表为市统计的2024年11月至2025年3月这5个月该市AI电脑的月销量,其中为月份代号,(单位:万台)为AI电脑的月销量.
月份 2024年11月 2024年12月 2025年1月 2025年2月 2025年3月
月份代号 1 2 3 4 5
月销量 0.5 0.9 1 1.2 1.4
经过分析,与线性相关,且其线性回归方程为,则2025年3月的残差为( )(实际值与预计值之差)
A. B. C.0.02 D.0.04
二、填空题
9.(24-25高二下·辽宁重点中学协作校·期中)某公司从某年起年的利润情况如下表所示.
第年
利润/亿元
且关于的回归直线方程是,则的值为__________.
三、解答题
10.(24-25高二下·内蒙古呼和浩特市林格尔县民族中学·期中)哈三中高二数学备课组对学生的记忆力和判断力进行统计分析,所得数据如下表所示:
4 6 8 10
2 3 5 6
(1)请根据上表提供的数据,用最小二乘法求出关于的线性回归方程;
(2)根据(1)中求出的线性回归方程,预测记忆力为9的学生的判断力.
(参考公式:,)
11.(24-25高二下·辽宁县域重点高中·期中)某课外实验小组通过实验统计了某种子的发芽率y%与土壤的湿度x%的相关数据如下表:
x 40 45 50 55 60
y 50 56 64 72 83
(1)求y关于x的相关系数r(精确到0.001),并判断它们是否具有较强的线性相关关系?
(2)求y关于x的回归直线方程,并预测当土壤的湿度为70%时,种子的发芽率y%的值.
参考公式及数据:对于一组数据,,…,,回归直线方程的斜率和截距的最小二乘估计公式分别为,,相关系数,,,.
12.(24-25高二下·内蒙古自治区呼和浩特市剑桥中学·期中)某运动服饰公司对产品研发的年投资额(单位:十万元)与年销售量(单位:万件)的数据进行统计,整理后得到如下统计表:
1 2 3 4 5
35 40 50 55 70
(1)求和的样本相关系数(精确到0.01),并推断和的线性相关程度;(若,则线性相关程度很强;若,则线性相关程度一般;若,则线性相关程度很弱)
(2)求年销售量关于年投资额的回归直线方程,并据此预测年投资额为60万元时的年销售量.
参考数据:.
参考公式:相关系数;
回归直线方程中,.
一、单选题
1.(24-25高二下·辽宁省实验中学·期中)已知变量与变量的关系可以用模型(,为常数)拟合,设,变换后得到一组数据如下:
2 3 4 5 6
1.02 1.20 1.42 1.62 1.84
由上表可得经验回归方程为,则( )
A.0.206 B. C.0.596 D.
2.(24-25高二下·辽宁大连滨城高中联盟·期中)下表为某外来生物物种入侵某河流生态后的前3个月繁殖数量(单位:百只)的数据,通过相关理论进行分析,知可用回归模型对与的关系进行拟合,则根据该回归模型,预测第7个月该物种的繁殖数量为( )
第个月 1 2 3
繁殖数量
A.百只 B.百只 C.百只 D.百只
二、填空题
3.(24-25高二下·内蒙古自治区呼和浩特市剑桥中学·期中)以模型去拟合一组数据时,为了求出回归方程,设,其变换后得到线性回归方程,则______.
三、解答题
4.(24-25高二下·辽宁重点中学协作校·期中)已知与及与的成对数据如下,且关于的回归直线方程为,
(1)求关于的回归直线方程;
(2)由散点图发现可以用指数型函数模型拟合与的关系,请建立关于的回归方程(,的值精确到);
(3)又得到一组新数据,,根据这对数据残差的绝对值的大小判断(1)、(2)两个方程哪个拟合效果更好.
参考数据:
其中,.
参考公式:对于一组数据,,,,
其回归直线方程为,其中,.
5.(24-25高二下·辽宁省七校协作体·期中)当前,人工智能技术以前所未有的速度迅猛发展,并逐步影响我们的方方面面,人工智能被认为是推动未来社会发展和解决人类面临的全球性问题的重要手段.某公司在这个领域逐年加大投入,以下是近年来该公司对产品研发年投入额(单位:百万元)与其年销售量y(单位:千件)的数据统计表.
1 2 3 4 5 6
1 1.5 3 6 12
(1)公司拟分别用①和②两种方案作为年销售量关于年投入额的回归分析模型,请根据已知数据,确定方案①和②的经验回归方程;(计算过程保留到小数点后两位,最后结果保留到小数点后一位)
(2)根据下表数据,用决定系数(只需比较出大小)比较两种模型的拟合效果哪种更好,并选择拟合精度更高的模型,预测年投入额为百万元时,产品的销售量是多少
经验回归方程
残差平方和
参考公式及数据:,,,,,,,, .
一、单选题
1.(24-25高二下·辽宁省七校协作体·期中)针对2025年第九届亚冬会在哈尔滨举办,校团委对“是否喜欢冰雪运动与学生性别的关系”进行了一次调查,其中被调查的男、女生人数相同,男生中喜欢冰雪运动的人数占男生人数的,女生中喜欢冰雪运动的人数占女生人数的,若依据的独立性检验,认为是否喜欢冰雪运动与学生性别有关,则被调查的学生中男生的人数不可能是( )
附:.
0.1 0.05 0.01 0.005 0.001
2.706 3.841 6.635 7.879 10.828
A.48 B.54 C.60 D.66
2.(24-25高二下·辽宁重点中学协作校·期中)为了了解性别与视力之间的关系,一个调查机构得到列联表如图,则当取下面何值时,性别与视力无关的可能性最大( )
男 女
近视 240 200
不近视 50
A.40 B.60 C.100 D.240
二、多选题
3.(24-25高二下·内蒙古呼和浩特和林格尔县民族中学·期中)下列的叙述正确的有( )
A.关于一元线性回归,若相关系数,则y与x的相关程度很强
B.关于一元线性回归,若决定系数的越大,模型拟合效果越差
C.关于独立性检验,随机变量的值越大,认为“两个分类变量有关系”的把握性越大
D.关于独立性检验,若的观测值满足,依据小概率值的独立性检验,认为“两个分类变量无关”(参考数据:)
4.(24-25高二下·辽宁重点中学协作校·期中)统计学中,常用的显著性水平以及对应的分位数如下表所示.
在检验与是否有关的过程中,根据已知数据计算得,则( )
A.若,则在犯错误的概率不超过的前提下认为与有关
B.若,则在犯错误的概率不超过的前提下认为与无关
C.若,则有的把握认为与有关
D.若,,则
三、解答题
5.(24-25高二下·内蒙古呼和浩特市林格尔县民族中学·期中)某学校为全面提高学生的语文素养和阅读水平,构建“书香校园”,特举办“课外阅读知识竞赛”,为了调查学生对这次活动的满意程度,在所有参加“课外阅读知识竞赛”的同学中抽取容量为300的样本进行调查,并得到如下列联表:
单位:人
满意程度 性别 合计
男生 女生
满意 120
不满意 150
合计 200
请补全上面的列联表,依据小概率值的独立性检验,能否认为满意程度与性别有关系.
附:,其中.
0.1 0.05 0.01 0.001
2.706 3.841 6.635 10.828
6.(24-25高二下·辽宁大连第二十四中学·期中)研究表明,春季早晚温差大,由于个人体质不同,可能会导致感冒患病. 某医学研究小组为了解20-30岁年轻人的体质健康是否与性别有关,在4月感冒易发季节对某一小区中该年龄段的年轻人进行了随机抽样,得到如2×2列联表.
性别 健康状况
感冒 不感冒
男 8 14
女 4 24
(1)在上述感冒的年轻人中按照性别采用分层抽样的方法抽取6人,再从这6人中随机选取3人访谈,记参与访谈的男性人数为X,求X的分布和期望;
(2)依据表中数据,在犯错误的概率不超过0.05的前提下,20-30岁年轻人的体质健康与性别是否有关 若把表中所有数据都扩大到原来的10倍,此时结论还一样吗 请解释其中原因,并简要说明应如何调整调查可使此研究更具有严谨性.
参考数据:
参考公式:,其中.
7.(24-25高二·辽宁抚顺六校协作体·期中)为了研究学生每天整理数学错题的情况,某校数学建模兴趣小组在本校某年级学生中随机抽取了200名学生,调查他们平时的数学成绩和整理数学错题的情况,现统计的部分数据如下表:
数学成绩总评优秀的人数 数学成绩总评非优秀的人数 合计
每天都整理数学错题的人数 90
不是每天都整理数学错题的人数 40 100
合计 200
(1)完成上述样本数据的列联表,并判断是否有的把握认为学生的数学成绩总评优秀与每天都整理数学错题有关;
(2)按照比例采用分层随机抽样的方法从不是每天都整理数学错题的学生中随机抽取5名学生,再从这5名学生中选3名做进一步访谈,设这3人中数学成绩总评非优秀的人数为,求的分布列和期望.
附:,其中.
0.1 0.05 0.01 0.005 0.001
2.706 3.841 6.635 7.879 10.828
8.(24-25高二下·辽宁重点高中沈阳郊联体·期中)近年来,随着智能手机的普及,网上买菜迅速进入了我们的生活.现将一周网上买菜次数超过3次的市民认定为“喜欢网上买菜”,不超过3次甚至从不在网上买菜的市民认定为“不喜欢网上买菜”.某市M社区为了解该社区市民网上买菜情况,随机抽取了该社区100名市民,得到的统计数据如下表所示:
喜欢网上买菜 不喜欢网上买菜 合计
年龄不超过45岁的市民 40 10 50
年龄超过45岁的市民 20 30 50
合计 60 40 100
(1)是否有的把握认为社区的市民喜欢网上买菜与年龄有关?
(2)社区的市民小张周一 二均在网上买菜,且周一等可能地从两个买菜平台随机选择一个下单买菜如果周一选平台买菜,那么周二选平台买菜的概率为,如果周一选每平台买菜,那么周二选择平合买菜的概率为,求小张周二选择平台买菜的概率;
(3)用频率估计概率,现从社区随机抽取25名市民,记其中喜欢网上买菜的市民人数为随机变量,求的期望和方差.
附:.
0.100 0.050 0.010 0.005 0.001
2.706 3.841 6.635 7.879 10.828
9.(24-25高二下·辽宁省东北育才中学·期中)游泳是一种高效的锻炼方法,坚持游泳可以增强体质,提高免疫力.某游泳馆为了了解是否喜欢游泳与性别有关联,随机在某小区调查了200人,得到的数据如表所示:
性别 游泳 合计
喜欢 不喜欢
男 80 40 120
女 32 48 80
合计 112 88 200
(1)依据小概率值的独立性检验,能否认为是否喜欢游泳与性别有关联?
(2)为分析喜欢游泳的原因,在喜欢游泳的人中采用分层抽样的方法随机抽取7人,再从这7人中随机抽取3人进行调查,记随机变量X为这3人中女性的人数,求X的分布列与数学期望.
附:,其中.
0.1 0.05 0.01 0.005 0.001
2.706 3.841 6.635 7.879 10.828
10.(24-25高二下·辽宁沈阳重点高中联合体·期中)电视台对某时段收看综艺节目和新闻节目的观众进行抽样调查,随机抽取了100名电视观众,相关的数据如下表所示(单位:人).
收看综艺节目 收看新闻节目
20~40岁 45 10
40岁及以上 30 15
(1)从表中数据分析,是否有95%的把握认为在这一时段观众选择收看综艺节目还是新闻节目与年龄有关.
(2)现从所抽取的40岁及以上的电视观众中利用分层抽样的方法抽取9人,再从这9人中随机选取3人做访谈,求选取的3人中至少有2人在这一时段收看综艺节目的概率.
(3)将频率视为概率,从我市所有在这一时段收看综艺节目和新闻节目的观众中随机抽取20人,记其中收看新闻节目的观众数为X,求随机变量X的数学期望和方差.
参考公式:,其中.
临界值表:
0.1 0.05 0.01 0.005 0.001
2.706 3.811 6.635 7.879 10.828
11.(24-25高二下·辽宁沈阳五校协作体·期中)为了研究高中学生每天整理数学错题的情况,沈阳市某校数学建模兴趣小组的同学在本校高二年级学生中采用随机抽样的方法抽取了40名学生,调查他们平时的数学成绩和整理数学错题的情况,现统计得部分数据如下:
数学成绩总评优秀人数 数学成绩总评非优秀人数 合计
每天都整理数学错题人数 14 a
不是每天都整理数学错题人数 b 15 20
合计 40
(1)计算a,b的值,并判断是否有99%的把握认为“数学成绩总评优秀与每天都整理数学错题有关”?
附:
0.10 0.01 0.001
2.706 6.635 10.828
(2)从样本中不是每天都整理数学错题的学生中随机抽取3名学生做进一步访谈,设恰好抽取到数学成绩总评优秀的人数为X,求X的分布列和期望.
12.(24-25高二下·辽宁实验中学·期中)为调查某地区老年人是否需要志愿者提供帮助,用简单随机抽样方法从该地区调查了500位老人,结果如下面表中所示:
男 女 合计
需要 50 25 s
不需要 200 225 425
合计 250 t 500
(1)求s,t;
(2)能否有99%的把握认为该地老年人是否需要帮助与性别有关?
(3)根据(2)的结论,你能否提出更好的调查方法来估计该地区的老年人中,需要志愿者提供帮助的老年人的比例?说明理由.
附:,
0.050 0.010 0.001
k 3.841 6.635 10.828
13.(24-25高二下·辽宁县域重点高中·期中)某医疗机构为了解某种地方性疾病与饮食习惯间的关系(饮食习惯分为良好与不良),从该地区随机抽取300名居民,得到如下2×2列联表:
饮食习惯 合计
良好 不良
患有这种地方性疾病 40
未患有这种地方性疾病 200
合计 220
(1)请补充上面2×2列联表,并判断是否有99.9%的把握认为居民是否患有这种地方性疾病与饮食习惯有关联?
(2)通过抽血化验的方式进行这种地方性疾病的检验,随机地将k个人的血样混合再化验,如果混管血样呈阴性,说明这k个人全部阴性;如果混管血样呈阳性,说明这k个人中至少一人血样呈阳性,需要对每个人再分别化验一次.已知5人的混管血样呈阳性.
(ⅰ)若这5人中有2人患有这种地方性疾病,现将这5人每个人的血样逐个化验,直到查出患有这种地方性疾病的2人为止,设X表示所需化验次数,求X的分布列与数学期望;
(ⅱ)若这5人中有1人患有这种地方性疾病,从这5人中取出3人的血样混合一起化验,若呈阳性,则对这3人的血样再逐一化验,直到查出患有这种地方性疾病的人为止;若呈阴性,则对剩下2人的血样逐一化验,直到查出患有这种地方性疾病的人为止.设Y表示所需化验次数,求.
附:,其中.
0.1 0.01 0.001
k 2.706 6.635 10.828
14.(24-25高二下·辽宁大连滨城高中联盟·期中)某观影平台为了解观众对最近上映的某部影片的评价情况(评价结果仅有“好评”、“差评”),从平台所有参与评价的观众中随机抽取216人进行调查,部分数据如下表所示(单位:人):
好评 差评 合计
男性 40 68 108
女性 60 48 108
合计 100 116 216
(1)判断是否有的把握认为“对该部影片的评价与性别有关”
(2)若将频率视为概率,从观影平台的所有给出“好评”的观众中随机抽取3人,用随机变量表示被抽到的男性观众的人数,求的分布列;
(3)在抽出的216人中,从给出“好评”的观众中利用分层抽样的方法抽取10人,从给出“差评”的观众中抽取人.现从这人中,随机抽出2人,用随机变量表示被抽到的给出“好评”的女性观众的人数.若随机变量的数学期望不小于1,求的最大值.
参考公式:,其中.
参考数据:
0.10 0.05 0.025 0.010 0.005 0.001
2.706 3.841 5.024 6.635 7.879 10.828
21世纪教育网 www.21cnjy.com 精品试卷·第 2 页 (共 2 页)
21世纪教育网(www.21cnjy.com)

展开更多......

收起↑

资源列表