单元检测九 统计与成对数据的统计分析(原卷版 解析版)2026届高考数学好题汇编

资源下载
  1. 二一教育资源

单元检测九 统计与成对数据的统计分析(原卷版 解析版)2026届高考数学好题汇编

资源简介

中小学教育资源及组卷应用平台
单元检测九 统计与成对数据的统计分析
(时间:120分钟 分值:150分)
一、选择题(本题共8小题,每小题5分,共40分.在每小题给出的四个选项中,只有一项是符合题目要求的)
1.某班有55人,要抽出3人,用随机数法确定人选,班长给全班同学编号为01,02,03,…,55,依次得到4个随机数为02,29,68,47,其中不能作为编号的随机数是(  )
A.02 B.29 C.68 D.47
2.(2025·大庆模拟)从大到小排列的一组数据:134,126,120,110,96,90,86,80,这组数据的下四分位数为(  )
A.86 B.88 C.123 D.126
3.(2026·安康模拟)已知一组数据x1,x2,…,xk的平均数为a,方差为b,则数据4x1-3,4x2-3,…,4xk-3的(  )
A.平均数为4a B.平均数为16a-3
C.方差为16b2 D.方差为16b
4.(2026·萍乡模拟)某中学有初中生600名,高中生200名,为保障学生的身心健康,学校举办了“校园安全知识”竞赛.现用按比例分配的分层随机抽样的方法,分别抽取初中生m名,高中生n名,经统计,(m+n)名学生的平均成绩为74分,其中m名初中生的平均成绩为72分,n名高中生的平均成绩为x分,则x等于(  )
A.74 B.76 C.78 D.80
5.(2025·丹东模拟)为了解是否喜欢羽毛球运动与性别的关系,某数学兴趣小组经统计得到如下数据,若要使是否喜欢羽毛球运动与性别无关的可能性最大,则等于(  )
性别 羽毛球
喜欢 不喜欢
女生 m n
男生 50 100
附:χ2=,其中n=a+b+c+d.
A.4 B.2 C.1 D.
6.某学校一同学研究温差x(℃)与本校当天新增感冒人数y(人)的关系,该同学记录了5天的数据:
x 5 6 8 9 12
y 17 20 25 28 35
经过拟合,发现基本符合经验回归方程=2.6x+,则下列结论错误的是(  )
A.经验回归直线一定过点(8,25)
B.=4.2
C.当x=5时,残差为-0.2
D.若去掉样本点(8,25),则样本相关系数r增大
7.(2025·成都模拟)某年1月25日至2月12日某旅游景区A及其里面的特色景点a累计参观人次的折线图如图所示,则下列判断正确的是(  )
A.1月29日景区A累计参观人次中特色景点a的占比超过了
B.2月4日至2月10日特色景点a累计参观人次增加了9 800人次
C.2月4日至2月6日特色景点a累计参观人次的增长率和2月6日至2月8日特色景点a累计参观人次的增长率相等
D.2月8日至2月10日景区A累计参观人次的增长率小于2月6日至2月8日的增长率
8.(2025·天津模拟)某工人智能软件的使用成为当下的热门话题.某中学高中数学社团以16至40岁人群使用该软件的频率为课题,分小组自主选题进行调查研究,下列说法正确的是(  )
A.甲小组开展了该软件每周使用频次与年龄的相关性研究,经计算样本相关系数r≈0.97,可以推断两个变量正相关,但线性相关程度很弱
B.乙小组利用最小二乘法得到该软件每周使用频次y关于年龄x的经验回归方程为=0.3x+8,可以推断年龄为30岁的群体每周使用频次一定为17次
C.丙小组用决定系数R2来比较模型的拟合效果,经验回归方程①和②的R2分别约为0.733和0.998,因此经验回归方程②的拟合效果比经验回归方程①的好很多
D.丁小组研究性别因素是否影响该软件使用频次,根据小概率值α=0.1的独立性检验,计算得到χ2=3.837>2.706=x0.1,可以认为不同性别对该软件的使用频次没有差异
二、选择题(本题共3小题,每小题6分,共18分.在每小题给出的选项中,有多项符合题目要求.全部选对的得6分,部分选对的得部分分,有选错的得0分)
9.(2025·唐山模拟)下列说法中正确的是(  )
A.对于独立性检验,χ2的值越大,说明两事件相关程度越大
B.以模型y=cekx去拟合一组数据时,为了求出经验回归方程,设z=ln y,将其变换后得到z=0.3x+4,则c,k的值分别是e4和0.3
C.若变量y和x之间的样本相关系数r=-0.99,则变量y和x之间具有很强的线性相关性,而且是负相关
D.通过经验回归方程=x+及系数可以精确反映变量的取值和变化趋势
10.(2025·绵阳模拟)某校组织全体高一年级的学生进行古典诗词知识测试,从中随机抽取100名学生,记录他们的分数,整理得到频率分布直方图如图(各组区间除最后一组为闭区间外,其余各组均为左闭右开区间),则以下说法正确的是(  )
A.a=0.025
B.估计此次测试学生分数的众数为95
C.估计此次测试学生分数的中位数为90
D.估计此次测试学生分数的下四分位数为85
11.对于变量x和变量y,经过随机抽样获得成对样本数据(xi,yi),i=1,2,3,…,10,且=2.2,样本数据对应的散点大致分布在一条直线附近.利用最小二乘法求得经验回归方程为=1.8x+0.04,分析发现样本数据(4,4.9)对应的散点远离经验回归直线,将其剔除后得到新的经验回归方程,则(  )
A.变量x与变量y的样本相关系数为1.8
B.剔除后,变量x与变量y的样本相关系数变大
C.新的经验回归直线一定经过点(2,5.9)
D.若新的经验回归直线经过点(3,5.9),则其方程为=2x-0.1
三、填空题(本题共3小题,每小题5分,共15分)
12.(2025·杭州模拟)已知成对样本数据(x1,y1),(x2,y2),…,(xn,yn)(n≥3)中,x1,x2,…,xn互不相等,且所有样本点(xi,yi)(i=1,2,…,n)都在直线y=-x+1上,则这组成对样本数据的样本相关系数r=    .
13.(2025·天津模拟)某公司青年、中年、老年员工的人数之比为6∶5∶4,从中抽取100名作为样本,若每人被抽中的概率是,则该公司青年员工的人数为    .
14.(2025·济南模拟)两个相关变量x,y的一组数据统计如表.
x 2 3 4 5 6
y 2.8 3.1 3.3 3.8 4.0
根据上表可得经验回归方程=x+中的为0.31,据此经验回归方程,当x=7时,y的预测值为     .
四、解答题(本题共5小题,共77分.解答应写出文字说明、证明过程或演算步骤)
15.(13分)某地用简单随机抽样的方法抽取15个村进行验收调查,调查得到一组样本数据(xi,yi)(i=1,2,…,15),其中xi和yi分别表示第i个村中村户的年平均收入(单位:万元)和产业资金投入数量(单位:万元),并计算得到xi=15,yi=750,(xi-)2=0.82,(yi-)2=1 670,(xi-)(yi-)=35.3.
(1)试估计该地被调查村的村户年平均收入;(3分)
(2)根据样本数据,求该地被调查村中村户年平均收入与产业资金投入数量的样本相关系数;(精确到0.01)(5分)
(3)根据现有统计资料,各被调查村产业资金投入差异很大.为了准确地进行验收,请给出一种你认为更合理的抽样方法,并说明理由.(5分)
16.(15分)(2025·成都模拟)随着手机的日益普及,学生使用手机对学校管理和学生发展带来诸多影响.某中学为探究“周末使用手机时长是否影响学业成绩”,随机调查100名学生,得到部分统计数据如表.
学业成绩 使用手机≤2小时 使用手机>2小时
良好 m 20
不良好 n 40
记事件A=“学业成绩良好且使用手机≤2小时”,事件B=“学业成绩不良好且使用手机≤2小时”,已知事件A的频率是事件B的频率的3倍.
(1)求表中的m,n的值;(4分)
(2)记使用手机≤2小时的学生中学业成绩良好的概率为P,求P的估计值;(4分)
(3)根据小概率值α=0.001的独立性检验,分析周末使用手机时长与学业成绩是否有关联.(7分)
参考数据:χ2=,其中n=a+b+c+d.
α 0.10 0.05 0.01 0.005 0.001
xα 2.706 3.841 6.635 7.879 10.828
17.(15分)某学校为提高学生对《红楼梦》的了解,举办了“我知红楼”知识竞赛,现从所有答卷卷面成绩中随机抽取100份作为样本,将样本数据(满分100分,成绩均为不低于40分的整数)分成六段:[40,50),[50,60),…,[90,100],并作出如图所示的频率分布直方图.
(1)求频率分布直方图中a的值;(3分)
(2)求样本数据的第62百分位数;(6分)
(3)已知样本数据落在[50,60)的平均数是52,方差是6;落在[60,70)的平均数是64,方差是3.求这两组数据的总平均数和总方差s2.(6分)
18.(17分)某人统计了20212025年某网站“双11”当天的交易额,统计结果如表:
年份 2021 2022 2023 2024 2025
年份代码x 1 2 3 4 5
交易额y/百亿元 9 12 17 21 26
(1)请根据表中提供的数据,用样本相关系数r说明y与x的线性相关程度;(样本相关系数保留三位小数,样本相关系数r=.当|r|越接近1时,成对样本数据的线性相关程度越强;当|r|越接近0时,成对样本数据的线性相关程度越弱)(9分)
(2)求出y关于x的经验回归方程,并预测2028年该网站“双11”当天的交易额.(8分)
附:在经验回归方程=x+中,=,=-,≈43.1.
19.(17分)(2025·泰安模拟)2025年4月24日是第十个中国航天日.十年来,中国航天事业蒸蒸日上,中国人在太空的印记不断被刷新.某校部分学生十分关注中国航天的发展,若将累计关注中国航天发展的消息达到6次及以上者称为“航天达人”,未达到6次者称为“非航天达人”.现从该校随机抽取100人进行分析,得到数据如表所示:
性别 是否为“航天达人” 合计
航天达人 非航天达人
男 40 60
女 20
合计
(1)补全2×2列联表,根据小概率值α=0.01的独立性检验,能否认为“航天达人”与性别有关联?(5分)
(2)现从抽取的“航天达人”中,按性别采用分层随机抽样的方法抽取6人,然后从这6人中随机抽取3人,记这3人中女“航天达人”的人数为X,求X的分布列和数学期望;(5分)
(3)为进一步提高学生对航天事业的关注度,该学校组织了“航天知识竞赛”活动,竞赛共设置20道题目, 其中n(3≤n≤13)道题目是小明能答对的, 规定每位参赛者从20道题目中随机抽取10道作答,则要使小明恰好答对3道题目的概率最大,那么n取多少?(7分)
附:
α 0.10 0.05 0.01 0.005
xα 2.706 3.841 6.635 7.879
χ2=,n=a+b+c+d.
单元检测九 统计与成对数据的统计分析
(时间:120分钟 分值:150分)
一、选择题(本题共8小题,每小题5分,共40分.在每小题给出的四个选项中,只有一项是符合题目要求的)
1.某班有55人,要抽出3人,用随机数法确定人选,班长给全班同学编号为01,02,03,…,55,依次得到4个随机数为02,29,68,47,其中不能作为编号的随机数是(  )
A.02 B.29 C.68 D.47
答案 C
解析 由于68>55,所以68不能作为编号.
2.(2025·大庆模拟)从大到小排列的一组数据:134,126,120,110,96,90,86,80,这组数据的下四分位数为(  )
A.86 B.88 C.123 D.126
答案 B
解析 从小到大排列这组数据得,80,86,90,96,110,120,126,134,
因为25%×8=2,所以这组数据的下四分位数为=88.
3.(2026·安康模拟)已知一组数据x1,x2,…,xk的平均数为a,方差为b,则数据4x1-3,4x2-3,…,4xk-3的(  )
A.平均数为4a B.平均数为16a-3
C.方差为16b2 D.方差为16b
答案 D
解析 设数据x1,x2,…,xk的平均数和方差为,,
数据4x1-3,4x2-3,…,4xk-3的平均数和方差为',,
由题意知=a,则'=4-3=4a-3,故A,B均错误;
=b,则=42=16b,故C错误,D正确.
4.(2026·萍乡模拟)某中学有初中生600名,高中生200名,为保障学生的身心健康,学校举办了“校园安全知识”竞赛.现用按比例分配的分层随机抽样的方法,分别抽取初中生m名,高中生n名,经统计,(m+n)名学生的平均成绩为74分,其中m名初中生的平均成绩为72分,n名高中生的平均成绩为x分,则x等于(  )
A.74 B.76 C.78 D.80
答案 D
解析 由题意,得
可得=74,解得x=80.
5.(2025·丹东模拟)为了解是否喜欢羽毛球运动与性别的关系,某数学兴趣小组经统计得到如下数据,若要使是否喜欢羽毛球运动与性别无关的可能性最大,则等于(  )
性别 羽毛球
喜欢 不喜欢
女生 m n
男生 50 100
附:χ2=,其中n=a+b+c+d.
A.4 B.2 C.1 D.
答案 D
解析 要使是否喜欢羽毛球运动与性别无关的可能性最大,则χ2=0,所以100m=50n,
所以=.
6.某学校一同学研究温差x(℃)与本校当天新增感冒人数y(人)的关系,该同学记录了5天的数据:
x 5 6 8 9 12
y 17 20 25 28 35
经过拟合,发现基本符合经验回归方程=2.6x+,则下列结论错误的是(  )
A.经验回归直线一定过点(8,25)
B.=4.2
C.当x=5时,残差为-0.2
D.若去掉样本点(8,25),则样本相关系数r增大
答案 D
解析 因为==8,
==25,
所以经验回归直线一定过点(8,25),故A正确;
由25=2.6×8+,
解得=4.2,故B正确;
由B项知,=2.6x+4.2,令x=5,
则=2.6×5+4.2=17.2,
所以残差为17-17.2=-0.2,故C正确;
由样本相关系数的公式可知,去掉样本点(8,25)后,x与y的样本相关系数r不变,故D错误.
7.(2025·成都模拟)某年1月25日至2月12日某旅游景区A及其里面的特色景点a累计参观人次的折线图如图所示,则下列判断正确的是(  )
A.1月29日景区A累计参观人次中特色景点a的占比超过了
B.2月4日至2月10日特色景点a累计参观人次增加了9 800人次
C.2月4日至2月6日特色景点a累计参观人次的增长率和2月6日至2月8日特色景点a累计参观人次的增长率相等
D.2月8日至2月10日景区A累计参观人次的增长率小于2月6日至2月8日的增长率
答案 D
解析 1月29日景区A累计参观人次中特色景点a的占比为<=,故A错误;
2月4日至2月10日特色景点a累计参观人次增加了9 800-6 000=3 800(人次),故B错误;
2月4日至2月6日特色景点a累计参观人次的增长率为=,
2月6日至2月8日特色景点a累计参观人次的增长率为=,
因为≠,故C错误;
2月8日至2月10日景区A累计参观人次的增长率为=,
2月6日至2月8日景区A累计参观人次的增长率为=,
因为<,故D正确.
8.(2025·天津模拟)某工人智能软件的使用成为当下的热门话题.某中学高中数学社团以16至40岁人群使用该软件的频率为课题,分小组自主选题进行调查研究,下列说法正确的是(  )
A.甲小组开展了该软件每周使用频次与年龄的相关性研究,经计算样本相关系数r≈0.97,可以推断两个变量正相关,但线性相关程度很弱
B.乙小组利用最小二乘法得到该软件每周使用频次y关于年龄x的经验回归方程为=0.3x+8,可以推断年龄为30岁的群体每周使用频次一定为17次
C.丙小组用决定系数R2来比较模型的拟合效果,经验回归方程①和②的R2分别约为0.733和0.998,因此经验回归方程②的拟合效果比经验回归方程①的好很多
D.丁小组研究性别因素是否影响该软件使用频次,根据小概率值α=0.1的独立性检验,计算得到χ2=3.837>2.706=x0.1,可以认为不同性别对该软件的使用频次没有差异
答案 C
解析 r的绝对值越接近1,两变量间的线性相关性越强,故A错误;
经验回归方程为=0.3x+8给出的是预测值,所以年龄为30岁的群体每周使用频次不一定为17次,故B错误;
R2越大,模型拟合效果越好,所以经验回归方程②的拟合效果比经验回归方程①的好很多,故C正确;
χ2=3.837>2.706=x0.1,则根据小概率值α=0.1的独立性检验,可以认为不同性别对该软件的使用频次有差异,故D错误.
二、选择题(本题共3小题,每小题6分,共18分.在每小题给出的选项中,有多项符合题目要求.全部选对的得6分,部分选对的得部分分,有选错的得0分)
9.(2025·唐山模拟)下列说法中正确的是(  )
A.对于独立性检验,χ2的值越大,说明两事件相关程度越大
B.以模型y=cekx去拟合一组数据时,为了求出经验回归方程,设z=ln y,将其变换后得到z=0.3x+4,则c,k的值分别是e4和0.3
C.若变量y和x之间的样本相关系数r=-0.99,则变量y和x之间具有很强的线性相关性,而且是负相关
D.通过经验回归方程=x+及系数可以精确反映变量的取值和变化趋势
答案 ABC
解析 对于A,根据独立性检验的性质知,χ2的值越大,说明两个事件的相关程度越大,A正确;
对于B,由y=cekx,两边取自然对数得ln y=ln c+kx,设z=ln y,则z=kx+ln c,
由z=0.3x+4,得则B正确;
对于C,由变量y和x之间的样本相关系数r=-0.99<0,得变量y和x之间具有很强的线性相关性,且是负相关,C正确;
对于D,通过经验回归方程=x+及系数,可以预测变量的取值和变化趋势,D错误.
10.(2025·绵阳模拟)某校组织全体高一年级的学生进行古典诗词知识测试,从中随机抽取100名学生,记录他们的分数,整理得到频率分布直方图如图(各组区间除最后一组为闭区间外,其余各组均为左闭右开区间),则以下说法正确的是(  )
A.a=0.025
B.估计此次测试学生分数的众数为95
C.估计此次测试学生分数的中位数为90
D.估计此次测试学生分数的下四分位数为85
答案 ABD
解析 对于A,由10(0.006+0.009+0.02+0.032+a+0.008)=1,得a=0.025,A正确;
对于B,因为众数是频率分布直方图中最高矩形的底边中点的横坐标,故众数是95,B正确;
对于C,由于分数小于90的频率是0.35,故中位数不可能为90,C错误;
对于D,下四分位数就是第25百分位数,根据频率分布直方图,易知前两组的频率之和为0.15<0.25,前三组的频率之和为0.35>0.25,所以第25百分位数在[80,90)内,设为x,则0.15+0.02(x-80)=0.25,解得x=85,即估计此次测试学生分数的下四分位数为85,D正确.
11.对于变量x和变量y,经过随机抽样获得成对样本数据(xi,yi),i=1,2,3,…,10,且=2.2,样本数据对应的散点大致分布在一条直线附近.利用最小二乘法求得经验回归方程为=1.8x+0.04,分析发现样本数据(4,4.9)对应的散点远离经验回归直线,将其剔除后得到新的经验回归方程,则(  )
A.变量x与变量y的样本相关系数为1.8
B.剔除后,变量x与变量y的样本相关系数变大
C.新的经验回归直线一定经过点(2,5.9)
D.若新的经验回归直线经过点(3,5.9),则其方程为=2x-0.1
答案 BD
解析 对于A,样本相关系数的绝对值的最大值为1,故A错误;
对于B,由剔除的是偏离直线较大的异常点,得剔除该点后,
新样本数据的线性相关程度变强,即样本相关系数的绝对值变大,
易知变量x与变量y正相关,所以剔除后,样本相关系数变大,故B正确;
对于C,原样本中,=1.8×2.2+0.04=4,
剔除一个偏离直线较大的异常点(4,4.9)后,
新样本中,'==2,'==3.9,
因此剔除该异常点后的经验回归直线一定经过点(2,3.9),故C错误;
对于D,由新的经验回归直线经过点(3,5.9),得新的经验回归直线的斜率为=2,
设=2x+,将点(2,3.9)代入,得=-0.1,所以其方程为=2x-0.1,故D正确.
三、填空题(本题共3小题,每小题5分,共15分)
12.(2025·杭州模拟)已知成对样本数据(x1,y1),(x2,y2),…,(xn,yn)(n≥3)中,x1,x2,…,xn互不相等,且所有样本点(xi,yi)(i=1,2,…,n)都在直线y=-x+1上,则这组成对样本数据的样本相关系数r=    .
答案 -1
解析 因为所有样本点(xi,yi)(i=1,2,…,n)都在直线y=-x+1上,则|r|=1,又直线y=-x+1的斜率-<0,
所以样本数据负相关,则样本相关系数r=-1.
13.(2025·天津模拟)某公司青年、中年、老年员工的人数之比为6∶5∶4,从中抽取100名作为样本,若每人被抽中的概率是,则该公司青年员工的人数为    .
答案 120
解析 设该公司的人数为n,因为抽取100名作为样本,每人被抽中的概率是,
可得=,解得n=300,
又该公司青年、中年、老年员工的人数之比为6∶5∶4,
所以该公司青年员工的人数为300×=120.
14.(2025·济南模拟)两个相关变量x,y的一组数据统计如表.
x 2 3 4 5 6
y 2.8 3.1 3.3 3.8 4.0
根据上表可得经验回归方程=x+中的为0.31,据此经验回归方程,当x=7时,y的预测值为     .
答案 4.33
解析 由题表得==4,==3.4,
由于经验回归直线=0.31x+过点(4,3.4),则=3.4-0.31×4=2.16,
即=0.31x+2.16,则当x=7时,=0.31×7+2.16=4.33.
四、解答题(本题共5小题,共77分.解答应写出文字说明、证明过程或演算步骤)
15.(13分)某地用简单随机抽样的方法抽取15个村进行验收调查,调查得到一组样本数据(xi,yi)(i=1,2,…,15),其中xi和yi分别表示第i个村中村户的年平均收入(单位:万元)和产业资金投入数量(单位:万元),并计算得到xi=15,yi=750,(xi-)2=0.82,(yi-)2=1 670,(xi-)(yi-)=35.3.
(1)试估计该地被调查村的村户年平均收入;(3分)
(2)根据样本数据,求该地被调查村中村户年平均收入与产业资金投入数量的样本相关系数;(精确到0.01)(5分)
(3)根据现有统计资料,各被调查村产业资金投入差异很大.为了准确地进行验收,请给出一种你认为更合理的抽样方法,并说明理由.(5分)
解 (1)该地被调查村的村户年平均收入的估计值为xi=×15=1(万元).
(2)样本相关系数为
r==
=≈≈0.95.
(3)采用按比例分配的分层随机抽样,理由如下:
由(2)知被调查村的村户年平均收入与该村的产业投入资金有很强的正相关性,
由于各被调查村产业资金投入差异很大,因此被调查村的村户年平均收入差异也很大,
所以采用按比例分配的分层随机抽样的方法较好地保持了样本结构与总体结构的一致性,提高了样本的代表性,从而可以获得该地更准确的验收估计.
16.(15分)(2025·成都模拟)随着手机的日益普及,学生使用手机对学校管理和学生发展带来诸多影响.某中学为探究“周末使用手机时长是否影响学业成绩”,随机调查100名学生,得到部分统计数据如表.
学业成绩 使用手机≤2小时 使用手机>2小时
良好 m 20
不良好 n 40
记事件A=“学业成绩良好且使用手机≤2小时”,事件B=“学业成绩不良好且使用手机≤2小时”,已知事件A的频率是事件B的频率的3倍.
(1)求表中的m,n的值;(4分)
(2)记使用手机≤2小时的学生中学业成绩良好的概率为P,求P的估计值;(4分)
(3)根据小概率值α=0.001的独立性检验,分析周末使用手机时长与学业成绩是否有关联.(7分)
参考数据:χ2=,其中n=a+b+c+d.
α 0.10 0.05 0.01 0.005 0.001
xα 2.706 3.841 6.635 7.879 10.828
解 (1)由样本容量为100,
得m+n+20+40=100,即m+n=40.
又事件A的频率是事件B的频率的3倍,
所以=3×,即m=3n.
故n=10,m=30.
(2)因为在样本中使用手机≤2小时的学生中学业成绩良好的频率为==,
根据用样本频率估计总体频率,估计总体中使用手机≤2小时的学生中学业成绩良好的频率为,
再由频率估计概率,故使用手机≤2小时的学生中学业成绩良好的概率为.
故P的估计值为.
(3)零假设为H0:周末使用手机时长与学业成绩相互独立.由题得列联表,
学业成绩 使用手机≤2小时 使用手机>2小时 合计
良好 30 20 50
不良好 10 40 50
合计 40 60 100
所以χ2===≈16.667>10.828,
根据小概率值α=0.001的独立性检验,推断零假设H0不成立,即认为周末使用手机时长与学业成绩有关联,此推断犯错误的概率不超过0.001.
17.(15分)某学校为提高学生对《红楼梦》的了解,举办了“我知红楼”知识竞赛,现从所有答卷卷面成绩中随机抽取100份作为样本,将样本数据(满分100分,成绩均为不低于40分的整数)分成六段:[40,50),[50,60),…,[90,100],并作出如图所示的频率分布直方图.
(1)求频率分布直方图中a的值;(3分)
(2)求样本数据的第62百分位数;(6分)
(3)已知样本数据落在[50,60)的平均数是52,方差是6;落在[60,70)的平均数是64,方差是3.求这两组数据的总平均数和总方差s2.(6分)
解 (1)由(0.005+0.010+0.020+a+0.025+0.010)×10=1,
解得a=0.030.
(2)因为(0.005+0.010+0.020)×10=0.35,
(0.005+0.010+0.020+0.030)×10=0.65,
所以样本数据的第62百分位数在[70,80)内,
可得70+×10=79,
所以样本数据的第62百分位数为79.
(3)样本数据落在[50,60)的个数为0.1×100=10,
落在[60,70)的个数为0.2×100=20,
总平均数=×52+×64=60,
总方差s2=[6+(52-60)2]+[3+(64-60)2]=36.
18.(17分)某人统计了20212025年某网站“双11”当天的交易额,统计结果如表:
年份 2021 2022 2023 2024 2025
年份代码x 1 2 3 4 5
交易额y/百亿元 9 12 17 21 26
(1)请根据表中提供的数据,用样本相关系数r说明y与x的线性相关程度;(样本相关系数保留三位小数,样本相关系数r=.当|r|越接近1时,成对样本数据的线性相关程度越强;当|r|越接近0时,成对样本数据的线性相关程度越弱)(9分)
(2)求出y关于x的经验回归方程,并预测2028年该网站“双11”当天的交易额.(8分)
附:在经验回归方程=x+中,=,=-,≈43.1.
解 (1)根据表格中的数据,
可得=×(1+2+3+4+5)=3,
=×(9+12+17+21+26)=17,
则(xi-)(yi-)=(1-3)×(9-17)+(2-3)×(12-17)+0+(4-3)×(21-17)+(5-3)×(26-17)=43,
(xi-)2=(1-3)2+(2-3)2+0+(4-3)2+(5-3)2=10,
(yi-)2=(9-17)2+(12-17)2+0+(21-17)2+(26-17)2=186,
故==≈43.1,
所以r=≈≈0.998,
因为|r|≈0.998非常接近1,所以变量y与x的线性相关程度很强.
(2)由(1)可得===4.3,
则=-=17-4.3×3=4.1.
可得y关于x的经验回归方程为=4.3x+4.1,
令x=8,得=4.3×8+4.1=38.5,
所以预测2028年该网站“双11”当天的交易额为38.5百亿元.
19.(17分)(2025·泰安模拟)2025年4月24日是第十个中国航天日.十年来,中国航天事业蒸蒸日上,中国人在太空的印记不断被刷新.某校部分学生十分关注中国航天的发展,若将累计关注中国航天发展的消息达到6次及以上者称为“航天达人”,未达到6次者称为“非航天达人”.现从该校随机抽取100人进行分析,得到数据如表所示:
性别 是否为“航天达人” 合计
航天达人 非航天达人
男 40 60
女 20
合计
(1)补全2×2列联表,根据小概率值α=0.01的独立性检验,能否认为“航天达人”与性别有关联?(5分)
(2)现从抽取的“航天达人”中,按性别采用分层随机抽样的方法抽取6人,然后从这6人中随机抽取3人,记这3人中女“航天达人”的人数为X,求X的分布列和数学期望;(5分)
(3)为进一步提高学生对航天事业的关注度,该学校组织了“航天知识竞赛”活动,竞赛共设置20道题目, 其中n(3≤n≤13)道题目是小明能答对的, 规定每位参赛者从20道题目中随机抽取10道作答,则要使小明恰好答对3道题目的概率最大,那么n取多少?(7分)
附:
α 0.10 0.05 0.01 0.005
xα 2.706 3.841 6.635 7.879
χ2=,n=a+b+c+d.
解 (1)补全2×2列联表如表所示.
性别 是否为“航天达人” 合计
航天达人 非航天达人
男 40 20 60
女 20 20 40
合计 60 40 100
零假设为H0:“航天达人”与性别无关,根据表中的数据计算得到
χ2==≈2.778<6.635=x0.01,
所以根据小概率值α=0.01的独立性检验,没有充分证据推断H0不成立,因此可以认为H0成立,因此认为“航天达人”与性别无关.
(2)抽取的男“航天达人”有4人,女“航天达人”有2人,
X的所有可能取值为0,1,2.
则P(X=0)==,
P(X=1)==,
P(X=2)==,
所以X的分布列为
X 0 1 2
P
X的数学期望为E(X)=0×+1×+2×=1.
(3)从20道题目中抽取10道,恰有3道小明能答对的题目的概率P=,
设f(n)=,3≤n≤13,
当3≤n≤12时,===,
-n2+12n+13-(-n2+22n-40)=53-10n,
当3≤n≤5时,f(n+1)>f(n),
当6≤n≤12时,f(n+1)f(7)>…>f(13),
则f(n)max=f(6),
所以当n=6时,小明恰好答对3道题目的可能性最大.
21世纪教育网 www.21cnjy.com 精品试卷·第 2 页 (共 2 页)
HYPERLINK "http://21世纪教育网(www.21cnjy.com)
" 21世纪教育网(www.21cnjy.com)

展开更多......

收起↑

资源预览