2026年高考数学一轮复习专题课件:成对数据的统计分析(共95张PPT)

资源下载
  1. 二一教育资源

2026年高考数学一轮复习专题课件:成对数据的统计分析(共95张PPT)

资源简介

(共95张PPT)
成对数据的统计分析
2026年高考数学一轮复习专题课件★★
两个变量的相关关系
(1)散点图:将样本中n个数据点(xi,yi)(i=1,2,…,n)描在平面直角坐标系中得到的统计图叫________.
(2)正相关
从整体上看,当一个变量的值增加时,另一个变量的相应值也呈现______的趋势,我们就称这两个变量正相关.
(3)负相关
当一个变量的值增加时,另一个变量的相应值呈现______的趋势,则称这两个变量负相关.
回归教材
散点图
增加
减少
(4)线性相关关系
如果两个变量的取值呈现正相关或负相关,而且散点落在_______________,就称这两个变量线性相关.
(5)回归分析:由一个变量的变化去推测另一个变量的变化的方法.
(6)样本相关系数r
①r=
②当r>0时,表明成对样本数据_______;
当r<0时,表明成对样本数据________.
r的绝对值越接近1,表明成对样本数据的线性相关程度_____;r的绝对值越接近0,表明成对样本数据的线性相关程度______.
一条直线附近
正相关
负相关
越强
越弱
一元线性回归模型及应用
(1)最小二乘法
求经验回归直线使得样本数据点到经验回归直线的______________
________的方法叫做最小二乘法.
竖直距离平方
和最小
(3)残差分析
①作残差图:作图时纵坐标为______,横坐标可以选为样本编号,或xi数据,或yi数据,这样作出的图形称为残差图;②残差分析:残差比较均匀地分布在水平的带状区域中,说明选用的模型比较合适,这样的带状区域的宽度越窄,说明模型拟合精度越高,经验回归方程的预报精度越高.
残差
平方和越大,即模型的拟合效果越差.在经验回归模型中,R2表示解释变量对于响应变量变化的贡献率,R2越接近1,表示拟合的效果越好.

列联表与独立性检验
(1)分类变量:为了表述方便,我们经常会使用一种特殊的随机变量,以区别不同的现象或性质,这类随机变量称为分类变量.
(2)列联表:列出两个分类变量的__________,称为列联表.假设有两个分类变量X和Y,它们的可能取值分别为{x1,x2}和{y1,y2},其样本频数列联表(称为2×2列联表)为
X Y 合计
y1 y2 x1 a b a+b
x2 c d c+d
合计 a+c b+d n=a+b+c+d
构造一个随机变量χ2=__________________________________,
其中n=___________为样本容量.
频数表
a+b+c+d
(3)独立性检验
基于小概率值α的检验规则是:
当χ2≥xα时,我们就推断H0不成立,即认为X和Y不独立,该推断犯错误的概率不超过α;
当χ2这种利用χ2的取值推断分类变量X和Y是否独立的方法称为χ2独立性检验,读作“卡方独立性检验”,简称独立性检验.
(4)独立性检验的基本步骤
①提出零假设H0:X和Y相互独立,并给出在问题中的解释.
②根据抽样数据整理出2×2列联表,计算χ2的值,并与临界值xα比较.
③根据检验规则得出推断结论.
④在X和Y不独立的情况下,根据需要,通过比较相应的频率,分析X和Y间的影响规律.
1.判断下面结论是否正确.(对的打“√”,错的打“×”)
(1)“名师出高徒”可以解释为教师的教学水平与学生的水平呈正相关.
夯实双基
答案 (1)√
(2)两个随机变量的线性相关程度越强,样本相关系数的绝对值越接近0.
答案 (2)×
(3)某同学研究卖出的热饮杯数y与气温x(℃)之间的关系,得经验回归方程 =-2.352x+147.767,则气温为2 ℃时,一定可以卖出143杯热饮.
答案 (3)×
(4)事件X,Y关系越密切,则由观测数据计算得到的χ2越大.
答案 (4)√
(5)由独立性检验可知,在犯错误的概率不超过1%的前提下认为物理成绩优秀与数学成绩有关,某人数学成绩优秀,则他有99%的可能物理成绩优秀.
答案 (5)×
2.(2023·天津)调查某种群花萼长度和花瓣长度,所得数据如图所示,其中相关系数r=0.824 5,下列说法正确的是(  )
A.花瓣长度和花萼长度没有相关性
B.花瓣长度和花萼长度呈现负相关
C.花瓣长度和花萼长度呈现正相关
D.若从样本中抽取一部分,则这部分的相关系数一定是0.824 5

解析 根据散点的集中程度可知,花瓣长度和花萼长度有相关性,A错误;散点的分布是从左下到右上,从而花瓣长度和花萼长度呈现正相关性,B错误,C正确;由于r=0.824 5是全部数据的相关系数,取出来一部分数据,相关性可能变强,可能变弱,也可能不变,即取出的数据的相关系数不一定是0.824 5,D错误.故选C.
3.已知某产品的营销费用x(单位:万元)与销售额y(单位:万元)的统计数据如表所示,根据下表可得y关于x的经验回归方程为=7x+ ,则当该产品的营销费用为6万元时,预计销售额为(  )
A.40.5万元       B.41.5万元
C.42.5万元 D.45万元

营销费用x/万元 2 3 4 5
销售额y/万元 15 20 30 35
4.【多选题】(2025·天域全国名校联考)已知由样本数据(xi,yi)(i=1,2,3,…,10)组成的一个样本,得到经验回归方程为 =-x+3,且 =4.剔除一个偏离直线较大的异常点(-5,-1)后,得到新的经验回归直线经过点(6,-4),则下列说法正确的是(  )
A.相关变量x,y具有正相关关系
B.剔除该异常点后,样本相关系数的绝对值变大
C.剔除该异常点后的经验回归直线经过点(5,-1)
D.剔除该异常点后,随x值增加变量y值的减小速度变小


5.为了解喜爱足球是否与性别有关,随机抽取了若干人进行调查,抽取的女性人数是男性的2倍,男性喜爱足球的人数占男性人数的 ,女性喜爱足球的人数占女性人数的 ,若本次调查得出“在犯错误的概率不超过0.005的前提下认为喜爱足球与性别有关”的结论,则被调查的男性至少有________人.
α 0.10 0.05 0.01 0.005 0.001
xα 2.706 3.841 6.635 7.879 10.828
12
解析 设被调查的男性为x人,则女性为2x人,依据题意可得列联表如下表:
.因为本次调查得出“在犯错误的概率不超
过0.005的前提下认为喜爱足球与性别有关”的结论,所以χ2≥7.879,即
≥7.879,解得x≥11.818 5,又因为上述列表中的所有数字均为整数,所以x的最小值为12.
题型一  变量的相关关系(自主学习)
(1)对两个变量x,y进行线性相关检验,得样本相关系数r1=0.899 5,对两个变量u,v进行线性相关检验,得样本相关系数r2=-0.956 8,则下列判断正确的是(  )
A.变量x与y正相关,变量u与v负相关,变量x与y的线性相关性较强
B.变量x与y负相关,变量u与v正相关,变量x与y的线性相关性较强
C.变量x与y正相关,变量u与v负相关,变量u与v的线性相关性较强
D.变量x与y负相关,变量u与v正相关,变量u与v的线性相关性较强

【解析】 因为样本相关系数r1=0.899 5>0,所以x,y正相关,因为样本相关系数r2=-0.956 8<0,所以u,v负相关,又因为|r1|<|r2|,所以变量u,v的线性相关性比x,y的线性相关性强,故A、B、D错误,C正确.故选C.
(2) 如图是相关变量x,y的散点图,现对这两
个变量进行线性相关分析,方案一:根据图中所
有数据,得到经验回归方程为= ,样本
相关系数为r1;方案二:剔除点(10,21),根据剩
下数据得到经验回归方程为= ,样本相关系数为r2,则(  )
A.0C.-1
【解析】 根据相关变量x,y的散点图知,
变量x,y呈负相关,且点(10,21)是极端值.
方案一中,没剔除极端值,线性相关程度较
弱,呈负相关;
方案二中,剔除极端值,线性相关程度较强,也是负相关,
所以-1(3)(2022·全国乙卷,理)某地经过多年的环境治理,已将荒山改造成了绿水青山.为估计一林区某种树木的总材积量,随机选取了10棵这种树木,测量每棵树的根部横截面积(单位:m2)和材积量(单位:m3),得到如下数据:
样本号i 1 2 3 4 5 6 7 8 9 10 总和
根部横截 面积xi 0.04 0.06 0.04 0.08 0.08 0.05 0.05 0.07 0.07 0.06 0.6
材积量yi 0.25 0.40 0.22 0.54 0.51 0.34 0.36 0.46 0.42 0.40 3.9
①估计该林区这种树木平均一棵的根部横截面积与平均一棵的材积量;
②求该林区这种树木的根部横截面积与材积量的样本相关系数(精确到0.01);
③现测量了该林区所有这种树木的根部横截面积,并得到所有这种树木的根部横截面积总和为186 m2.已知树木的材积量与其根部横截面积近似成正比.利用以上数据给出该林区这种树木的总材积量的估计值.
【答案】 ①0.06,0.39 ②0.97 ③1 209 m3
状元笔记
判定两个变量正、负相关的方法
(1)画散点图:点的分布从左下角到右上角,两个变量正相关;点的分布从左上角到右下角,两个变量负相关.
(2)样本相关系数:r>0时,正相关;r<0时,负相关.
(3)经验回归方程中: >0时,正相关; <0时,负相关.
(4)两个变量之间线性相关程度的强弱用样本相关系数r来衡量.样
本相关系数r= .r>0,表示两个变量正
相关;r<0,表示两个变量负相关,r的绝对值越接近1,表明两个变量的线性相关程度越强;r的绝对值越接近0,表明两个变量的线性相关程度越弱.

思考题1 (1)对四组数据进行统计,
获得以下散点图,关于其样本相关系数的比
较,正确的是(  )
A.r2C.r4【解析】 由散点图可知图①,图③中的
变量正相关,且图①中的点比图③中的点分布
更为集中,故r1>r3>0;
图②,图④中的变量负相关,且图②中的点比图④中的点分布更为集中,
故r2综上可得r2(2)(2025·河南新乡模拟预测)氮氧化
物是一种常见的大气污染物,如图为我
国2015年至2023年氮氧化物排放量(单位:
万吨)的折线图,其中年份代码1~9分别
对应年份2015~2023.
①可否用一元线性回归模型拟合y与t的关系?请分别根据折线图和样本相关系数加以说明;
②若根据所给数据建立回归模型
=-138t+2 025,可否用此模型来
预测2024年和2034年我国的氮氧化物
排放量?请说明理由.
【答案】 ①可以用一元线性回归模型拟合y与t的关系,说明见解析
②可以预测2024年的氮氧化物排放量,但不可以预测2034年的氮氧化物排放量,理由见解析
【解析】 ①从折线图看,各点落
在一条直线附近,因而可以用一元线性
回归模型拟合y与t的关系,
因为|r|很接近1,故y与t具有很强的线性相关关系,故可以用一元线性回归模型拟合y与t的关系.
②可以预测2024年的氮氧化物排放
量,但不可以预测2034年的氮氧化物排
放量.
理由如下:
2024年与所给数据的年份较接近,因而可以认为短期内氮氧化物排放量将延续该趋势,故可以用此模型进行预测;
2034年与所给数据的年份相距过远,而影响氮氧化物排放量的因素有很多,这些因素在短期内可能保持不变,但从长期看很有可能会变化,因而用此模型预测可能是不准确的.
题型二  一元线性回归模型
(1)【多选题】(2025·河南开封期末)右表是
2022年某市1~5月份新能源汽车销量y(单位:千辆)
与月份x的统计数据,
由表中数据求得经验回归方程为 ,则下列说法正确的是(  )
A. =3.9
B.y与x正相关
C.由经验回归方程估计,月份每增加1个月,销量平均增加0.7千辆
D.由已知数据可以确定,6月份该市新能源汽车销量一定为8.1千辆
月份x 1 2 3 4 5
销量y 5 5 6 6 8



A正确;由经验回归方程的系数是0.7>0,知y与x正相关,且月份每增加1个月,销量平均增加0.7千辆,故B、C正确;经验回归方程只能预测趋势,不能确定销量,故D错误.故选ABC.

(2) 根据统计,某蔬菜基地西红柿亩产量的增加
量y(百千克)与某种液体肥料每亩使用量x(千克)之间
的对应数据的散点图如图所示:
①依据数据的散点图可以看出,可用线性回归
模型拟合y与x的关系,请计算样本相关系数并加以
说明(若|r|越接近1,则线性相关程度越强,可用线性回归模型拟合);
②求y关于x的经验回归方程,并预测液体肥料
每亩使用量为12千克时,西红柿亩产量的增加量约
为多少.
∴预测液体肥料每亩使用量为12千克时,西红柿亩产量的增加量约为9.9百千克.
状元笔记

思考题2 (1)【多选题】(2025·湖北武汉模拟预测)某科技公司统计了一款App最近5个月的下载量如表所示,若下载量y(万次)与月份x线性相关,且经验回归方程为 ,则(  )
A.y与x负相关
B. =5.6
C.预测第6个月的下载量是2.1万次
D.残差绝对值的最大值为0.2
月份x 1 2 3 4 5
下载量y 5 4.5 4 3.5 2.5


(2)现代物流成为继劳动力、自然资源外影响企业生产成本及利润的重要因素.某企业去年前八个月的物流成本和企业利润的数据(单位:万元)如下表所示:
根据最小二乘法求得经验回归方程为 =3.2x-151.8.
①求m的值,并利用已知的经验回归方程求出8月份对应的残差值 8;
②请先求出线性回归模型 =3.2x-151.8的决定系数R2(精确到0.000 1);若根据非线性经验回归方程 =267.76ln x-1 069.2求得解释变量(物流成本)对于响应变量(利润)的决定系数R02=0.905 7,请说明以上两种模型哪种模型拟合效果更好?
③通过残差分析,怀疑残差绝对值最大的那组数据有误,经再次核实后发现其真正利润为116万元.请重新根据最小二乘法的思想与公式,求出新的经验回归方程.
题型三  一元非线性回归模型
2023年年初某公司研发一种新产品并投入市场,开始销量较少,经推广,销量逐月增加,下表为2023年1月份到7月份,销量y(单位:百件)与月份x之间的关系.
月份x 1 2 3 4 5 6 7
销量y 6 11 21 34 66 101 196
(1)画出散点图,并根据散点图判断y=ax+b与y=
cdx(c,d均为大于零的常数)哪一个适合作为销量y与月
份x的经验回归方程类型(给出判断即可,不必说明理由)
【答案】 (1)散点图见解析,y=cdx适合
【解析】 (1)散点图如下图,
根据散点图判断,y=cdx适合作为销量y与月份x的经验回归方程类型.
(2)根据(1)的判断结果及表中的数据,求y关于x的经验回归方程,并预测2023年8月份的销量;
(3)考虑销量、产品更新及价格逐渐下降等因素,预测从2023年1月份到12月份(x的取值依次记作1到12),每百件该产品的利润为P=10-0.05x2+0.6x元,求2023年几月份该产品的利润Q最大.
【答案】 (3)8月份或9月份
【解析】 (3)由题意得Q=yP=3.47×10-0.05x2+0.85x(x∈N且1≤x≤
12),
构造函数f (x)=-0.05x2+0.85x(x∈N且1≤x≤12),
所以当x=8或9时,f (x)取最大值,
即2023年8月份或9月份利润最大.
状元笔记
思考题3 脑机接口,即指在人或动物大脑与外部设备之间创建的直接连接,实现脑与设备的信息交换.2024年8月2日,马斯克宣布,其脑机接口公司Neuralink成功将第二颗脑机接口芯片植入一名人类患者体内,该试验可以实现意念控制手机和电脑.未来10到20年,我国脑机接口产业将产生数百亿元的经济价值.为了适应市场需求,同时兼顾企业盈利的预期,某科技公司决定增加一定数量的研发人员,经过调研,得到年收益增量y(单位:亿元)与研发人员增量x(单位:人)的10组数据.现用模型①y=bx+a,②y=c+d 分别进行拟合,由此得到相应的经验回归方程,并进行残差分析,得到如图所示的残差图.
(1)根据残差图,判断应选择哪个模型;(无需说明理由)
【答案】 (1)选择模型②
【解析】 (1)选择模型②.
(2)根据(1)中所选模型,求出y关于x的经验回归方程;并用该模型预测,要使年收益增量超过8亿元,研发人员增量至少为多少人?
附:对于一组具有线性相关关系的数据(x1,y1),(x2,y2),…,(xn,
题型四  独立性检验
(2024·全国甲卷,理)某工厂进行生产线智能化升级改造.升级改造后,从该工厂甲、乙两个车间的产品中随机抽取150件进行检验,数据如下:
优级品 合格品 不合格品 总计
甲车间 26 24 0 50
乙车间 70 28 2 100
总计 96 52 2 150
(1)填写如下列联表:
能否有95%的把握认为甲、乙两车间产品的优级品率存在差异?能否有99%的把握认为甲、乙两车间产品的优级品率存在差异?
优级品 非优级品
甲车间
乙车间
【答案】 (1)见解析
【解析】 (1)根据题意可得列联表:
因为3.841<4.687 5<6.635,
所以有95%的把握认为甲、乙两车间产品的优级品率存在差异,没有99%的把握认为甲、乙两车间产品的优级品率存在差异.
【答案】 (2)见解析
状元笔记
独立性检验的一般步骤
(1)根据样本数据制成2×2列联表.
(2)提出零假设H0:X与Y相互独立,并根据公式计算χ2=
的值.
(3)比较χ2与临界值的大小关系,并做出推断.
思考题4 某校为了解该校学生对课后服务
的满意度,从全校七、八、九年级学生中按照1∶2
∶3分层随机抽样的方法,抽取容量为240的样本进
行调查.被抽中的学生分别对课后服务进行评分,
满分为100分,调查结果显示:最低分为51分,最
高分为100分.八、九年级学生的评分结果按照相同的分组方式分别整理成了频数分布表和频率分布直方图,图表如下.
八年级学生评分结果频数分布表
分数区间 [50,60) [60,70) [70,80) [80,90) [90,100]
频数 2 m 17 38 20
(1)根据上述统计图表信息试求m和n的值;
【答案】 (1)3,0.015
【解析】 (1)由已知可得,八年级学生样
本容量为240× =80,m=80-2-17-
38-20=3,(0.005+n+0.020+0.040+0.020)
×10=1,解得n=0.015.
(2)为了便于调查学校开展课后服
务满意度情况是否与年级高低有关,
把评分不低于70分的定义为“满意”,
评分低于70分的定义为“不满意”,通
过样本将七年级和九年级学生对课后服务满意度情况汇总得到右表.
请补充上表,并根据小概率值α=0.10的独立性检验判断能否认为学生对课后服务满意度与年级高低有关?
满意 情况 年级 合计
七年级 九年级 满意 30
不满意
合计
α 0.10 0.050 0.010
xα 2.706 3.841 6.635
【答案】 (2)见解析
【解析】 (2)七年级学生样本容量为240× =40,九年级学生“不满意”人数为(0.005+0.015)×10×(240-80-40)=24,列联表如下:
满意情况 年级 合计
七年级 九年级 满意 30 96 126
不满意 10 24 34
合计 40 120 160
 零假设为H0:学生对课后服务满意度与年级高低无关.
所以根据小概率值α=0.10的独立性检验推断H0成立,即不能认为学生对课后服务满意度与年级高低有关.
重温高考
1.(2024·新课标Ⅱ卷)某农业研究部门在面积相等的100块稻田上种植一种新型水稻,得到各块稻田的亩产量(单位:kg)并整理得下表:
根据表中数据,下列结论中正确的是(  )
A.100块稻田亩产量的中位数小于1 050 kg
B.100块稻田中亩产量低于1 100 kg的稻田所占比例超过80%
C.100块稻田亩产量的极差介于200 kg至300 kg之间
D.100块稻田亩产量的平均值介于900 kg至1 000 kg之间

亩产量 [900, 950) [950, 1 000) [1 000, 1 050) [1 050, 1 100) [1 100, 1 150) [1 150,
1 200)
频数 6 12 18 30 24 10
解析 对于A,因为前3组的频率之和为0.06+0.12+0.18=0.36<0.5,前4组的频率之和为0.36+0.30=0.66>0.5,所以100块稻田亩产量的中位数所在的区间为[1 050,1 100),故A不正确;
对于B,100块稻田中亩产量低于1 100 kg的稻田所占比例为
×100%=66%,故B不正确;
对于C,因为1 200-900=300,1 150-950=200,所以100块稻田亩产量的极差介于200 kg至300 kg之间,故C正确;
对于D,100块稻田亩产量的平均值为 ×(925×6+975×12+1 025×18+1 075×30+1 125×24+1 175×10)=1 067(kg),故D不正确.综上所述,故选C.
2.(2023·新高考Ⅱ卷)某学校为了解学生参加体育运动的情况,用比例分配的分层随机抽样方法作抽样调查,拟从初中部和高中部两层共抽取60名学生.已知该校初中部和高中部分别有400名和200名学生,则不同的抽样结果共有(  )
A.C40045·C20015种      B.C40020·C20040种
C.C40030·C20030种 D.C40040·C20020种

解析 根据分层随机抽样的定义知初中部共抽取60× =40(人),高中部共抽取60× =20(人),根据组合数公式和分步乘法计数原理可知不同的抽样结果共有C40040·C20020种.故选D.
3.(2022·全国甲卷,理)某社区通过
公益讲座以普及社区居民的垃圾分类知识.
为了解讲座效果,随机抽取10位社区居民,让他们在讲座前和讲座后各回答一份垃圾分类知识问卷,这10位社区居民在讲座前和讲座后问卷答题的正确率如图,则(  )
A.讲座前问卷答题的正确率的中位数小于70%
B.讲座后问卷答题的正确率的平均数大于85%
C.讲座前问卷答题的正确率的标准差小于讲座后正确率的标准差
D.讲座后问卷答题的正确率的极差大于讲座前正确率的极差

解析 对于A,讲座前问卷答题的正
确率的中位数是 =72.5%,所以
A错误;对于B,讲座后问卷答题的正确
率分别是80%,85%,85%,85%,85%,
90%,90%,95%,100%,100%,其平均
数显然大于85%,所以B正确;对于C,由题图可知,讲座前问卷答题的正确率波动较大,讲座后问卷答题的正确率波动较小,所以讲座前问卷答题的正确率的标准差大于讲座后问卷答题的正确率的标准差,所以C错误;对于D,讲座前问卷答题的正确率的极差是95%-60%=35%,讲座后问卷答题的正确率的极差是100%-80%=20%,所以讲座前问卷答题的正确率的极差大于讲座后问卷答题的正确率的极差,所以D错误.故选B.
4.(2021·全国甲卷)为了解某地农村经济情
况,对该地农户家庭年收入进行抽样调查,将
农户家庭年收入的调查数据整理得到如下频率
分布直方图:
根据此频率分布直方图,下面结论中不正确的是(  )
A.该地农户家庭年收入低于4.5万元的农户比率估计为6%
B.该地农户家庭年收入不低于10.5万元的农户比率估计为10%
C.估计该地农户家庭年收入的平均值不超过6.5万元
D.估计该地有一半以上的农户,其家庭年收入介于4.5万元至8.5万元之间

解析 该地农户家庭年收入低于4.5万元的
农户比率估计为0.02×1+0.04×1=0.06=6%,
A正确.不低于10.5万元的比率估计为(0.04+
0.02×3)×1=0.1=10%,B正确.平均值为(3
×0.02+4×0.04+5×0.1+6×0.14+7×0.2+8×0.2+9×0.1+10×0.1+11×0.04+12×0.02+13×0.02+14×0.02)×1=7.68(万元),C不正确.家庭年收入介于4.5万元至8.5万元的比率估计为0.1×1+0.14×1+0.2×1+0.2×1=0.64,D正确.
5.【多选题】(2021·新高考Ⅱ卷)下列统计量中可用于度量样本x1,x2,…,xn离散程度的有(  )
A.x1,x2,…,xn的标准差 B.x1,x2,…,xn的中位数
C.x1,x2,…,xn的极差 D.x1,x2,…,xn的平均数


解析 平均数和中位数反映的是一组数据的集中趋势,标准差和极差则体现了一组数据的离散程度.故选AC.
6.【多选题】(2020·新高考Ⅱ卷)我国新冠
肺炎疫情进入常态化,各地有序推进复工复产,
下面是某地连续11天复工复产指数折线图.下
列说法正确的是(  )
A.这11天复工指数和复产指数均逐日增加
B.这11天期间,复产指数增量大于复工指数的增量
C.第3天至第11天复工复产指数均超过80%
D.第9天至第11天复产指数增量大于复工指数的增量


解析 由题图可知,复产指数第7天到第9
天逐日减少,复工指数第1天到第2天、第7天
到第8天、第10天到第11天逐日减少,故A错
误;由题图可知,第1天复产指数与复工指数
的差大于第11天复产指数与复工指数的差,所以这11天期间,复产指数的增量小于复工指数的增量,故B错误;由题图可知,第3天至第11天复工复产指数均在80%以上,故C正确;由题图可知,第9天至第11天复产指数的增量大于复工指数的增量,故D正确.故选CD.
7.(2020·课标全国Ⅲ)设一组样本数据x1,x2,…,xn的方差为0.01,则数据10x1,10x2,…,10xn的方差为(  )
A.0.01         B.0.1
C.1 D.10

解析 因为数据axi+b(i=1,2,…,n)的方差是数据xi(i=1,2,…,n)的方差的a2倍,所以所求数据方差为102×0.01=1.故选C.
8.(2020·课标全国Ⅲ,理)在一组样本数据中,1,2,3,4出现的频率分别为p1,p2,p3,p4,且 pi=1,则下面四种情形中,对应样本的标准差最大的一组是(  )
A.p1=p4=0.1,p2=p3=0.4 B.p1=p4=0.4,p2=p3=0.1
C.p1=p4=0.2,p2=p3=0.3 D.p1=p4=0.3,p2=p3=0.2

解析 对于A,该组数据的平均数为 =(1+4)×0.1+(2+3)×0.4=2.5,
方差为sA2=(1-2.5)2×0.1+(2-2.5)2×0.4+(3-2.5)2×0.4+(4-2.5)2×0.1=0.65;

对于B,该组数据的平均数为 B=(1+4)×0.4+(2+3)×0.1=2.5,
方差为sB2=(1-2.5)2×0.4+(2-2.5)2×0.1+(3-2.5)2×0.1+(4-2.5)2×0.4=1.85;
对于C,该组数据的平均数为 C=(1+4)×0.2+(2+3)×0.3=2.5,
方差为sC2=(1-2.5)2×0.2+(2-2.5)2×0.3+(3-2.5)2×0.3+(4-2.5)2×0.2=1.05;
对于D,该组数据的平均数为 D=(1+4)×0.3+(2+3)×0.2=2.5,
方差为sD2=(1-2.5)2×0.3+(2-2.5)2×0.2+(3-2.5)2×0.2+(4-2.5)2×0.3=1.45.
因此,B这一组的标准差最大.故选B.
9.(2023·上海)现有某地一年四个季度的GDP(亿元),第一季度GDP为232(亿元),第四季度GDP为241(亿元),四个季度的GDP逐季度增长,且中位数与平均数相同,则该地一年的GDP为________.
946
解析 设第二季度GDP为x亿元,第三季度GDP为y亿元,则23210.(2025·八省联考)为考察某种药物A对预防疾病B的效果,进行了动物(单位:只)试验,得到如下列联表:
药物 疾病 合计
未患病 患病 未服用 100 80 s
服用 150 70 220
合计 250 t 400
(1)求s,t;
答案 (1)180,150 
解析 (1)由列联表知s=100+80=180,t=80+70=150.
(2)记未服用药物A的动物患疾病B的概率为P,给出P的估计值;
解析 (2)由列联表知,未服用药物A的动物有s=180只,
未服用药物A且患疾病B的动物有80只,
(3)根据小概率值α=0.01的独立性检验,能否认为药物A对预防疾病B有效?
P(χ2≥k) 0.050 0.010 0.001
k 3.841 6.635 10.828
答案 (3)见解析
解析 (3)零假设H0:药物A对预防疾病B无效,
根据小概率值α=0.01的独立性检验,推断H0不成立,即认为药物A对预防疾病B有效,该推断犯错误的概率不超过0.01.
11.(2023·新高考Ⅱ卷)某研究小组经过研究发现某种疾病的患病者与未患病者的某项医学指标有明显差异,经过大量调查,得到如下的患病者和未患病者该指标的频率分布直方图:
利用该指标制定一个检测标准,需要确定临界值c,将该指标大于c的人判定为阳性,小于或等于c的人判定为阴性.此检测标准的漏诊率是将患病者判定为阴性的概率,记为p(c);误诊率是将未患病者判定为阳性的概率,记为q(c).假设数据在组内均匀分布.以事件发生的频率作为相应事件发生的概率.
(1)当漏诊率p(c)=0.5%时,求临界值c和误诊率q(c);
答案 (1)97.5,3.5% 
解析 (1)由题意知(c-95)·0.002=0.5% c=97.5,
q(c)=0.01×2.5+5×0.002=0.035=3.5%.
(2)设函数f(c)=p(c)+q(c),当c∈[95,105]时,求f(c)的解析式,并求f(c)在区间[95,105]的最小值.
答案 (2)见解析
解析 (2)当c∈[95,100]时,f(c)=p(c)+q(c)=(c-95)·0.002+(100-c)·0.01+5×0.002=-0.008c+0.82≥0.02.
当c∈(100,105]时,f(c)=p(c)+q(c)=5×0.002+(c-100)·0.012+(105-c)·0.002=0.01c-0.98>0.02,
故f(c)= f(c)min=0.02.
12.(2021·全国乙卷,文)某厂研制了一种生产高精产品的设备,为检验新设备生产产品的某项指标有无提高,用一台旧设备和一台新设备各生产了10件产品,得到各件产品该项指标数据如下:
旧设备 9.8 10.3 10.0 10.2 9.9 9.8 10.0 10.1 10.2 9.7
新设备 10.1 10.4 10.1 10.0 10.1 10.3 10.6 10.5 10.4 10.5
旧设备和新设备生产产品的该项指标的样本平均数分别记为 和 ,样本方差分别记为S12和S22.
答案 (1)10,10.3,0.036,0.04 
(2)判断新设备生产产品的该项指标的均值较旧设备是否有显著提高(如果 ,则认为新,设备生产产品的该项指标的均值较,旧设备有显著提高,否则不认为有显著提高).
答案 (2)有显著提高

展开更多......

收起↑

资源预览