统计 创新学案——2023届高考数学一轮复习(Word含答案)

资源下载
  1. 二一教育资源

统计 创新学案——2023届高考数学一轮复习(Word含答案)

资源简介

统计二轮复习学案
——奋力争取,静待花开
班级:
姓名:
目录
【重点讲解】——————————————————————————3
【创新题试做】—————————————————————————15
【参考答案】——————————————————————————29
【课时作业】——————————————————————————44
【参考答案】——————————————————————————51
特别提醒:创新题试做部分是难度极大的试题,
仅针对学有余力的学生,或作为共同探讨问题。
请勿轻易尝试!请勿轻易尝试!请勿轻易尝试!
【重点讲解】
重点1:用样本估计总体
1.百分位数与四分位数
(1)一般地,一组数据的第 百分位数是这样一个值,它使得这组数据中至少有 的数据小于或等于这个值,且至少有 的数据大于或等于这个值。
(2)四分位数
常用的分位数有第25百分位数,第50百分位数(即中位数),第75百分位数。这三个分位数把一组由小到大排列后的数据分成四等份,因此称为四分位数。其中第25百分位数也称为第一四分位数或下四分位数,第75百分位数也称为第三四分位数或上四分位数。
【例1】求下列数据的四分位数.13,15,12,27,22,24,28,30,31,18,19,20.
【答案】答案见解析
【详解】解:把12个数据按从小到大的顺序排列可得:
12,13,15,18,19,20,22,24,27,28,30,31,
计算,
所以数据的25百分位数为,50百分位数为,75百分位数为.
【跟踪训练1】某地8名新冠肺炎病患者的潜伏期(单位:天)分别为7,8,8,12,11,10,14,16,则它们的上四分位数是_____________.
【答案】13
【详解】将已知数据按照从小到大的顺序排列,得7,8,8,10,11,12,14,16,
,所以75%分位数是.故答案为:13
【例2】数据的第80百分位数是__________.
【答案】9.5
【详解】将数据从小到大排列为,共10个数,
由,得第80百分位数为.故答案为:.
【跟踪训练2】数据7.0,8.4,8.4,8.4,8.6,8.7,9.0,9.1的第30百分位数是________.
【答案】8.4
【详解】
因为8×30%=2.4,故30%分位数是第三项数据8.4
2、方差与标准差
(1)假设一组数据是 , , , ,用 表示这组数据的平均数,则我们称 为这组数据的方差。有时为了计算方差的方便,我们还把方差写成 的形式。我们对方差开平方,取它的算术平方根 ,称为这组数据的标准差。
(2)方差和标准差反映了数据波动程度的大小。
方差: 。
标准差: 。
补充:①若数据x1,x2,…,xn的平均数为,
则mx1+a,mx2+a,mx3+a,…,mxn+a的平均数是m+a;
②若数据x1,x2,…,xn的方差为s2,
则数据ax1+b,ax2+b,…,axn+b的方差为a2s2.
【例3】若的方差为3,则的方差为_______.
【答案】27
【详解】设平均数为 ,则的平均数为,
又的方差为3,所以,
所以的方差为:

.
【跟踪训练3】 的方差为,则的方差是________.
【答案】
【详解】因为 的方差,所以,因此的方差是,故答案为.
【例4】数据、、、、的方差为___________
【答案】
【详解】数据、、、、的平均数为,
因此,这组数据的方差为.
【跟踪训练4】 这个数的标准差为________.
【答案】
【详解】代入标准差公式:,计算得标准差为.
3.相关系数与相关指数
(1)定义: ,
我们称 为变量 和变量 的样本相关系数。
当 时,称成对样本数据正相关。这时,当其中一个数据的值变小时,另一个数据的值通常也变小;当其中一个数据的值变大时,另一个数据的值通常也变大。
当 时,称成对样本数据负相关。这时,当其中一个数据的值变小时,另一个数据的值通常会变大;当其中一个数据的值变大时,另一个数据的值通常会变小。
(2)线性相关的程度
样本相关系数 的取值范围为 。样本相关系数 的绝对值大小可以反映成对样本数据之间线性相关的程度:
当 越接近1时,成对样本数据的线性相关程度越强;
当 越接近0时,成对样本数据的线性相关程度越弱。
(3)相关指数
在 表达式中, 与经验回归方程无关,残差平方和 与经验回归方程有关。因此 越大,表示残差平方和越小,即模型的拟合效果越好; 越小,表示残差平方和越大,即模型的拟合效果越差。
【例5】对相关系数r,
①r越大,线性相关程度越大;
②r越小,线性相关程度越大;
③|r|越大,线性相关程度越小,|r|越接近0,线性相关程度越大;
④|r|≤1且|r|越接近1,线性相关程度越大,|r|越接近0,线性相关程度越小
以上说法中,正确说法的序号是__________.
【答案】④
【详解】两个变量之间的相关系数,r的绝对值越接近于1,表示两个变量的线性相关性越强,r的绝对值非常接近于0时,表示两个变量之间几乎不存在线性相关.故答案为④.
【跟踪训练5】下面的散点图与相关系数一定不符合的是( )
A.①②③ B.①②④ C.①③④ D.②③④
【答案】C
【详解】①中,由散点图可得,两相关变量呈负相关,故①错;
②中,由散点图可得,两相关变量呈正相关,且相关系数可能是;
③中,若相关系数,则所有的点应该分布在一条直线上,散点图显然不符合,故③错;
④中,若相关系数,则所有的点应该分布在一条直线上,散点图显然不符合,故④错;
4、其他数字特征
(1)中位数:将一组数据按大小依次排列,处于最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数.
(2)众数:一组数据中出现次数最多的数据叫做这组数据的众数.
(3)平均数:一组数据的算术平均数即为这组数据的平均数,
n个数据x1,x2,…,xn的平均数 =(x1+x2+…+xn).
【例6】有一组样本数据:1,2,4,3,1,2,1,则( )
A.这组数据的众数为2 B.这组数据的极差为3
C.这组效据的平均数为2 D.这组数据的中位数为
【答案】BC
【详解】对A,该组数据众数为1,故错误;对B,极差为4-1=3,故正确;
对C,平均数为,故正确;
对D,中位数为2,故错误
【跟踪训练6】已知一组数据为-1,1,5,5,0,则该组数据的( )
A.众数是5 B.平均数是2 C.中位数是5 D.方差是
【答案】ABD
【详解】数据为-1,1,5,5,0,的众数为5,A正确;
数据的平均数为,B正确;数据的中位数为1,C错误;
数据的方差为,D正确.
重点2:线性回归分析与非线性回归分析
【例7】某地经过多年的环境治理,已将荒山改造成了绿水青山.为估计一林区某种树木的总材积量,随机选取了棵这种树木,测量每棵树的根部横截面积单位:和材积量单位:,得到如下数据:
样本号 总和
根部横截面积
材积量
并计算得,,.
(1)估计该林区这种树木平均一棵的根部横截面积与平均一棵的材积量;
(2)求该林区这种树木的根部横截面积与材积量的样本相关系数精确到;
(3)现测量了该林区所有这种树木的根部横截面积,并得到所有这种树木的根部横截面积总和为已知树木的材积量与其根部横截面积近似成正比.利用以上数据给出该林区这种树木的总材积量的估计值.
附:相关系数,.
【答案】(1),(2)(3)
【解析】(1)设这棵树木平均一棵的根部横截面积为,平均一棵的材积量为,则根据题中数据得:,;
(2)由题可知,.
(3)设从根部面积总和,总材积量为,则,故
【跟踪训练7】如图是某采矿厂的污水排放量单位:吨与矿产品年产量单位:吨的折线图:
(1)依据折线图计算相关系数精确到,并据此判断是否可用线性回归模型拟合y与x的关系?若,则线性相关程度很高,可用线性回归模型拟合
(2)若可用线性回归模型拟合与的关系,请建立关于的线性回归方程,并预测年产量为10吨时的污水排放量.
相关公式:,参考数据:.
回归方程中,
【答案】(1)相关系数,可用线性回归模型拟合y与x的关系(2),吨
【解析】(1)由折线图得如下数据计算得:,,,所以相关系数,因为,所以可用线性回归模型拟合y与x的关系
(2),所以回归方程为,当时,,所以预测年产量为10吨时的污水排放量为吨
【例8】某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费(单位:千元)对年销售量(单位:)和年利润(单位:千元)的影响,对近8年的年宣传费和年销售量(=1,2,···,8)数据作了初步处理,得到下面的散点图及一些统计量的值.
46.6 563 6.8 289.8 1.6 1469 108.8
表中,.
(1)根据散点图判断,与哪一个适宜作为年销售量关于年宣传费的回归方程类型?(给出判断即可,不必说明理由)
(2)根据(1)的判断结果及表中数据,建立关于的回归方程;
(3)已知这种产品的年利率与、的关系为.根据(Ⅱ)的结果回答下列问题:
(i)年宣传费时,年销售量及年利润的预报值是多少?
(ii)年宣传费为何值时,年利率的预报值最大?
附:对于一组数据,,……,,其回归线的斜率和截距的最小二乘估计分别为:、
【答案】(1)适合(2)(3)46.24
【解析】
(1)解:由散点图知:各点呈非线性递增趋势,所以作为回归方程比较合适.
(2)解:由,则,由,,则,所以.
(3)解:①当时,;此时年利润千元.②由题意,,所以,当,即时,年利润的预报值最大.
【跟踪训练8】5G网络是指第五代移动网络通讯技术,它的主要特点是传输速度快,峰值传输速度可达每秒钟数十GB.作为新一代移动通讯技术,它将要支持的设备远不止智能手机,而是会扩展到未来的智能家居,智能穿戴等设备.某科技创新公司基于领先技术的支持,经济收入在短期内逐月攀升,该公司1月份至6月份的经济收入y(单位:万元)关于月份x的数据如下表所示,并根据数据绘制了如图所示的散点图.
月份x 1 2 3 4 5 6
收入y 6 11 23 37 72 124
(1)根据散点图判断,与(a,b,c,d均为常数)哪一个更适合作为经济收入y关于月份x的回归方程类型(给出判断即可,不必说明理由)?
(2)根据(1)的结果及表中数据,求出y关于x的回归方程(结果保留两位小数);
(3)根据(2)所求得的回归方程,预测该公司7月份的经济收入(结果保留两位小数).
参考公式及参考数据:回归方程中斜率和截距的最小二乘估计公式为:,;
3.5 45.5 3.34 17.5 393.5 10.63 239.85
其中,().
【答案】(1)更适合(2)(3)239.85万元
【解析】(1)由散点图可知,更适合作为经济收入y关于月份x的回归方程类型.
(2)的两边取自然对数,得.因为,,,,所以,,所以,所以经济收入y关于月份x的回归方程为.
(3)当时,.预测该公司7月份的经济收入约为239.85万元.
重点3:独立性检验
【例9】为了解我区高中学生阅读情况,随机调查了100位同学每月课外阅读时间(小时),并将这100个数据按阅读时间整理得到下表;
阅读时间
人数 10 12 14 20 24 14 6
将每月课外阅读时间40小时及以上者视为“阅读达人”,40小时以下者视为“非阅谜达人”.
(1)请根据已知条件完成以下列联表,并判断是否有的把握认为“阅读达人”与性别有关?
非阅读达人 阅读达人 合计
男生
女生 12 40
合计
(2)用样本估计总体,将频率视为概率.现从全区高中学生中随机抽取19人,则抽到“阅读达人”最有可能的人数是多少?
附表:独立性检验临界值
参考公式:,其中
【答案】(1)列联表见解析,有的把握(2)4
【解析】(1)解:女生中非阅读达人有人,阅读达人共有人,则男生中阅读达人有人,男生中非阅读达人有人,列联表如下表:
非阅读达人 阅读达人 合计
男生 52 8 60
女生 28 12 40
合计 80 20 100
,所以有的把握认为“阅读达人”与性别有关;
(2)解:将频率视为概率,则任抽取1人,抽到“阅读达人”的概率为,设抽到“阅读达人”的人数为,则,则,所以抽到“阅读达人”最有可能的人数是人.
【跟踪训练9】在某次社会机构的招聘考试中,参加考试的文科大学生与理科大学生的人数比例为,且成绩(单位:分)分布在,为调研此次考试的整体状况,按文理科用分层抽样的方法抽取160人的成绩作为样本,得到成绩的频率分布直方图如图所示,且规定70及其以上为优秀.
(1)填写列联表;
文科生 理科生 合计
优秀 4
不优秀
合计 160
(2)通过计算判断是否有90%的把握认为成绩优秀与大学生的文理科有关.
参考公式:,其中.
参考数据:
0.15 0.10 0.05 0.025 0.01
2.072 2.706 3.841 5.024 6.635
【答案】(1)列联表见解析;(2)有90%的把握认为成绩优秀与大学生的文理科有关.
【解析】(1)由题意可知,文理科人数的比例为且按分层抽样抽取160人,则文科生有人,理科生有人,70分及以上为优秀,则优秀的共有人,所以列联表为:
文科生 理科生 合计
优秀 4 28 32
不优秀 36 92 128
合计 40 120 160
(2)由(1)知,,所以有90%的把握认为成绩优秀与大学生的文理科有关.
【创新题试做】
一、单选题
1.根据气象学上的标准,连续5天的日平均气温低于即为入冬,将连续5天的日平均温度的记录数据(记录数据都是自然数)作为一组样本,现有4组样本①、②、③、④,依次计算得到结果如下:
①平均数; ②平均数且极差小于或等于3;
③平均数且标准差; ④众数等于5且极差小于或等于4.
则4组样本中一定符合入冬指标的共有( )
A.1组 B.2组 C.3组 D.4组
2.在卡方独立性检验中,,其中为列联表中第行列的实际频数,为假定独立情况下由每行 每列的总频率乘以总频数得到的理论频数,取时,如表所示,则有:,因此:与课本公式等价,故以下列联表的最小值为( )
1 2
3 4
30
30 25 45
A. B. C. D.
二、多选题
3.用分层随机抽样从某校高一年级学生的数学期末成绩(满分为分,成绩都是整数)中抽取一个样本量为的样本,其中男生成绩数据个,女生成绩数据个,再将个男生成绩样本数据分为组:,,,,,,绘制得到如图所示的频率分布直方图.下列正确的是( )
A.男生成绩样本数据的平均数为
B.估计有的男生数学成绩在分以内
C.在和内的两组男生成绩中,随机抽取两个进行调查,则调查对象来自不同分组的概率为
D.若男生成绩样本数据的方差为,女生成绩样本数据的平均数和方差分别为和,则总样本的方差为
4.已知采用分层抽样得到的样本数据由两部分组成,第一部分样本数据的平均数为,方差为;第二部分样本数据的平均数为,方差为,设,则以下命题正确的是( )
A.设总样本的平均数为,则 B.设总样本的平均数为,则
C.设总样本的方差为,则 D.若,则
5.计算机显示的数字图像是由一个个小像素点组合而成的.处理图像时,常会通过批量调整各像素点的亮度,间接调整图像的对比度、饱和度等物理量,让图像更加美观.特别地,当图像像素点规模为1行列时,设第i列像素点的亮度为,则该图像对比度计算公式为.已知某像素点规模为1行列的图像第i列像素点的亮度,现对该图像进行调整,有2种调整方案:①;②,则( )
A.使用方案①调整,当时,
B.使用方案②调整,当时,
C.使用方案①调整,当时,
D.使用方案②调整,当,时,
6.设一组样本的统计数据为:,其中n∈N*,.已知该样本的统计数据的平均数为,方差为,设函数,x∈R.则下列说法正确的是( )
A.设b∈R,则的平均数为 B.设a∈R,则的方差为
C.当x=时,函数有最小值 D.
三、填空题
7.已知a,b,c,d,e为5个实数,若a,b,c,d、a,b,c,e、a,b,d,e的方差均为1,则b,c,d,e方差的最大值是________.
8.水痘是一种传染性很强的病毒性疾病,易在春天爆发.市疾控中心为了调查某校高一年级学生注射水症疫苗的人数,在高一年级随机抽取5个班级,每个班抽取的人数互不相同,若把每个班级抽取的人数作为样本数据.已知样本平均数为7,样本方差为4,则样本数据中的最大值是_____.
四、双空题
9.甲 乙两班参加了同一学科的考试,其中甲班50人,乙班40人.甲班的平均成绩为76分,方差为96分;乙班的平均成绩为85分,方差为60分.那么甲 乙两班全部90名学生的平均成绩是________分,方差是________分.
五、解答题
10.为抢占市场,特斯拉电动车近期进行了一系列优惠促销方案.要保证品质兼优,特斯拉上海工厂在车辆出厂前抽取100辆Model3型汽车作为样本进行了单次最大续航里程的测试.现对测试数据进行分析,得到如图所示的频率分布直方图:
(1)估计这100辆汽车的单次最大续航里程的平均值(同一组中的数据用该组区间的中点值代替).
(2)根据大量的测试数据,可以认为Model3这款汽车的单次最大续航里程近似地服从正态分布,经计算第(1)问中样本标准差s的近似值为50.用样本平均数作为的近似值,用样本标准差s作为的估计值,现从生产线下任取一辆汽车,求它的单次最大续航里程恰在250千米到400千米之间的概率.
(3)为迅速抢占市场举行促销活动,特斯拉销售公司现面向意向客户推出“玩游戏,赢大奖,送车模”活动,客户可根据拋掷硬币的结果,指挥车模在方格图上行进,若车模最终停在“幸运之神”方格,则可获得购车优惠券6万元;若最终停在“赠送车模”方格时,则可获得车模一个.已知硬币出现正 反面的概率都是0.5,方格图上标有第0格 第1格 第2格 …… 第20格.车模开始在第0格,客户每掷一次硬币,车模向前移动一次.若掷出正面,车模向前移动一格(从k到k+1),若掷出反面,车模向前移动两格(从k到k+2),直到移到第19格(幸运之神)或第20格(赠送车模)时游戏结束.设车模移到第格的概率为,试证明是等比数列;若有6人玩游戏,每人参与一次,求这6人获得优惠券总金额的期望值(结果精确到1万元).
参考数据:若随机变量服从正态分布,则
11.某果园种植“糖心苹果”已有十余年,根据其种植规模与以往的种植经验,产自该果园的单个“糖心苹果”的果径(最大横切面直径,单位:)在正常环境下服从正态分布.
(1)一顾客购买了20个该果园的“糖心苹果”,求会买到果径小于56的概率;
(2)为了提高利润,该果园每年投入一定的资金,对种植、采摘、包装、宣传等环节进行改进.如图是2009年至2018年,该果园每年的投资金额(单位:万元)与年利润增量(单位:万元)的散点图:
该果园为了预测2019年投资金额为20万元时的年利润增量,建立了关于的两个回归模型;
模型①:由最小二乘公式可求得与的线性回归方程:;
模型②:由图中样本点的分布,可以认为样本点集中在曲线:的附近,对投资金额做交换,令,则,且有,,,.
(I)根据所给的统计量,求模型②中关于的回归方程;
(II)根据下列表格中的数据,比较两种模型的相关指数,并选择拟合精度更高、更可靠的模型,预测投资金额为20万元时的年利润增量(结果保留两位小数).
回归模型 模型① 模型②
回归方程
102.28 36.19
附:若随机变量,则,;样本的最小乘估计公式为,;
相关指数.
参考数据:,,,.
12.2021年6月17日9时22分,我国酒泉卫星发射中心用长征二号F遥十二运载火箭,成功将神舟十二号载人飞船送入预定轨道,顺利将聂海胜、刘伯明、汤洪胺3名航天员送入太空,发射取得圆满成功,这标志着中国人首次进入自己的空间站.某公司负责生产的A型材料是神舟十二号的重要零件,该材料应用前景十分广泛,该公司为了将A型材料更好地投入商用,拟对A型材料进行应用改造,根据市场调研与模拟,得到应用改造投入x(亿元)与产品的直接收益y(亿元)的数据统计如下:
序号 1 2 3 4 5 6 7 8 9 10 11 12
x 2 3 4 6 8 10 13 21 22 23 24 25
y 15 22 27 40 48 54 60 68.5 68 67.5 66 65
当0模型①:;模型②:;
当x>13时,确定y与x满足的线性回归直线方程为.
根据以上阅读材料,解答以下问题:
(1)根据下列表格中的数据,比较当0回归模型 模型① 模型②
回归方程
79.13 20.2
(2)当应用改造的投入为20亿元时,以回归直线方程为预测依据,计算公司的收益约为多少.
附:①若最小二乘法求得回归直线方程为,则;

③,当时,.
13.生物学家认为,睡眠中的恒温动物依然会消耗体内能量,主要是为了保持体温.脉搏率是单位时间心跳的次数,医学研究发现,动物的体重(单位:)与脉搏率存在着一定的关系.表1给出一些动物体重与脉搏率对应的数据,图1画出了体重与脉搏率的散点图,图2画出了与的散点图.
动物名 鼠 大鼠 豚鼠 兔 小狗 大狗 羊
体重 25 200 300 2000 5000 30000 50000
脉搏率 670 420 300 200 120 85 70
为了较好地描述体重和脉搏率的关系,现有以下两种模型供选择:
① ②
(1)选出你认为最符合实际的函数模型,并说明理由;
(2)不妨取表1中豚鼠和兔的体重脉搏率数据代入所选函数模型,求出关于的函数解析式;
(3)若马的体重是兔的256倍,根据(2)的结论,预计马的脉搏率.
(参考数据:,.)
14.近年来,国家为了鼓励高校毕业生自主创业,出台了许多优惠政策,以创业带动就业.某高校毕业生小张自主创业从事苹果的种植,并开设网店进行销售.为了做好苹果的品控,小张从自己果园的苹果树上,随机摘取150个苹果测重(单位:克),其重量分布在区间内,根据统计的数据得到如图1所示的频率分布直方图.
(1)以上述样本数据中频率作为概率,现一顾客从该果园购买了5个苹果,求这5个苹果中重量至少有一个在一个在内的概率.
(2)小张的网店为了进行苹果的促销,推出了“买苹果,送福袋”的活动,买家在线参加按图行进赢取福袋的游戏.该游戏的规则如下:买家点击抛掷一枚特殊的骰子,每次抛掷的结果为1或2,且这两种结果的概率相同;从出发格(第0格)开始,每掷一次,按照抛掷的结果,按如图2所示的路径向前行进一次,若掷出1点,即从当前位置向前行进一格(从第k格到第格,),若掷出2点,即从当前位置向前行进两格(从第k格到第格,),行进至第31格(获得福袋)或第32格(谢谢惠顾),游戏结束.设买家行进至第i格的概率为,.
(i)求、.
(ii)说明该大学生网店推出的此款游戏活动,是更有利于卖家,还是更有利于买家.
15.十三届全国人大四次会议3月11日表决通过了关于国民经济和社会发展第十四个五年规划和2035年远景目标纲要的决议,决定批准这个规划纲要.纲要指出:“加强原创性引领性科技攻关”.某企业集中科研骨干,攻克系列“卡脖子”技术,已成功实现离子注入机全谱系产品国产化,包括中束流 大束流 高能 特种应用及第三代半导体等离子注入机,工艺段覆盖至28,为我国芯片制造产业链补上重要一环,为全球芯片制造企业提供离子注入机一站式解决方案.此次技术的突破可以说为国产芯片的制造做出了重大贡献.该企业使用新技术对某款芯片进行试生产.
(1)在试产初期,该款芯片的批次生产有四道工序,前三道工序的生产互不影响,第四道是检测评估工序,包括智能自动检测与人工抽检.已知该款芯片在生产中,前三道工序的次品率分别为,,.
①求批次芯片的次品率;
②第四道工序中智能自动检测为次品的芯片会被自动淘汰,合格的芯片进入流水线并由工人进行抽查检验.已知批次的芯片智能自动检测显示合格率为,求工人在流水线进行人工抽检时,抽检一个芯片恰为合格品的概率(百分号前保留两位小数).
(2)已知某批次芯片的次品率为,设个芯片中恰有个不合格品的概率为,记的最大值点为,改进生产工艺后批次的芯片的次品率.某手机生产厂商获得批次与批次的芯片,并在某款新型手机上使用.现对使用这款手机的用户回访,对开机速度进行满意度调查.据统计,回访的名用户中,安装批次有部,其中对开机速度满意的有人;安装批次有部,其中对开机速度满意的有人.求,并判断是否有的把握认为芯片质量与用户对开机速度满意度有关?
附:.
16.在某生态系统中,有甲、乙两个种群,两种群之间为竞争关系.设t时刻甲、乙种群的数量分别为,(起始时刻为).由数学家Lotka和Volterra提出的模型是函数,满足方程,,其中a,b,c,d均为非负实数.
(1)下图为没有乙种群时,一段时间内甲种群数量与时间的关系折线图.为预测甲种群的数量变化趋势,研究人员提出了两种可能的数学模型:①;②,其中m,n均为大于1的正数.根据折线图判断,应选用哪种模型进行预测,并说明理由.
(2)设,.
①函数的单调性;
②根据①中的结论说明:在绝大多数情况下,经过充分长的时间后,或者甲种群灭绝,或者乙种群灭绝.
注:在题设条件下,各种群数量均有上限值.
17.某贫困地区有统计数据显示,2020年该地利用网络直播形式销售农产品的销售主播年龄等级分布如图1所示,一周内使用直播销售的频率分布扇形图如图2所示.若将销售主播按照年龄分为“年轻人”(岁~岁)和“非年轻人”(岁及以下或者岁及以上)两类,将一周内使用的次数为次或次以上的称为“经常使用直播销售用户”,使用次数为次或不足次的称为“不常使用直播销售用户”,则“经常使用直播销售用户”中有是“年轻人”.
(1)现对该地相关居民进行“经常使用网络直播销售与年龄关系”的调查,采用随机抽样的方法,抽取一个容量为的样本,请你根据图表中的数据,完成列联表,并根据列联表判断是否有的把握认为经常使用网络直播销售与年龄有关?
年轻人 非年轻人 合计
经常使用直播销售用户
不常使用直播销售用户
合计
(2)某投资公司在2021年年初准备将万元投资到“销售该地区农产品”的项目上,现有两种销售方案供选择:方案一:线下销售.根据市场调研,利用传统的线下销售,到年底可能获利,可能亏损,也可能不赔不赚,且这三种情况发生的概率分别为;方案二:线上直播销售.根据市场调研,利用线上直播销售,到年底可能获利,可能亏损,也可能不赔不赚,且这三种情况发生的概率分别为.针对以上两种销售方案,请你从期望和方差的角度为投资公司选择一个合理的方案,并说明理由.
参考数据:独立性检验临界值表
其中,.
18.某公司研发了一种帮助家长解决孩子早教问题的萌宠机器人.萌宠机器人语音功能让它就像孩子的小伙伴一样和孩子交流,记忆功能还可以记住宝宝的使用习惯,很快找到宝宝想听的内容.同时提供快乐儿歌、国学经典、启蒙英语等早期教育内容,且云端内容可以持续更新.萌宠机器人一投放市场就受到了很多家长欢迎.为了更好地服务广大家长,该公司研究部门从流水线上随机抽取100件萌宠机器人(以下简称产品),统计其性能指数并绘制频率分布直方图(如图1):
产品的性能指数在的适合托班幼儿使用(简称A类产品),在的适合小班和中班幼儿使用(简称B类产品),在的适合大班幼儿使用(简称C类产品),A,B,C,三类产品的销售利润分别为每件1.5,3.5,5.5(单位:元).以这100件产品的性能指数位于各区间的频率代替产品的性能指数位于该区间的概率.
(1)求每件产品的平均销售利润;
(2)该公司为了解年营销费用(单位:万元)对年销售量(单位:万件)的影响,对近5年的年营销费用,和年销售量数据做了初步处理,得到的散点图(如图2)及一些统计量的值.
16.30 24.87 0.41 1.64
表中,,,.
根据散点图判断,可以作为年销售量(万件)关于年营销费用(万元)的回归方程.
(i)建立关于的回归方程;
(ii)用所求的回归方程估计该公司应投入多少营销费,才能使得该产品一年的收益达到最大?
(收益=销售利润-营销费用,取).
参考公式:对于一组数据,其回归直线的斜率和截距的最小二乘估计分别为,.
19.为了检测某种抗病毒疫苗的免疫效果,通常需要进行动物与人体试验.研究人员将疫苗注射到200只小白鼠体内,一段时间后测量小白鼠的某项指标值,按,,,,分组,绘制频率分布直方图如图所示.试验发现小白鼠体内产生抗体的共有160只,其中该项指标值不小于60的有110只.假设小白鼠注射疫苗后是否产生抗体相互独立,并用频率估计概率.
(1)填写下面的列联表,并根据列联表判断是否有95%的把握认为注射疫苗后小白鼠产生抗体与指标值不小于60有关?
指标值 指标值
有抗体
没有抗体
(2)为检验疫苗二次接种的免疫抗体性,对第一次注射疫苗后没有产生抗体的40只小白鼠进行第二次注射疫苗,结果又有20只小白鼠产生抗体.①求一只小白鼠注射2次疫苗后产生抗体的概率;
②以(1)中确定的概率作为人体注射2次疫苗后产生抗体的概率,进行人体接种试验,记个人注射2次疫苗后产生抗体的数量为随机变量.试验后统计数据显示,当时,取最大值,求参加人体接种试验的人数及的数学期望.参考公式:,其中.
0.15 0.10 0.050 0.010 0.001
2.072 2.706 3.841 6.635 10.828
20.马拉松赛事是当下一项非常火爆的运动项目,受到越来越多人的喜爱.王老师是一位资深的马拉松爱好者,他的微信朋友圈内也有大量的好友加入了他的“马拉松跑友群”,他随机选取了其中的100人(男、女各50人),记录了他们在某一天马拉松训练中的跑步公里数,并将数据整理如下:
跑步公里数性别 5~10 10~15 15~20 20~25 25~30
男 4 8 10 12 10 6
女 8 4 14 14 6 4
(1)已知某人一天的跑步公里数超过20公里被“跑友群”评定为“高级”,否则为“初级”,根据题意完成下面的列联表,并据此判断能否有97.5%的把握认为“评定级别”与“性别”有关
初级 高级 总计


总计
(2)若王老师以这100位好友该日跑步公里数的频率分布来估计其跑群中所有跑友每日跑步公里数的概率分布,现从王老师的所有跑群好友中任选2人,其中每日跑步公里数不超过10公里的有X人,超过30公里的有Y人,设,求的分布列及数学期望.
附:,
0.05 0.025 0.010
3.841 5.024 6.635
【参考答案】
1.B【详解】①举反例:,,,,,其平均数.但不符合入冬指标;
②假设有数据大于或等于10,由极差小于或等于3可知,
则此组数据中的最小值为,此时数据的平均数必然大于7,
与矛盾,故假设错误.则此组数据全部小于10. 符合入冬指标;
③举反例:1,1,1,1,11,平均数,且标准差.但不符合入冬指标;
④在众数等于5且极差小于等于4时,则最大数不超过9.符合入冬指标.
2.C【详解】由已知,可将上述列联表补充完整,
30
30 25 45
,所以,;
;;;
;;
,①
由,设,,所以,
带入①式得:
令,设函数,该函数为对勾函数,函数在区间单调递减,在区间单调递增,而因为,所以当时最接近最小值,故时,时①式取得最小值,为.
3.BCD【详解】对于选项A,根据频率分布直方图有,男生成绩样本数据的平均数,故A错误;
对于选项B,根据频率分布直方图有,男生数学成绩在分以内的人数的频率为,所以估计有的男生数学成绩在分以内,故B正确;
对于选项C,根据频率分布直方图有,在和内的男生人数分别为6人、2人,随机抽取两个进行调查,则调查对象来自不同分组的概率为,故C正确;
对于选项D,设女生成绩样本数据的平均数为,则总样本的平均数,所以总样本的方差为,故D正确.
4.AD【详解】对于A选项,因为,所以
,即,A正确;
对于B选项,取第一部分数据为,则,,取第二部分数据为,则,,则,B不正确;
对于C选项,取第一部分数据为,则,,
取第二部分数据为,则,,则,
,C不正确;
对于D选项,若,则.
5.AC【详解】使用方案①调整:当时且,又则,A正确;
,,
当,即且,又,可得,C正确;
使用方案②调整:当时,显然若时,B错误;
,而,则,故,
又,则,,
所以,而,
时,则,则,
此时,显然存在,D错误.
6.AC【详解】对于A,的平均数,的平均数为,正确;
对于B,的方差,的平均数为,方差为,错误;
对于C, ,又,,故,故当x=时,函数有最小值;
对于D,由上知,.
7.【详解】解:先证明一个引理:当“是常数”时,.
证明:因为.
设,由引理可得原题即:
已知的方差均为,求的方差的最大值.
由题设可得:,
方程组里的前两个等式相减可得,
故,同理.
若互异,则,相减得,前后矛盾!里至少有两个相等.
(1)若,
则问题转化为由求的最大值.
而即,
故,故.
(2)若,则,即.
将代入三个方差等式化简均得:
将代入的表达式得:
当时,.设. 将之代入得:

可得,故.
(3)若“”(由对称性知,“”与“”相同),则
当时,.
故设. 将之代入得:
,
可得,故.
综上,所求方差最大值是.故答案为:.
8.10【详解】设五个班级的数据分别为,根据平均数和方差得,,显然各个括号为整数.设分别为,则,设,由已知,则判别式,即,解得,即,且,
所以,即样本数据中的最大值是.
9. 80 100
【详解】设甲班50人的成绩为,则其平均成绩,
设乙班40人的成绩为,则其平均成绩,
则甲乙两班全部90名学生的平均成绩为;
设甲班50人成绩的方差为,所以
则,
设乙班40人成绩的方差为,则,
设甲乙两班全部90人成绩的方差为,则
10.(1)(千米);(2);(3)证明见解析,优惠券总金额的期望万元.
【详解】(1)(千米)(2)因为服从正态分布
所以
(3)第一次掷硬币出现正面,车模从第0格移到第一格,其概率为即移动到第二格有两类情况.车模移到第()格的情况是下列两种,而且也只有两种.
①车模先到第格,又掷出反面,其概率为
②车模先到第格,又掷出正面,其概率为
所以,,
当时,数列是公比为的等比数列.
,经验证也满足.是公比为的等比数列.
以上各式相加,得

(),经检验时也符合.

获得优惠券的概率
获得车模的概率
设参与游戏的6人获得优惠券的有人,由题可知
的期望
设优惠卷总金额为万元,
优惠券总金额的期望万元
11.(1)0.3695;(2)(I),(II)模型①的小于模型②,说明回归模型②刻画的拟合效果更好,当时,模型②的年利润增量的预测值为(万元),
【详解】(1)由已知,当个“糖心苹果”的果径,则,.
由正态分布的对称性可知,
设一顾客购买了20个该果园的“糖心苹果”,其中果径小于56的有个,则,
故,
所以这名顾客所购买20个“糖心苹果”中有果径小于56的苹果概率为0.3695.
(2)(I)由,,可得,,
又由题,得,

所以,模型②中关于的回归方程.
(II)由表格中的数据,有,即,
所以模型①的小于模型②,说明回归模型②刻画的拟合效果更好,
当时,模型②的年利润增量的预测值为
(万元),
这个结果比模型①的预测精度更高、更可靠.
12.(1)模型②拟合效果更好(2)69.1(亿元)
【解析】(1)对于模型①,因为,故对应的,
故对应的相关指数,
对于模型②,同理对应的相关指数,故模型②拟合效果更好.
(2)当时,后五组的,
由最小二乘法可得,
所以当时,确定y与x满足的线性回归直线方程为
故当投入20亿元时,预测公司的收益约为:(亿元).
13.(1)模型②最符合实际,理由见解析;(2);(3)50.
【详解】(1)模型②最符合实际
根据散点图的特征,图2基本上呈直线形式,所以可以选择一次函数来刻画和的关系.
(2)由题意知,
因为,,.
解得,即,
所以关于的函数解析式为.
(3)设马的体重和脉搏率为,,设兔的体重和脉搏率为,,由题意,
,因为,则,即马的脉搏率为50.
14.(1);(2)(i),,(ii)小张网店推出的此款游戏活动是更有利于买家.
【详解】(1)由频率分布直方图可知苹果重量在内的概率为0.28,
所以不在的概率为,购买5个所得重量相当于5次独立重复试验,
故这5个苹果中重量至少有一个在内的概率为
(2)(i)买家要行进至第1格的情况只有一种:买家第一次抛掷骰子,结果为1,行进至第一格,其概率为,则;
买家要行进至第2格的情况有以下两种:
①当前格在第0格,第一次抛掷骰子,结果为2,行进至第2格,其概率为;
②当前格在第1格,第二次抛掷骰子,结果为1,行进至第2格,其概率为;
所以.
(ii)买家要行进至第i格()的情况有以下两种:
①当前格在第格,抛掷一次骰子,结果为2,行进至第i格,其概率为;
②当前格在第格,抛掷一次骰子,结果为1,行进至第i格,其概率为;
所以.,
即,又,
所以数列是首项为,
公比为的等比数列.所以,
所以
.即.
所以买家行进至第31格(获得福袋)的概率为

又买家行进至第32格(谢谢惠顾)的概率为,
由于,
所以买家行进至第31格的概率大于行进至第32格的概率,即小张网店推出的此款游戏活动是更有利于买家.
15.(1)①;②;(2),有的把握认为芯片质量与用户对开机速度满意度有关.
【详解】(1)①Ⅰ批次芯片的次品率为.
②设批次Ⅰ的芯片智能自动检测合格为事件,人工抽检合格为事件,
由己知得,,
则工人在流水线进行人工抽检时,抽检一个芯片恰为合格品为事件,
.
(2)个芯片中恰有个不合格的概率.
因此,令,得.
当时,;当时,.所以的最大值点为.
由(1)可知,,,故批次芯片的次品率低于批次,故批次的芯片质量优于批次.由数据可建立2×2列联表如下:(单位:人)
开机速度满意度 芯片批次 合计
I J
不满意 12 3 15
满意 28 57 85
合计 40 60 100
根据列联表得
.
因此,有的把握认为芯片质量与用户对开机速度满意度有关.
16.(1)应选用模型②预测甲种群数量的变化趋势;理由见解析
(2)①为常函数;②答案见解析
【解析】(1)由折线图知,甲种群数量的增长速度随着时间的推移而加快.而增长速度大致对应种群数量对时间的导数.如选用模型①,,是关于时间的减函数,不符合折线图;如选用模型②,,是关于时间的增函数,符合折线图.所以应选用模型②预测甲种群数量的变化趋势
(2)由题设知,.(i),.消去条件中的得,所以.所以为常函数.(ii)由(i),,.由于各种群数量均有上限值,不妨设甲乙种群数量的上限值分别为,.①若,.则当时,,此时可以近似认为甲种群灭绝;②若,.则当时,,此时可以近似认为乙种群灭绝;③若,,甲乙种群数量之比保持恒定,可能不出现灭绝的情况.综上所述,对所有的情况,经过充分长的时间后,或者甲种群灭绝,或者乙种群灭绝
17.(1)列联表见解析,有的把握认为经常使用网络直播销售与年龄有关;(2)选方案一,理由见解析.
【详解】(1)由图1知,“年轻人”占比为,即有(人),“非年轻人”有(人)
由图2知,“经常使用直播销售用户”占比为,即有(人),“不常使用直播销售用户” 有(人).
“经常使用直播销售用户的年轻人”有中有(人),“经常使用直播销售用户的非年轻人”有(人)
补全的列联表如下:
年轻人 非年轻人 合计
经常使用直播销售用户
不常使用直播销售用户
合计
于是.,
即有的把握认为经常使用网络直播销售与年龄有关.
(2)若按方案一,设获利万元,则可取的值为行,的分布列为:
(万元),
若按方案二,设获利万元,则可取的值为,的分布列为:
(万元),

由方案二的方差要比方案一的方差大得多,从稳定性方面看方案一线下销售更稳妥,故选方案一.
18.(1)每件产品的平均销售利润为4元(2)(i)(ii)该厂应投入256万元营销费.
【详解】(1)设每件产品的销售利润为元,则的所有可能取值为1.5,3.5,5.5,
由直方图可得,,,三类产品的频率分别为0.15、0.45、0.4,
所以,,,,
所以随机变量的分布列为:
1.5 3.5 5.5
0.15 0.45 0.4
所以,,故每件产品的平均销售利润为4元;
(2)(i)由得,,
令,,,则,由表中数据可得,,
则,所以,,
即,因为,所以,故所求的回归方程为;
(ii)设年收益为万元,则,设,,
则,当时,,在单调递增,
当时,,在单调递减,所以,当,即时,有最大值为768,
即该厂应投入256万元营销费,能使得该产品一年的收益达到最大768万元.
19.(1)填表见解析;有;(2)①0.9;②接受接种试验的人数为99人或100人;期望为90.
【详解】(1)由频率分布直方图,200只小白鼠某项指标值的数据分布为:
在内有个;内有个;
内有个;内有个;
内有个;
由已知,小白鼠体内产生抗体的共有160只,其中指标值不小于60的有110只,故有抗体且指标值小于60的有50只;而指标值小于60的小白鼠共有只,所以指标值小于60没有抗体的小白鼠有20,同理,指标值不小于60没有抗体的小白鼠有20只,故列联表如下:
指标值 指标值
有抗体 50 110
没有抗体 20 20
由.
所以有95%的把握认为注射疫苗后小白鼠产生抗体与指标值不小于60有关.
(2)(1)令事件{小白鼠第一次注射疫苗产生抗体},
事件{小白鼠第二次注射疫苗产生抗体},事件{小白鼠注射2次疫苗后产生抗体},
记事件,,发生的概率分别为,,,
则,,.
所以一只小白鼠注射2次疫苗后产生抗体的概率为0.9.
(2)随机变量,,
由题意,最大,所以
,且.
解得,,因为是整数,所以或,所以接受接种试验的人数为99人或100人.①当接种人数为99人时,的分布列为,数学期望;②当接种人数为100人时,的分布列为,数学期望.
20.(1)没有97.5%的把握认为“评定级别”与“性别”有关;(2)见详解.
【详解】解:(1)跑步公里数的列联表如下:
初级 高级 总计
男 22 28 50
女 26 24 50
总计 48 52 100
因为
所以没有97.5%的把握认为“评定级别”与“性别”有关.
(2)由这100人跑步公里数的频数分布表得:在跑群中任选一人跑步公里数不超过10公里的概率为,超过30公里的频率为,在10公里和30公里之间的频率为,
当,时,,所以
;
当或时,,则
;
当或时,,则
;所以的分布列为:
所以.
【课时作业】
一、多选题
1.下列命题正确的是( )
A.两个随机变量的线性相关性越强,则相关系数的绝对值越接近于1
B.对具有线性相关关系的变量x y,有一组观测数据,其线性回归方程是,且,则实数的值是
C.已知样本数据的方差为4,则的标准差是4
D.已知随机变量,若,则
2.年的“金九银十”变成“铜九铁十”,全国各地房价“跳水”严重,但某地二手房交易却“逆市”而行.下图是该地某小区年月至年月间,当月在售二手房均价(单位:万元/平方米)的散点图.(图中月份代码分别对应年月年月)
根据散点图选择和两个模型进行拟合,经过数据处理得到的两个回归方程分别为和,并得到以下一些统计量的值:
注:是样本数据中的平均数,是样本数据中的平均数,则下列说法正确的是( )
A.当月在售二手房均价与月份代码呈负相关关系
B.由预测年月在售二手房均价约为万元/平方米
C.曲线与都经过点
D.模型回归曲线的拟合效果比模型的好
3.下列命题是真命题的有( )
A.有甲、乙、丙三种个体按的比例分层抽样调查,如果抽取的甲个体数为9,则样本容量为30
B.数据1,2,3,3,4,5的平均数、众数、中位数相同
C.若甲组数据的方差为5,乙组数据为5,6,9,10,5,则这两组数据中较稳定的是乙
D.一组数6,5,4,3,3,3,2,2,2,1的85%分位数为5
4.下列说法正确的是( )
A.某大学为了解在校本科生对参加某项社会实践活动的意向,拟采用分层抽样的方法从该校四个年级的本科生中抽取一个容量为300的样本进行调查.已知该校一、二、三、四年级本科生人数之比为6:5:5:4,则应从一年级中抽取90名学生
B.10件产品中有7件正品,3件次品,从中任取4件,则恰好取到1件次品的概率为
C.已知变量x与y正相关,且由观测数据算得=3,=3.5,则由该观测数据算得的线性回归方程可能是=0.4x+2.3
D.从装有2个红球和2个黑球的口袋内任取2个球,至少有一个黑球与至少有一个红球是两个互斥而不对立的事件
5.下列命题为真命题的是( )
A.对具有线性相关关系的变量、,有一组观测数据,其线性回归方程是,且,则实数的值是
B.从数字、、、、、、、中任取个数,则这个数的和为奇数的概率为
C.已知样本数据、、、的方差为,则数据、、、的标准差是
D.已知随机变量,若,则
二、填空题
6.下列说法:
①线性回归方程必过;
②命题“”的否定是“”
③相关系数越小,表明两个变量相关性越弱;
④在一个列联表中,由计算得,则有的把握认为这两个变量间有关系;
其中正确的说法是__________.(把你认为正确的结论都写在横线上)
本题可参考独立性检验临界值表:
7.下列命题中,正确的命题有__________.
①回归直线恒过样本点的中心,且至少过一个样本点;
②将一组数据的每个数据都加一个相同的常数后,方差不变;
③用相关指数来刻画回归效果,越接近,说明模型的拟合效果越好;
④用系统抽样法从名学生中抽取容量为的样本,将名学生从编号,按编号顺序平均分成组(号,号,号),若第组抽出的号码为,则第一组中用抽签法确定的号码为号.
三、解答题
8.某学生兴趣小组随机调查了某市100天中每天的空气质量等级和当天到某公园锻炼的人次,整理数据得到下表(单位:天):
锻炼人次 空气质量等级 [0,200] (200,400] (400,600]
1(优) 2 16 25
2(良) 5 10 12
3(轻度污染) 6 7 8
4(中度污染) 7 2 0
(1)分别估计该市一天的空气质量等级为1,2,3,4的概率;
(2)求一天中到该公园锻炼的平均人次的估计值(同一组中的数据用该组区间的中点值为代表);
(3)若某天的空气质量等级为1或2,则称这天“空气质量好”;若某天的空气质量等级为3或4,则称这天“空气质量不好”.根据所给数据,完成下面的2×2列联表,并根据列联表,判断是否有95%的把握认为一天中到该公园锻炼的人次与该市当天的空气质量有关?
人次≤400 人次>400
空气质量好
空气质量不好
附:,
P(K2≥k) 0.050 0.010 0.001
k 3.841 6.635 10.828
9.某沙漠地区经过治理,生态系统得到很大改善,野生动物数量有所增加.为调查该地区某种野生动物的数量,将其分成面积相近的200个地块,从这些地块中用简单随机抽样的方法抽取20个作为样区,调查得到样本数据(xi,yi)(i=1,2,…,20),其中xi和yi分别表示第i个样区的植物覆盖面积(单位:公顷)和这种野生动物的数量,并计算得,,,,.
(1)求该地区这种野生动物数量的估计值(这种野生动物数量的估计值等于样区这种野生动物数量的平均数乘以地块数);
(2)求样本(xi,yi)(i=1,2,…,20)的相关系数(精确到0.01);
(3)根据现有统计资料,各地块间植物覆盖面积差异很大.为提高样本的代表性以获得该地区这种野生动物数量更准确的估计,请给出一种你认为更合理的抽样方法,并说明理由.
附:相关系数r=,≈1.414.
10.某公司研发了一种帮助家长解决孩子早教问题的萌宠机器人.萌宠机器人语音功能让它就像孩子的小伙伴一样和孩子交流,记忆功能还可以记住宝宝的使用习惯,很快找到宝宝想听的内容.同时提供快乐儿歌、国学经典、启蒙英语等早期教育内容,且云端内容可以持续更新.萌宠机器人一投放市场就受到了很多家长欢迎.为了更好地服务广大家长,该公司研究部门从流水线上随机抽取100件萌宠机器人(以下简称产品),统计其性能指数并绘制频率分布直方图(如图1):
产品的性能指数在的适合托班幼儿使用(简称A类产品),在的适合小班和中班幼儿使用(简称B类产品),在的适合大班幼儿使用(简称C类产品),A,B,C,三类产品的销售利润分别为每件1.5,3.5,5.5(单位:元).以这100件产品的性能指数位于各区间的频率代替产品的性能指数位于该区间的概率.
(1)求每件产品的平均销售利润;
(2)该公司为了解年营销费用(单位:万元)对年销售量(单位:万件)的影响,对近5年的年营销费用,和年销售量数据做了初步处理,得到的散点图(如图2)及一些统计量的值.
16.30 24.87 0.41 1.64
表中,,,.
根据散点图判断,可以作为年销售量(万件)关于年营销费用(万元)的回归方程.
(i)建立关于的回归方程;
(ii)用所求的回归方程估计该公司应投入多少营销费,才能使得该产品一年的收益达到最大?
(收益=销售利润-营销费用,取).
参考公式:对于一组数据,其回归直线的斜率和截距的最小二乘估计分别为,
【参考答案】
1.ABC【详解】两个随机变量的线性相关性越强,相关系数的绝对值越接近于1,故A正确;
B中,,由得,B正确;
样本数据的方差为4,则数捍的方差为,标准差为4,C正确;随机变量,若,则,则,D错.
2.BD【详解】对于A,散点从左下到右上分布,所以当月在售二手房均价y与月份代码x呈正相关关系,故A不正确;对于B,令,由,
所以可以预测2021年2月在售二手房均价约为1.0509万元/平方米,故B正确;
对于C,非线性回归曲线不一定经过 ,故C错误;
对于D,越大,拟合效果越好,由,故D正确.
3.BCD【详解】对于A项,乙、丙抽取的个体数分别为,则样本容量为,故A错误;对于B项,平均数为,中位数为,众数为,故B正确;
对于C项,乙的平均数为,方差为,则这两组数据中较稳定的是乙,故C正确;
对于D项,将该组数据总小到大排列,由,则该组数据的85%分位数为5,故D正确;
4.ABC【详解】A.由分层抽样,应制取人数为,A正确;
B.恰好取到1件次品的概率为,B正确;
C.∵,直线=0.4x+2.3过中心点,可能是回归直线方程,C正确;
D.一红球一黑球这个事件即是至少有一个红球,也是至少有一个黑球,因此它们不互斥.
5.BC【详解】对于A选项,由已知条件可得,,所以,回归直线过样本中心点,
将其代入线性回归方程中,得,解得,故A错误;
对于B,若任取个数,使得这个数的和为奇数,则这个数中一个为奇数,一个为偶数,
即所求的概率为,故B正确;
对于C,设离散型随机变量的取值为、、、,则随机变量的取值为、、、,
由已知条件可得,则,
所以,数据、、、的标准差是,故C正确;
对于D,由随机变量知,
由正态分布密度曲线的轴对称性可知,则,所以,,故D错误.
6.①④【详解】线性回归方程必过样本中心点,故①正确.
命题“”的否定是“” 故②错误
③相关系数r绝对值越小,表明两个变量相关性越弱,故不正确;
④在一个列联表中,由计算得,则有的把握认为这两个变量间有关系,正确.故答案为①④.
7.②④【详解】回归直线恒过样本点的中心,不须过样本点;①错误;将一组数据的每个数据都加一个相同的常数后,数据的波动性不变,故方差不变;②正确;用相关指数来刻画回归效果,越接近,说明模型的拟合效果越好;③错误;④中系统抽样方法是正确的.故本题应选②④.
8.(1)该市一天的空气质量等级分别为、、、的概率分别为、、、;(2);(3)有,理由见解析.
【详解】(1)由频数分布表可知,该市一天的空气质量等级为的概率为,等级为的概率为,等级为的概率为,等级为的概率为;
(2)由频数分布表可知,一天中到该公园锻炼的人次的平均数为
(3)列联表如下:
人次 人次
空气质量好
空气质量不好

因此,有的把握认为一天中到该公园锻炼的人次与该市当天的空气质量有关.
9.(1);(2);(3)详见解析
【详解】(1)样区野生动物平均数为,
地块数为200,该地区这种野生动物的估计值为
(2)样本(i=1,2,…,20)的相关系数为
(3)由(2)知各样区的这种野生动物的数量与植物覆盖面积有很强的正相关性,
由于各地块间植物覆盖面积差异很大,从而各地块间这种野生动物的数量差异很大,
采用分层抽样的方法较好地保持了样本结构与总体结构的一致性,提高了样本的代表性,
从而可以获得该地区这种野生动物数量更准确的估计.
10.(1)每件产品的平均销售利润为4元(2)(i)(ii)该厂应投入256万元营销费.
【详解】(1)设每件产品的销售利润为元,则的所有可能取值为1.5,3.5,5.5,
由直方图可得,,,三类产品的频率分别为0.15、0.45、0.4,
所以,,,,
所以随机变量的分布列为:
1.5 3.5 5.5
0.15 0.45 0.4
所以,,故每件产品的平均销售利润为4元;
(2)(i)由得,,令,,,则,
由表中数据可得,,则,
所以,,即,
因为,所以,故所求的回归方程为;
(ii)设年收益为万元,则,设,,
则,当时,,在单调递增,
当时,,在单调递减,
所以,当,即时,有最大值为768,
即该厂应投入256万元营销费,能使得该产品一年的收益达到最大768万元.

展开更多......

收起↑

资源预览