2024高考压轴题06:统计与概率压轴题 学案 (2份打包)(解析版)

资源下载
  1. 二一教育资源

2024高考压轴题06:统计与概率压轴题 学案 (2份打包)(解析版)

资源简介

压轴题06 统计与概率压轴题
题型/考向一:计数原理与概率
题型/考向二:随机变量及其分布列
题型/考向三:统计与成对数据的统计分析
一、计数原理与概率
热点一 排列与组合
解决排列、组合问题的一般步骤
(1)认真审题弄清楚要做什么事情;
(2)要做的事情是分步还是分类,还是分步分类同时进行,确定分多少步及多少类;
(3)确定每一步或每一类是排列(有序)问题还是组合(无序)问题,元素总数是多少及取出多少元素.
热点二 二项式定理
1.求(a+b)n的展开式中的特定项一般要应用通项公式Tk+1=Can-kbk(k=0,1,2,…,n).
2.求两个因式积的特定项,一般对某个因式用通项公式,再结合因式相乘,分类讨论求解.
3.求三项展开式的特定项,一般转化为二项式求解或用定义法.
4.求解系数和问题应用赋值法.
热点三 概 率
1.古典概型的概率公式
P(A)=.
2.条件概率公式
设A,B为随机事件,且P(A)>0,
则P(B|A)=.
3.全概率公式
设A1,A2,…,An是一组两两互斥的事件,A1∪A2∪…∪An=Ω,且P(Ai)>0,i=1,2,…,n,则对任意的事件B Ω,有P(B)=P(Ai)P(B|Ai).
一 计数原理与概率
一、单选题
1.现将甲乙丙丁四个人全部安排到市 市 市三个地区工作,要求每个地区都有人去,则甲乙两个人至少有一人到市工作的安排种数为( )
A.12 B.14 C.18 D.22
2.世界数学三大猜想:“费马猜想”、“四色猜想”、“哥德巴赫猜想”,其中“四色猜想”和“费马猜想”已经分别在1976年和1994年荣升为“四色定理”和“费马大定理”.281年过去了,哥德巴赫猜想仍未解决,目前最好的成果“1+2”由我国数学家陈景润在1966年取得.哥德巴赫猜想描述为:任何不小于4的偶数,都可以写成两个质数之和.在不超过17的质数中,随机选取两个不同的数,其和为奇数的概率为( )
A. B. C. D.
3.在的展开式中,项的系数为( )
A.60 B.30 C.20 D.
4.在的展开式中,含的项的系数为( )
A. B. C. D.
5.甲 乙 丙 丁 戊5名志愿者参加新冠疫情防控志愿者活动,现有三个小区可供选择,每个志愿者只能选其中一个小区.则每个小区至少有一名志愿者,且甲不在小区的概率为( )
A. B. C. D.
6.一袋中有大小相同的个白球和个红球,现从中任意取出个球,记事件“个球中至少有一个白球”,事件“个球中至少有一个红球”,事件“个球中有红球也有白球”,下列结论不正确的是( )
A.事件与事件不为互斥事件 B.事件与事件不是相互独立事件
C. D.
7.某学校为了搞好课后服务工作,教务科组建了一批社团,学生们都能积极选择自己喜欢的社团.目前话剧社团、书法社团、摄影社团、街舞社团分别还可以再接收1名学生,恰好含甲、乙的4名同学前来教务科申请加入,按学校规定每人只能加入一个社团,则甲进街舞社团,乙进书法社团或摄影社团的概率为( )
A. B. C. D.
8.第十四届“中华人民共和国全国人民代表大会”和“中国人民政治协商会议”分别于2023年3月5日和3月4日胜利召开,为实现新时代新征程的目标任务汇聚智慧和力量.某市计划开展“学两会,争当新时代先锋”知识竞赛活动.某单位初步推选出3名党员和5名民主党派人士,并从中随机选取4人组成代表队参赛.在代表队中既有党员又有民主党派人士的条件下,则党员甲被选中的概率为( )
A. B. C. D.
二、多选题
9.在的展开式中,下列结论正确的是( )
A.第6项和第7项的二项式系数相等 B.奇数项的二项式系数和为256
C.常数项为84 D.有理项有2项
10.已知,则下列结论成立的是( )
A. B.
C. D.
11.甲箱中有5个红球,2个白球和3个黑球,乙箱中有4个红球,3个白球和3个黑球.先从甲箱中随机取出一球放入乙箱中,分别以,,表示由甲箱中取出的是红球,白球和黑球的事件;再从乙箱中随机取出一球,以B表示由乙箱中取出的球是红球的事件,则下列结论正确的是( )
A. B.
C.事件B与事件相互独立 D.、、两两互斥
12.爆竹声声辞旧岁,银花朵朵贺新春.除夕夜里小光用3D投影为家人进行虚拟现实表演,表演分为“燃爆竹、放烟花、辞旧岁、迎新春”4个环节.小光按照以上4个环节的先后顺序进行表演,每个环节表演一次.假设各环节是否表演成功互不影响,若每个环节表演成功的概率均为,则( )
A.事件“成功表演燃爆竹环节”与事件“成功表演辞旧岁环节”互斥
B.“放烟花”、“迎新春”环节均表演成功的概率为
C.表演成功的环节个数的期望为3
D.在表演成功的环节恰为3个的条件下“迎新春”环节表演成功的概率为
二、随机变量及其分布列
热点一 分布列的性质及应用
离散型随机变量X的分布列为
X x1 x2 … xi … xn
P p1 p2 … pi … pn
则(1)pi≥0,i=1,2,…,n.
(2)p1+p2+…+pn=1.
(3)E(X)=x1p1+x2p2+…+xipi+…+xnpn.
(4)D(X)=[xi-E(X)]2pi.
(5)若Y=aX+b,则E(Y)=aE(X)+b,D(Y)=a2D(X).
热点二 随机变量的分布列
1.二项分布
一般地,在n重伯努利试验中,设每次试验中事件A发生的概率为p(0E(X)=np,D(X)=np(1-p).
2.超几何分布
一般地,假设一批产品共有N件,其中有M件次品,从N件产品中随机抽取n件(不放回),用X表示抽取的n件产品中的次品数,则X的分布列为P(X=k)=,k=m,m+1,m+2,…,r.其中n,N,M∈N*,M≤N,n≤N,m=max{0,n-N+M},r=min{n,M},E(X)=n·.
热点三 正态分布
解决正态分布问题的三个关键点
(1)对称轴x=μ.
(2)样本标准差σ.
(3)分布区间:利用3σ原则求概率时,要注意利用μ,σ分布区间的特征把所求的范围转化为3σ的特殊区间.
二 随机变量及其分布列
一、单选题
1.某班级有50名学生,期末考试数学成绩服从正态分布,已,则的学生人数为( )
A.5 B.10 C.20 D.30
2.在某个独立重复实验中,事件,相互独立,且在一次实验中,事件发生的概率为,事件发生的概率为,其中.若进行次实验,记事件发生的次数为,事件发生的次数为,事件发生的次数为,则下列说法正确的是( )
A. B.
C. D.
3.新能源汽车具有零排放、噪声小、能源利用率高等特点,近年来备受青睐.某新能源汽车制造企业为调查其旗下A型号新能源汽车的耗电量(单位:kW·h/100km)情况,随机调查得到了1200个样本,据统计该型号新能源汽车的耗电量,若,则样本中耗电量不小于的汽车大约有( )
A.180辆 B.360辆 C.600辆 D.840辆
4.设,这两个正态分布密度曲线如图所示.下列结论中正确的是( )
A.对任意实数,
B.对任意实数,
C.
D.
5.下列命题错误的是( )
A.两个随机变量的线性相关性越强,相关系数的绝对值越接近于
B.设,且,则
C.线性回归直线一定经过样本点的中心
D.随机变量,若,则
6.某地区有20000名考生参加了高三第二次调研考试.经过数据分析,数学成绩X近似服从正态分布,则数学成绩位于[80,88]的人数约为( )
参考数据:,,.
A.455 B.2718 C.6346 D.9545
7.某种品牌手机的电池使用寿命X(单位:年)服从正态分布,且使用寿命不少于2年的概率为0.9,则该品牌手机电池至少使用6年的概率为( )
A.0.9 B.0.7 C.0.3 D.0.1
8.法国数学家庞加莱是个喜欢吃面包的人,他每天都会到同一家面包店购买一个面包.该面包店的面包师声称自己所出售的面包的平均质量是1000g,上下浮动不超过50g.这句话用数学语言来表达就是:每个面包的质量服从期望为1000g,标准差为50g的正态分布.假设面包师的说法是真实的,记随机购买一个面包的质量为X,若,则买一个面包的质量大于900g的概率为( )
(附:①随机变量服从正态分布,则,,;)
A.0.84135 B.0.97225
C.0.97725 D.0.99865
二、多选题
9.已知随机变量X服从二项分布,随机变量,则下列说法正确的是( )
A.随机变量X的数学期望 B.
C.随机变量X的方差 D.随机变量Y的方差
10.随机变量且,随机变量,若,则( )
A. B. C. D.
11.李明每天7:00从家里出发去学校,有时坐公交车,有时骑自行车.他各记录了50次坐公交车和骑自行车所花的时间,经数据分析得到:坐公交车平均用时30分钟,样本方差为36;自行车平均用时34分钟,样本方差为4.假设坐公交车用时X和骑自行车用时Y都服从正态分布,则( )
A.P(X>32)>P(Y>32)
B.P(X≤36)=P(Y≤36)
C.李明计划7:34前到校,应选择坐公交车
D.李明计划7:40前到校,应选择骑自行车
12.假设某厂有两条包装食盐的生产线甲、乙,生产线甲正常情况下生产出来的包装食盐质量服从正态分布(单位:g),生产线乙正常情况下生产出来包装食盐质量为xg,随机变量x服从正态密度函数,其中,则( )
附:随机变量,则,,.
A.正常情况下,从生产线甲任意抽取一包食盐,质量小于485g的概率为0.15%
B.生产线乙的食盐质量
C.生产线乙产出的包装食盐一定比生产线甲产出的包装食盐质量重
D.生产线甲上的检测员某天随机抽取两包食盐,称得其质量均大于515g,于是判断出该生产线出现异常是合理的
三、解答题
13.学校要从12名候选人中选4名同学组成学生会,已知有4名候选人来自甲班,假设每名候选人都有相同的机会被选到.
(1)求恰有1名甲班的候选人被选中的概率;
(2)用X表示选中的候选人中来自甲班的人数,求;
(3)求(2)中X的分布列及数学期望.
14.网购生鲜蔬菜成为很多家庭日常消费的新选择.某小区物业对本小区三月份参与网购生鲜蔬菜的家庭的网购次数进行调查,从一单元和二单元参与网购生鲜蔬菜的家庭中各随机抽取10户,分别记为A组和B组,这20户家庭三月份网购生鲜蔬菜的次数如下图:
假设用频率估计概率,且各户网购生鲜蔬菜的情况互不影响·
(1)从一单元参与网购生鲜蔬菜的家庭中随机抽取1户,估计该户三月份网购生鲜蔬菜次数大于20的概率;
(2)从一单元和二单元参与网购生鲜蔬菜的家庭中各随机抽取1户,记这两户中三月份网购生鲜蔬菜次数大于20的户数为X,估计X的数学期望;
(3)从A组和B组中分别随机抽取2户家庭,记为A组中抽取的两户家庭三月份网购生鲜蔬菜次数大于20的户数,为B组中抽取的两户家庭三月份网购生鲜蔬菜次数大于20的户数,比较方差与的大小.(结论不要求证明)
15.2022世界机器人大会在北京召开,来自各个领域的参展机器人给参观者带来了不同的高科技体验.现有A,B两种型号的小型家庭生活废品处理机器人,其工作程序依次分为三个步骤:分捡,归类,处理,每个步骤完成后进入下一步骤.若分捡步骤完成并且效能达到95%及以上,则该步骤得分为20分,若归类步骤完成并且效能达到95%及以上,则该步骤得分为30分,若处理步骤完成并且效能达到95%及以上,则该步骤得分为50分.若各步骤完成但效能没有达到95%,则该步骤得分为0分,在第三个步骤完成后,机器人停止工作.现已知A款机器人完成各步骤且效能达到95%及以上的概率依次为,,,B款机器人完成各步骤且效能达到95%及以上的概率均为,每款机器人完成每个步骤且效能是否达到95%及以上都相互独立.
(1)求B款机器人只有一个步骤的效能达到95%及以上的概率;
(2)若准备在A,B两种型号的小型家庭生活废品处理机器人中选择一款机器人,从最后总得分的期望角度来分析,你会选择哪一种型号?
三、统计与成对数据的统计分析
热点一 用样本估计总体
1.频率分布直方图中相邻两横坐标之差表示组距,纵坐标表示,频率=组距×.
2.在频率分布直方图中各小长方形的面积之和为1.
3.利用频率分布直方图求众数、中位数与平均数.
(1)最高的小长方形底边中点的横坐标即众数.
(2)中位数左边和右边的小长方形的面积和相等.
(3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和.
热点二 回归分析
求经验回归方程的步骤
(1)依据成对样本数据画出散点图,确定两个变量具有线性相关关系(有时可省略).
(2)计算出,,x,xiyi的值.
(3)计算,.
(4)写出经验回归方程.
热点三 独立性检验
独立性检验的一般步骤
(1)根据样本数据列2×2列联表;
(2)根据公式χ2=,计算χ2的值;
(3)查表比较χ2与临界值的大小关系,作统计判断.χ2越大,对应假设事件H0成立(两类变量相互独立)的概率越小,H0不成立的概率越大.
三 统计与成对数据的统计分析
一、单选题
1.已知一组数据的方差为1,则数据的方差为( )
A.3 B.1 C. D.
2.某企业为了解员工身体健康情况,采用分层抽样的方法从该企业的营销部门和研发部门抽取部分员工体检,已知该企业营销部门和研发部门的员工人数之比是4:1且被抽到参加体检的员工中,营销部门的人数比研发部门的人数多72,则参加体检的人数是( )
A.90 B.96 C.102 D.120
3.某校1000名学生参加环保知识竞赛,随机抽取了20名学生的考试成绩(单位:分),成绩的频率分布直方图如图所示,则下列说法正确的是( )
A.频率分布直方图中的值为0.004
B.估计这20名学生考试成绩的第60百分位数为75
C.估计这20名学生数学考试成绩的众数为80
D.估计总体中成绩落在内的学生人数为150
4.如图,一组数据,的平均数为5,方差为,去除,这两个数据后,平均数为,方差为,则( )
A., B., C., D.,
5.某市质量检测部门从辖区内甲、乙两个地区的食品生产企业中分别随机抽取9家企业,根据食品安全管理考核指标对抽到的企业进行考核,并将各企业考核得分整理成如下的茎叶图.由茎叶图所给信息,可判断以下结论中正确是( )
A.若,则甲地区考核得分的极差大于乙地区考核得分的极差
B.若,则甲地区考核得分的平均数小于乙地区考核得分的平均数
C.若,则甲地区考核得分的方差小于乙地区考核得分的方差
D.若,则甲地区考核得分的中位数小于乙地区考核得分的中位数
6.下列关于统计概率知识的判断,正确的是( )
A.将总体划分为2层,通过分层随机抽样,得到两层的样本平均数和样本方差分别为和,且已知,则总体方差
B.在研究成对数据的相关关系时,相关关系越强,相关系数越接近于1
C.已知随机变量服从正态分布,若,则
D.按从小到大顺序排列的两组数据:甲组:;乙组:,若这两组数据的第30百分位数 第50百分位数都分别对应相等,则
7.若数据,,…,的平均数为2,方差为3,则下列说法错误的是( )
A.数据,,…,的平均数为9 B.
C.数据,,…,的方差为 D.
8.在研究急刹车的停车距离问题时,通常假定停车距离等于反应距离(,单位:m)与制动距离(,单位:m)之和.如图为某实验所测得的数据,其中“KPH”表示刹车时汽车的初速度(单位:km/h).根据实验数据可以推测,下面四组函数中最适合描述,与的函数关系的是( )
A., B.,
C., D.,
二、多选题
9.下列说法正确的是( )
A.数据5,7,8,11,10,15,20的中位数为11
B.一组数据7,8,8,9,11,13,15,17,20,22的第80百分位数为18.5
C.从1,2,3,4,5中任取3个不同的数,则这3个数能构成直角三角形三边长的概率为0.1
D.设随机事件和,已知,,,则
10.为了加强学生对党的二十大精神的学习,某大学开展了形式灵活的学习活动.随后组织该校大一学生参加二十大知识测试(满分:100分),随机抽取200名学生的测试成绩,这200名学生的成绩都在区间内,将其分成5组:,,,,,得到如下频率分布直方图.根据此频率分布直方图,视频率为概率,同一组中的数据用该组区间的中点值为代表,则( )
A.该校学生测试成绩不低于76分的学生比例估计为76%
B.该校学生测试成绩的中位数估计值为80
C.该校学生测试成绩的平均数大于学生测试成绩的众数
D.从该校学生中随机抽取2人,则这2人的成绩不低于84分的概率估计值为0.16
11.随着生活水平的不断提高,旅游已经成为人们生活的一部分.某地旅游部门从2022年到该地旅游的游客中随机抽取10000位游客进行调查,得到各年龄段游客的人数和旅游方式,如图所示,则( )
A.估计2022年到该地旅游的游客中中年人和青年人占游客总人数的80%
B.估计2022年到该地旅游的游客中选择自助游的游客占游客总人数的26.25%
C.估计2022年到该地旅游且选择自助游的游客中青年人超过一半
D.估计2022年到该地旅游的游客中选择自助游的青年人比到该地旅游的老年人还要多
12.如图为国家统计局于2022年12月27日发布的有关数据,则( )
A.营业收入增速的中位数为 B.营业收入增速极差为
C.利润总额增速越来越小 D.利润总额增速的平均数大于
三、解答题
13.为了检测某种抗病毒疫苗的免疫效果,需要进行动物与人体试验.研究人员将疫苗注射到200只小白鼠体内,一段时间后测量小白鼠的某项指标值,按分组,绘制频率分布直方图如图所示,实验发现小白鼠体内产生抗体的共有160只,其中该项指标值不小于60的有110只,假设小白鼠注射疫苗后是否产生抗体相互独立.
抗体 指标值 合计
小于60 不小于60
有抗体
没有抗体
合计
(1)填写下面的2×2列联表,并根据列联表及的独立性检验,判断能否认为注射疫苗后小白鼠产生抗体与指标值不小于60有关.(单位:只)
(2)为检验疫苗二次接种的免疫抗体性,对第一次注射疫苗后没有产生抗体的40只小白鼠进行第二次注射疫苗,结果又有20只小自鼠产生抗体.
(i)用频率估计概率,求一只小白鼠注射2次疫苗后产生抗体的概率p;
(ii)以(i)中确定的概率p作为人体注射2次疫苗后产生抗体的概率,进行人体接种试验,记n个人注射2次疫苗后产生抗体的数量为随机变量X.试验后统计数据显示,当X =99时,P(X)取最大值,求参加人体接种试验的人数n.
参考公式:(其中为样本容量)
0.50 0.40 0.25 0.15 0.100 0.050 0.025
0.455 0.708 1.323 2.072 2.706 3.841 5.024
14.某地经过多年的环境治理,已将荒山改造成了绿水青山.为估计一林区某种树木的总材积量,随机选取了10棵这种树木,测量每棵树的根部横截面积(单位:)和材积量(单位:),得到如下数据:
样本号i 1 2 3 4 5 6 7 8 9 10 平均值
根部横截面积 0.04 0.06 0.04 0.08 0.08 0.05 a b c 0.07 0.06
材积量 0.25 0.41 0.22 0.54 0.53 0.34 0.35 0.39 0.43 0.44 0.39
其中a,b,c为等差数列,并计算得:,,.
(1)求b的值;
(2)若选取前6个样本号对应数据,判断这种树木的根部横截面积与材积量是否具有很强的线性相关性,并求该林区这种树木的根部横截面积与材积量的回归直线方程(若,则认为两个变量的线性相关性一般;若,则认为两个变量的线性相关性很强);
附:相关系数,
回归直线中,,.
(3)根据回归直线方程估计a,c的值(精确到0.01).
1压轴题06 统计与概率压轴题答案
题型/考向一:计数原理与概率
题型/考向二:随机变量及其分布列
题型/考向三:统计与成对数据的统计分析
一、计数原理与概率
热点一 排列与组合
解决排列、组合问题的一般步骤
(1)认真审题弄清楚要做什么事情;
(2)要做的事情是分步还是分类,还是分步分类同时进行,确定分多少步及多少类;
(3)确定每一步或每一类是排列(有序)问题还是组合(无序)问题,元素总数是多少及取出多少元素.
热点二 二项式定理
1.求(a+b)n的展开式中的特定项一般要应用通项公式Tk+1=Can-kbk(k=0,1,2,…,n).
2.求两个因式积的特定项,一般对某个因式用通项公式,再结合因式相乘,分类讨论求解.
3.求三项展开式的特定项,一般转化为二项式求解或用定义法.
4.求解系数和问题应用赋值法.
热点三 概 率
1.古典概型的概率公式
P(A)=.
2.条件概率公式
设A,B为随机事件,且P(A)>0,
则P(B|A)=.
3.全概率公式
设A1,A2,…,An是一组两两互斥的事件,A1∪A2∪…∪An=Ω,且P(Ai)>0,i=1,2,…,n,则对任意的事件B Ω,有P(B)=P(Ai)P(B|Ai).
一 计数原理与概率
一、单选题
1.现将甲乙丙丁四个人全部安排到市 市 市三个地区工作,要求每个地区都有人去,则甲乙两个人至少有一人到市工作的安排种数为( )
A.12 B.14 C.18 D.22
【答案】D
【详解】若甲乙两人中的1人到市工作,有种选择,其余3人到另外两个地方工作,先将3人分为两组,再进行排列,有安排种数,故有种;
若甲乙两人中的1人到市工作,有种选择,丙丁中一人到市工作,有种选择,其余2人到另外两个地方工作,有种选择,故安排种数有种;
若安排甲乙2人都到市工作,其余丙丁2人到另外两个地方工作,安排种数有种,
故总共有12+8+2=22种.
故选:D
2.世界数学三大猜想:“费马猜想”、“四色猜想”、“哥德巴赫猜想”,其中“四色猜想”和“费马猜想”已经分别在1976年和1994年荣升为“四色定理”和“费马大定理”.281年过去了,哥德巴赫猜想仍未解决,目前最好的成果“1+2”由我国数学家陈景润在1966年取得.哥德巴赫猜想描述为:任何不小于4的偶数,都可以写成两个质数之和.在不超过17的质数中,随机选取两个不同的数,其和为奇数的概率为( )
A. B. C. D.
【答案】B
【详解】不超过17的质数有:2,3,5,7,11,13,17,共7个,
随机选取两个不同的数,基本事件总数,
其和为奇数包含的基本事件有:,共6个,
所以.
故选:B
3.在的展开式中,项的系数为( )
A.60 B.30 C.20 D.
【答案】D
【详解】由,可得其二项展开式,
若先满足项中y的次数,则,可得,
其中展开式的通项为,
令,得,可得,
故项的系数为.
故选:D.
4.在的展开式中,含的项的系数为( )
A. B. C. D.
【答案】D
【详解】由二项式定理可知:展开式各项的表达式为:,
其中,,;
令得:,或,
含的项的系数为.
故选:D.
5.甲 乙 丙 丁 戊5名志愿者参加新冠疫情防控志愿者活动,现有三个小区可供选择,每个志愿者只能选其中一个小区.则每个小区至少有一名志愿者,且甲不在小区的概率为( )
A. B. C. D.
【答案】B
【详解】首先求所有可能情况,5个人去3个地方,共有种情况,
再计算5个人去3个地方,且每个地方至少有一个人去,
5人被分为或
当5人被分为时,情况数为;
当5人被分为时,情况数为;
所以共有.
由于所求甲不去,情况数较多,反向思考,求甲去的情况数,最后用总数减即可,
当5人被分为时,且甲去,甲若为1,则,甲若为3,则
共计种,
当5人被分为时,且甲去,甲若为1,则,甲若为2,则,共计种,
所以甲不在小区的概率为
故选:B.
6.一袋中有大小相同的个白球和个红球,现从中任意取出个球,记事件“个球中至少有一个白球”,事件“个球中至少有一个红球”,事件“个球中有红球也有白球”,下列结论不正确的是( )
A.事件与事件不为互斥事件 B.事件与事件不是相互独立事件
C. D.
【答案】D
【详解】根据题意,取出的个球的可能情况为:个红球;个红球个白球;个红球个白球;个白球.
故事件包含:个红球个白球;个红球个白球;个白球,且;
事件包含:个红球个白球;个红球个白球;个红球,且;
事件包含:个红球个白球;个红球个白球,且.
所以,,,
因为,则事件与事件不为互斥事件,A选项错误;
,故事件与事件不是相互独立事件,B正确;
,故D错误;
,故C正确;
故选:D.
7.某学校为了搞好课后服务工作,教务科组建了一批社团,学生们都能积极选择自己喜欢的社团.目前话剧社团、书法社团、摄影社团、街舞社团分别还可以再接收1名学生,恰好含甲、乙的4名同学前来教务科申请加入,按学校规定每人只能加入一个社团,则甲进街舞社团,乙进书法社团或摄影社团的概率为( )
A. B. C. D.
【答案】C
【详解】4名同学分别进入话剧社团、书法社团、摄影社团、街舞社团共有种,
其中甲进街舞社团,乙进书法社团或摄影社团有种,
由古典概型的概率计算公式可得,按学校规定每人只能加入一个社团,则甲进街舞社团,乙进书法社团或摄影社团的概率为,
故选:C.
8.第十四届“中华人民共和国全国人民代表大会”和“中国人民政治协商会议”分别于2023年3月5日和3月4日胜利召开,为实现新时代新征程的目标任务汇聚智慧和力量.某市计划开展“学两会,争当新时代先锋”知识竞赛活动.某单位初步推选出3名党员和5名民主党派人士,并从中随机选取4人组成代表队参赛.在代表队中既有党员又有民主党派人士的条件下,则党员甲被选中的概率为( )
A. B. C. D.
【答案】C
【详解】记“随机选取4人”为事件,“代表队中既有党员又有民主党派人士”为事件A,“党员甲被选中”为事件B,
则可得,
则,
故在代表队中既有党员又有民主党派人士的条件下,则党员甲被选中的概率为.
故选:C.
二、多选题
9.在的展开式中,下列结论正确的是( )
A.第6项和第7项的二项式系数相等 B.奇数项的二项式系数和为256
C.常数项为84 D.有理项有2项
【答案】BC
【详解】的展开式中共有10项,由二项式系数的性质可得展开式中的第5项和第6项的二项式系数相等,故A错误;
由已知可得二项式系数之和为,且展开式中奇数项的二项式系数和与偶数项的二项式系数和相等,
所以奇数项的二项式系数和为,故B正确;
展开式的通项为 ,令,解得.
故常数项为,故C正确;
有理项中x的指数为整数,故,2,4,6,8,故有理项有5项,故D错误.
故选:BC
10.已知,则下列结论成立的是( )
A. B.
C. D.
【答案】ABD
【详解】,
展开式的通项为,
对选项A:令,可得,正确;
对选项B:,所以,正确;
对选项C:令,可得,错误;
对选项D:,两边同时求导,得,令,,正确.
故选:ABD
11.甲箱中有5个红球,2个白球和3个黑球,乙箱中有4个红球,3个白球和3个黑球.先从甲箱中随机取出一球放入乙箱中,分别以,,表示由甲箱中取出的是红球,白球和黑球的事件;再从乙箱中随机取出一球,以B表示由乙箱中取出的球是红球的事件,则下列结论正确的是( )
A. B.
C.事件B与事件相互独立 D.、、两两互斥
【答案】BD
【详解】A选项,,,,
故,A错误;
B选项,,故,B正确;
C选项,因为,故,所以事件B与事件不相互独立,C错误;
D选项,因为,故、、两两互斥,D正确.
故选:BD
12.爆竹声声辞旧岁,银花朵朵贺新春.除夕夜里小光用3D投影为家人进行虚拟现实表演,表演分为“燃爆竹、放烟花、辞旧岁、迎新春”4个环节.小光按照以上4个环节的先后顺序进行表演,每个环节表演一次.假设各环节是否表演成功互不影响,若每个环节表演成功的概率均为,则( )
A.事件“成功表演燃爆竹环节”与事件“成功表演辞旧岁环节”互斥
B.“放烟花”、“迎新春”环节均表演成功的概率为
C.表演成功的环节个数的期望为3
D.在表演成功的环节恰为3个的条件下“迎新春”环节表演成功的概率为
【答案】BCD
【详解】事件“成功表演燃爆竹环节”与事件“成功表演辞旧岁环节”可以同时发生,故不互斥,A错误;
“放烟花”、“迎新春”环节均表演成功的概率为,B正确;
记表演成功的环节个数为X,则,期望为,C正确;
记事件M:“表演成功的环节恰为3个”,事件N:“迎新春环节表演成功”.

由条件概率公式,D正确,
故选:BCD
二、随机变量及其分布列
热点一 分布列的性质及应用
离散型随机变量X的分布列为
X x1 x2 … xi … xn
P p1 p2 … pi … pn
则(1)pi≥0,i=1,2,…,n.
(2)p1+p2+…+pn=1.
(3)E(X)=x1p1+x2p2+…+xipi+…+xnpn.
(4)D(X)=[xi-E(X)]2pi.
(5)若Y=aX+b,则E(Y)=aE(X)+b,D(Y)=a2D(X).
热点二 随机变量的分布列
1.二项分布
一般地,在n重伯努利试验中,设每次试验中事件A发生的概率为p(0E(X)=np,D(X)=np(1-p).
2.超几何分布
一般地,假设一批产品共有N件,其中有M件次品,从N件产品中随机抽取n件(不放回),用X表示抽取的n件产品中的次品数,则X的分布列为P(X=k)=,k=m,m+1,m+2,…,r.其中n,N,M∈N*,M≤N,n≤N,m=max{0,n-N+M},r=min{n,M},E(X)=n·.
热点三 正态分布
解决正态分布问题的三个关键点
(1)对称轴x=μ.
(2)样本标准差σ.
(3)分布区间:利用3σ原则求概率时,要注意利用μ,σ分布区间的特征把所求的范围转化为3σ的特殊区间.
二 随机变量及其分布列
一、单选题
1.某班级有50名学生,期末考试数学成绩服从正态分布,已,则的学生人数为( )
A.5 B.10 C.20 D.30
【答案】D
【详解】因为期末考试数学成绩服从正态分布,所以期末考试数学成绩关于对称,
则,所以,
所以的学生人数为:人.
故选:D.
2.在某个独立重复实验中,事件,相互独立,且在一次实验中,事件发生的概率为,事件发生的概率为,其中.若进行次实验,记事件发生的次数为,事件发生的次数为,事件发生的次数为,则下列说法正确的是( )
A. B.
C. D.
【答案】C
【详解】由已知,,∴,,
,∴,,
∵事件,相互独立,
∴一次实验中,,同时发生的概率,
∴,
∴,,
对于A,,,
不一定成立,故选项A说法不正确;
对于B,,,
,不一定成立,故选项B说法不正确;
对于C,,,
成立,故选项C说法正确;
对于D,,,
不一定成立,故选项D说法不正确.
故选:C.
3.新能源汽车具有零排放、噪声小、能源利用率高等特点,近年来备受青睐.某新能源汽车制造企业为调查其旗下A型号新能源汽车的耗电量(单位:kW·h/100km)情况,随机调查得到了1200个样本,据统计该型号新能源汽车的耗电量,若,则样本中耗电量不小于的汽车大约有( )
A.180辆 B.360辆 C.600辆 D.840辆
【答案】A
【详解】因为,且,
所以,
所以样本中耗电量不小于的汽车大约(辆).
故选:A.
4.设,这两个正态分布密度曲线如图所示.下列结论中正确的是( )
A.对任意实数,
B.对任意实数,
C.
D.
【答案】B
【详解】依题意,由图可得,
对任意实数,,
因为,
所以,故A错误,B正确;
,故C错误;
因为,所以,故D错误;
故选:B.
5.下列命题错误的是( )
A.两个随机变量的线性相关性越强,相关系数的绝对值越接近于
B.设,且,则
C.线性回归直线一定经过样本点的中心
D.随机变量,若,则
【答案】B
【详解】根据相关系数的意义可知,两个随机变量的线性相关性越强,
相关系数的绝对值越接近于,
故A正确;
由,知,
即概率密度函数的图像关于直线对称,
所以,
则,
故B错误;
根据线性回归直线的性质可知,
线性回归直线一定经过样本点的中心,
故C正确;
随机变量,若,
则,
故D正确;
故选:B.
6.某地区有20000名考生参加了高三第二次调研考试.经过数据分析,数学成绩X近似服从正态分布,则数学成绩位于[80,88]的人数约为( )
参考数据:,,.
A.455 B.2718 C.6346 D.9545
【答案】B
【详解】由题意可知,,
则数学成绩位于[80,88]的人数约为.
故选:B
7.某种品牌手机的电池使用寿命X(单位:年)服从正态分布,且使用寿命不少于2年的概率为0.9,则该品牌手机电池至少使用6年的概率为( )
A.0.9 B.0.7 C.0.3 D.0.1
【答案】D
【详解】由题得:,故,
因为,所以根据对称性得:.
故选:D.
8.法国数学家庞加莱是个喜欢吃面包的人,他每天都会到同一家面包店购买一个面包.该面包店的面包师声称自己所出售的面包的平均质量是1000g,上下浮动不超过50g.这句话用数学语言来表达就是:每个面包的质量服从期望为1000g,标准差为50g的正态分布.假设面包师的说法是真实的,记随机购买一个面包的质量为X,若,则买一个面包的质量大于900g的概率为( )
(附:①随机变量服从正态分布,则,,;)
A.0.84135 B.0.97225
C.0.97725 D.0.99865
【答案】C
【详解】由题意得,
故面包的质量大于900g的概率为.
故选:C
二、多选题
9.已知随机变量X服从二项分布,随机变量,则下列说法正确的是( )
A.随机变量X的数学期望 B.
C.随机变量X的方差 D.随机变量Y的方差
【答案】AC
【详解】因为X服从二项分布,
故,,故选项A,C正确;
又,故B选项错误,
又,则,故选项D错误.
故选:AC.
10.随机变量且,随机变量,若,则( )
A. B. C. D.
【答案】ACD
【详解】解:因为且,
所以,故,,选项A正确,选项B错误;
因为,所以,
所以,解得,选项C正确;
,选项D正确.
故选:ACD.
11.李明每天7:00从家里出发去学校,有时坐公交车,有时骑自行车.他各记录了50次坐公交车和骑自行车所花的时间,经数据分析得到:坐公交车平均用时30分钟,样本方差为36;自行车平均用时34分钟,样本方差为4.假设坐公交车用时X和骑自行车用时Y都服从正态分布,则( )
A.P(X>32)>P(Y>32)
B.P(X≤36)=P(Y≤36)
C.李明计划7:34前到校,应选择坐公交车
D.李明计划7:40前到校,应选择骑自行车
【答案】BCD
【详解】A.由条件可知,,根据对称性可知,故A错误;
B., ,所以,故B正确;
C. =,所以,故C正确;
D. ,,所以,故D正确.
故选:BCD
12.假设某厂有两条包装食盐的生产线甲、乙,生产线甲正常情况下生产出来的包装食盐质量服从正态分布(单位:g),生产线乙正常情况下生产出来包装食盐质量为xg,随机变量x服从正态密度函数,其中,则( )
附:随机变量,则,,.
A.正常情况下,从生产线甲任意抽取一包食盐,质量小于485g的概率为0.15%
B.生产线乙的食盐质量
C.生产线乙产出的包装食盐一定比生产线甲产出的包装食盐质量重
D.生产线甲上的检测员某天随机抽取两包食盐,称得其质量均大于515g,于是判断出该生产线出现异常是合理的
【答案】AD
【详解】由条件可知,设生产线甲正常情况下生产出来的包装食盐的质量为,
其中,其中,,
则,故A正确;
B. 随机变量x服从正态密度函数,可知,,,
所以生产线乙的食盐质量,故B错误;
C.不一定,可能小概率事件发生,生产线乙产出的包装食盐比生产线甲产出的包装食盐质量轻,故C错误;
D. ,说明生产线甲抽到质量大于515g的可能性很低,所以随机抽取两包质量均大于515g,说明判断出该生产线出现异常是合理的,故D正确.
故选:AD
三、解答题
13.学校要从12名候选人中选4名同学组成学生会,已知有4名候选人来自甲班,假设每名候选人都有相同的机会被选到.
(1)求恰有1名甲班的候选人被选中的概率;
(2)用X表示选中的候选人中来自甲班的人数,求;
(3)求(2)中X的分布列及数学期望.
【详解】(1)记事件A为恰有1名甲班的候选人被选中,则.
(2).
(3)由题可知X=0,1,2,3,4,X服从超几何分布,,,,,.故X的分布列如下:
X 0 1 2 3 4
P

14.网购生鲜蔬菜成为很多家庭日常消费的新选择.某小区物业对本小区三月份参与网购生鲜蔬菜的家庭的网购次数进行调查,从一单元和二单元参与网购生鲜蔬菜的家庭中各随机抽取10户,分别记为A组和B组,这20户家庭三月份网购生鲜蔬菜的次数如下图:
假设用频率估计概率,且各户网购生鲜蔬菜的情况互不影响·
(1)从一单元参与网购生鲜蔬菜的家庭中随机抽取1户,估计该户三月份网购生鲜蔬菜次数大于20的概率;
(2)从一单元和二单元参与网购生鲜蔬菜的家庭中各随机抽取1户,记这两户中三月份网购生鲜蔬菜次数大于20的户数为X,估计X的数学期望;
(3)从A组和B组中分别随机抽取2户家庭,记为A组中抽取的两户家庭三月份网购生鲜蔬菜次数大于20的户数,为B组中抽取的两户家庭三月份网购生鲜蔬菜次数大于20的户数,比较方差与的大小.(结论不要求证明)
【详解】(1)设“该户三月份网购生鲜蔬菜次数大于20”为事件,在组10户中超过20次的有3户,由样本频率估计总体概率,则.
(2)由样本频率估计总体概率,一单元参与网购家庭随机抽取1户的网购生鲜蔬菜次数超过20次概率为,二单元参与网购家庭随机抽取1户的网购生鲜蔬菜次数超过20次概率为,X的可能取值为0,1,2,所以,
,,
,.
(3)依题可知,,的可能取值为0,1,2,且,服从超几何分布,
,,,
,,,
因为,,所以,

,所以,.
15.2022世界机器人大会在北京召开,来自各个领域的参展机器人给参观者带来了不同的高科技体验.现有A,B两种型号的小型家庭生活废品处理机器人,其工作程序依次分为三个步骤:分捡,归类,处理,每个步骤完成后进入下一步骤.若分捡步骤完成并且效能达到95%及以上,则该步骤得分为20分,若归类步骤完成并且效能达到95%及以上,则该步骤得分为30分,若处理步骤完成并且效能达到95%及以上,则该步骤得分为50分.若各步骤完成但效能没有达到95%,则该步骤得分为0分,在第三个步骤完成后,机器人停止工作.现已知A款机器人完成各步骤且效能达到95%及以上的概率依次为,,,B款机器人完成各步骤且效能达到95%及以上的概率均为,每款机器人完成每个步骤且效能是否达到95%及以上都相互独立.
(1)求B款机器人只有一个步骤的效能达到95%及以上的概率;
(2)若准备在A,B两种型号的小型家庭生活废品处理机器人中选择一款机器人,从最后总得分的期望角度来分析,你会选择哪一种型号?
【详解】(1)记“B款机器人只有一个步骤的效能达到及以上”为事件,
则.
(2)设款机器人完成所有工作总得分为,
则的可能取值为,
所以,






所以的分布列为:
0 20 30 50 70 80 100
则.
设款机器人完成所有工作总得分为,
则的可能取值为,
所以,

所以的分布列为:
0 20 30 50 70 80 100

因为,
所以,
所以从最后总得分的期望角度来分析,应该选择种型号的机器人.
三、统计与成对数据的统计分析
热点一 用样本估计总体
1.频率分布直方图中相邻两横坐标之差表示组距,纵坐标表示,频率=组距×.
2.在频率分布直方图中各小长方形的面积之和为1.
3.利用频率分布直方图求众数、中位数与平均数.
(1)最高的小长方形底边中点的横坐标即众数.
(2)中位数左边和右边的小长方形的面积和相等.
(3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和.
热点二 回归分析
求经验回归方程的步骤
(1)依据成对样本数据画出散点图,确定两个变量具有线性相关关系(有时可省略).
(2)计算出,,x,xiyi的值.
(3)计算,.
(4)写出经验回归方程.
热点三 独立性检验
独立性检验的一般步骤
(1)根据样本数据列2×2列联表;
(2)根据公式χ2=,计算χ2的值;
(3)查表比较χ2与临界值的大小关系,作统计判断.χ2越大,对应假设事件H0成立(两类变量相互独立)的概率越小,H0不成立的概率越大.
三 统计与成对数据的统计分析
一、单选题
1.已知一组数据的方差为1,则数据的方差为( )
A.3 B.1 C. D.
【答案】D
【详解】设数据的平均数为,则,
数据的平均数为,
数据的方差为,
数据的方差
,解得,
所以数据的方差为.
故选:D
2.某企业为了解员工身体健康情况,采用分层抽样的方法从该企业的营销部门和研发部门抽取部分员工体检,已知该企业营销部门和研发部门的员工人数之比是4:1且被抽到参加体检的员工中,营销部门的人数比研发部门的人数多72,则参加体检的人数是( )
A.90 B.96 C.102 D.120
【答案】D
【详解】设参加体检的人数是,则,解得.
故选:D
3.某校1000名学生参加环保知识竞赛,随机抽取了20名学生的考试成绩(单位:分),成绩的频率分布直方图如图所示,则下列说法正确的是( )
A.频率分布直方图中的值为0.004
B.估计这20名学生考试成绩的第60百分位数为75
C.估计这20名学生数学考试成绩的众数为80
D.估计总体中成绩落在内的学生人数为150
【答案】D
【详解】由可得,故A错误;
前三个矩形的面积和为,所以这20名学生数学考试成绩的第60百分位数为80,故B错误;
这20名学生数学考试成绩的众数为75,故C错误;
总体中成绩落在内的学生人数为,故D正确.
故选:D
4.如图,一组数据,的平均数为5,方差为,去除,这两个数据后,平均数为,方差为,则( )
A., B., C., D.,
【答案】D
【详解】由题意可得:,则,
故,
∵是波幅最大的两个点的值,则去除,这两个数据后,整体波动性减小,故.
故选:D.
5.某市质量检测部门从辖区内甲、乙两个地区的食品生产企业中分别随机抽取9家企业,根据食品安全管理考核指标对抽到的企业进行考核,并将各企业考核得分整理成如下的茎叶图.由茎叶图所给信息,可判断以下结论中正确是( )
A.若,则甲地区考核得分的极差大于乙地区考核得分的极差
B.若,则甲地区考核得分的平均数小于乙地区考核得分的平均数
C.若,则甲地区考核得分的方差小于乙地区考核得分的方差
D.若,则甲地区考核得分的中位数小于乙地区考核得分的中位数
【答案】C
【详解】对于A:甲地区考核得分的极差为,乙地区考核得分的极差为,
即甲地区考核得分的极差小于乙地区考核得分的极差,故A错误;
对于B:甲地区考核得分的平均数为
乙地区考核得分的平均数为,
即甲地区考核得分的平均数大于乙地区考核得分的平均数,故B错误;
对于C:甲地区考核得分从小到大排列为:75,78,81,84,85,88,92,93,94
乙地区考核得分从小到大排列为:74,77,80,83,84,87,91,95,99
由以上数据可知,乙地区考核得分的波动程度比甲地区考核得分的波动程度大,
即甲地区考核得分的方差小于乙地区考核得分的方差,故C正确;
对于D:由茎叶图可知,甲地区考核得分的中位数为,乙地区考核得分的中位数为,则甲地区考核得分的中位数大于乙地区考核得分的中位数,故D错误;
故选:C
6.下列关于统计概率知识的判断,正确的是( )
A.将总体划分为2层,通过分层随机抽样,得到两层的样本平均数和样本方差分别为和,且已知,则总体方差
B.在研究成对数据的相关关系时,相关关系越强,相关系数越接近于1
C.已知随机变量服从正态分布,若,则
D.按从小到大顺序排列的两组数据:甲组:;乙组:,若这两组数据的第30百分位数 第50百分位数都分别对应相等,则
【答案】C
【详解】对于A项,总体方差与样本容量有关,故A项错误;
对于B项,相关性越强,越接近于1;故B项错误;
对于C项,若,则,所以,故C项正确;
对于D项,甲组:第30百分位数为30,第50百分位数为,乙组:第30百分位数为,第50百分位数为,
所以,解得:,故.故D项错误.
故选:C.
7.若数据,,…,的平均数为2,方差为3,则下列说法错误的是( )
A.数据,,…,的平均数为9 B.
C.数据,,…,的方差为 D.
【答案】C
【详解】A:由原数据期望,则新数据期望,正确;
B:,正确;
C:由原数据方差,则新数据期望,错误;
D:由,
所以,正确.
故选:C
8.在研究急刹车的停车距离问题时,通常假定停车距离等于反应距离(,单位:m)与制动距离(,单位:m)之和.如图为某实验所测得的数据,其中“KPH”表示刹车时汽车的初速度(单位:km/h).根据实验数据可以推测,下面四组函数中最适合描述,与的函数关系的是( )
A., B.,
C., D.,
【答案】B
【详解】设,.
由图象知,过点,,,,,,,,,,,,,,.
作出散点图,如图1.
由图1可得,与呈现线性关系,可选择用.
过点,,,,,,,,,,,,,,.
作出散点图,如图2.
由图2可得,与呈现非线性关系,比较之下,可选择用.
故选:B.
二、多选题
9.下列说法正确的是( )
A.数据5,7,8,11,10,15,20的中位数为11
B.一组数据7,8,8,9,11,13,15,17,20,22的第80百分位数为18.5
C.从1,2,3,4,5中任取3个不同的数,则这3个数能构成直角三角形三边长的概率为0.1
D.设随机事件和,已知,,,则
【答案】BCD
【详解】对于A,选项中的数据按从小到大顺序排列为,
故中位数为10,故A错误;
对于B,选项中的数据共有10个数,,
即第8个数与第9个数的平均数为18.5,则这组数据的第80百分位数是18.5,故B正确;
对于C,只有3,4,5这三个数符合,则,故C正确;
对于D,由全概率公式,
故D正确.
故选:BCD.
10.为了加强学生对党的二十大精神的学习,某大学开展了形式灵活的学习活动.随后组织该校大一学生参加二十大知识测试(满分:100分),随机抽取200名学生的测试成绩,这200名学生的成绩都在区间内,将其分成5组:,,,,,得到如下频率分布直方图.根据此频率分布直方图,视频率为概率,同一组中的数据用该组区间的中点值为代表,则( )
A.该校学生测试成绩不低于76分的学生比例估计为76%
B.该校学生测试成绩的中位数估计值为80
C.该校学生测试成绩的平均数大于学生测试成绩的众数
D.从该校学生中随机抽取2人,则这2人的成绩不低于84分的概率估计值为0.16
【答案】ACD
【详解】由题图可知,,所以.该校学生测试成绩不低于76分的学生比例估计为,A正确.
该校学生测试成绩在内的频率为,测试成绩在内的频率为,所以学生测试成绩的中位数在区间内.设中位数为分,则,解得,B错误.
该校学生测试成绩的平均数估计值为
.又知该校学生测试成绩的众数估计值为,故该校学生测试成绩的平均数大于学生测试成绩的众数,C正确.
从该校学生中随机抽取1人,此人成绩在内的概率为,故从该校学生中随机抽取2人,这2人的成绩不低于84分的概率估计值为,D正确.
故选:ACD.
11.随着生活水平的不断提高,旅游已经成为人们生活的一部分.某地旅游部门从2022年到该地旅游的游客中随机抽取10000位游客进行调查,得到各年龄段游客的人数和旅游方式,如图所示,则( )
A.估计2022年到该地旅游的游客中中年人和青年人占游客总人数的80%
B.估计2022年到该地旅游的游客中选择自助游的游客占游客总人数的26.25%
C.估计2022年到该地旅游且选择自助游的游客中青年人超过一半
D.估计2022年到该地旅游的游客中选择自助游的青年人比到该地旅游的老年人还要多
【答案】ABC
【详解】设2022年到该地旅游的游客总人数为,
由题意可知游客中老年人、中年人、青年人的人数分别为,,,
其中选择自助游的老年人、中年人、青年人的人数分别为,,,
所以2022年到该地旅游的游客中中年人和青年人的人数为,所以A正确;
因为2022年到该地旅游的游客选择自助游的人数,
所以B正确;
因为2022年到该地旅游且选择自助游的游客的人数为,其中青年人的人数为,所以C正确;
因为2022年到该地旅游的游客中选择自助游的青年人的人数为,而到该地旅游的老年人的人数为,所以D错误.
故选:ABC.
12.如图为国家统计局于2022年12月27日发布的有关数据,则( )
A.营业收入增速的中位数为 B.营业收入增速极差为
C.利润总额增速越来越小 D.利润总额增速的平均数大于
【答案】ABD
【详解】由表中数据易知营业收入增速的中位数为,故选项正确;
营业收入增速的极差为,故选项正确;
利润总额增速2022年1-3月累计比2022年1-2月累计上升,故选项错误;
利润总额增速的平均数
,故选项正确;
故选:.
三、解答题
13.为了检测某种抗病毒疫苗的免疫效果,需要进行动物与人体试验.研究人员将疫苗注射到200只小白鼠体内,一段时间后测量小白鼠的某项指标值,按分组,绘制频率分布直方图如图所示,实验发现小白鼠体内产生抗体的共有160只,其中该项指标值不小于60的有110只,假设小白鼠注射疫苗后是否产生抗体相互独立.
抗体 指标值 合计
小于60 不小于60
有抗体
没有抗体
合计
(1)填写下面的2×2列联表,并根据列联表及的独立性检验,判断能否认为注射疫苗后小白鼠产生抗体与指标值不小于60有关.(单位:只)
(2)为检验疫苗二次接种的免疫抗体性,对第一次注射疫苗后没有产生抗体的40只小白鼠进行第二次注射疫苗,结果又有20只小自鼠产生抗体.
(i)用频率估计概率,求一只小白鼠注射2次疫苗后产生抗体的概率p;
(ii)以(i)中确定的概率p作为人体注射2次疫苗后产生抗体的概率,进行人体接种试验,记n个人注射2次疫苗后产生抗体的数量为随机变量X.试验后统计数据显示,当X =99时,P(X)取最大值,求参加人体接种试验的人数n.
参考公式:(其中为样本容量)
0.50 0.40 0.25 0.15 0.100 0.050 0.025
0.455 0.708 1.323 2.072 2.706 3.841 5.024
【详解】(1)由频率分布直方图,知200只小白鼠按指标值分布为:
在内有(只);
在内有(只);
在内有(只);
在内有(只),
在内有(只).
由题意,有抗体且指标值小于60的有50只;
而指标值小于60的小白鼠共有只,
所以指标值小于60且没有抗体的小白鼠有20只,
同理,指标值不小于60且没有抗体的小白鼠有20只,
故列联表如下:单位:只
抗体 指标值 合计
小于60 不小于60
有抗体 50 110 160
没有抗体 20 20 40
合计 70 130 200
零假设为:注射疫苗后小白鼠产生抗体与指标值不小于60无关联.
根据列联表中数据,得,
根据的独立性检验,推断不成立,
即认为注射疫苗后小白鼠产生抗体与指标值不小于60有关,
此推断犯错误的概率不大于0.05.
(2)(i)令事件A=“小白鼠第一次注射疫苗产生抗体”,
事件B=“小白鼠第二次注射疫苗产生抗体’’,
事件C=“小白鼠注射2次疫苗后产生抗体”,
记事件A,B,C发生的概率分别为,
则,,

所以一只小白鼠注射2次疫苗后产生抗体的概率,
(ii)由题意,知随机变量,

因为最大,
所以,
解得
是整数,所以或,
接受接种试验的人数为109或110.
14.某地经过多年的环境治理,已将荒山改造成了绿水青山.为估计一林区某种树木的总材积量,随机选取了10棵这种树木,测量每棵树的根部横截面积(单位:)和材积量(单位:),得到如下数据:
样本号i 1 2 3 4 5 6 7 8 9 10 平均值
根部横截面积 0.04 0.06 0.04 0.08 0.08 0.05 a b c 0.07 0.06
材积量 0.25 0.41 0.22 0.54 0.53 0.34 0.35 0.39 0.43 0.44 0.39
其中a,b,c为等差数列,并计算得:,,.
(1)求b的值;
(2)若选取前6个样本号对应数据,判断这种树木的根部横截面积与材积量是否具有很强的线性相关性,并求该林区这种树木的根部横截面积与材积量的回归直线方程(若,则认为两个变量的线性相关性一般;若,则认为两个变量的线性相关性很强);
附:相关系数,
回归直线中,,.
(3)根据回归直线方程估计a,c的值(精确到0.01).
【详解】(1)由a,b,c为等差数列,得,由表格得该树木根部横截面积的平均值为,
可得,
故,解得.
(2)由已知得,

相关系数,故这种树木的根部横截面积与材积量具有很强的线性相关性.
,,
所以该林区这种树木的根部横截面积与材积量的回归直线方程为.
(3)由表格数据可得,根部横截面积为a,c时对应的材积量分别为,,
代入回归直线方程分别得,,解得,.
1压轴题06 统计与概率压轴题
题型/考向一:统计与概率
题型/考向二:统计案例
一、统计与概率
热点一 用样本估计总体
1.频率分布直方图中相邻两横坐标之差表示组距,纵坐标表示,频率=组距×.
2.在频率分布直方图中各小长方形的面积之和为1.
3.利用频率分布直方图求众数、中位数与平均数.
(1)最高的小长方形底边中点的横坐标即众数.
(2)中位数左边和右边的小长方形的面积和相等.
(3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和.
热点二 概率
1.古典概型的概率公式
P(A)=.
2.条件概率公式
设A,B为随机事件,且P(A)>0,
则P(B|A)=.
3.全概率公式
设A1,A2,…,An是一组两两互斥的事件,A1∪A2∪…∪An=Ω,且P(Ai)>0,i=1,2,…,n,则对任意的事件B Ω,有P(B)=P(Ai)P(B|Ai).
一 统计与概率
一、单选题
1.对某校中学学生的身高进行统计,并将他们的身高(单位:厘米)数据绘制成频率分布直方图(如图),则该校学生身高数据的中位数为( )
A.165 B.165.75 C.166 D.166.25
2.如图,一组数据,的平均数为5,方差为,去除,这两个数据后,平均数为,方差为,则( )
A., B., C., D.,
3.已知数据是某市个普通职工的年收入,如果再加上世界首富的年收入,组成个数据,则下列说法正确的是( )
A.年收入的平均数可能不变,中位数可能不变,方差可能不变
B.年收入的平均数大大增加,中位数可能不变,方差变大
C.年收入的平均数大大增加,中位数可能不变,方差变小
D.年收入的平均数大大增加,中位数一定变大,方差可能不变
4.甲、乙两名篮球运动员在8场比赛中的单场得分用茎叶图表示(图1),茎叶图中甲的得分有部分数据丢失,但甲得分的折线图(图2)完好,则( )
A.甲的单场平均得分比乙低 B.乙的60%分位数为19
C.甲、乙的极差均为11 D.乙得分的中位数是16.5
5.某省普通高中学业水平考试分为合格性考试(合格考)和选择性考试(选择考).其中“选择考”成绩根据学生考试时的原始卷面分数,由高到低进行排序,评定为五个等级.某高中2022年参加“选择考”总人数是2020年参加“选择考”总人数的2倍,为了更好地分析该校学生“选择考”的水平,统计了该校2020年和2022年“选择考”成绩等级结果,得到如下统计图.针对该校“选择考”情况,2022年与2020年比较,下列说法正确的是( )
A.获得A等级的人数减少了 B.获得B等级的人数增加了1.5倍
C.获得D等级的人数减少了一半 D.获得E等级的人数相同
6.在“2,3,5,7,11,13,17,19”这8个素数中,任取2个不同的数,则这两个数之和仍为素数的概率是( )
A. B. C. D.
7.2022年11月30日,神舟十五号、神舟十四号乘组在太空“胜利会师”,在中国人自己的“太空家园”里留下了一张足以载入史册的太空合影.某班级开展了关于太空知识的分享交流活动,活动中有2名男生、3名女生发言,活动后从这5人中任选2人进行采访,则这2人中至少有1名男生的概率为( )
A. B. C. D.
8.不透明箱子中装有大小相同标号为1,2,3,4,5的5个冰墩墩(北京冬奥会吉祥物),随机抽取2个冰墩墩,则被抽到的2个冰墩墩标号相邻的概率是( )
A. B. C. D.
二、多选题
9.如图是国家统计局公布的2021年5月至2021年12月的规模以上工业日均发电量的月度走势情况,则( ).
A.2021年7月至2021年10月,规模以上工业月度日均发电量呈现下降趋势
B.2021年5月至2021年12月,规模以上工业月度日均发电量的中位数为228
C.2021年11月,规模以上工业发电总量约为6758亿千瓦时
D.从2021年5月至2021年12月中随机抽取2个月份,规模以上工业月度日均发电量都超过230亿千瓦时的概率为
10.树人中学班某科研小组,持续跟踪调查了他们班全体同学一学期中周锻炼身体的时长,经过整理得到男生、女生各周锻炼身体的平均时长(单位:)的数据如下:
男生:、、、、、、、、、、、、、、、;
女生:、、、、、、、、、、、、、、、.
以下判断中正确的是( )
A.女生每周锻炼身体的平均时长的平均值等于
B.男生每周锻炼身体的平均时长的分位数是
C.男生每周锻炼身体的平均时长大于的概率的估计值为
D.与男生相比,女生每周锻炼身体的平均时长波动性比较大
11.已知甲袋内有a个红球,b个黑球,乙袋内有b个红球,a个黑球,从甲、乙两袋内各随机取出1个球,记事件“取出的2个球中恰有1个红球”,“取出的2个球都是红球”,“取出的2个球都是黑球”,则( )
A. B.
C. D.
12.某中学为了能充分调动学生对学术科技的积极性,鼓励更多的学生参与到学术科技之中,提升学生的创新意识,该学校决定邀请知名教授于9月2日和9月9日到学校做两场专题讲座.学校有东、西两个礼堂,第一次讲座地点的安排不影响下一次讲座的安排,假设选择东、西两个礼堂作为讲座地点是等可能的,则下列叙述正确的是( )
A.两次讲座都在东礼堂的概率是
B.两次讲座安排在东、西礼堂各一场的概率是
C.两次讲座中至少有一次安排在东礼堂的概率是
D.若第一次讲座安排在东礼堂,下一次讲座安排在西礼堂的概率是
三、解答题
13.春节期间,我国高速公路继续执行“节假日高速免费政策” .某路桥公司为了解春节期间车辆出行的高峰情况,在某高速收费点发现大年初三上午9:20~10:40这一时间段内有600辆车通过,将其通过该收费点的时刻绘成频率分布直方图.其中时间段9:20~9:40记作区间,9:40~10:00记作,10:00~10:20记作,10:20~10:40记作,例如:10点04分,记作时刻64.
(1)估计这600辆车在9:20~10:40时间段内通过该收费点的时刻的平均值(同一组中的数据用该组区间的中点值代表);
(2)为了对数据进行分析,现采用分层抽样的方法从这600辆车中抽取5辆,再从这5辆车中随机抽取3辆,则恰有1辆为9:20~10:00之间通过的概率是多少?
14.我国某医药研究所在针对某种世界疾病难题的解决方案中提到了中医疗法,为证实此方法的效用,该研究所购进若干副某种中草药,现按照每副该中草药的重量大小(单位:克)分为4组:,,,,并绘制频率分布直方图如下所示:
(1)估计每副该中草药的平均重量(同一组中的数据用该区间的中点值作代表);
(2)现从每副重量在,内的中草药中按照分层抽样的方式一共抽取6副该中草药,再从这6副中草药中随机取出2副进行分析,求取出的2副中仅有1副重量在中的概率.
二、统计案例
热点一 回归分析
求经验回归方程的步骤
(1)依据成对样本数据画出散点图,确定两个变量具有线性相关关系(有时可省略).
(2)计算出,,x,xiyi的值.
(3)计算,.
(4)写出经验回归方程.
热点二 独立性检验
独立性检验的一般步骤
(1)根据样本数据列2×2列联表;
(2)根据公式χ2=,计算χ2的值;
(3)查表比较χ2与临界值的大小关系,作统计判断.χ2越大,对应假设事件H0成立(两类变量相互独立)的概率越小,H0不成立的概率越大.
二 统计案例
一、单选题
1.以模型去拟合一组数据时,设,将其变换后得到线性回归方程,则( )
A. B. C. D.e
2.下列说法正确的有( )
①对于分类变量与,它们的随机变量的观测值越大,说明“与有关系”的把握越大;
②我校高一、高二、高三共有学生人,其中高三有人.为调查需要,用分层抽样的方法从全校学生中抽取一个容量为的样本,那么应从高三年级抽取人;
③若数据、、、的方差为,则另一组数据、、、的方差为;
④把六进制数转换成十进制数为:.
A.①④ B.①② C.③④ D.①③
3.给出以下四个命题:
①在回归分析中,可用相关指数的值判断模型的拟合效果,越大,模型的拟合效果越好;
②回归模型中离差是实际值与估计值的差,离差点所在的带状区域宽度越窄,说明模型拟合精度越高;
③在一组样本数据(,不全相等)的散点图中,若所有样本点都在直线上,则这组样本数据的线性相关系数为;
④对分类变量与的统计量来说,值越小,判断“与有关系”的把握程度越大.
其中,真命题的个数为( )
A. B. C. D.
4.如图是近十年来全国城镇人口、乡村人口的折线图(数据来自国家统计局).
根据该折线图,下列说法错误的是( )
A.城镇人口与年份呈现正相关 B.乡村人口与年份的相关系数接近
C.城镇人口逐年增长率大致相同 D.可预测乡村人口仍呈现下降趋势
5.已知变量之间的线性回归方程为,且变量之间的一组相关数据如表所示,
6 8 10 12
6 m 3 2
则下列说法中错误的有( )
A.变量之间呈现负相关关系 B.变量之间的相关系数
C.的值为5 D.该回归直线必过点
6.设两个相关变量和分别满足下表:
若相关变量和可拟合为非线性回归方程,则当时,的估计值为( )
(参考公式:对于一组数据,,,,其回归直线的斜率和截距的最小二乘估计公式分别为:,;)A. B. C. D.
7.通过随机询问相同数量的不同性别大学生在购买食物时是否看营养说明,得知有的男大学生“不看”,有的女大学生“不看”,若有99%的把握认为性别与是否看营养说明之间有关,则调查的总人数可能为( )
A.150 B.170 C.240 D.175
8.已知一组样本数据,根据这组数据的散点图分析x与y之间的线性相关关系,若求得其线性回归方程为,则在样本点处的残差为( )
A. B.2.45 C.3.45 D.54.55
二、多选题
9.下列关于成对数据的统计说法正确的有( )
A.若当一个变量的值增加时,另一个变量的相应值呈现减少的趋势,则称这两个变量负相关
B.样本相关系数r的绝对值大小可以反映成对样本数据之间线性相关的程度
C.通过对残差的分析可以判断模型刻画数据的效果,以及判断原始数据中是否存在可疑数据
D.决定系数越大,模型的拟合效果越差
10.某服装生产商为了解青少年的身高和体重的关系,在15岁的男生中随机抽测了10人的身高和体重,数据如下表所示:
编号 1 2 3 4 5 6 7 8 9 10
身高/cm 165 168 170 172 173 174 175 177 179 182
体重/kg 55 89 61 65 67 70 75 75 78 80
由表中数据制作成如下所示的散点图:
由最小二乘法计算得到经验回归直线的方程为,相关系数为,决定系数为;经过残差分析确定为离群点(对应残差过大),把它去掉后,再用剩下的9组数据计算得到经验回归直线的方程为,相关系数为,决定系数为.则以下结论中正确的有( )
A. B.
C. D.
11.下列命题中为真命题的是( )
A.用最小二乘法求得的一元线性回归模型的残差和一定是0.
B.一组数按照从小到大排列后为:,,…,,计算得:,则这组数的25%分位数是.
C.在分层抽样时,如果知道各层的样本量、各层的样本均值及各层的样本方差,可以计算得出所有数据的样本均值和方差.
D.从统计量中得知有97%的把握认为吸烟与患肺病有关系,是指推断有3%的可能性出现错误.
12.给出下列说法,其中正确的是( )
A.某病8位患者的潜伏期(天)分别为3,3,8,4,2,7,10,18,则它们的第50百分位数为
B.已知数据的平均数为2,方差为3,那么数据,,的平均数和方差分别为5,13
C.在回归分析中,变量间的关系若是非确定性关系,那么因变量不能由自变量唯一确定
D.样本相关系数
三、解答题
13.国家发改委和住建部等六部门发布通知,提到:2025年,农村生活垃圾无害化处理水平将明显提升.现阶段我国生活垃圾有填埋 焚烧 堆肥等三种处理方式,随着我国生态文明建设的不断深入,焚烧处理已逐渐成为主要方式.根据国家统计局公布的数据,对2013-2020年全国生活垃圾焚烧无害化处理厂的个数y(单位:座)进行统计,得到如下表格:
年份 2013 2014 2015 2016 2017 2018 2019 2020
年份代码 1 2 3 4 5 6 7 8
垃圾焚烧无害化 处理厂的个数 y 166 188 220 249 286 331 389 463
(1)根据表格中的数据,可用一元线性回归模型刻画变量与变量之间的线性相关关系,请用相关系数加以说明(精确到0.01);
(2)求出关于的经验回归方程,并预测2022年全国生活垃圾焚烧无害化处理厂的个数;
(3)对于2035年全国生活垃圾焚烧无害化处理厂的个数,还能用(2)所求的经验回归方程预测吗?请简要说明理由.
参考公式:相关系数,回归方程中斜率和截距的最小二乘法估计公式分别为
参考数据:,
14.为加快推动旅游业复苏,进一步增强居民旅游消费意愿,山东省人民政府规定自2023年1月21日起至3月31日在全省实施景区门票减免,全省国有A级旅游景区免首道门票,鼓励非国有A级旅游景区首道门票至少半价优惠.本次门票优惠几乎涵盖了全省所有知名的重点景区,据统计,活动开展以来游客至少去过两个及以上景区的人数占比约为90%.某市旅游局从游客中随机抽取100人(其中年龄在50周岁及以下的有60人)了解他们对全省实施景区门票减免活动的满意度,并按年龄(50周岁及以下和50周岁以上)分类统计得到如下不完整的列联表:
不满意 满意 总计
50周岁及以下 55
50周岁以上 15
总计 100
(1)根据统计数据完成以上列联表,并根据小概率值的独立性检验,能否认为对全省实施景区门票减免活动是否满意与年龄有关联?
(2)现从本市游客中随机抽取3人了解他们的出游情况,设其中至少去过两个及以上景区的人数为,若以本次活动中至少去过两个及以上景区的人数的频率为概率.
①求的分布列和数学期望;
②求.
参考公式及数据:,其中.
0.100 0.050 0.010 0.001
2.706 3.841 6.635 10.828
1压轴题06 统计与概率压轴题答案
题型/考向一:统计与概率
题型/考向二:统计案例
一、统计与概率
热点一 用样本估计总体
1.频率分布直方图中相邻两横坐标之差表示组距,纵坐标表示,频率=组距×.
2.在频率分布直方图中各小长方形的面积之和为1.
3.利用频率分布直方图求众数、中位数与平均数.
(1)最高的小长方形底边中点的横坐标即众数.
(2)中位数左边和右边的小长方形的面积和相等.
(3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和.
热点二 概率
1.古典概型的概率公式
P(A)=.
2.条件概率公式
设A,B为随机事件,且P(A)>0,
则P(B|A)=.
3.全概率公式
设A1,A2,…,An是一组两两互斥的事件,A1∪A2∪…∪An=Ω,且P(Ai)>0,i=1,2,…,n,则对任意的事件B Ω,有P(B)=P(Ai)P(B|Ai).
一 统计与概率
一、单选题
1.对某校中学学生的身高进行统计,并将他们的身高(单位:厘米)数据绘制成频率分布直方图(如图),则该校学生身高数据的中位数为( )
A.165 B.165.75 C.166 D.166.25
【答案】D
【详解】由频率分布直方图知,数据在的频率依次为,
显然中位数,则,解得,
所以该校学生身高数据的中位数为166.25.
故选:D
2.如图,一组数据,的平均数为5,方差为,去除,这两个数据后,平均数为,方差为,则( )
A., B., C., D.,
【答案】D
【详解】由题意可得:,则,
故,
∵是波幅最大的两个点的值,则去除,这两个数据后,整体波动性减小,故.
故选:D.
3.已知数据是某市个普通职工的年收入,如果再加上世界首富的年收入,组成个数据,则下列说法正确的是( )
A.年收入的平均数可能不变,中位数可能不变,方差可能不变
B.年收入的平均数大大增加,中位数可能不变,方差变大
C.年收入的平均数大大增加,中位数可能不变,方差变小
D.年收入的平均数大大增加,中位数一定变大,方差可能不变
【答案】B
【详解】因为数据是某市个普通职工的年收入,
而是世界首富的年收入,则会远远大于,
故这个数据中,年收入的平均数大大增加,中位数可能不变,也可能稍微变大,
由于数据的集中程度也受到比较大的影响,而更加离散,则方差变大.
故选:B
4.甲、乙两名篮球运动员在8场比赛中的单场得分用茎叶图表示(图1),茎叶图中甲的得分有部分数据丢失,但甲得分的折线图(图2)完好,则( )
A.甲的单场平均得分比乙低 B.乙的60%分位数为19
C.甲、乙的极差均为11 D.乙得分的中位数是16.5
【答案】D
【详解】A:由茎叶图和直方图,甲比赛得分为,平均得分为,
乙比赛得分为,平均得分为,甲高于乙,错误;
B:由,故乙的60%分位数为17,错误;
C:甲的极差为,乙的极差为,错误;
D:乙得分的中位数是,正确.
故选:D
5.某省普通高中学业水平考试分为合格性考试(合格考)和选择性考试(选择考).其中“选择考”成绩根据学生考试时的原始卷面分数,由高到低进行排序,评定为五个等级.某高中2022年参加“选择考”总人数是2020年参加“选择考”总人数的2倍,为了更好地分析该校学生“选择考”的水平,统计了该校2020年和2022年“选择考”成绩等级结果,得到如下统计图.针对该校“选择考”情况,2022年与2020年比较,下列说法正确的是( )
A.获得A等级的人数减少了 B.获得B等级的人数增加了1.5倍
C.获得D等级的人数减少了一半 D.获得E等级的人数相同
【答案】B
【详解】由题可知:设2020年参加选择考的总人数为a,则2022年参加选择考的总人数为2a人;
2020年评定为五个等级的人数为:;
2022年评定为五个等级的人数为∶;
由此可知获得A等级的人数增加了,A错误;
由于,即获得B等级的人数增加了1.5倍,B正确;
获得D等级的人数增加了,C错误;
获得E等级的人数增加了1倍,D错误;
故选∶B.
6.在“2,3,5,7,11,13,17,19”这8个素数中,任取2个不同的数,则这两个数之和仍为素数的概率是( )
A. B. C. D.
【答案】C
【详解】这8个素数中,任取2个不同的数,有如下基本事件:
共有28个基本事件,
这两个数之和仍为素数的基本事件有:共4个,
所以这两个数之和仍为素数的概率是,
故选:C.
7.2022年11月30日,神舟十五号、神舟十四号乘组在太空“胜利会师”,在中国人自己的“太空家园”里留下了一张足以载入史册的太空合影.某班级开展了关于太空知识的分享交流活动,活动中有2名男生、3名女生发言,活动后从这5人中任选2人进行采访,则这2人中至少有1名男生的概率为( )
A. B. C. D.
【答案】D
【详解】记2名男生为,记3名女生为,
从5人中任选2人的试验含有的基本事件为,共10个结果,
其中至少有1名男生的事件M含有的基本事件为,共7个结果,
所以这2人中至少有1名男生的概率.
故选:D
8.不透明箱子中装有大小相同标号为1,2,3,4,5的5个冰墩墩(北京冬奥会吉祥物),随机抽取2个冰墩墩,则被抽到的2个冰墩墩标号相邻的概率是( )
A. B. C. D.
【答案】B
【详解】解:根据题意,随机取出的2个冰墩墩的编号的可能情况有:12,13,14,15,23,24,25,34,35,45,共10种;
其中被抽到的2个冰墩墩标号相邻的情况有:12,23,34,45,共4种;
所以,被抽到的2个冰墩墩标号相邻的概率是.
故选:B
二、多选题
9.如图是国家统计局公布的2021年5月至2021年12月的规模以上工业日均发电量的月度走势情况,则( ).
A.2021年7月至2021年10月,规模以上工业月度日均发电量呈现下降趋势
B.2021年5月至2021年12月,规模以上工业月度日均发电量的中位数为228
C.2021年11月,规模以上工业发电总量约为6758亿千瓦时
D.从2021年5月至2021年12月中随机抽取2个月份,规模以上工业月度日均发电量都超过230亿千瓦时的概率为
【答案】AD
【详解】由图可知,2021年7月至2021年10月,规模以上工业月度日均发电量数据由大变小,故A正确;
将2021年5月至2021年12月的月度日均发电量的数据从小到大排序,第4个数为225,第5个数为228.7,则所求中位数为226.85,故B错误;
2021年11月,规模以上工业发电总量为亿千瓦时,故C错误;
从2021年5月至2021年12月中随机抽取2个月份,规模以上工业月度日均发电量都超过230亿千瓦时的概率为,故D正确.
故选:AD
10.树人中学班某科研小组,持续跟踪调查了他们班全体同学一学期中周锻炼身体的时长,经过整理得到男生、女生各周锻炼身体的平均时长(单位:)的数据如下:
男生:、、、、、、、、、、、、、、、;
女生:、、、、、、、、、、、、、、、.
以下判断中正确的是( )
A.女生每周锻炼身体的平均时长的平均值等于
B.男生每周锻炼身体的平均时长的分位数是
C.男生每周锻炼身体的平均时长大于的概率的估计值为
D.与男生相比,女生每周锻炼身体的平均时长波动性比较大
【答案】BD
【详解】对于A选项,由平均数公式可知,
女生每周锻炼身体的平均时长的平均值等于
,A错;
对于B选项,因为,
因此,男生每周锻炼身体的平均时长的分位数是,B对;
对于C选项,男生每周锻炼身体的平均时长大于的有周,
所求概率为,C错;
对于D选项,男生每周锻炼身体的平均时长分布在区间内共有个,女生有个,
男生每周锻炼身体的平均时长分布在区间内的共个,女生为个,
男生每周锻炼身体的平均时长的极差为,女生为,
据此可知与男生相比,女生每周锻炼身体的平均时长波动性比较大,
所以,与男生相比,女生每周锻炼身体的平均时长波动性比较大,D对.
故选:BD.
11.已知甲袋内有a个红球,b个黑球,乙袋内有b个红球,a个黑球,从甲、乙两袋内各随机取出1个球,记事件“取出的2个球中恰有1个红球”,“取出的2个球都是红球”,“取出的2个球都是黑球”,则( )
A. B.
C. D.
【答案】BD
【详解】解:若取出的2个球为1个红球1个黑球,其概率,
若2个球都是红球,其概率,
若2个球都是黑球,其概率,且,
故B正确,C错误;
而,故A错误;
,D正确,
故选:BD.
12.某中学为了能充分调动学生对学术科技的积极性,鼓励更多的学生参与到学术科技之中,提升学生的创新意识,该学校决定邀请知名教授于9月2日和9月9日到学校做两场专题讲座.学校有东、西两个礼堂,第一次讲座地点的安排不影响下一次讲座的安排,假设选择东、西两个礼堂作为讲座地点是等可能的,则下列叙述正确的是( )
A.两次讲座都在东礼堂的概率是
B.两次讲座安排在东、西礼堂各一场的概率是
C.两次讲座中至少有一次安排在东礼堂的概率是
D.若第一次讲座安排在东礼堂,下一次讲座安排在西礼堂的概率是
【答案】ABC
【详解】总的情况有种,两次讲座都在东礼堂有1种情况,所以的概率是,故A正确;
两次讲座安排在东、西礼堂各一场有第一次安排在东礼堂,第二次安排在西礼堂和第一次安排在西礼堂,第二次安排在东礼堂两种情况,所以概率是,故B正确;
两次讲座至少有一次安排在东礼堂的对立事件为两次讲座都安排在西礼堂,所以概率是,故C正确;
第一次讲座安排在东礼堂,下一次讲座安排在西礼堂的概率是,故D错.
故选:ABC.
三、解答题
13.春节期间,我国高速公路继续执行“节假日高速免费政策” .某路桥公司为了解春节期间车辆出行的高峰情况,在某高速收费点发现大年初三上午9:20~10:40这一时间段内有600辆车通过,将其通过该收费点的时刻绘成频率分布直方图.其中时间段9:20~9:40记作区间,9:40~10:00记作,10:00~10:20记作,10:20~10:40记作,例如:10点04分,记作时刻64.
(1)估计这600辆车在9:20~10:40时间段内通过该收费点的时刻的平均值(同一组中的数据用该组区间的中点值代表);
(2)为了对数据进行分析,现采用分层抽样的方法从这600辆车中抽取5辆,再从这5辆车中随机抽取3辆,则恰有1辆为9:20~10:00之间通过的概率是多少?
【详解】(1)这600辆车在时间段内通过该收费点的时刻的平均值为,即:10点04分.
(2)由题意知,时间段内抽取车辆数为,分别记为:,,
时间段内抽取车辆数为,分别记为:,,
时间段内抽取车辆数为,记为:,
所以从这5辆车中随机抽取3辆的基本事件有:,,,,,,,,,共10个,
恰有1辆为之间通过的基本事件有:,,,,,共有6个,
所以恰有1辆为之间通过的概率为.
14.我国某医药研究所在针对某种世界疾病难题的解决方案中提到了中医疗法,为证实此方法的效用,该研究所购进若干副某种中草药,现按照每副该中草药的重量大小(单位:克)分为4组:,,,,并绘制频率分布直方图如下所示:
(1)估计每副该中草药的平均重量(同一组中的数据用该区间的中点值作代表);
(2)现从每副重量在,内的中草药中按照分层抽样的方式一共抽取6副该中草药,再从这6副中草药中随机取出2副进行分析,求取出的2副中仅有1副重量在中的概率.
【详解】(1)根据题意可得(克),
所以每副该中草药的平均重量约为32克.
(2)因为重量在的频率为,
重量在的频率为,
所以按照分层抽样的方式,取出的6副该中草药中重量在中的有4副,
重量在中的有2副,
所以从这6副中草药中随机取出2副有种方法,
满足取出的2副中仅有1副重量在中(记为事件A)有种方法,
所以.
故取出的2副中仅有1副重量在中的概率为.
二、统计案例
热点一 回归分析
求经验回归方程的步骤
(1)依据成对样本数据画出散点图,确定两个变量具有线性相关关系(有时可省略).
(2)计算出,,x,xiyi的值.
(3)计算,.
(4)写出经验回归方程.
热点二 独立性检验
独立性检验的一般步骤
(1)根据样本数据列2×2列联表;
(2)根据公式χ2=,计算χ2的值;
(3)查表比较χ2与临界值的大小关系,作统计判断.χ2越大,对应假设事件H0成立(两类变量相互独立)的概率越小,H0不成立的概率越大.
二 统计案例
一、单选题
1.以模型去拟合一组数据时,设,将其变换后得到线性回归方程,则( )
A. B. C. D.e
【答案】C
【详解】因为,所以,
令,所以,即.
故选:C
2.下列说法正确的有( )
①对于分类变量与,它们的随机变量的观测值越大,说明“与有关系”的把握越大;
②我校高一、高二、高三共有学生人,其中高三有人.为调查需要,用分层抽样的方法从全校学生中抽取一个容量为的样本,那么应从高三年级抽取人;
③若数据、、、的方差为,则另一组数据、、、的方差为;
④把六进制数转换成十进制数为:.
A.①④ B.①② C.③④ D.①③
【答案】A
【详解】对于①,对于分类变量与,它们的随机变量的观测值越大,说明“与有关系”的把握越大,①对;
对于②,由分层抽样可知,应从高三年级抽取的人数为,②错;
对于③,记,则,
所以,数据、、、的平均数为

其方差为
,③错;
对于④,把六进制数转换成十进制数为:,④对.
故选:A.
3.给出以下四个命题:
①在回归分析中,可用相关指数的值判断模型的拟合效果,越大,模型的拟合效果越好;
②回归模型中离差是实际值与估计值的差,离差点所在的带状区域宽度越窄,说明模型拟合精度越高;
③在一组样本数据(,不全相等)的散点图中,若所有样本点都在直线上,则这组样本数据的线性相关系数为;
④对分类变量与的统计量来说,值越小,判断“与有关系”的把握程度越大.
其中,真命题的个数为( )
A. B. C. D.
【答案】B
【详解】对于①,由相关指数的定义知:越大,模型的拟合效果越好,①正确;
对于②,离差点所在的带状区域宽度越窄,则离差平方和越小,模型拟合精度越高,②正确;
对于③,若所有样本点都在直线上,则线性相关系数,③错误;
对于④,由独立性检验的思想知:值越大,“与有关系”的把握程度越大,④错误.
故选:B.
4.如图是近十年来全国城镇人口、乡村人口的折线图(数据来自国家统计局).
根据该折线图,下列说法错误的是( )
A.城镇人口与年份呈现正相关 B.乡村人口与年份的相关系数接近
C.城镇人口逐年增长率大致相同 D.可预测乡村人口仍呈现下降趋势
【答案】B
【详解】对于A选项,由折线图可知,城镇人口与年份呈现正相关,A对;
对于B选项,因为乡村人口与年份呈负线性相关关系,且线性相关性很强,所以接近,B错;
对于C选项,城镇人口与年份呈现正相关,且线性相关性很强,相关系数接近,
故城镇人口逐年增长率大致相同,C对;
对于D选项,由折线图可知,乡村人口与年份呈负线性相关关系,可预测乡村人口仍呈现下降趋势,D对.
故选:B.
5.已知变量之间的线性回归方程为,且变量之间的一组相关数据如表所示,
6 8 10 12
6 m 3 2
则下列说法中错误的有( )A.变量之间呈现负相关关系 B.变量之间的相关系数
C.的值为5 D.该回归直线必过点
【答案】B
【详解】对于A∶根据线性回归方程为,可知回归系数 ,
故判断之间呈现负相关关系,A正确;
对于C,根据表中数据,计算, ,
代入回归方程得 ,解得 ,C正确;
对于B︰变量之间的相关系数,B错误;
对于D∶由以上分析知,线性回归方程一定过点,
∴线性回归方程过点 ,D正确,
故选:B.
6.设两个相关变量和分别满足下表:
若相关变量和可拟合为非线性回归方程,则当时,的估计值为( )
(参考公式:对于一组数据,,,,其回归直线的斜率和截距的最小二乘估计公式分别为:,;)A. B. C. D.
【答案】B
【详解】解:因为非线性回归方程为:,则有,
令,即,列出相关变量关系如下:
0 1 3 3 4
所以,,
,,
所以,
所以,所以,
即,即,因为,所以,
当时,.
故选:B
7.通过随机询问相同数量的不同性别大学生在购买食物时是否看营养说明,得知有的男大学生“不看”,有的女大学生“不看”,若有99%的把握认为性别与是否看营养说明之间有关,则调查的总人数可能为( )
A.150 B.170 C.240 D.175
【答案】C
【详解】设男女大学生各有m人,根据题意画出2×2列联表,如下图:
看 不看 合计
男 m
女 m
合计 2m
所以,因为有99%的把握认为性别与对产品是否满意有关,所以,解得,所以总人数2m可能为240.
故选:C.
8.已知一组样本数据,根据这组数据的散点图分析x与y之间的线性相关关系,若求得其线性回归方程为,则在样本点处的残差为( )
A. B.2.45 C.3.45 D.54.55
【答案】B
【详解】把代入,得,
所以在样本点处的残差.
故选:B.
二、多选题
9.下列关于成对数据的统计说法正确的有( )
A.若当一个变量的值增加时,另一个变量的相应值呈现减少的趋势,则称这两个变量负相关
B.样本相关系数r的绝对值大小可以反映成对样本数据之间线性相关的程度
C.通过对残差的分析可以判断模型刻画数据的效果,以及判断原始数据中是否存在可疑数据
D.决定系数越大,模型的拟合效果越差
【答案】ABC
【详解】对于A,如果从整体上看,当一个变量的值增加时,另一个变量的相应值也呈现增加的趋势,就称这两个变量正相关;如果当一个变量的值增加时,另一个变量的相应值呈现减少的趋势,则称这两个变量负相关,故A正确;
对于B,在回归分析中,成对样本数据的样本相关系数r的绝对值越大,成对样本数据的线性相关程度越强,故B正确;
对于C,残差图可以发现原始数据中的可疑数据,可用残差平方和判断模型的拟合效果,残差平方和越小,模型的拟合效果越好,故C正确;
对于D,在回归分析中,可用决定系数的值判断模型的拟合效果,越大,模型的拟合效果越好,故D错误.
故选:ABC.
10.某服装生产商为了解青少年的身高和体重的关系,在15岁的男生中随机抽测了10人的身高和体重,数据如下表所示:
编号 1 2 3 4 5 6 7 8 9 10
身高/cm 165 168 170 172 173 174 175 177 179 182
体重/kg 55 89 61 65 67 70 75 75 78 80
由表中数据制作成如下所示的散点图:
由最小二乘法计算得到经验回归直线的方程为,相关系数为,决定系数为;经过残差分析确定为离群点(对应残差过大),把它去掉后,再用剩下的9组数据计算得到经验回归直线的方程为,相关系数为,决定系数为.则以下结论中正确的有( )A. B.
C. D.
【答案】AC
【详解】身高的平均数为,
因为离群点的横坐标168小于平均值,纵坐标89相对过大,
所以去掉离群点后经验回归直线的截距变小而斜率变大,
所以,,所以A正确,B错误;
去掉离群点后成对样本数据的线性相关程度更强,拟合效果会更好,
所以,所以C正确,D错误.
故选:AC.
11.下列命题中为真命题的是( )
A.用最小二乘法求得的一元线性回归模型的残差和一定是0.
B.一组数按照从小到大排列后为:,,…,,计算得:,则这组数的25%分位数是.
C.在分层抽样时,如果知道各层的样本量、各层的样本均值及各层的样本方差,可以计算得出所有数据的样本均值和方差.
D.从统计量中得知有97%的把握认为吸烟与患肺病有关系,是指推断有3%的可能性出现错误.
【答案】ACD
【详解】对于A,根据残差定义及最小二乘法
故A正确;
对于B,由百分位数定义,结果应为,故B错误;
对于C,在分层抽样时,如果知道各层的样本量、各层的样本均值及各层的样本方差,可以计算得出所有数据的样本均值和方差,故C正确;
对于D,从统计量中得知有97%的把握认为吸烟与患肺病有关系,是指推断有3%的可能性出现错误,故D正确.
故选:ACD.
12.给出下列说法,其中正确的是( )
A.某病8位患者的潜伏期(天)分别为3,3,8,4,2,7,10,18,则它们的第50百分位数为
B.已知数据的平均数为2,方差为3,那么数据,,的平均数和方差分别为5,13
C.在回归分析中,变量间的关系若是非确定性关系,那么因变量不能由自变量唯一确定
D.样本相关系数
【答案】AC
【详解】选项A,将3,3,8,4,2,7,10,18由小到大排列为2,3,3,4,7,8,10,18,第50百分位数即为中位数,这组数的中位数为,故A正确,
选项B,由数据的平均数为2,方差为3,则数据,,的平均数为,方差为,故B错误,
选项C,在回归分析中,变量间的关系若是非确定性关系,那么因变量不能由自变量唯一确定,故C正确.
选项D中,样本的相关系数应满足,故D错误.
故选:AC
三、解答题
13.国家发改委和住建部等六部门发布通知,提到:2025年,农村生活垃圾无害化处理水平将明显提升.现阶段我国生活垃圾有填埋 焚烧 堆肥等三种处理方式,随着我国生态文明建设的不断深入,焚烧处理已逐渐成为主要方式.根据国家统计局公布的数据,对2013-2020年全国生活垃圾焚烧无害化处理厂的个数y(单位:座)进行统计,得到如下表格:
年份 2013 2014 2015 2016 2017 2018 2019 2020
年份代码 1 2 3 4 5 6 7 8
垃圾焚烧无害化 处理厂的个数 y 166 188 220 249 286 331 389 463
(1)根据表格中的数据,可用一元线性回归模型刻画变量与变量之间的线性相关关系,请用相关系数加以说明(精确到0.01);
(2)求出关于的经验回归方程,并预测2022年全国生活垃圾焚烧无害化处理厂的个数;
(3)对于2035年全国生活垃圾焚烧无害化处理厂的个数,还能用(2)所求的经验回归方程预测吗?请简要说明理由.
参考公式:相关系数,回归方程中斜率和截距的最小二乘法估计公式分别为
参考数据:,
【详解】(1)
相关系数
因为与的相关系数,接近1,所以与的线性相关程度很高,可用线性回归模型拟合与的关系.
(2)
所以与的线性回归方程为
又2022年对应的年份代码,当时,,
所以预测2022年全国生活垃圾焚烧无害化处理厂的个数为513.
(3)对于2035年全国生活垃圾焚烧无害化处理厂的个数,不能由(2)所求的线性回归方程预测,理由如下(说出一点即可):
①线性回归方程具有时效性,不能预测较远情况;
②全国生活垃圾焚烧无害化处理厂的个数有可能达到上限,一段时间内不再新建;
③受国家政策的影响,可能产生新的生活垃圾无害化处理方式.
14.为加快推动旅游业复苏,进一步增强居民旅游消费意愿,山东省人民政府规定自2023年1月21日起至3月31日在全省实施景区门票减免,全省国有A级旅游景区免首道门票,鼓励非国有A级旅游景区首道门票至少半价优惠.本次门票优惠几乎涵盖了全省所有知名的重点景区,据统计,活动开展以来游客至少去过两个及以上景区的人数占比约为90%.某市旅游局从游客中随机抽取100人(其中年龄在50周岁及以下的有60人)了解他们对全省实施景区门票减免活动的满意度,并按年龄(50周岁及以下和50周岁以上)分类统计得到如下不完整的列联表:
不满意 满意 总计
50周岁及以下 55
50周岁以上 15
总计 100
(1)根据统计数据完成以上列联表,并根据小概率值的独立性检验,能否认为对全省实施景区门票减免活动是否满意与年龄有关联?
(2)现从本市游客中随机抽取3人了解他们的出游情况,设其中至少去过两个及以上景区的人数为,若以本次活动中至少去过两个及以上景区的人数的频率为概率.
①求的分布列和数学期望;
②求.
参考公式及数据:,其中.
0.100 0.050 0.010 0.001
2.706 3.841 6.635 10.828
【详解】(1)由题意,抽取的100人年龄在50周岁及以下的有60人,则年龄在50周岁以上的有40人,补全的列联表如下:
不满意 满意 总计
50周岁及以下 5 55 60
50周岁以上 15 25 40
总计 20 80 100
则.
所以在犯错误的概率不超过0.001的情况下认为对全省实施景区门票减免活动是否满意与年龄有关联.
(2)①由题意可得,游客至少去过两个及以上景区的概率为0.9,
则,的所有可能取值为0,1,2,3,
,,,,
所以的分布列如下:
0 1 2 3
因为,所以数学期望.
②.
1

展开更多......

收起↑

资源列表