新教材适用2024版高考数学二轮总复习第1篇专题6概率与统计(8份打包)

资源下载
  1. 二一教育资源

新教材适用2024版高考数学二轮总复习第1篇专题6概率与统计(8份打包)

资源简介

第2讲 随机变量及其分布列
高频考点 高考预测
n重伯努利试验、二项分布 以现实生活中的实际例子为背景,考查离散型随机变量的分布列、均值、方差及其概率的计算.
超几何分布
离散型随机变量及其分布
离散型随机变量的均值、方差
1. (2022·全国甲卷)甲、乙两个学校进行体育比赛,比赛共设三个项目,每个项目胜方得10分,负方得0分,没有平局.三个项目比赛结束后,总得分高的学校获得冠军.已知甲学校在三个项目中获胜的概率分别为0.5,0.4,0.8,各项目的比赛结果相互独立.
(1)求甲学校获得冠军的概率;
(2)用X表示乙学校的总得分,求X的分布列与期望.
【解析】 (1)设甲在三个项目中获胜的事件依次记为A,B,C,所以甲学校获得冠军的概率为
P=P(ABC)+P(BC)+P(AC)+P(AB)
=0.5×0.4×0.8+0.5×0.4×0.8+0.5×0.6×0.8+0.5×0.4×0.2
=0.16+0.16+0.24+0.04=0.6.
(2)依题可知,X的可能取值为0,10,20,30,所以,
P(X=0)=0.5×0.4×0.8=0.16,
P(X=10)=0.5×0.4×0.8+0.5×0.6×0.8+0.5×0.4×0.2=0.44,
P(X=20)=0.5×0.6×0.8+0.5×0.4×0.2+0.5×0.6×0.2=0.34,
P(X=30)=0.5×0.6×0.2=0.06.
即X的分布列为
X 0 10 20 30
P 0.16 0.44 0.34 0.06
期望E(X)=0×0.16+10×0.44+20×0.34+30×0.06=13.
2. (2023·全国新高考Ⅰ)甲、乙两人投篮,每次由其中一人投篮,规则如下:若命中则此人继续投篮,若未命中则换为对方投篮.无论之前投篮情况如何,甲每次投篮的命中率均为0.6,乙每次投篮的命中率均为0.8.由抽签确定第1次投篮的人选,第1次投篮的人是甲、乙的概率各为0.5.
(1)求第2次投篮的人是乙的概率;
(2)求第i次投篮的人是甲的概率;
(3)已知:若随机变量Xi服从两点分布,且P(Xi=1)=1-P(Xi=0)=qi,i=1,2,…,n,则E(i)=i.记前n次(即从第1次到第n次投篮)中甲投篮的次数为Y,求E(Y).
【解析】 (1)设第2次投篮的人是乙的概率为P,
由题意得P=0.5×0.4+0.5×0.8=0.6.
(2)由题意设Pn为第n次投篮的是甲的概率,
则Pn+1=0.6Pn+0.2(1-Pn)=0.4Pn+0.2,
∴Pn+1-=0.4,
又P1-=-=≠0,则是首项为,公比为0.4的等比数列,
∴Pn-=×n-1,即Pn=+×n-1,
∴第i次投篮的人是甲的概率为Pi=+×i-1.
(3)由(2)得Pi=+×i-1,
由题意得甲第i次投篮次数Yi服从两点分布,且P(Yi=1)=1-P(Yi=0)=Pi,
∴E(i)=E(Y)=i,
∴当n≥1时,E(Y)=i=i-1+=+=+;当n=0时,E(Y)=0=+,综上所述,E(Y)=+,n∈N.
3. (2021·全国新高考Ⅰ卷)某学校组织“一带一路”知识竞赛,有A,B两类问题.每位参加比赛的同学先在两类问题中选择一类并从中随机抽取一个问题回答,若回答错误则该同学比赛结束;若回答正确则从另一类问题中再随机抽取一个问题回答,无论回答正确与否,该同学比赛结束.A类问题中的每个问题回答正确得20分,否则得0分;B类问题中的每个问题回答正确得80分,否则得0分.
已知小明能正确回答A类问题的概率为0.8,能正确回答B类问题的概率为0.6,且能正确回答问题的概率与回答次序无关.
(1)若小明先回答A类问题,记X为小明的累计得分,求X的分布列;
(2)为使累计得分的期望最大,小明应选择先回答哪类问题?并说明理由.
【解析】 (1)由已知可得,X的所有可能取值为0,20,100,
则P(X=0)=1-0.8=0.2,
P(X=20)=0.8×(1-0.6)=0.32
P(X=100)=0.8×0.6=0.48,
所以X的分布列为:
X 0 20 100
P 0.2 0.32 0.48
(2)由(1)可知小明先回答A类问题累计得分的期望为E(X)=0×0.2+20×0.32+100×0.48=54.4,
若小明先回答B类问题,记Y为小明的累计得分,
则Y的所有可能取值为0,80,100,
P(Y=0)=1-0.6=0.4,
P(Y=80)=0.6×(1-0.8)=0.12,
P(Y=100)=0.6×0.8=0.48,
则Y的期望为E(Y)=0×0.4+80×0.12+100×0.48=57.6,
因为E(Y)>E(X),
所以为使累计得分的期望最大,小明应选择先回答B类问题.
4. (2021·全国新高考Ⅱ卷)一种微生物群体可以经过自身繁殖不断生存下来,设一个这种微生物为第0代,经过一次繁殖后为第1代,再经过一次繁殖后为第2代……,该微生物每代繁殖的个数是相互独立的且有相同的分布列,设X表示1个微生物个体繁殖下一代的个数,P(X=i)=pi(i=0,1,2,3).
(1)已知p0=0.4,p1=0.3,p2=0.2,p3=0.1,求E(X);
(2)设p表示该种微生物经过多代繁殖后临近灭绝的概率,p是关于x的方程:p0+p1x+p2x2+p3x3=x的一个最小正实根,求证:当E(X)≤1时,p=1,当E(X)>1时,p<1;
(3)根据你的理解说明(2)问结论的实际含义.
【解析】 (1)E(X)=0×0.4+1×0.3+2×0.2+3×0.1=1.
(2)设f(x)=p3x3+p2x2+(p1-1)x+p0,
因为p3+p2+p1+p0=1,故f(x)=p3x3+p2x2-(p2+p0+p3)x+p0,
若E(X)≤1,则p1+2p2+3p3≤1,故p2+2p3≤p0.
f′(x)=3p3x2+2p2x-(p2+p0+p3),
因为f′(0)=-(p2+p0+p3)<0,f′(1)=p2+2p3-p0≤0,
故f′(x)有两个不同零点x1,x2,且x1<0<1≤x2,
且x∈(-∞,x1)∪(x2,+∞)时,f′(x)>0;x∈(x1,x2)时,f′(x)<0;
故f(x)在(-∞,x1),(x2,+∞)上为增函数,在(x1,x2)上为减函数,
若x2=1,因为f(x)在(x2,+∞)为增函数且f(1)=0,
而当x∈(0,x2)时,因为f(x)在(x1,x2)上为减函数,故f(x)>f(x2)=f(1)=0,
故1为p0+p1x+p2x2+p3x3=x的一个最小正实根,
若x2>1,因为f(1)=0且在(0,x2)上为减函数,故1为p0+p1x+p2x2+p3x3=x的一个最小正实根,
综上,若E(X)≤1,则p=1.
若E(X)>1,则p1+2p2+3p3>1,故p2+2p3>p0.
此时f′(0)=-(p2+p0+p3)<0,f′(1)=p2+2p3-p0>0,
故f′(x)有两个不同零点x3,x4,且x3<0且x∈(-∞,x3)∪(x4,+∞)时,f′(x)>0;x∈(x3,x4)时,f′(x)<0;
故f(x)在(-∞,x3),(x4,+∞)上为增函数,在(x3,x4)上为减函数,
而f(1)=0,故f(x4)<0,
又f(0)=p0>0,故f(x)在(0,x4)存在一个零点p,且p<1.
所以p为p0+p1x+p2x2+p3x3=x的一个最小正实根,此时p<1,
故当E(X)>1时,p<1.
(3)意义:每一个该种微生物繁殖后代的平均数不超过1,则若干代必然灭绝,若繁殖后代的平均数超过1,则若干代后被灭绝的概率小于1.
核心考点1 n重伯努利实验、二项分布
核心知识· 精归纳
1.n重伯努利试验
把只包含两个可能结果的试验叫做_伯努利试验__;将一个伯努利试验独立地重复进行n次所组成的随机试验称为n重伯努利试验.
2.二项分布
(1)定义:设每次试验中事件A发生的概率为p(0<p<1);
在n重伯努利试验中,用X表示事件A发生的次数,则X的分布列为P(X=k)= Cpk(1-p)n-k ,k=0,1,2,…,n.则称随机变量X服从_二项分布__,记作X~B(n,p)
(2)如果ξ~B(n,p),则用公式E(ξ)=np,D(ξ)=np(1-p).
典例研析· 悟方法
角度1:n重伯努利试验的概率
典例1 (1) (2023·南通模拟)某次抽奖活动中,参与者每次抽中奖的概率均为,现甲参加3次抽奖,则甲恰好有一次中奖的概率为( C )
A. B.
C. D.
【解析】 因为参与者每次抽中奖的概率均为,则甲参加3次抽奖,甲恰好有一次中奖的概率为P=C××2=.故选C.
(2)某同学上学的路上有4个红绿灯路口,假如他走到每个红绿灯路口遇到绿灯的概率为,则该同学在上学的路上至少遇到2次绿灯的概率为( D )
A. B.
C. D.
【解析】 4次均不是绿灯的概率为4=,3次不是绿灯的概率为C×3×=,所以至少遇到2次绿灯的概率为1--=,故选D.
方法技巧· 精提炼
n重伯努利试验概率求解的策略
(1)首先判断问题中涉及的试验是否为n重伯努利试验,判断时注意各次试验之间是否相互独立,并且每次试验的结果是否只有两种,在任何一次试验中,某一事件发生的概率是否都相等,全部满足n重伯努利试验的要求才能用相关公式求解.
(2)解此类题时常用互斥事件概率加法公式,相互独立事件概率乘法公式及对立事件的概率公式.
角度2:二项分布
典例2 (2023·潍坊模拟)为了让人民群众过一个欢乐祥和的新春佳节,某地疫情防控指挥部根据当地疫情防控工作部署,安排4名干部和三个部门(A,B,C)的16名职工到该地的四个高速路口担任疫情防控志愿者,其中16名职工分别是A部门8人,B部门4人,C部门4人.
(1)若从这16名职工中选出4人作为组长,求至少有2个组长来自A部门的概率;
(2)若将这4名干部随机安排到四个高速路口(假设每名干部安排到各高速路口是等可能的,且各位干部的选择是相互独立的),记安排到第一个高速路口的干部人数为X,求随机变量X的分布列和数学期望.
【解析】 (1)从这16名职工中选出4人作为组长,则至少有2个组长来自A部门的概率为++=.
(2)依题意可知X=0,1,2,3,4且X~B,
所以P(X=0)=C0×4=,
P(X=1)=C1×3==,
P(X=2)=C2×2==,
P(X=3)=C3×1==,
P(X=4)=C4×0=,
故分布列为
X 0 1 2 3 4
P
数学期望E(X)=4×=1.
方法技巧· 精提炼
(1)在根据n重伯努利试验求二项分布的有关问题时,关键是理清事件与事件之间的关系,确定二项分布的试验次数n和变量的概率,从而求得概率.
(2)①求随机变量ξ的期望与方差时,可首先分析ξ是否服从二项分布,如果ξ~B(n,p),则用公式E(ξ)=np,D(ξ)=np(1-p)求解,可大大减少计算量.
②有些随机变量虽不服从二项分布,但与之具有线性关系的另一随机变量服从二项分布,这时,可以综合应用E(aξ+b)=aE(ξ)+b以及E(ξ)=np求出E(aξ+b),同样还可求出D(aξ+b).
加固训练· 促提高
1. (2023·石家庄模拟)将五枚质地、大小完全一样的硬币向上抛出,则正面向上的硬币枚数为2或者3的概率为  .
【解析】 设X表示五枚硬币中正面朝上的硬币数量,则P(2≤X≤3)=C×0.52×(1-0.5)3+C×0.53×(1-0.5)2=.
2. (2023·济南模拟)在某次奥运会中,甲、乙、丙三名跳水运动员参加小组赛,已知甲晋级的概率为p(0(1)若甲晋级的概率与乙、丙两人均没有晋级的概率相等,与乙、丙两人有且仅有一人晋级的概率也相等,求p,q;
(2)若p=,记三个人中晋级的人数为ξ,若ξ=0时的概率和ξ=3时的概率相等,求E(ξ).
【解析】 (1)乙、丙两人均没有晋级的概率为(1-q)2,乙、丙两人有且仅有一人晋级的概率为Cq(1-q),故解得p=,q=.
(2)ξ的所有可能取值为0,1,2,3.
P(ξ=0)=(1-q)2,P(ξ=3)=q2,
由题知(1-q)2=q2,解得q=,所以ξ~B,所以E(ξ)=3×=.核心考点2 超几何分布
核心知识· 精归纳
超几何分布
(1)定义
一般地,假设一批产品共有N件,其中有M件次品,从N件产品中随机抽取n件(不放回),用X表示抽取的n件产品中的次品数,则X的分布列为P(X=k)=,k=m,m+1,m+2,…,r.
其中n,N,M∈N*,M≤N,n≤N,m=max{0,n-N+M},r=min{n,M}.如果随机变量X的分布列具有上式的形式,那么称随机变量X服从超几何分布.
(2)超几何分布的均值
设随机变量X服从超几何分布,则X可以解释为从包含M件次品的N件产品中,不放回地随机抽取n件产品的次品数.令p=,则E(X)=  =_np__.
典例研析· 悟方法
角度1:超几何分布及概率计算
典例3 (多选)袋中有6个大小相同的黑球,编号为1,2,3,4,5,6,还有4个同样大小的白球,编号为7,8,9,10,现从中任取4个球,则下列结论正确的是( BD )
A.取出的最大号码X服从超几何分布
B.取出的黑球个数Y服从超几何分布
C.取出2个白球的概率为
D.若取出一个黑球记2分,取出一个白球记1分,则总得分最大的概率为
【解析】 根据超几何分布的定义,要把总体分为两类,再依次选取,由此可知取出的最大号码X不符合超几何分布的定义,无法用超几何分布的数学模型计算概率,故A错误;取出的黑球个数Y符合超几何分布的定义,将黑球视作第一类,白球视作第二类,可以用超几何分布的数学模型计算概率,故B正确;取出2个白球的概率为=,故C错误;若取出一个黑球记2分,取出一个白球记1分,则取出四个黑球的总得分最大,所以总得分最大的概率为=,故D正确.
角度2:超几何分布的分布列
典例4 已知某单位甲、乙、丙三个部门的员工人数分别为24,16,16.现采用分层随机抽样的方法从中抽取7人,进行睡眠时间的调查.
(1)应从甲、乙、丙三个部门的员工中分别抽取多少人?
(2)若抽出的7人中有4人睡眠不足,3人睡眠充足,现从这7人中随机抽取3人做进一步的身体检查.用X表示抽取的3人中睡眠不足的员工人数,求随机变量X的分布列与数学期望.
【解析】 (1)由已知,甲、乙、丙三个部门的员工人数之比为3∶2∶2,由于采用分层随机抽样的方法从中抽取7人,因此应从甲、乙、丙三个部门的员工中分别抽取的人数为3,2,2.
(2)随机变量X的所有可能取值为0,1,2,3.
所以P(X=0)==,P(X=1)==,
P(X=2)==,P(X=3)==,
所以随机变量X的分布列为
X 0 1 2 3
P
 随机变量X的数学期望E(X)=0×+1×+2×+3×=.
方法技巧· 精提炼
超几何分布的特点和应用条件
(1)超几何分布的两个特点:①超几何分布是不放回抽样问题;②随机变量表示抽到的某类个体的个数.
(2)超几何分布的应用条件:①两类不同的对象(物品、人或事);②已知各类对象的个数;③从中抽取若干个个体.
加固训练· 促提高
1. (2023·虹口区二模)端午节吃粽子是我国的传统习俗.一盘中放有10个外观完全相同的粽子,其中豆沙粽3个,肉粽3个,白米粽4个,现从盘子任意取出3个,则取到白米粽的个数的数学期望为  .
【解析】 设取到白米粽的个数为随机变量X,则X=0,1,2,3,所以P(X=0)===,P(X=1)===,P(X=2)===,P(X=3)===,所以E(X)=+2×+3×=.
2.为发展业务,某调研组对A,B两个公司的扫码支付情况进行调查,准备从国内n(n∈N,n>0)个人口超过1 000万的超大城市和8个人口低于100万的小城市中随机抽取若干个进行统计.若一次抽取2个城市,全是小城市的概率为.
(1)求n的值;
(2)若一次抽取4个城市,
①假设抽取出的小城市的个数为X,求X的分布列;
②若抽取的4个城市是同一类城市,求全为超大城市的概率.
【解析】 (1)从(n+8)个城市中一次抽取2个城市,有C种情况,其中全是小城市的有C种情况,则全是小城市的概率为==,解得n=7(负值舍去).
(2)①由题意可知,X的可能取值为0,1,2,3,4,
则P(X=0)==,P(X=1)==,
P(X=2)==,P(X=3)==,
P(X=4)==.
故X的分布列为
X 0 1 2 3 4
P
②若抽取的4个城市全是超大城市,共有C=35种情况;若抽取的4个城市全是小城市,共有C=70种情况,所以若抽取的4个城市是同一类城市,则全为超大城市的概率为=.核心考点3 离散型随机变量的期望与方差
核心知识· 精归纳
1.离散型随机变量分布列的性质
(1)pi_≥__0,i=1,2,3,…,n;
(2)p1+p2+…+pn=_1__.
2.数学期望的公式:E(X)=_x1p1+x2p2+…+xnpn__.
3.方差的公式:D(X)=(x1-E(X))2p1+(x2-E(X))2p2+…+(xn-E(X))2pn= (xi-E(X))2pi .
4.均值与方差的性质
(1)E(aX+b)=_aE(X)+b__.
(2)D(aX+b)=_a2D(X)__.
典例研析· 悟方法
角度1:离散型随机变量均值与方差的计算
典例5 设有3个投球手,其中一人命中率为q,剩下的两人水平相当且命中率均为p(p,q∈(0,1)),每位投球手均独立投球一次,记投球命中的总次数为随机变量为ξ.
(1)当p=q=时,求数学期望E(ξ)及方差D(ξ);
(2)当p+q=1时,将ξ的数学期望E(ξ)用p表示.
【解析】 (1)∵每位投球手均独立投球一次,
当p=q=时,每次试验事件发生的概率相等,
∴ξ~B,由二项分布的期望和方差公式得到结果
∴E(ξ)=np=3×=,D(ξ)=np(1-p)=3××=.
(2)ξ的可取值为0,1,2,3.
P(ξ=0)=(1-q)(1-p)2=pq2;
P(ξ=1)=q(1-p)2+(1-q)Cp(1-p)=q3+2p2q;
P(ξ=2)=qCp(1-p)+(1-q)p2=2pq2+p3;
P(ξ=3)=qp2.
ξ的分布列为
ξ 0 1 2 3
P pq2 q3+2p2q 2pq2+p3 qp2
E(ξ)=0×pq2+1×(q3+2p2q)+2×(2pq2+p3)+3×qp2=1+p.
角度2:随机变量分布列的综合应用
典例6 (2023·甘肃一模)如图,李先生家住H小区,他工作在C科技园区,从家开车到公司上班路上有L1、L2两条路线,L1路线上有A1、A2、A3三个路口,各路口遇到红灯的概率均为;L2路线上有B1、B2两个路口,各路口遇到红灯的概率依次为,.
(1)若走L1路线,求最多遇到1次红灯的概率;
(2)若走L2路线,求遇到红灯次数X的数学期望;
(3)按照“平均遇到红灯次数最少”的要求,请你帮助李先生从上述两条路线中选择一条最好的上班路线,并说明理由.
【解析】 (1)设“走L1路线最多遇到1次红灯”为事件A,包括没有遇到红灯和只遇到红灯一次两种情况.
则P(A)=C×3+C××2=,
所以走L1路线,最多遇到1次红灯的概率为.
(2)依题意,X的可能取值为0,1,2.
P(X=0)=×=,P(X=1)=×+×=,P(X=2)=×=.
随机变量X的分布列为:
X 0 1 2
P
所以E(X)=×0+×1+×2=.
(3)设选择L1路线遇到红灯次数为Y,随机变量Y服从二项分布Y~B,所以E(Y)=3×=.
因为E(X)<E(Y),所以选择L2路线上班最好.
角度3:概率的综合问题
典例7 (2023·茂名二模)马尔可夫链是因俄国数学家安德烈·马尔可夫得名,其过程具备“无记忆”的性质,即第n+1次状态的概率分布只跟第n次的状态有关,与第n-1,n-2,n-3,…次状态是“没有任何关系的”.现有甲、乙两个盒子,盒子中都有大小、形状、质地相同的2个红球和1个黑球.从两个盒子中各任取一个球交换,重复进行n(n∈N*)次操作后,记甲盒子中黑球个数为Xn,甲盒中恰有1个黑球的概率为an,恰有2个黑球的概率为bn.
(1)求X1的分布列;
(2)求数列{an}的通项公式;
(3)求Xn的期望.
【解析】 (1)由题可知,X1的可能取值为0,1,2,由相互独立事件概率乘法公式可知:P(X1=0)=×=,P(X1=1)=×+×=,P(X1=2)=×=,
故X1的分布列如下表:
X1 0 1 2
P
(2)由全概率公式可知:
P(Xn+1=1)=P(Xn=1)P(Xn+1=1|Xn=1)+P(Xn=2)P(Xn+1=1|Xn=2)+P(Xn=0)P(Xn+1=1|Xn=0)
=P(Xn=1)+P(Xn=2)+P(Xn=0)
=P(Xn=1)+P(Xn=2)+P(Xn=0),
即:an+1=an+bn+(1-an-bn),
所以an+1=-an+,
所以an+1-=-,
又a1=P(X1=1)=,
所以,数列是以a1-为首项,以-为公比的等比数列,
所以an-=-×n-1=×n,
即:an=+×n.
(3)由全概率公式可得:P(Xn+1=2)=P(Xn=1)·P(Xn+1=2|Xn=1)+P(Xn=2)P(Xn+1=2|Xn=2)+P(Xn=0)P(Xn+1=2|Xn=0)
=P(Xn=1)+P(Xn=2)+0×P(Xn=0),
即:bn+1=an+bn,
又an=+×n,
所以bn+1=bn+×,
所以bn+1-+×n+1=×,
又b1=P(X1=2)=,
所以b1-+×=--=0,
所以bn-+×n=0,
所以bn=-×n,
所以E(Xn)=an+2bn+0×(1-an-bn)=an+2bn=1.
方法技巧· 精提炼
1.决策问题的解题关注点
(1)关注均值:随机变量的均值反映了随机变量取值的平均水平
(2)关注方差:方差反映了随机变量稳定于均值的程度,它们从整体和局部上刻画了随机变量,是生产实际中用于方案取舍的重要理论依据;
(3)先后顺序:一般先比较均值,若均值相等,再用方差来解决.
2.交汇问题的解题关键
离散型随机变量及其分布列常与函数、数列等知识结合运用,解决这类问题的关键是:
(1)建立函数、数列等数学模型,将问题进行合理转化;
(2)结合模型进行分析,并与相关变量融合,结合离散型随机变量的相关知识及性质求解.
加固训练· 促提高
1. (2023·贵州模拟)据世界田联官方网站消息,原定于2023年5月13、14日在中国广州举办的世界田联接力赛延期至2025年4月至5月举行.据了解,甲、乙、丙三支队伍将会参加2025年4月至5月在广州举行的4×400米接力的角逐.接力赛分为预赛、半决赛和决赛,只有预赛、半决赛都获胜才能进入决赛.已知甲队在预赛和半决赛中获胜的概率分别为和;乙队在预赛和半决赛中获胜的概率分别为和;丙队在预赛和半决赛中获胜的概率分别为和.
(1)甲、乙、丙三队中,谁进入决赛的可能性最大;
(2)设甲、乙、丙三队中进入决赛的队伍数为ξ,求ξ的分布列.
【解析】 (1)甲队进入决赛的概率为×=,
乙队进入决赛的概率为×=,
丙队进入决赛的概率为×=,
显然乙队进入决赛的概率最大,所以乙进入决赛的可能性最大.
(2)由(1)可知:甲、乙、丙三队进入决赛的概率分别为,,,
ξ的可能取值为0,1,2,3,
P(ξ=0)==,P(ξ=2)=××+××+××=,P(ξ=3)=××=,P(ξ=1)=1-P(ξ=0)-P(ξ=2)-P(ξ=3)=1---=,
故ξ的分布列为:
ξ 0 1 2 3
P
2.已知10件不同的产品中共有3件次品,现对它们进行一一测试,直到找出所有3件次品为止.
(1)求恰好在第5次测试时3件次品全部被测出的概率;
(2)记恰好在第k次测试时3件次品全部被测出的概率为f(k),求f(k)的最大值和最小值.
【解析】 (1)若恰好在第5次测试时3件次品全部被测出,则第5次取出第3件次品,前4次中有2次是次品,2次是正品;
则有ACA种情况,从10件产品中按顺序取出5件,有A种情况,
则第5次测试时3件次品全部被测出的概率P==.
(2)根据题意,分析可得k的范围是3≤k≤9,
当3≤k≤6时,若恰好在第k次测试时3件次品全部被测出,则第k次取出第3件次品,前(k-1)次中有2次是次品,(k-3)次是正品;而从10件产品中按顺序取出k件,有A种情况,则f(k)==(k2-3k+2),
则f(3)=,f(4)=,f(5)=,f(6)=;
当k=7时,即恰好在第7次测试时3件次品全部被测出,有两种情况,一是第7次取出第3件次品,前6次中有2次是次品,4次是正品;二是前7次没有取出次品,此时也可以测出三件次品,
则f(7)==;
当k=8时,即恰好在第8次测试时3件次品全部被测出,有两种情况,一是第8次取出第3件次品,前7次中有2次是次品,5次是正品;二是前7次恰有一次次品,第8次取出为合格品,
则f(8)==;
当k=9时,此时f(9)=1-f(3)-f(4)-f(5)-f(6)-f(7)-f(8)=,
故f(k)min=f(3)=,f(k)max=f(9)=.第3讲 统计与成对数据的分析
高频考点 高考预测
随机抽样与用样本估计总体 以社会热点话题为背景,结合“五育并举”,考查随机抽样与用样本估计总体,线性回归方程的求解与运用,独立性检验问题.常与概率综合考查,中等难度.
频率分布直方图
回归分析及其应用
独立性检验
1. (2021·全国甲卷)为了解某地农村经济情况,对该地农户家庭年收入进行抽样调查,将农户家庭年收入的调查数据整理得到如下频率分布直方图:
根据此频率分布直方图,下面结论中不正确的是( C )
A.该地农户家庭年收入低于4.5万元的农户比率估计为6%
B.该地农户家庭年收入不低于10.5万元的农户比率估计为10%
C.估计该地农户家庭年收入的平均值不超过6.5万元
D.估计该地有一半以上的农户,其家庭年收入介于4.5万元至8.5万元之间
【解析】 该地农户家庭年收入低于4.5万元的农户比率为(0.02+0.04)×1=0.06=6%,故选项A正确;该地农户家庭年收入不低于10.5万元的农户比率为(0.04+0.02×3)×1=0.1=10%,故选项B正确;估计该地农户家庭年收入的平均值为3×0.02+4×0.04+5×0.1+6×0.14+7×0.2+8×0.2+9×0.1+10×0.1+11×0.04+12×0.02+13×0.02+14×0.02=7.68>6.5万元,故选项C错误;家庭年收入介于4.5万元至8.5万元之间的频率为(0.1+0.14+0.2+0.2)×1=0.64>0.5,故估计该地有一半以上的农户,其家庭年收入介于4.5万元至8.5万元之间,故选项D正确.故选C.
2. (2022·全国甲卷)某社区通过公益讲座以普及社区居民的垃圾分类知识.为了解讲座效果,随机抽取10位社区居民,让他们在讲座前和讲座后各回答一份垃圾分类知识问卷,这10位社区居民在讲座前和讲座后问卷答题的正确率如下图:
则( B )
A.讲座前问卷答题的正确率的中位数小于70%
B.讲座后问卷答题的正确率的平均数大于85%
C.讲座前问卷答题的正确率的标准差小于讲座后正确率的标准差
D.讲座后问卷答题的正确率的极差大于讲座前正确率的极差
【解析】 讲座前中位数为>70%,所以A错;讲座后问卷答题的正确率只有一个是80%,4个85%,剩下全部大于等于90%,所以讲座后问卷答题的正确率的平均数大于85%,所以B对;讲座前问卷答题的正确率更加分散,所以讲座前问卷答题的正确率的标准差大于讲座后正确率的标准差,所以C错;讲座后问卷答题的正确率的极差为100%-80%=20%,讲座前问卷答题的正确率的极差为95%-60%=35%>20%,所以D错.故选B.
3. (2021·全国乙卷)某厂研制了一种生产高精产品的设备,为检验新设备生产产品的某项指标有无提高,用一台旧设备和一台新设备各生产了10件产品,得到各件产品该项指标数据如下:
旧设备 9.8 10.3 10.0 10.2 9.9 9.8 10.0 10.1 10.2 9.7
新设备 10.1 10.4 10.1 10.0 10.1 10.3 10.6 10.5 10.4 10.5
旧设备和新设备生产产品的该项指标的样本平均数分别记为和,样本方差分别记为s和s.
(1)求,,s,s;
(2)判断新设备生产产品的该项指标的均值较旧设备是否有显著提高(如果-≥2,则认为新设备生产产品的该项指标的均值较旧设备有显著提高,否则不认为有显著提高).
【解析】 (1)由题中的数据可得,
=×(9.8+10.3+10.0+10.2+9.9+9.8+10.0+10.1+10.2+9.7)=10,
=×(10.1+10.4+10.1+10.0+10.1+10.3+10.6+10.5+10.4+10.5)=10.3,
s=×[(9.8-10)2+(10.3-10)2+(10-10)2+(10.2-10)2+(9.9-10)2+(9.8-10)2+(10-10)2+(10.1-10)2+(10.2-10)2+(9.7-10)2]=0.036;
s=×[(10.1-10.3)2+(10.4-10.3)2+(10.1-10.3)2+(10.0-10.3)2+(10.1-10.3)2+(10.3-10.3)2+(10.6-10.3)2+(10.5-10.3)2+(10.4-10.3)2+(10.5-10.3)2]=0.04.
(2)-=10.3-10=0.3,
2=2=2≈0.174,
所以->2,
故新设备生产产品的该项指标的均值较旧设备有显著提高.
4. (2022·全国乙卷)某地经过多年的环境治理,已将荒山改造成了绿水青山.为估计一林区某种树木的总材积量,随机选取了10棵这种树木,测量每棵树的根部横截面积(单位:m2)和材积量(单位:m3),得到如下数据:
样本号i 1 2 3 4 5 6 7 8 9 10 总和
根部横截面积xi 0.04 0.06 0.04 0.08 0.08 0.05 0.05 0.07 0.07 0.06 0.6
材积量yi 0.25 0.40 0.22 0.54 0.51 0.34 0.36 0.46 0.42 0.40 3.9
并计算得=0.038,=1.615 8,iyi=0.247 4.
(1)估计该林区这种树木平均一棵的根部横截面积与平均一棵的材积量;
(2)求该林区这种树木的根部横截面积与材积量的样本相关系数(精确到0.01);
(3)现测量了该林区所有这种树木的根部横截面积,并得到所有这种树木的根部横截面积总和为186 m2.已知树木的材积量与其根部横截面积近似成正比.利用以上数据给出该林区这种树木的总材积量的估计值.
附:相关系数r=,≈1.377.
【解析】 (1)样本中10棵这种树木的根部横截面积的平均值==0.06,
样本中10棵这种树木的材积量的平均值==0.39,
据此可估计该林区这种树木平均一棵的根部横截面积为0.06 m2,
平均一棵的材积量为0.39 m3.
(2)r=


=≈≈0.97,
则r≈0.97.
(3)设该林区这种树木的总材积量的估计值为Y m3,
又已知树木的材积量与其根部横截面积近似成正比,
可得=,解之得Y=1 209 m3.
则该林区这种树木的总材积量估计为1 209 m3.
5. (2022·全国甲卷)甲、乙两城之间长途客车均由A和B两家公司运营,为了解这两家公司长途客车的运行情况,随机调查了甲、乙两城之间的500个班次,得到下面列联表:
准点班次数 未准点班次数
A 240 20
B 210 30
(1)根据上表,分别估计这两家公司甲、乙两城之间的长途客车准点的概率;
(2)能否有90%的把握认为甲、乙两城之间的长途客车是否准点与客车所属公司有关?
附:K2=,
P(K2≥k) 0.100 0.050 0.010
k 2.706 3.841 6.635
【解析】 (1)根据表中数据,A家公司共有班次260次,准点班次有240次,
设A家公司长途客车准点事件为M,
则P(M)==;
B家公司共有班次240次,准点班次有210次,
设B家公司长途客车准点事件为N,
则P(N)==,
A家公司长途客车准点的概率为;
B家公司长途客车准点的概率为.
(2)列联表
准点班次数 未准点班次数 合计
A 240 20 260
B 210 30 240
合计 450 50 500
K2=
=≈3.205>2.706,
根据临界值表可知,有90%的把握认为甲、乙两城之间的长途客车是否准点与客车所属公司有关.
6. (2023·全国乙卷理科)某厂为比较甲、乙两种工艺对橡胶产品伸缩率的处理效应,进行10次配对试验,每次配对试验选用材质相同的两个橡胶产品,随机地选其中一个用甲工艺处理,另一个用乙工艺处理,测量处理后的橡胶产品的伸缩率,甲、乙两种工艺处理后的橡胶产品的伸缩率分别记为xi,yi(i=1,2,…,10).试验结果如下:
试验序号i 1 2 3 4 5 6 7 8 9 10
伸缩率xi 545 533 551 522 575 544 541 568 596 548
伸缩率yi 536 527 543 530 560 533 522 550 576 536
记zi=xi-yi(i=1,2,…,10),记z1,z2,…,z10的样本平均数为,样本方差为s2.
(1)求,s2;
(2)判断甲工艺处理后的橡胶产品的伸缩率较乙工艺处理后的橡胶产品的伸缩率是否有显著提高.(如果≥2,则认为甲工艺处理后的橡胶产品的伸缩率较乙工艺处理后的橡胶产品的伸缩率有显著提高,否则不认为有显著提高)
【解析】 (1)根据表中数据,计算zi=xi-yi(i=1,2,…,10),填表如下:
试验序号i 1 2 3 4 5 6 7 8 9 10
伸缩率xi 545 533 551 522 575 544 541 568 596 548
伸缩率yi 536 527 543 530 560 533 522 550 576 536
zi=xi-yi 9 6 8 -8 15 11 19 18 20 12
计算平均数为=i=×(9+6+8-8+15+11+19+18+20+12)=11,
方差为s2=(zi-)2=×[(-2)2+(-5)2+(-3)2+(-19)2+42+02+82+72+92+12]=61.
(2)由(1)知,=11,2=2<2=5,
所以>2,认为甲工艺处理后的橡胶产品的伸缩率较乙工艺处理后的橡胶产品的伸缩率有显著提高.
7. (2023·全国甲卷理科)为探究其药物对小鼠的生长抑制作用,将40只小鼠均分为两组,分别为对照组(不加药物)和实验组(加药物).
(1)设其中两只小鼠中对照组小鼠数目为X,求X的分布列和数学期望;
(2)测得40只小鼠体重如下(单位:g):(已按从小到大排好)
对照组:17.3 18.4 20.1 20.4 21.5 23.2
24.6 24.8 25.0 25.4 26.1 26.3 26.4
26.5 26.8 27.0 27.4 27.5 27.6 28.3
实验组:5.4 6.6 6.8 6.9 7.8 8.2 9.4
10.0 10.4 11.2 14.4 17.3 19.2 20.2
23.6 23.8 24.5 25.1 25.2 26.0
①求40只小鼠体重的中位数m,并完成下面2×2列联表:
<m ≥m
对照组
实验组
②根据2×2列联表,能否有95%的把握认为药物对小鼠生长有抑制作用.
参考数据:
k0 0.10 0.05 0.010
P(k2≥k0) 2.706 3.841 6.635
【解析】 (1)根据题意可得X=0,1,2,
又P(X=0)==,
P(X=1)==,
P(X=2)==,
∴X的分布列为:
X 0 1 2
P
∴E(X)=0×+1×+2×=1.
(2)①由于源数据已经排好,我们只需观察对照组第一排数据与实验组第二排数据即可,
可得第11位数据为14.4,后续依次为17.3,17.3,18.4,19.2,20.1,20.2,20.4,21.5,23.2,23.6,…,
故第20位数为23.2,第21位数为23.6,
∴m==23.4,
∴补全列联表为:
<m ≥m 合计
对照组 6 14 20
实验组 14 6 20
合计 20 20 40
②由①可知K2==6.400>3.841,
∴能有95%的把握认为药物对小鼠生长有抑制作用.
核心考点1 抽样方法
核心知识· 精归纳
1.两种抽样方法:简单随机抽样、分层随机抽样
2.分层随机抽样的样本均值
在分层随机抽样中,如果层数分为2层,第1层和第2层包含的个体数分别为M和N,抽取的样本量分别为m和n,第1层和第2层样本的平均数分别为,,则样本的平均数=+=+.
多维题组· 明技法
角度1:简单随机抽样
1.用简单随机抽样的方法从含有10个个体的总体中抽取一个容量为3的样本,其中某一个体a“第一次被抽到”的可能性与“第二次被抽到”的可能性分别是( A )
A., B.,
C., D.,
【解析】 在抽样过程中,个体a每一次被抽中的概率是相等的,因为总体容量为10,故个体a“第一次被抽到”的可能性与“第二次被抽到”的可能性均为.
2.我国古代数学名著《数书九章》中有“米谷粒分”问题:“开仓受纳,有甲户米一千五百三十四石到廊.验得米内夹谷,乃于样内取米一捻,数计二百五十四粒,内有谷二十八颗.今欲知米内杂谷多少.”意思是:官府开仓接受百姓纳粮,甲户交米1 534石到廊前,检验出米里夹杂着谷子,于是从米样粒取出一捻,数出共254粒,其中有谷子28颗,则这批米内有谷子约_169__石(结果四舍五入保留整数).
【解析】 依题意可得米内夹谷的比例为=,所以这批米内有谷子1 534×≈169石.
角度2:分层随机抽样的应用
3. (2023·上饶二模)为了支持民营企业发展壮大,帮助民营企业解决发展中的困难,某市政府采用分层抽样调研走访各层次的民营企业.该市的小型企业、中型企业、大型企业分别有900家、90家、10家.若大型企业的抽样家数是2,则中型企业的抽样家数应该是( C )
A.180 B.90
C.18 D.9
【解析】 该市中型企业和大型企业的家数比为9∶1,由分层抽样的意义可得中型企业的抽样家数应该是9×2=18.故选C.
4. (2023·吴忠模拟)在学生人数比例为2∶3∶5的A,B,C三所学校中,用分层抽样方法招募n名志愿者,若在A学校恰好选出了6名志愿者,那么n=( C )
A.15 B.20
C.30 D.60
【解析】 ∵学生人数比例为2∶3∶5,A校恰好抽出了6名志愿者,∴n=×6=30,故选C.
方法技巧· 精提炼
1.简单随机抽样
(1)简单随机抽样需满足:被抽取的样本总体的个体数有限;逐个抽取;等可能抽取.
(2)简单随机抽样一般有抽签法(适用于总体中个体数较少的情况)、随机数法(适用于个体数较多的情况)
2.分层随机抽样中有关计算的方法
(1)抽样比==.
(2)在分层随机抽样中,如果层数分为两层,第一层的样本量为m,平均值为x;第二层的样本量为n,平均值为y,则样本的平均值为.
加固训练· 促提高
1.下列抽取样本的方式属于简单随机抽样的个数为( A )
①从无限多个个体中抽取100个个体作为样本;
②从20件玩具中一次性抽取3件进行质量检验;
③某班有56名同学,指定个子最高的5名同学参加学校组织的篮球赛.
A.0 B.1
C.2 D.3
【解析】 ①不是简单随机抽样.因为被抽取样本的总体的个数是无限的,而不是有限的.②不是简单随机抽样.因为这是“一次性”抽取,而不是“逐个”抽取.③不是简单随机抽样.因为不是等可能抽样.故选A.
2. (2023·江西模拟)目前,甲型流感病毒在国内传播,据某市卫健委通报,该市流行的甲型流感病毒,以甲型H1N1亚型病毒为主,假如该市某小区共有100名感染者,其中有10名年轻人,60名老年人,30名儿童,现用分层抽样的方法从中随机抽取20人进行检测,则做检测的老年人人数为( C )
A.6 B.10
C.12 D.16
【解析】 老年人做检测的人数为20×=12.故选C.核心考点2 用样本估计总体
核心知识· 精归纳
1.频率分布直方图的相关结论
(1)直方图中各小长方形的面积之和为1.
(2)直方图中纵轴表示,故每组样本的频率为组距×,即矩形的面积.
(3)直方图中每组样本的频数为频率×总数.
2.中位数、众数、平均数、百分位数
(1)中位数
将一组数据按大小依次排列,处于最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的_中位数__.
(2)众数
一组数据中出现次数_最多__的数据称为这组数据的众数.
(3)平均数
一组数据的_算术平均数__即为这组数据的平均数,n个数据x1,x2,…,xn的平均数= (x1+x2+…+xn) .
(4)百分位数
①第p百分位数的定义:一般地,一组数据的第p百分位数是这样一个值,它使得这组数据中至少有p%的数据_小于或等于__这个值,且至少有 (100-p)% 的数据大于或等于这个值.
②计算一组n个数据的第p百分位数的步骤:
第1步,按_从小到大__排列原始数据.
第2步,计算i=_n×p%__.
第3步,若i不是整数,而大于i的比邻整数为j,则第p百分位数为第j项数据;若i是整数,则第p百分位数为第i项与第_(i+1)__项数据的平均数.
3.样本的数字特征
如果有n个数据x1,x2,…,xn,那么:
平均数为= (x1+x2+…+xn) ,
标准差为
s=,
方差为s2= [(x1-)2+(x2-)2+…+(xn-)2] .
多维题组· 明技法
角度1:统计图表
1. (2023·郑州三模)为了树立和践行绿水青山就是金山银山的理念,A市某高中全体教师于2023年3月12日开展植树活动,购买柳树、银杏、梧桐、樟树四种树苗共计600棵,比例如图所示.青年教师、中年教师、老年教师报名参加植树活动的人数之比为5∶3∶2,若每种树苗均按各年龄段报名人数的比例进行分配,则中年教师应分得梧桐的数量为( C )
A.30棵 B.50棵
C.72棵 D.80棵
【解析】 由题意可知,梧桐树苗有40%×600=240颗,根据人数占比可得中年教师应分得梧桐的数量为240×=72颗.故选C.
2. (2023·市中区校级二模)某调查机构抽取了部分关注济南地铁建设的市民作为样本,分析其年龄和性别结构,并制作出如下等高条形图.根据图中(35岁以上含35岁)的信息,关于该样本的结论不一定正确的是( C )
A.男性比女性更关注地铁建设
B.关注地铁建设的女性多数是35岁以上
C.35岁以下的男性人数比35岁以上的女性人数多
D.35岁以上的人对地铁建设关注度更高
【解析】 由等高条形图可得:由左图知,样本中男性数量多于女性数量,所以男性比女性更关注地铁建设,故A正确;由右图知女性中35岁以上的占多数,从而样本中多数女性是35岁以上,从而得到关注地铁建设的女性多数是35岁以上,故B正确;由左图知男性人数大于女性人数,由右图知35岁以下的男性占男性人数比35岁以上的女性占女性人数的比例少,所以无法判断35岁以下的男性人数与35岁以上的女性人数的多少,故C不一定正确;由右图知样本中35岁以上的人对地铁建设关注度更高,故D正确.故选C.
3. (2023·雁塔区校级模拟)某滑冰馆统计了某小区居民在该滑冰馆一个月的锻炼天数,得到如图所示的频率分布直方图(将频率视为概率),则下列说法正确的是( B )
A.该小区居民在该滑冰馆的锻炼天数在区间(25,30]内的最少
B.估计该小区居民在该滑冰馆的锻炼天数超过15天的概率为0.465
C.估计该小区居民在该滑冰馆的锻炼天数的中位数为16
D.估计小区居民在该滑冰馆的锻炼天数的平均值为15
【解析】 该小区居民在该滑冰馆的锻炼天数在区间(20,25]内的最少,A错误;估计该小区居民在该滑冰馆的锻炼天数超过15天的概率为(0.06+0.013+0.02)×5=0.465,B正确;(0.02+0.04)×5=0.3,(0.02+0.04+0.047)×5=0.535,∴中位数落在区间[10,15),设中位数为x,则:0.3+(x-10)×0.047=0.5,解得x≈14,C错误;0.013×5×+0.04×5×+0.047×5×+0.06×5×+0.013×5×+0.02×5×≈14,D错误.故选B.
角度2:样本与总体数据的估计
4. (2023·长沙模拟)某校1 000名学生参加环保知识竞赛,随机抽取了20名学生的考试成绩(单位:分),成绩的频率分布直方图如图所示,则下列说法正确的是( D )
A.频率分布直方图中a的值为0.004
B.估计这20名学生考试成绩的第60百分位数为75
C.估计这20名学生数学考试成绩的众数为80
D.估计总体中成绩落在[60,70)内的学生人数为150
【解析】 由频率分布直方图,得:10(2a+3a+7a+6a+2a)=1,解得a=0.005,故A错误;前三个矩形的面积和为10(2a+3a+7a)=0.6,∴这20名学生数学考试成绩的第60百分数为80,故B错误;这20名学生数学考试成绩的众数为75,故C错误;总体中成绩落在[60,70)内的学生人数为3a×10×1 000=150,故D正确.故选D.
5. (多选)(2023·台江区校级模拟)在某市高三年级举行的一次调研考试中,共有30 000人参加考试.为了解考生的某科成绩情况,抽取了样本容量为n的部分考生成绩,已知所有考生成绩均在[50,100],按照[50,60),[60,70),[70,80),[80,90),[90,100]的分组作出如图所示的频率分布直方图.若在样本中,成绩落在区间[50,60)的人数为16,则由样本估计总体可知下列结论正确的为( AC )
A.x=0.016
B.n=1 000
C.考生成绩的第70百分位数为76
D.估计该市全体考生成绩的平均分为71
【解析】 因为(x+0.030+0.040+0.010+0.004)×10=1,解得x=0.016,故A正确;因为成绩落在区间[50,60)内的人数为16,所以样本容量n==100,故B错误;因为(0.016+0.030)×10=0.46<0.7,(0.016+0.030+0.040)×10=0.86>0.7,所以考生成绩的第70百分位数落在区间[70,80),设考生成绩的第70百分位数为x,则0.46+(x-70)×0.04=0.7,解得x=76,即考生成绩的第70百分位数为76,故C正确;学生成绩平均分为0.016×10×55+0.030×10×65+0.040×10×75+0.010×10×85+0.004×10×95=70.6,故D错误.故选AC.
角度3:样本数据的数字特征
6. (2023·河南三模)某学校对班级管理实行量化打分,每周一总结,若一个班连续5周的量化打分不低于80分,则为优秀班级.下列能断定该班为优秀班级的是( D )
A.某班连续5周量化打分的平均数为83,中位数为81
B.某班连续5周量化打分的平均数为83,方差大于0
C.某班连续5周量化打分的中位数为81,众数为83
D.某班连续5周量化打分的平均数为83,方差为1
【解析】 根据题意,依次分析选项:对于A,若数据为88,87,81,80,79,满足平均数为83,中位数为81,但不能断定该班为优秀班级;对于B,若数据为88,87,81,80,79,满足平均数为83,其方差一定大于0,但不能断定该班为优秀班级;对于C,若数据为83,83,81,80,79,满足中位数为81,众数为83,但不能断定该班为优秀班级;对于D,设数据的最低分为x,若数据平均数为83,方差为1,则有(83-x)2<5,必有x>80,可以断定该班为优秀班级.故选D.
7. (2023·雁峰区校级模拟)若数据x1+m、x2+m、…、xn+m的平均数是5,方差是4,数据3x1+1、3x2+1、…、3xn+1的平均数是10,标准差是s,则下列结论正确的是( A )
A.m=2,s=6 B.m=2,s=36
C.m=4,s=6 D.m=4,s=36
【解析】 根据题意,设数据x1、x2、…、xn的平均数为,标准差为σ,数据3x1+1、3x2+1、…、3xn+1的平均数是10,则=+1=3+1=10,可得=3,而数据x1+m、x2+m、…、xn+m的平均数是5,则有=+m=+m=5,可得m=2,由方差公式可得==σ2=4,s2===9σ2=36,解得s=6.故选A.
方法技巧· 精提炼
1.关于平均数、方差的计算
(1)利用平均数、方差的性质可简化运算,要熟记.
(2)方差描述一组数据围绕平均数波动的幅度.
2.频率分布直方图中数字特征的计算
(1)最高的小长方形底边中点的横坐标即是众数.
(2)中位数左边和右边的小长方形的面积和是相等的.
(3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和.
加固训练· 促提高
1. (2023·湖北模拟)云南某镇因地制宜,在政府的带领下,数字力量赋能乡村振兴,利用“农抬头”智慧农业平台,通过大数据精准分析柑橘等特色产业的生产数量、价格走势、市场供求等数据,帮助小农户找到大市场,开启“直播+电商”销售新模式,推进当地特色农产品“走出去”;通过“互联网+旅游”聚焦特色农产品、绿色食品、生态景区资源.下面是2022年7月到12月份该镇甲、乙两村销售收入统计数据(单位:百万):
甲:5,6,6,7,8,16;
乙:4,6,8,9,10,17.
根据上述数据,则( B )
A.甲村销售收入的第50百分位数为7百万
B.甲村销售收入的平均数小于乙村销售收入的平均数
C.甲村销售收入的中位数大于乙村销售收入的中位数
D.甲村销售收入的方差大于乙村销售收入的方差
【解析】 因为6×0.5=3,所以这组数据的第50百分位数为=6.5,故A错误;甲=×(5+6+6+7+8+16)=8,乙=×(4+6+8+9+10+17)=9,故甲村销售收入的平均数小于乙村销售收入的平均数,故B正确;甲村销售收入的中位数为=6.5,乙村销售收入的中位数为=8.5,则甲村销售收入的中位数小于乙村销售收入的中位数,故C错误;甲村销售收入的方差s=×[(5-8)2+(6-8)2+(6-8)2+(7-8)2+(8-8)2+(16-8)2]=,乙村销售收入的方差s=×[(4-9)2+(6-9)2+(8-9)2+(9-9)2+(10-9)2+(17-9)2]=,所以甲村销售收入的方差小于乙村销售收入的方差,故D错误.故选B.
2. (2023·碑林区校级模拟)如图,一组数据x1,x2,x3,…,x9,x10的平均数为5,方差为s,去除x9,x10这两个数据后,平均数为,方差为s,则( D )
A.>5,s>s B.<5,s<s
C.=5,s<s D.=5,s>s
【解析】 由题意可得:i=5,x9=1,x10=9,则i=50,故=i=(i-x9-x10)=(50-1-9)=5,∵x9,x10是波幅最大的两个点的值,则去除x9,x10这两个数据后,整体波动性减小,故s>s.故选D.核心考点3 经验回归方程
核心知识· 精归纳
1.相关系数:r=.
2.经验回归方程:将=x+称为y关于x的经验回归方程,其中=,=- ,(,)称为样本中心.
典例研析· 悟方法
典例1 (2023·济南模拟)第24届冬奥会于2022年2月4日在北京市和张家口市联合举行,此项赛事大大激发了国人冰雪运动的热情.某滑雪场在冬奥会期间开业,下表统计了该滑雪场开业第x天的滑雪人数y(单位:百人)的数据.
天数代码x 1 2 3 4 5 6 7
滑雪人数y/百人 11 13 16 15 20 21 23
(1)根据第1至7天的数据分析,可用线性回归模型拟合y与x的关系,请用样本相关系数加以说明(保留两位有效数字);
(2)经过测算,若一天中滑雪人数超过3 000人时,当天滑雪场可实现盈利,请建立y关于x的经验回归方程,并预测该滑雪场开业的第几天开始盈利.
附注:参考数据:iyi=532,≈57.5.
参考公式:对于一组数据(u1,v1),(u2,v2),…,(un,vn),其样本相关系数r=.
【解析】 (1)因为=4,=17,所以(xi-)·(yi-)=iyi-=532-7×4×17=56,
所以r=≈≈0.97,
因为样本相关系数|r|接近于1,所以可以推断x和y这两个变量线性相关,且相关程度很强.
(2)因为(xi-)2=(1-4)2+(2-4)2+(3-4)2+…+(7-4)2=28,
所以===2,因为=- =17-2×4=9,所以经验回归方程为=2x+9,因为一天中滑雪人数超过3 000人时,当天滑雪场可实现盈利,即2x+9>30时,可实现盈利,解得x>10.5,所以根据经验回归方程预测,该滑雪场开业的第11天开始盈利.
方法技巧· 精提炼
求回归直线方程的方法
(1)若所求的回归直线方程是在选择题中,常利用回归直线必经过样本点的中心(,)快速解决.
(2)若所求的回归直线方程是在解答题中,则求回归直线方程的一般步骤:
①依据样本数据画出散点图,确定两个变量具有线性相关关系;
②计算,,,iyi的值;
③计算回归系数,;
④写出回归直线方程=x+.
加固训练· 促提高
(2023·吕梁三模)数据显示中国车载音乐已步入快速发展期,随着车载音乐的商业化模式进一步完善,市场将持续扩大,下表为2018—2022年中国车载音乐市场规模(单位:十亿元),其中年份2018—2022对应的代码分别为1~5.
年份代码x 1 2 3 4 5
车载音乐市场规模y 2.8 3.9 7.3 12.0 17.0
(1)由上表数据知,可用指数函数模型y=a·bx拟合y与x的关系,请建立y关于x的回归方程(a,b的值精确到0.1);
(2)综合考虑2023年及2024年的经济环境及疫情等因素,某预测公司根据上述数据求得y关于x的回归方程后,通过修正,把b-1.3作为2023年与2024年这两年的年平均增长率,请根据2022年中国车载音乐市场规模及修正后的年平均增长率预测2024年的中国车载音乐市场规模.
参考数据:
ivi e0.524 e0.472
1.94 33.82 1.7 1.6
其中vi=ln yi,=i.
参考公式:对于一组数据(u1,v1),(u2,v2),…,(un,vn),其回归直线=+u的斜率和截距的最小二乘估计公式分别为=,=v-u.
【解析】 (1)因为y=a·bx,所以两边同时取常用对数,得ln y=ln a+xln b,
设v=ln y,所以v=ln a+xln b,设α=ln a,β=ln b,
因为=3,=1.94,
所以===0.472,=- =1.94-0.472×3=0.524,
所以ln =0.524,ln =0.472,
所以=e0.524=1.7,=e0.472=1.6,
所以=1.7×1.6x.
(2)由题意知2023年与2024年这两年的年平均增长率1.6-1.3=0.3,
2022年中国车载音乐市场规模为1.7,
故预测2024年的中国车载音乐市场规模1.7(1+0.3)2=2.873(十亿元).核心考点4 独立性检验
核心知识· 精归纳
假设有两个分类变量X和Y,它们的取值分别为{x1,x2}和{y1,y2},其样本频数列联表(称为2×2列联表)为:
y1 y2 总计
x1 a b a+b
x2 c d c+d
总计 a+c b+d a+b+c+d
K2=(其中n=a+b+c+d为样本容量).
典例研析· 悟方法
典例2 (2023·全国一模)某学校号召学生参加“每天锻炼1小时”活动,为了了解学生参与活动的情况,随机调查了100名学生一个月(30天)完成锻炼活动的天数,制成如下频数分布表:
天数 [0,5] (5,10] (10,15] (15,20] (20,25] (25,30]
人数 4 15 33 31 11 6
(1)由频数分布表可以认为,学生参加体育锻炼天数X近似服从正态分布N(μ,σ2),其中μ近似为样本的平均数(每组数据取区间的中间值),且σ=6.1,若全校有3 000名学生,求参加“每天锻炼1小时”活动超过21天的人数(精确到1);
(2)调查数据表明,参加“每天锻炼1小时”活动的天数在(15,30]的学生中有30名男生,天数在[0,15]的学生中有20名男生,学校对当月参加“每天锻炼1小时”活动超过15天的学生授予“运动达人”称号.请填写下面列联表:
性别 活动天数 合计
[0,15] (15,30]
男生
女生
合计
并依据小概率值α=0.05的独立性检验,能否认为学生性别与获得“运动达人”称号有关联.如果结论是有关联,请解释它们之间如何相互影响.
附:参考数据:P(μ-α≤X≤μ+σ)=0.682 7;P(μ-2σ≤X≤μ+2σ)=0.954 5;P(μ-3σ≤X≤μ+3σ)=0.997 3.χ2=(n=a+b+c+d)
α 0.1 0.05 0.01 0.005 0.001
xα 2.706 3.841 6.635 7.879 10.828
【解析】 (1)由频数分布表知μ==14.9,
则X~N(14.9,6.12),∵P(μ-σ≤X≤μ+σ)=0.682 7,
∴P(X>21)=P(X>14.9+6.1)==0.158 65,
∴3 000×0.158 65=475.95≈476,
∴参加“每天锻炼1小时”活动超过21天的人数约为476人.
(2)由频数分布表知,锻炼活动的天数在[0,15]的人数为:4+15+33=52,∵参加“每天锻炼1小时”活动的天数在[0,15]的学生中有20名男生,∴参加“每天锻炼1小时”活动的天数在[0,15]的学生中有女生人数:52-20=32,
由频数分布表知,锻炼活动的天数在(15,30]的人数为31+11+6=48,∵参加“每天锻炼1小时”活动的天数在(15,30]的学生中有30名男生,∴参加“每天锻炼1小时”活动的天数在(15,30]的学生中有女生人数:48-30=18,
列联表如下:
性别 活动天数 合计
[0,15] (15,30]
男生 20 30 50
女生 32 18 50
合计 52 48 100
零假设为H0:学生性别与获得“运动达人”称号无关,χ2=≈5.769>3.841,
依据α=0.05的独立性检验,我们推断H0不成立,即:可以认为学生性别与获得“运动达人”称号有关;
而且此推断犯错误的概率不大于0.05,根据列联表中的数据得到,男生、女生中活动天数超过15天的频率分别为:=0.6和=0.36,可见男生中获得“运动达人”称号的频率是女生中获得“运动达人”的称号频率的≈1.67倍,于是依据频率稳定与概率的原理,我们可以认为男生获得“运动达人”的概率大于女生,即男生更容易获得运动达人称号.
方法技巧· 精提炼
独立性检验的一般步骤
(1)根据样本数据制成2×2列联表.
(2)根据公式χ2=计算.
(3)比较χ2与临界值的大小关系,作统计推断.
加固训练· 促提高
(2023·日照模拟)第五代移动通信技术(简称5G)是最新一代蜂窝移动通信技术,是实现人、机、物互联的网络基础设施.某市工信部门为了解本市5G手机用户对5G网络的满意情况,随机抽取了本市200名5G手机用户进行调查,所得情况统计如下:
满意情况 年龄 合计
50岁以下 50岁或50岁以上
满意 95
不满意 25
合计 120 200
(1)完成上述列联表,并估计本市5G手机用户对5G网络满意的概率;
(2)依据小概率值α=0.05的独立性检验,分析本市5G手机用户对5G网络满意与年龄在50岁以下是否有关.
附:
α 0.10 0.05 0.025 0.010 0.001
xα 2.706 3.841 5.024 6.635 10.828
χ2=,其中n=a+b+c+d.
【解析】 (1)2×2列联表如下:
满意情况 年龄 合计
50岁以下 50岁或50岁以上
满意 95 55 150
不满意 25 25 50
合计 120 80 200
所以本市5G手机用户对5G网络满意的概率约为=.
(2)零假设为H0:本市5G手机用户对5G网络满意与年龄在50岁以下无关.
根据列联表中的数据,计算可得
χ2==≈2.778<3.841=x0.05.
根据小概率值α=0.05的χ2独立性检验原则,没有充分证据推断H0不成立,因此可以认为H0成立,即认为本市5G手机用户对5G网络满意与年龄在50岁以下无关.微专题 概率与统计的创新问题
创新分析
概率与统计试题大多数紧密结合社会实际,以现实生活为背景设置试题,注重知识的综合应用与实际应用,作为考查实践能力的重要载体,要求考生会收集、整理、分析数据,能从大量数据中抽取对研究问题有用的信息,建立数学模型,再应用数学原理和数学工具解决实际问题.
创新命题1 概率与传统文化结合
典例1 (2023·河南模拟)“春雨惊春清谷天,夏满芒夏暑相连,秋处露秋寒霜降,冬雪雪冬小大寒,每月两节不变更.最多相差一两天.”中国农历的“二十四节气”,凝结着中华民族的智慧,是中国传统文化的结晶,如五月有立夏、小满,六月有芒种、夏至,七月有小暑、大暑.现从五月、六月、七月这六个节气中任选两个节气,则这两个节气恰在同一个月的概率为( C )
A. B.
C. D.
创新点 以中国传统文化的结晶“二十四节气”为背景,把传统文化与概率知识巧妙结合
考查点 古典概型
解法 (1)将实际问题转化为古典概型概率问题(2)写出从五月、六月、七月这六个节气中任选两个节气的所有样本点,找出其中在同一个月的两个节气,利用古典概型的概率公式求得所求概率
【解析】 由题意,样本点由(立夏,小满),(立夏,芒种),(立夏,夏至),(立夏,小暑),(立夏,大暑),(小满,芒种),(小满,夏至),(小满,小暑),(小满,大暑),(芒种,夏至),(芒种,小暑),(芒种,大暑),(夏至,小暑),(夏至,大暑),(小暑,大暑)共15个,其中任取两个在同一个月的有3个,所以P==.故选C.
创新命题2 概率与社会热点交叉
典例2 (2023·西安二模)2022年10月12日,“天宫课堂”第三课在中国空间站开讲,新晋“太空教师”刘洋用2米长的吸管成功喝到了芒果汁,这是中国航天员首次在问天实验舱内进行授课,并通过网络向全国进行直播,这场直播极大地激发了广大中学生对航天知识的兴趣,为领悟航天精神,感受中国梦想.某校高一年级组织了一次“寻梦天宫”航天知识比赛,比赛规则:每组两个班级,每个班级各派出3名同学参加比赛,每一轮比赛中每个班级派出1名同学代表其所在班级答题,两个班级都全部答对或者没有全部答对,则均记0分;一班级全部答对而另一班级没有全部答对,则全部答对的班级记1分,没有全部答对的班级记-1分,三轮比赛结束后,累计得分高的班级获胜.设甲、乙两个班级为一组参加比赛,每轮比赛中甲班全部答对的概率为,乙班全部答对的概率为,甲、乙两班答题相互独立,且每轮比赛互不影响.
(1)求甲班每轮比赛得-1分、0分、1分的概率;
(2)两轮比赛后甲班得分为X,求X的分布列和数学期望.
创新点 以社会热点中国航天员首次在问天实验舱内进行授课为背景,与概率统计合理交叉
考查点 离散型随机变量的分布列和期望
解法 (1)分别计算甲班全部答错且乙班全部答对、甲班、乙班都全部答对或都全部答错、甲班全部答对且乙班全部答错的概率即可;(2)分别计算X取-2,-1,0,1,2的概率并写出分布列.
【解析】 (1)记事件A为“甲班每轮比赛得-1分”,事件B为“甲班每轮比赛得0分”,事件C为“甲班每轮比赛得1分”,
则P(A)=×=,
P(B)=×+×=,
P(C)=×=.
(2)由题意可得,X的所有取值可能为-2,-1,0,1,2,
则由(1)可得,P(X=-2)=P(AA)=×=,
P(X=-1)=P(AB)+P(BA)=×+×=,
P(X=0)=P(AC)+P(CA)+P(BB)=×+×+×=,
P(X=1)=P(BC)+P(CB)=×+×=,
P(X=2)=P(CC)=×=,
所以X的分布列为:
X -2 -1 0 1 2
P
所以E(X)=(-2)×+(-1)×+0×+1×+2×=-.
创新命题3 经验回归方程、独立性检验与生产生活牵手
典例3 (2023·琼山区四模)“十四五”时期是我国全面建成小康社会、实现第一个百年奋斗目标之后,开启全面建设社会主义现代化国家新征程、向第二个百年奋斗目标进军的第一个五年.“三农”工作重心历史性转向全面推进乡村振兴,加快中国特色农业农村现代化进程.国务院印发《“十四五”推进农业农村现代化规划》制定了具体工作方案和工作目标,提出到2025年全国水产品年产量达到6 900万吨.2018年至2021年全国水产品年产量y(单位:千万吨)的数据如下表:
年份 2018 2019 2020 2021
年份代号x 1 2 3 4
总产量y 6.46 6.48 6.55 6.69
(1)求出y关于x的线性回归方程,并预测2025年水产品年产量能否实现目标;
(2)为了系统规划渔业科技推广工作,研究人员收集了2019年全国32个地区(含中农发集团)渔业产量、渔业从业人员、渔业科技推广人员的数据,渔业年产量超过90万吨的地区有14个,有渔业科技推广人员高配比(配比=渔业科技推广人员总数:渔业从业人员总数)的地区有16个,其中年产量超过90万吨且高配比的地区有4个,依据小概率值α=0.05的独立性检验,能否认为“渔业科技推广人员配比和年产量”有关系.
附:对于一组数据(x1,y1),(x2,y2),…,(xn,yn),其回归直线=x+的斜率和截距的最小二乘法估计分别为=,=- ,χ2=
P(K2≥k) 0.050 0.010 0.001
k 3.841 6.635 10.828
参考数据=6.545,iyi=65.83
创新点 以《“十四五”推进农业农村现代化规划》提出的全国水产品年产量目标为命题背景,与统计案例合理的交汇.
考查点 线性回归方程的求解,独立性检验的应用
解法 (1)先求出,的值,再利用公式求出β,α的值,从而得到y关于x的线性回归方程;(2)根据题意列出渔业科技推广人员配比和年产量之间的2×2列联表,根据公式计算χ2的值,再与临界值比较即可得到结果.
【解析】 (1)由题意可得=12+22+32+42=30,
又因为==,=6.545,iyi=65.83,
所以β===0.076,
所以α=-β=6.545-0.076×=6.355,
所以y关于x的线性回归方程为y=0.076x+6.355.
(2)由题意得,渔业科技推广人员配比和年产量之间的2×2列联表如下:
渔业科技推广人员配比 渔业科技推广人员配比 合计
年产量超过90万吨 4 10 14
年产量未超过90万吨 12 6 18
合计 16 16 32
所以χ2==4.571>3.841,
依据α=0.05的独立性检验,我们推断H0不成立,即:“渔业科技推广人员配比和年产量”有关系;而且此推断犯错误的概率不大于0.05.
创新命题4 概率与体育赛事融合
典例4 (2023·湖南模拟)冰壶是2022年2月4日至2月20日在中国举行的第24届冬季奥运会的比赛项目之一.冰壶比赛的场地如图所示,其中左端(投掷线MN的左侧)有一个发球区,运动员在发球区边沿的投掷线MN将冰壶掷出,使冰壶沿冰道滑行,冰道的右端有一圆形的营垒,以场上冰壶最终静止时距离营垒区圆心O的远近决定胜负.甲、乙两人进行投掷冰壶比赛,规定冰壶的重心落在圆O中,得3分,冰壶的重心落在圆环A中,得2分.冰壶的重心落在圆环B中,得1分,其余情况均得0分.已知甲、乙投掷冰壶的结果互不影响.甲、乙得3分的概率分别为,;甲、乙得2分的概率分别为,;甲、乙得1分的概率分别为,.
(1)求甲、乙两人所得分数相同的概率;
(2)设甲、乙两人所得的分数之和为X,求X的分布列和期望.
创新点 以冬季奥运会冰壶比赛的场地及比赛规则为命题背景,结合“五育”命题要求,把概率统计与赛事巧妙结合
考查点 古典概型以及离散型随机变量的分布列与期望
解法 (1)求出甲、乙二人都得0分的概率,然后由两人同时得0分、1分、2分、3分计算概率并相加即可;(2)由题意X可能取值为0,1,2,3,4,5,6,分别计算出概率的分布列,由期望公式计算期望.
【解析】 (1)由题意知甲得0分的概率为1---=,
乙得0分的概率为1---=,
所以甲、乙两人所得分数相同的概率为×+×+×+×=.
(2)X可能取值为0,1,2,3,4,5,6,
则P(X=0)=×=,
P(X=1)=×+×=,
P(X=2)=×+×+×=,
P(X=3)=×+×+×+×=,
P(X=4)=×+×+×=,
P(X=5)=×+×=,
P(X=6)=×=,
所以,随机变量X的分布列为:
X 0 1 2 3 4 5 6
P
所以E(X)=0×+1×+2×+3×+4×+5×+6×=.
加固训练· 促提高
1. (2023·龙岩模拟)算盘是我国一类重要的计算工具.如图是一把算盘的初始状态,自右向左前四位分别表示个位、十位、百位、千位,上面一粒珠子(简称上珠)代表5,下面一粒珠子(简称下珠)代表1,即五粒下珠的代表数值等于同组一粒上珠的代表数值,例如,个位拨动一粒上珠至梁上,十位未拨动,百位拨动一粒下珠至梁上,表示数字105,现将算盘的千位拨动一粒珠子至梁上,个位、十位、百位至多拨动一粒珠子至梁上,其他位置珠子不拨动.设事件A=“表示的四位数为偶数”,事件B=“表示的四位数大于5 050”,则P(B|A)=( A )
A. B.
C. D.
【解析】 算盘的千位拨动一粒珠子至梁上,个位、十位、百位至多拨动一粒珠子至梁上,其他位置珠子不拨动.基本事件为:1 000,1 001,1 005,1 010,1 050,1 100,1 500,5 000,5 001,5 005,5 010,5 050,5 100,5 500共14种,事件A=“表示的四位数为偶数”,则P(A)==,事件B=“表示的四位数大于5 050”,则P(AB)==,所以P(B|A)==.故选A.
2. (2023·思明区校级期末)3月15日是国际消费者权益日.中央电视台特地推出3.15公益晚会,曝光了食品、医美、直播等多领域乱象,在很大程度上震慑了一些不良商家,也增强了消费者的维权意识.一名市民在某商店买了一只灯泡,结果用了两个月就坏了,他拨打了12315投诉电话.通过调查,发现该商店将一些不合格灯泡混入一批合格灯泡中以次充好卖给顾客.假设合格灯泡在使用1 000小时后损坏的概率为0.004,不合格灯泡在使用1 000小时后损坏的概率为0.4,若混入的不合格灯泡数占灯泡总数的25%,现一顾客在该商店买一只灯泡,则该灯泡在使用1 000小时后不会损坏的概率为( C )
A.0.103 B.0.301
C.0.897 D.0.699
【解析】 由全概率公式,可得任取一零件,它是合格品的概率为(1-0.4)×25%+(1-0.004)×75%=0.897.故选C.
3. (多选)(2023·杭州模拟)2022年11月17日,工业和信息化部成功举办第十七届“中国芯”集成电路产业大会.此次大会以“强芯固基以质为本”为主题,旨在培育壮大我国集成电路产业,夯实产业基础、营造良好产业生态.某芯片研发单位用在“A芯片”上研发费用占本单位总研发费用的百分比y如表所示.已知=40%,于是分别用p=30%和p=40%得到了两条回归直线方程:y=1x+1,y=2x+2,对应的相关系数分别为r1、r2,百分比y对应的方差分别为s、s,则下列结论正确的是( ABC )
年份 2018 2019 2020 2021 2022
年份代码x 1 2 3 4 5
y 20% p 40% 50% q
A.r1>r2 B.s>s
C.1>2 D.1>2
【解析】 p=30%时,q=60%,变量x、y呈线性正相关,故r1=1>r2,故A正确;方差反映数据的稳定性,显然p=40%时更稳定,故此时方差更小,即s>s,故B正确;由于=,当p=30%时,iyi=1×20%+2×30%+3×40%+4×50%+5×60%=700%,当p=40%时,iyi=1×20%+2×40%+3×40%+4×50%+5×50%=670%,所以1>2,故C正确;因为=- ,所以1>2时,1<2,故D错误.故选ABC.
4. (2023·辽宁模拟)近两年来,多个省份公布新高考改革方案,其中部分省份实行“3+1+2”的高考模式,“3”为全国统一高考的语文、数学、外语3门必考科目,“1”由考生在物理、历史两门科目中选考1门科目,“2”由考生在思想政治、地理、化学、生物4门科目中选考2门科目,则甲,乙两名考生恰有两门选考科目相同的概率为  .
【解析】 甲、乙两名考生选科的总情况有(CC)2=144,其中恰有两门选考科目相同的情况有以下两种:①在物理、历史两科中选科相同,有CCA=48种选法,②在物理、历史两科中选科不同,有CA=12种选法,∴甲,乙两名考生恰有两门选考科目相同的概率为P==.
5. (2023·闵行区校级二模)某新能源汽车销售公司统计了某款汽车行驶里程x(单位:万千米)对应维修保养费用y(单位:万元)的四组数据,这四组数据如表:
行驶里程x/万千米 1 2 4 5
维修保养费用y/万元 0.50 0.90 2.30 2.70
若用最小二乘法求得回归直线方程为=0.58x+,则估计该款汽车行驶里程为6万千米时的维修保养费是_3.34__万元.
【解析】 由表中数据可得,=×(1+2+4+5)=3,=×(0.5+0.9+2.3+2.7)=1.6,样本中心点为(3,1.6),∵回归直线方程为=0.58x+,∴1.6=0.58×3+,解得=-0.14,故回归直线方程为=0.58x-0.14,当x=6时,=0.58×6-0.14=3.34,故估计该款汽车行驶里程为6万千米时的维修保养费是3.34万元.
6. (2023·安庆二模)为了“锤炼党性修养,筑牢党性根基”,党员教师小A每天自觉登录“学习强国APP”,参加各种学习活动,同时热衷于参与四人赛.每局四人赛是由网络随机匹配四人进行比赛,每题回答正确得20分,第1个达到100分的比赛者获得第1名,赢得该局比赛,该局比赛结束.每天的四人赛共有30局,前2局是有效局,根据得分情况获得相应名次,从而得到相应的学习积分,第1局获得第1名的得3分,获得第2、3名的得2分,获得第4名的得1分;第2局获得第1名的得2分,获得第2、3、4名的得1分;后28局是无效局,无论获得什么名次,均不能获得学习积分.经统计,小A每天在第1局四人赛中获得3分、2分、1分的概率分别为,,,在第2局四人赛中获得2分、1分的概率分别为,.
(1)设小A每天获得的得分为X,求X的分布列、数学期望和方差;
(2)若小A每天赛完30局,设小A在每局四人赛中获得第1名从而赢得该局比赛的概率为,每局是否赢得比赛相互独立,请问在每天的30局四人赛中,小A赢得多少局的比赛概率最大?
【解析】 (1)记事件Ai(i=1,2,3)表示第一局获得i分,
事件Bi(i=1,2)表示第二局获得i分,这些事件相互独立,由条件知X的可能值为5,4,3,2,
P(X=5)=P(A3B2)=P(A3)P(B2)=×=,
P(X=4)=P(A3B1)+P(A2B2)=×+×=,
P(X=3)=P(A2B1)+P(A1B2)=×+×=,
P(X=2)=P(A1B1)=×=,
所以X的分布列为:
X 5 4 3 2
P
E(X)=5×+4×+3×+2×=,
D(X)=2×+2×+2×+2×=.
(2)设小A每天赢得的局数为Y,则Y~B,
于是P(Y=k)=C·k·30-k.
根据条件得
由①得·k·30-k≥·k-1·31-k,得k≤,
同理由②得≤k,所以≤k≤,
又因为k∈Z,所以k=10,因此在每天的30局四人赛中,小A赢得10局的比赛概率最大.

展开更多......

收起↑

资源列表