资源简介 现代概率论与高中概率统计的融合问题高考定位 与概率统计有关的创新问题主要有两个类型:(1)以高等数学知识为背景的问题;(2)概率、统计方法的新定义问题.【题型突破】题型一 极大似然估计问题例1 (2024·杭州二模)在概率统计中,常常用频率估计概率.已知袋中有若干个红球和白球,有放回地随机摸球n次,红球出现m次.假设每次摸出红球的概率为p,根据频率估计概率的思想,则每次摸出红球的概率p的估计值为=.(1)若袋中这两种颜色球的个数之比为1∶3,不知道哪种颜色的球多.有放回地随机摸取3个球,设摸出的球为红球的次数为Y,则Y~B(3, p).(注:Pp(Y=k)表示当每次摸出红球的概率为p时,摸出红球次数为k的概率)①完成下表:k 0 1 2 3P(Y=k)P(Y=k)②在统计理论中,把使得Pp(Y=k)的取值达到最大时的p,作为p的估计值,记为,请写出的值.(2)把(1)中“使得Pp(Y=k)的取值达到最大时的p作为p的估计值”的思想称为最大似然原理.基于最大似然原理的最大似然参数估计方法称为最大似然估计.具体步骤:先对参数θ构建对数似然函数l(θ),再对其关于参数θ求导,得到似然方程l′(θ)=0,最后求解参数θ的估计值.已知Y~B(n,p)的参数p的对数似然函数为l(p)=Xiln p+(1-Xi)ln(1-p),其中Xi=求参数p的估计值,并且说明频率估计概率的合理性.__________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________规律方法 极大似然估计是一种基于概率理论的方法,用于估计一个概率模型的参数,使得观测到的数据在该模型下出现的概率最大.换句话说,它寻找的是使我们观察到的数据最有可能发生的参数值,解决此类问题一般要利用导数与函数的性质.训练1 (2024·长沙调研)某制药公司研制了一款针对某种病毒的新疫苗.该病毒一般通过病鼠与白鼠之间的接触传染,现有n只白鼠,每只白鼠在接触病鼠后被感染的概率为,被感染的白鼠数用随机变量X表示,假设每只白鼠是否被感染之间相互独立.(1)若P(X=5)=P(X=95),求数学期望E(X);(2)接种疫苗后的白鼠被病鼠感染的概率为p,现有两个不同的研究团队理论研究发现概率p与参数θ(0<θ<1)的取值有关.团队A提出函数模型为p=ln(1+θ)- θ2,团队B提出函数模型为p=(1-e-θ).现将100只接种疫苗后的白鼠分成10组,每组10只,进行实验,随机变量Xi(i=1,2,…,10)表示第i组被感染的白鼠数,将随机变量Xi(i=1,2,…,10)的实验结果xi(i=1,2,…,10)绘制成频率分布图,如图所示.①试写出事件“X1=x1,X2=x2,…,X10=x10”发生的概率表达式(用p表示,组合数不必计算);②在统计学中,若参数θ=θ0时使得概率P(X1=x1,X2=x2,…,X10=x10)最大,称θ0是θ的最大似然估计.根据这一原理和团队A,B提出的函数模型,判断哪个团队的函数模型可以求出θ的最大似然估计,并求出最大似然估计.参考数据:ln ≈0.405 5.________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________题型二 信息熵问题例2 (2024·南京模拟)信息熵是信息论之父香农(Shannon)定义的一个重要概念,香农在1948年发表的论文《通信的数学理论》中指出,任何信息都存在冗余,把信息中排除了冗余后的平均信息量称为“信息熵”,并给出了计算信息熵的数学表达式:设随机变量X所有可能的取值为1,2,…,n(n∈N*),且P(X=i)=pi>0(i=1,2,…,n),pi=1,定义X的信息熵H(X)=-pilog2pi.(1)当n=1时,计算H(X);(2)若pi=(i=1,2,…,n),判断并证明当n增大时,H(X)的变化趋势;(3)若n=2m(m∈N*),随机变量Y所有可能的取值为1,2,…,m,且P(Y=j)=pj+p2m+1-j(j=1,2,…,m),证明:H(X)>H(Y).________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________规律方法 信息熵可以理解为某种特定信息出现的概率,解题的关键是紧扣定义,恰当地利用相关概率公式计算.训练2 (2024·济南调研)在信息论中,熵(entropy)是接收的每条消息中包含的信息的平均量,又被称为信息熵、信源熵、平均自信息量.这里,“消息”代表来自分布或数据流中的事件、样本或特征.(熵最好理解为不确定性的量度而不是确定性的量度,因为越随机的信源的熵越大)来自信源的另一个特征是样本的概率分布.这里的想法是,比较不可能发生的事情,当它发生了,会提供更多的信息.由于一些其他的原因,把信息(熵)定义为概率分布的对数的相反数是有道理的.事件的概率分布和每个事件的信息量构成了一个随机变量,这个随机变量的均值(即期望)就是这个分布产生的信息量的平均值(即熵).熵的单位通常为比特,但也用Sh、nat、Hart计量,取决于定义用到对数的底.采用概率分布的对数作为信息的量度的原因是其可加性.例如,投掷一次硬币提供了1 Sh的信息,而掷m次就为m位.更一般地,你需要用log2 n位来表示一个可以取n个值的变量.在1948年,克劳德·艾尔伍德·香农将热力学的熵,引入到信息论,因此它又被称为香农熵.而正是信息熵的发现,使得1871年由英国物理学家詹姆斯·麦克斯韦为了说明违反热力学第二定律的可能性而设想的麦克斯韦妖理论被推翻.设随机变量ξ所有取值为1,2,…,n,定义ξ的信息熵H(ξ)=-Pilog2Pi(Pi=1,i=1,2,…,n).(1)若n=2,试探索ξ的信息熵关于P1的解析式,并求其最大值;(2)若P1=P2=,Pk+1=2Pk(k=2,3,…,n),求此时的信息熵.____________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________题型三 概率、统计方法的新定义问题例3 (2024·西安调研)条件概率与条件期望是现代概率体系中的重要概念.近年来,随着人们对随机现象的不断观察和研究,条件概率和条件期望已经被广泛的利用到日常生产生活中.定义:设X,Y是离散型随机变量,则X在给定事件Y=y条件下的期望为E(X|Y=y)=xi·P(X=xi|Y=y)=xi·,其中{x1,x2,…,xn}为X的所有可能取值集合,P(X=x,Y=y)表示事件“X=x”与事件“Y=y”都发生的概率.某射击手进行射击训练,每次射击击中目标的概率均为p(0(1)求P(ξ=2,η=5),P(η=5);(2)求E(ξ|η=5),E(ξ|η=n)(n≥2).____________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________规律方法 本例新定义了条件期望,可以类比我们学习过的条件概率和数学期望加以理解.要有目标意识,紧扣题目条件中所给的公式进行计算.训练3 (2024·武汉模拟)在一个典型的数字通信系统中,由信源发出携带着一定信息量的消息,转换成适合在信道中传输的信号,通过信道传送到接收端.有干扰无记忆信道是实际应用中常见的信道,信道中存在干扰,从而造成传输的信息失真.在有干扰无记忆信道中,信道输入和输出是两个取值x1,x2,…,xn的随机变量,分别记作X和Y.条件概率P(Y=xj|X=xi),i,j=1,2,…,n,描述了输入信号和输出信息之间统计依赖关系,反映了信道的统计特性.随机变量X的平均信息量定义为:H(X)=-p(X=xi)log2p(X=xi).当n=2时,信道疑义度定义为H(Y|X)=-p(X=xi,Y=xj)log2p(Y=xj|X=xi)=-[P(X=x1,Y=x1)log2p(Y=x1|X=x1)+P(X=x1,Y=x2)log2p(Y=x2|X=x1)+P(X=x2,Y=x1)log2p(Y=x1|X=x2)+P(X=x2,Y=x2)log2p(Y=x2|X=x2)].设有一非均匀的骰子,若其任一面出现的概率与该面上的点数成正比,试求扔一次骰子向上的面出现的点数X的平均信息量(log2 3≈1.59,log2 5≈2.32,log2 7≈2.81);(2)设某信道的输入变量X与输出变量Y均取值0,1.满足:P(X=0)=ω,p(Y=1|X=0)=p(Y=0|X=1)=p(0<ω<1,0①求P(Y=0)的值;②求该信道的信道疑义度H(Y|X)的最大值.____________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________创新点5 现代概率论与高中概率统计的融合问题题型突破例1解 (1)因为袋中这两种颜色球的个数之比为1∶3,且Y~B(3,p),所以p的值为或;①当p=时,P(Y=1)=Cp1(1-p)2=,P(Y=2)=Cp2(1-p)=,当p=时,P(Y=0)=Cp0(1-p)3=,P(Y=2)=Cp2(1-p)=,表格如下k 0 1 2 3P(Y=k)P(Y=k)②由上表可知Pp(Y=k)=Cpk(1-p)3-k.当Y=0或1时,参数p=的概率最大;当Y=2或3时,参数p=的概率最大.所以=(2)由l(p)=Xiln p+(1-Xi)ln(1-p),则l′(p)=Xi-(1-Xi),令Xi-(1-Xi)=0,即===-1,故p=Xi,即当p∈时,l′(p)>0,当p∈时,l′(p)<0,故l(p)在上单调递增,在上单调递减,即当p=Xi时,l(p)取最大值,故=Xi,因此,用最大似然估计的参数与频率估计概率的是一致的,故用频率估计概率是合理的.训练1解 (1)由题知,随机变量X服从二项分布,X~B,由P(X=5)=P(X=95),则C=C=C,得n=100,所以E(X)=np=50.(2)①A=“X1=x1,X2=x2,…,X10=x10”,P(A)=[Cp(1-p)9]3[Cp2(1-p)8]3[Cp3·(1-p)7]2[Cp4(1-p)6][Cp6(1-p)4],所以P(A)=(C)3(C)3(C)2(C)2p25(1-p)75;②记g(p)=ln[(C)3(C)3(C)2(C)2]+25ln p+75ln (1-p),则g′(p)=-=,当00,g(p)单调递增;当当p=时,g(p)取得最大值,即P取得最大值,在团队A提出的函数模型p=ln(1+θ)-θ2(0<θ<1)中,记函数f1(x)=ln(1+x)-x2(0f1′(x)=-x=,当00,f1(x)单调递增;当当x=时,f1(x)取得最大值ln -<,则θ不可以估计;在团队B提出的函数模型p=(1-e-θ)中,记函数f2(x)=(1-e-x),f2(x)单调递增,令f2(x)=,解得x=ln 2,则团队B可以求出θ的最大似然估计,且θ0=ln 2是θ的最大似然估计.例2 (1)解 当n=1时,则i=1,p1=1,所以H(X)=-(1×log21)=0.(2)解 H(X)随着n的增大而增大.当pi=(i=1,2,…,n),则H(X)=-×n=-log2=log2n,设f(n)=log2n,n∈N*,则f(n+1)-f(n)=log2(n+1)-log2n=log2>0,因此H(X)随着n的增大而增大.(3)证明 若n=2m(m∈N*),随机变量Y所有可能的取值为1,2,…,m,且P(Y=j)=pj+p2m+1-j(j=1,2,…,m).H(X)=-pi·log2pi=pi·log2=p1·log2+p2·log2+…+p2m-1·log2+p2m·log2.H(Y)=(p1+p2m)·log2 +(p2+p2m-1)·log2 +…+(pm+pm+1)·log2 ,因为0故log2 >0,故H(Y)>p1·log2 +p2·log2 +…+p2m-1·log2 +p2m·log2 ,由于pi>0(i=1,2,…,2m),所以>>0,所以log2 >log2 ,所以pi·log2 >pi·log2 ,所以H(X)>H(Y).训练2 解 (1)当n=2时,P1∈(0,1),H(ξ)=-P1log2P1-(1-P1)log2(1-P1),令f(t)=-tlog2t-(1-t)log2(1-t),t∈(0,1),则f′(t)=-log2t+log2(1-t)=log2,所以函数f(t)在上单调递增,在上单调递减,所以当P1=时,H(ξ)取得最大值,最大值为H(ξ)max=1.(2)因为P1=P2=,Pk+1=2Pk(k=2,3,…,n),所以Pk=P2·2k-2==(k=2,3,…,n),故Pklog2Pk=log2=-,而P1log2P1=log2=-,于是H(ξ)=+Pklog2Pk=+++…++,整理得H(ξ)=-++++…++.令Sn=+++…++,则Sn=+++…++,两式相减得Sn=+++…+-=1-.因此Sn=2-,所以H(ξ)=-+Sn=-+2-=2-.例3 解 (1)由题设,P(ξ=2,η=5)=(1-p)·p·(1-p)·(1-p)·p=(1-p)3p2,P(η=5)=C(1-p)3p2=4(1-p)3p2.(2)由题设,E(ξ|η=5)==1×+2×+3×+4×=+++1=;同(1),P(η=n)=C(1-p)n-2p2=(n-1)·(1-p)n-2p2,P(ξ|η=n)=(1-p)n-2p2,所以E(ξ|η=n)= =++…++1==.训练3解 (1)设X表示扔一非均匀骰子点数,则X 1 2 3 4 5 6P扔一次平均得到的信息量为H(X)=-p(X=xi)log2p(X=xi)=log2 =log2 21-ilog2 i=log27+log23-log25-≈2.40.(2)①由全概率公式,得p(Y=0)=p(X=0)P(Y=0|X=0)+p(X=1)·P(Y=0|X=1)=ω(1-p)+(1-ω)p.②由题意,p(Y=0|X=0)=p(Y=1|X=1)=1-p,所以,H(Y|X)=-[P(X=x1,Y=x1)log2p(Y=x1|X=x1)+P(X=x1,Y=x2)log2p(Y=x2|X=x1)+P(X=x2,Y=x1)log2p(Y=x1|X=x2)+P(X=x2,Y=x2)log2p(Y=x2|X=x2)]=-[P(X=x1)p(Y=x1|X=x1)log2p(Y=x1|X=x1)+p(X=x1)p(Y=x2|X=x1)log2p(Y=x2|X=x1)+p(X=x2)p(Y=x1|X=x2)·log2p(Y=x1|X=x2)+p(X=x2)p(Y=x2|X=x2)log2p(Y=x2|X=x2)]=-[ω(1-p)log2(1-p)+ωplog2p+(1-ω)·plog2p+(1-ω)(1-p)log2(1-p)]=-plog2p-(1-p)log2(1-p);其中x1=0,x2=1.令f(p)=-plog2p-(1-p)log2(1-p),f′(p)=--[-log2(1-p)+(1-p)]=-log2p+log2(1-p)=log2.f′(p)=0,p=,x∈时,f′(p)>0,x∈时,f′(p)<0,所以f(p)max=f=1.(共45张PPT)板块五 概率与统计创新点5 现代概率论与高中概率统计的融合问题高考定位与概率统计有关的创新问题主要有两个类型:(1)以高等数学知识为背景的问题;(2)概率、统计方法的新定义问题.精准强化练题型一 极大似然估计问题题型二 信息熵问题题型三 概率、统计方法的新定义问题题型突破题型一 极大似然估计问题例1①完成下表:因为袋中这两种颜色球的个数之比为1∶3,且Y~B(3,p),表格如下极大似然估计是一种基于概率理论的方法,用于估计一个概率模型的参数,使得观测到的数据在该模型下出现的概率最大.换句话说,它寻找的是使我们观察到的数据最有可能发生的参数值,解决此类问题一般要利用导数与函数的性质.规律方法训练1得n=100,所以E(X)=np=50.①试写出事件“X1=x1,X2=x2,…,X10=x10”发生的概率表达式(用p表示,组合数不必计算);A=“X1=x1,X2=x2,…,X10=x10”,则团队B可以求出θ的最大似然估计,且θ0=ln 2是θ的最大似然估计.题型二 信息熵问题例2当n=1时,则i=1,p1=1,所以H(X)=-(1×log21)=0.H(X)随着n的增大而增大.设f(n)=log2n,n∈N*,因此H(X)随着n的增大而增大.若n=2m(m∈N*),随机变量Y所有可能的取值为1,2,…,m,且P(Y=j)=pj+p2m+1-j(j=1,2,…,m).因为0信息熵可以理解为某种特定信息出现的概率,解题的关键是紧扣定义,恰当地利用相关概率公式计算.规律方法(2024·济南调研)在信息论中,熵(entropy)是接收的每条消息中包含的信息的平均量,又被称为信息熵、信源熵、平均自信息量.这里,“消息”代表来自分布或数据流中的事件、样本或特征.(熵最好理解为不确定性的量度而不是确定性的量度,因为越随机的信源的熵越大)来自信源的另一个特征是样本的概率分布.这里的想法是,比较不可能发生的事情,当它发生了,会提供更多的信息.由于一些其他的原因,把信息(熵)定义为概率分布的对数的相反数是有道理的.事件的概率分布和每个事件的信息量构成了一个随机变量,这个随机变量的均值(即期望)就是这个分布产生的信息量的平均值(即熵).熵的单位通常为比特,但也用Sh、nat、Hart计量,取决于定义用到对数的底.采用概率分布的对训练2数作为信息的量度的原因是其可加性.例如,投掷一次硬币提供了1 Sh的信息,而掷m次就为m位.更一般地,你需要用log2 n位来表示一个可以取n个值的变量.在1948年,克劳德·艾尔伍德·香农将热力学的熵,引入到信息论,因此它又被称为香农熵.而正是信息熵的发现,使得1871年由英国物理学家詹姆斯·麦克斯韦为了说明违反热力学第二定律的可能性而设想的麦克斯韦妖理论被推翻.设随机变量ξ所有取值为1,2,…,2,…,n).(1)若n=2,试探索ξ的信息熵关于P1的解析式,并求其最大值;当n=2时,P1∈(0,1),H(ξ)=-P1log2P1-(1-P1)log2(1-P1),令f(t)=-tlog2t-(1-t)log2(1-t),t∈(0,1),题型三 概率、统计方法的新定义例3(1)求P(ξ=2,η=5),P(η=5);由题设,P(ξ=2,η=5)=(1-p)·p·(1-p)·(1-p)·p=(1-p)3p2,(2)求E(ξ|η=5),E(ξ|η=n)(n≥2).本例新定义了条件期望,可以类比我们学习过的条件概率和数学期望加以理解.要有目标意识,紧扣题目条件中所给的公式进行计算.规律方法训练3(2024·武汉模拟)在一个典型的数字通信系统中,由信源发出携带着一定信息量的消息,转换成适合在信道中传输的信号,通过信道传送到接收端.有干扰无记忆信道是实际应用中常见的信道,信道中存在干扰,从而造成传输的信息失真.在有干扰无记忆信道中,信道输入和输出是两个取值x1,x2,…,xn的随机变量,分别记作X和Y.条件概率P(Y=xj|X=xi),i,j=1,2,…,n,描述了输入信号和输出信息之间统计依赖关系,反映了信道的统计特性.随机变量X的平均信息量定义为:(1)设有一非均匀的骰子,若其任一面出现的概率与该面上的点数成正比,试求扔一次骰子向上的面出现的点数X的平均信息量(log2 3≈1.59,log2 5≈2.32,log2 7≈2.81);设X表示扔一非均匀骰子点数,则扔一次平均得到的信息量为(2)设某信道的输入变量X与输出变量Y均取值0,1.满足:P(X=0)=ω,p(Y=1|X=0)=p(Y=0|X=1)=p(0<ω<1,0①求P(Y=0)的值;由全概率公式,得p(Y=0)=p(X=0)P(Y=0|X=0)+p(X=1)·P(Y=0|X=1)=ω(1-p)+(1-ω)p.②求该信道的信道疑义度H(Y|X)的最大值.由题意,p(Y=0|X=0)=p(Y=1|X=1)=1-p,所以,H(Y|X)=-[P(X=x1,Y=x1)log2p(Y=x1|X=x1)+P(X=x1,Y=x2)log2p(Y=x2|X=x1)+P(X=x2,Y=x1)log2p(Y=x1|X=x2)+P(X=x2,Y=x2)log2p(Y=x2|X=x2)]=-[P(X=x1)p(Y=x1|X=x1)log2p(Y=x1|X=x1)+p(X=x1)p(Y=x2|X=x1)log2p(Y=x2|X=x1)+p(X=x2)p(Y=x1|X=x2)·log2p(Y=x1|X=x2)+p(X=x2)p(Y=x2|X=x2)log2p(Y=x2|X=x2)]=-[ω(1-p)log2(1-p)+ωplog2p+(1-ω)·plog2p+(1-ω)(1-p)log2(1-p)]=-plog2p-(1-p)log2(1-p);其中x1=0,x2=1.令f(p)=-plog2p-(1-p)log2(1-p),【精准强化练】1.(2024·泉州调研)某研究所研究某一型号疫苗的有效性,研究人员随机选取50只小白鼠注射疫苗,并将白鼠分成5组,每组10只,观察每组被感染的白鼠数.现有随机变量Xi(i=1,2,…,5)表示第i组被感染的白鼠数,并将随机变量Xi的观测值xi(i=1,2,…,5)绘制成如图所示的频数分布条形图.若接种疫苗后每只白鼠被感染的概率为p(p∈(0,1)),假设每只白鼠是否被感染是相互独立的.记Ai为事件“Xi=xi(i=1,2,…,5)”.由题知随机变量X1~B(10,p),(1)写出P(A1)(用p表示,组合数不必计算);设事件A=A1A2A3A4A5,由题图可知x1=2,x2=1,x3=1,x4=3,x5=3,由题意可得X满足二项分布X~B(N,p),由E(aX+b)=aE(X)+b知,(2)若0令h(x)=ex-x-1,-2×10-3当x∈(-2×10-3,0)时,h′(x)<0,h(x)为单调递减,当x∈(0,2×10-3)时,h′(x)>0,h(x)为单调递增,所以h(x)≥h(0)=0,且h(-2×10-3)=e-2×10-3-(-2×10-3)-1≈0,h(2×10-3)=e2×10-3-(2×10-3)-1≈0,所以当-2×10-3即ex≈x+1,两边取自然对数可得x≈ln(x+1),所以当0所以(1-p)K=eKln(1-p)≈e-Kp≈1-Kp,故某混管检测结果为阳性,则参与该混管检测的人中大概率恰有一人为阳性. 展开更多...... 收起↑ 资源列表 创新点 5 现代概率论与高中概率统计的融合问题.docx 创新点5 现代概率论与高中概率统计的融合问题.pptx