期末复习之一: 概率与统计

资源下载
  1. 二一教育资源

期末复习之一: 概率与统计

资源简介

期末复习之一: 概率与统计
第一部分.复习目标:
了解典型分布列:0~1分布,二项分布,几何分布。
了解离散型随机变量的期望值、方差的意义,会根据离散型随机变量的分布列求出期望值、方差。
在实际中经常用期望来比较两个类似事件的水平,当水平相近时,再用方差比较两个类似事件的稳定程度。
了解正态分布的意义,能借助正态曲线的图像理解正态曲线的性质。
了解标准正态分布的意义和性质,掌握正态总体转化为标准正态总体N(0,1)的公式及其应用。
通过生产过程的质量控制图,了解假设检验的基本思想。
第二部分.内容小结:
(Ⅰ)基础知识详析
㈠随机事件和统计的知识结构:
㈡随机事件和统计的内容提要
ε


P


1.主要内容是离散型随机变量的分布列、期望与方差,抽样方法,总体分布的估计,正态分布和线性回归。
2.随机变量的概率分布
(1)离散型随机变量的分布列:
两条基本性质①…); ②P1+P2+…=1。
(2)连续型随机变量概率分布:
由频率分布直方图,估计总体分布密度曲线y=f(x);总体分布密度函数的两条基本性质:
①f(x) ≥0(x∈R);②由曲线y=f(x)与x轴围成面积为1。
3.随机变量的数学期望和方差
(1)离散型随机变量的数学期望:…;反映随机变量取值的平均水平。
(2)离散型随机变量的方差:……;反映随机变量取值的稳定与波动,集中与离散的程度。
(3)基本性质:;。
4.三种抽样方法。
5.二项分布和正态分布
(1)记ε是n次独立重复试验某事件发生的次数,则ε~B(n,p);
其概率…。 期望Eε=np,方差Dε=npq。
(2)正态分布密度函数: 期望Eε=μ,方差。
(3)标准正态分布: 若,则, ,

6.线性回归:
㈢离散型随机变量的分布列
随机变量:如果随机试验的结果可以用一个变量来表示,那么这样的变量叫做随机变量。随机变量最常见的两种类型,即离散型随机变量和连续型随机变量。如果对于随机变量可能取的值,可以按一定次序一一列出,这样的随机变量叫做离散型随机变量;如果随机变量可以取某一区间内的一切值,这样的随机变量叫做连续型随机变量。
离散型随机变量的分布列:如果离散型随机变量的可能取值为xi(i=1,2,…),由于试验的各个结果的出现有一定的概率,于是随机变量取每一个值也有一定的概率P(=xi)=pi,人们常常习惯地把它们写成表格的形式,如:
x1
x2

xi

P
p1
p2

pi

这种表即为随机变量的概率分布,简称为的分布列。
分布列的表达式可有如下几种:(1)表格形式;(2)一组等式;(3)压缩为一个带“i”的等式。
1.在实际问题中,人们常关心随机变量的特征,而不是随机变量的具体值。离散型随机变量的期望和方差都是随机变量的特征数,期望反映了随机变量的平均取值,方差与标准差都反映了随机变量取值的稳定与波动、集中与离散的程度。其中标准差与随机变量本身有相同的单位。
2.离散型随机变量期望和方差的计算公式
设离散型随机变量的分布列为P(=xi)=pi,i=1,2,…,则:
E=i pi,D=i-E)2 pi=i2 pi-(E)2=E(2)-(E)2。
3.离散型随机变量期望和方差的性质:E (a+b)=aE+b,D (a+b)=a2 D。
4.二项分布的期望与方差:若~B (n,p),则E=np,D=np (1-p)。
㈣抽样方法:三种常用抽样方法:简单随机抽样、系统抽样、分层抽样。
㈤总体分布的估计总体分布:总体取值的概率分布规律通常称为总体分布。总体密度曲线:当样本容量无限增大,分组的组距无限缩小,那么频率分布直方图就会无限接近于一条光滑曲线,即总体密度曲线。
㈥正态分布:如果总体密度曲线是以下函数的图象:, ①式中的实数μ、σ(σ>0)是参数,分别表示总体的平均数与标准差,这个总体是有无限容量的抽象总体。其分布叫做正态分布,常记作N(μ,σ2)。①的图象被称为正态曲线。特别地,在函数①中,当μ=0,σ=1时,正态总体称为标准正态总体,这时,相应的函数表达式是,, ② 相应的曲线称为标准正态曲线。
1.正态分布的重要性:正态分布是概率统计中最重要的一种分布。一方面,正态分布是自然界最常见的一种分布。一般说来,若影响某一数量指标的随机因素很多,而每个因素所起的作用都不太大,则这个指标服从正态分布。例如,产品尺寸是一类典型的总体,对于成批生产的产品,如果生产条件正常并稳定,即工艺、设备、技术、操作、原料、环境等可以控制的条件都相对稳定,而且不存在产生系统误差的明显因素,那么,产品尺寸的总体分布就服从正态分布。又如测量的误差;炮弹落点的分布;人的生理特征的量:身高、体重等;农作物的收获量等等,都服从或近似服从正态分布。另一方面,正态分布具有许多良好的性质,很多分布可以用正态分布来近似描述,另外,一些分布又可以通过正态分布来导出,因此在理论研究中正态分布也十分重要。
2.正态曲线及其性质 正态分布函数: ,x∈(-∞,+∞)
3.标准正态曲线 标准正态曲线N(0,1)是一种特殊的正态分布曲线,它是本小节的重点。由于它具有非常重要的地位,已专门制作了“标准正态分布表”。对于抽像函数,课本中没有给出具体的表达式,但其几何意义非常明显,即由正态曲线N(0,1)、x轴、直线所围成的图形的面积。再由N(0,1)的曲线关于y轴对称,可以得出等式,以及标准正态总体在任一区间(a,b)内取值概率。
4.一般正态分布与标准正态分布的转化
由于一般的正态总体其图像不一定关于y轴对称,所以,研究其在某个区间的概率时,无法利用标准正态分布表进行计算。这时我们自然会思考:能否将一般的正态总体转化成标准的正态总体N(0,1)进行研究。人们经过探究发现:对于任一正态总体,其取值小于x的概率。对等式的来由不作要求,只要会用它求正态总体在某个特定区间的概率即可。
5.“小概率事件”和假设检验的基本思想
“小概率事件”通常指发生的概率小于5%的事件,因为对于这类事件来说,在大量重复试验中,平均每试验20次,才能发生1次,所以认为在一次试验中该事件是几乎不可能发生的。这种认识便是进行推断的出发点。关于这一点我们要有以下两个方面的认识:一是这里的“几乎不可能发生”是针对“一次试验”来说的,因为试验次数多了,该事件当然是很可能发生的;二是当我们运用“小概率事件几乎不可能发生的原理”进行推断时,我们也有5%的犯错误的可能。就是说,这里在概率的意义上所作的推理与过去确定性数学中的“若a则b”式的推理有所不同。
课本是借助于服从正态分布的有关零件尺寸的例子来介绍假设检验的基本思想。进行假设检验一般分三步:
第一步,提出统计假设。课本例子里的统计假设是这个工人制造的零件尺寸服从正态分布。
第二步,确定一次试验中的取值a是否落入范围(μ-3σ,μ+3σ)。
  第三步,作出推断。如果a∈(μ-3σ,μ+3σ),接受统计假设;如果,由于这是小概率事件,就拒绝统计假设。
上面这种拒绝统计假设的推理,与我们过去学习过的反证法有类似之处。事实上,用反证法证明一个问题时,先否定待证命题的结论,这本身看成一个新的命题,从它出发进行推理,如果出现了矛盾,就把这个矛盾归因于前述新命题不正确,从而将它否定。否定了新命题,也就等于证明了原命题的结论。
㈦线性回归(参阅教材)
㈧注意事项
(Ⅰ)1.由概率的性质可知,任一离散型随机变量的分布列具有下述两个性质:
(1)pi≥0,i=1,2,…;(2)p1+p2+…=1。
2.若随机变量的分布列为:P (=k)=Cnk pk qn-k。(k=0,1,2,…,n,0<p<1,q=1-p,则称服从二项分布,记作~B (n,p),其中n、 p为参数,并记Cnk pk qn-k=b(k;n,p)。
对二项分布来说,概率分布的两个性质成立。即:(1)P (=k)=Cnk pk qn-k>0,k=0,1,2,…,n;(2)P (=k)=Cnk pk qn-k=(p+q) n=1。
二项分布是一种常见的离散型随机变量的分布,它有着广泛的应用。
(Ⅱ)1.三种抽样方法的共同点都是等概率抽样,即抽样过程中每个个体被抽取的概率相等,体现了这三种抽样方法的客观性和公平性。若样本容量为n,总体的个体数为N,则用这三种方法抽样时,每一个个体被抽到的概率都是。
2.三种抽样方法的各自特点、适用范围、相互联系及共同点如下表:
类 别
共 同 点
各 自 特 点
相 互 联 系
适 用 范 围
简单随机抽样
抽样过程中每个个体被抽取的概率相等
从总体中逐个抽取
总体中的个体数较少
系统抽样
将总体均分成几个部分,然后按照事先确定的规则在各部分抽取
在起始部分抽样时采用简单随机抽样
总体中的个体数较多
分层抽样
将总体分成几层,分层进行抽取
各层抽样时采用简单随机抽样
总体由差异明显的几部分组成
(Ⅲ)总体密度曲线反映了总体分布,即反映了总体在各个范围内取值的概率。总体在区间(a,b)内取值的概率等于该区间上总体密度曲线与x轴、直线x=a、x=b所围成曲边梯形的面积。
(Ⅳ)1.正态分布由参数μ、σ唯一确定,如果随机变量~N(μ,σ2),根据定义有:μ=E,σ=D。
2.正态曲线具有以下性质:
(1)曲线在x轴的上方,与x轴不相交。(2)曲线关于直线x =μ对称。(3)曲线在x =μ时位于最高点。(4)当x <μ时,曲线上升;当x >μ时,曲线下降。并且当曲线向左、右两边无限延伸时,以x轴为渐近线,向它无限靠近。(5)当μ一定时,曲线的形状由σ确定。σ越大,曲线越“矮胖”,表示总体越分散;σ越小,曲线越“瘦高”,表示总体的分布越集中。
(Ⅴ)⒈在“标准正态分布表”中相应于x0的值(x0)是指总体取值小于的概率,则:(1)(x0)=P(x< x0);(2)(x0)=1-(-x0)。
⒉对于任一正态总体N(μ,σ2)来说,取值小于x的概率F(x)=()。
⒊从理论上讲,服从正态分布的随机变量的取值范围是R,但实际上取区间(μ-
3σ,μ+3σ)外的数值的可能性微乎其微,在实际问题中常常认为它是不会发生的。因此,往往认为它的取值是个有限区间,即区间(μ-3σ,μ+3σ),这即实用中的三倍标准差规则,也叫3σ规则。在企业管理中,经常应用这个规则进行产品质量检查和工艺生产过程控制。
(Ⅵ)线性回归的相关关系与函数关系不同,有相关关系的两个变量存在密切关系,但不存在确定性的函数关系。
第三部分:例题
盒子中有大小相同的球10个,其中标号为1的球3个,标号为2的球4个,标号为5的球3个,第一次从盒子中任取1个球,放回后第二次再任取1个球(假设取到每个球的可能性都相同).记第一次与第二次取到球的标号之和为.
(Ⅰ)求随机变量的分布列;(Ⅱ)求随机变量的期望.
设一汽车在前进途中要经过4个路口,汽车在每个路口遇到绿灯(允许通行)的概率为,遇到红灯(禁止通行)的概率为。假定汽车只在遇到红灯或到达目的地才停止前进,表示停车时已经通过的路口数,求:(Ⅰ)的概率的分布列及期望E;
(Ⅱ)停车时最多已通过3个路口的概率。
从4名男生和2名女生中任选3人参加演讲比赛,设随机变量表示所选3人中女生的人数.(Ⅰ)求的分布列;(Ⅱ)求的数学期望;(Ⅲ)求“所选3人中女生人数”的概率.
甲、乙、丙三台机床各自独立地加工同一种零件,已知甲机床加工的零件是一等品而乙机床加工的零件不是一等品的概率为,乙机床加工的零件是一等品而丙机床加工的零件不是一等品的概率为,甲、丙两台机床加工的零件都是一等品的概率为.
(Ⅰ)分别求甲、乙、丙三台机床各自加工零件是一等品的概率;
(Ⅱ)从甲、乙、丙加工的零件中各取一个检验,求至少有一个一等品的概率.
甲、乙两人参加一次英语口语考试,已知在备选的10道试题中,甲能答对其中的6题,乙能答对其中的8题.规定每次考试都从备选题中随机抽出3题进行测试,至少答对2题才算合格.(Ⅰ)求甲答对试题数ξ的概率分布及数学期望;(Ⅱ)求甲、乙两人至少有一人考试合格的概率.
某同学参加科普知识竞赛,需回答三个问题.竞赛规则规定:每题回答正确得100分,回答不正确得-100分.假设这名同学每题回答正确的概率均为0.8,且各题回答正确与否相互之间没有影响.(Ⅰ)求这名同学回答这三个问题的总得分的概率分布和数学期望;(Ⅱ)求这名同学总得分不为负分(即≥0)的概率.
(
0
1
2
p
某厂生产电子元件,其产品的次品率为5%,现从一批产品中任意连续取出2件,其中次品数( 的概率分布是
一个袋子里装有大小相同的3个红球和2个黄球,从中同时取出两个,则其中含红球个数的数学期望是__________________.
甲、乙两种冬小麦试验品种连续5年的平均单位面积产量如下(单位:t / hm2)
品种
第1年
第2年
第3年
第4年
第5年

9.8
9.9
10.1
10
10.2

9.4
10.3
10.8
9.7
9.8
其中产量比较稳定的小麦品种是 。
某公司生产三种型号的轿车,产量分别为1200辆,6000辆和2000辆。为检验该公司的产品质量,现用分层抽样的方法抽取46辆进行检验,这三种型号的轿车依次应抽取 ,z , 辆。
抽样本检查是产品检查的常用方法.分为返回抽样和不返回抽样两种具体操作方案.现有100只外型相同的电路板,其中有40只A类版后60只B类板.问在下列两种情况中“从100只抽出3只,3只都是B类”的概率是多少?
⑴ 每次取出一只,测试后放回,然后再随机抽取下一只(称为返回抽样);
⑵ 每次取出一只,测试后不放回,在其余的电路板中,随意取下一只(称为不返回抽样)
已知连续型随机变量ε的概率密度函数,且f(x) ≥0,求常数k的值,并计算概率P(1.5≤ε<2.5)。
 
某射击手击中目标的概率为P。求从射击开始到击中目标所需次数的期望、方差。

设,且总体密度曲线的函数表达式为:,x∈R。 (1)求μ,σ;(2)求及的值。

公共汽车门的高度是按照确保99%以上的成年男子头部不跟车门顶部碰撞设计的,如果某地成年男子的身高ε~N(173,7)(单位:cm),问车门应设计多高(精确到1cm)?
设随机变量ε服从N(0,1),求下列各式的值:
(1)P(ε≥2.55); (2)P(ε<-1.44); (3)P(|ε|<1.52)。
某厂生产的圆柱形零件的外径ε~N(4,0.25)。质检人员从该厂生产的1000件零件中随机抽查一件,测得它的外径为5.7cm。试问该厂生产的这批零件是否合格?
A、B两个代表队进行乒乓球对抗赛,每队三名队员,A队队员是A1、A2、A3,B队队员是B1、B2、B3 。按以往多次比赛的统计,对阵队员之间胜负概率如下:
对阵队员
A队队员胜的概率
A队队员负的概率
A1对B1


A2对B2


A3对B3


现按表中对阵方式出场, 每场胜队得1分, 负队得0分。设A队、B队最后总分分别为 (、(。
(Ⅰ) 求 (、( 的概率分布;
(Ⅱ) 求E(、E(。
(Ⅲ)强化训练
1
2
3
4
p
m
随机变量的的分布列如下,则m= ()(A)(B) (C) (D)
设随机变量服从二项分布B(6,),则P(=3)= ()
(A) (B) (C) (D)
从签盒中有编号为1、2、3、4、5、6的六支签中,任意取3支,设为这3支签的号码之中最大的一个。则的的数学期望为 ()
(A)5(B)5.25(C)5.8(D)4.6
某射手射击时击中目标的概率为0.7,设4次射击击中目标的次数为随机变量,则P(1)等于 ()
(A)0.9163(B)0.0081(C)0.0756(D)0.9919
在简单随机抽样中,某一个个体被抽到的可能性是 ()
与第几次抽样有关,第一次抽的可能性最大。
与第几次抽样有关,第一次抽的可能性最小。
与第几次抽样无关,每次抽到的可能性相等。
与第几次抽样无关,与抽取几个样本有关。
一个年级有12个班,每个班有50名学生,随机编为1~50号,为了了解他们在课外的兴趣爱好要求每班是40号学生留下来进行问卷调查,这里运用的抽样方法是 ()(A)分层抽样 (B)抽签法 (C)随机数表法 (D)系统抽样法
从总体中抽一个样本,2、3、4、8、7、6,则样本平均数为= ()
(A)4 (B)5 (C)6 (D)6.5
下面哪有个数不为总体特征数的是 ()
总体平均数(B)总体方差(C)总体标准差(D)总体样本
为了抽查某城市汽车尾气排放执行标准情况,在该城市的主干道上采取抽取车牌末位数字为5 的汽车检查,这种抽样方法称为 ()
(A)简单随机抽样(B)随机数表法(C)系统抽样法 (D)分层抽样法
设15000件产品中有1000件废品,从中抽取150件进行检查,查得废品的数学期望为()(A)20 (B)10 (C)5 (D)15
某一计算机网络,有几个终端,每个终端在一天中使用的概率p,则这个网络中一天平均使用的终端个数为 ()(A)np(1-p) (B)np (C)n (D)p(1- p)
下列说法正确的是: ()
甲乙两个班期末考试数学平均成绩相同,这表明这两个班数学学习情况一样
期末考试数学成绩的方差甲班比乙班的小,这表明甲班的数学学习情况比乙班好
期末考试数学平均成绩甲、乙两班相同,方差甲班比乙班大,则数学学习情况甲班比乙班好
期末考试数学平均成绩甲、乙两班相同,方差甲班比乙班小,则数学学习情况甲班比乙班好
ζ
7
8
9
10
P
0.21
P
0.29
0.22
某射击运动员射击所得环数的分布列如图所示,则P(=8)= ()
(A)P(P>0)(B)0.38(C)0.41(D)0.28
设随机变量的的分布列为P(=k)=(k=1、2、3、4、5、6),则P(1.5<3.5)= ()(A)(B)(C)(D)
如果η~B(15,)则使P(η=k)最大的k是 ()
(A)3 (B)4 (C)5 (D)3 或4
某人有资金10万元,准备用于投资经营甲,乙两种商品,根据统计资料:
经营甲 经营乙
获利(万元)
2
3
-1
概率
0.4
0.3
0.3
获利(万元)
1
4
-2
概率
0.6
0.2
0.2
那么,他应该选择经营 种商品。
在10件产品中有8件正品,从中任意地取出3件,设取到正品的个数为ζ,则ζ的取值可以有 种。
要检查某厂的产品合格率,检查人员从1000件产品中任意抽取了50件,问这种抽样的方法是 。
若样本a1,a2,a3的方差是2,则样本2a1+3,2a2+3,2a3+3的方差是 。
甲、乙两种棉花,各抽取50根棉花纤维检验长度,样本方差分别是s甲=1.32,s乙=0.93,这两种棉花质量较好的是 。
甲、乙两学生连续五次数学测验成绩如下,甲:80、75、80、90、70;乙:70、70、75、80、65。则可以认为 的数学成绩比较稳定。
某厂生产电子元件,其产品的次品率为5%,现从一批产品中任意地连续取出两件,其中次品数的概率分布是:
ζ
0
1
2
P



若样本a1,a2,a3的方差是2,则样本2a1,2a2,2a3的方差是 。
0
1
2
p
x2
x
已知随机变量的分布列如下:
求x的值。
袋中有3个白球,2个红球,从袋中随机取2个球,假设取得1个白球得1分,取得1个红球得0分,求得分值的分布列。(要写出解题过程,并按要求填空)
p

有10张卡片,其中8张标有数字2,有2张标有数字5,从中随机地取出3张卡片,设3张卡片的数字之和为随机变量。求E,D。
某市教委,为了指导教师更好地做好2002年高三复习迎考工作,决定对全市第一次高三模拟考试成绩进行分析,要从全市2008张考卷中抽取200份试卷,请你设计一个系统抽样,抽取所需数目的样本。
样本(x1,x2,x3,…,xn)的样本均值为,样本(x1,x2,x3,…,xn, xn+1)的样本均值为。
求证:=+ xn+1
据统计,一年中一个家庭万元以上财产被窃的概率为0.01,保险公司开办一年期万元以上家庭财产保险,参加者需交保险费100元,若在一年以内,万元以上财产被窃,保险公司赔偿a万元(a>100),问a如何确定,可是保险公司期望获利?
某公司有三个部门,第一个部门800个员工,第二个部门604个员工,第三个部门500个员工,现在用按部门分层抽样的方法抽取一个容量为380名员工的样本,求应该删除几个人,每个部门应该抽取多少名员工?
已知连续型随机变量的概率密度函数为:
f(x)= 且f(x)0,
求常数k的值,并计算概率p(1.5<ζ<2.5)。
在同样条件下,用甲乙两种方法测量某零件长度(单位mm),由大量结果得到分布列如下:
48
49
50
51
52
P
0.1
0.1
0.6
0.1
0.1
甲:
η
48
49
50
51
52
P
0.2
0.2
0.2
0.2
0.2
乙:
问哪种方法精度较好?
某班40人随机平均分成两组,两组学生一次考试的成绩情况如下表:
统计量
组别
平均
标准差
第一组
90
6
第二组
80
4
求全班的平均成绩和标准差。
某企业对一项工程的完成有三个方案,甲、乙、丙每个方案的获利情况如下表所示:
自然状况
方案甲
方案乙
方案丙
概率
获利
(万元)
概率
获利
(万元)
概率
获利
(万元)
巨大成功
0.4
6
0.3
7
0.4
6.5
中等成功
0.3
2
0.4
2.5
0.2
4.5
不成功
0.3
-4
0.3
-5
0.4
-4.5
问企业应选择哪种方案?
甲乙两人参加普法知识竞赛,其中选择题6个,判断题4个,甲、乙二人依次各抽一题.
(I) 甲抽到选择题、乙抽到判断题的概率是多少?
(II) 甲、乙二人中至少有一人抽到选择题的概率是多少?
用A、B、C三类不同的元件连接成两个系统N1、N2. 当 元件A、B、C都正常工作时,系统N1正常工作,当元件A正 常工作且元件B、C至少有一个正常工作时,系统N2正常工作. 已知元件A、B、C正常工作的概率依次为0.80, 0.90, 0.90,分 别求系统N1、N2正常工作的概率。
某单位6个员工借助互联网开展工作,每个员工上网的概率都是0.5 (相互独立)。
(Ⅰ) 求至少三人同时上网的概率;
(Ⅱ) 至少几人同时上网的概率小于0.3?
有三种产品,合格率分别为0.90, 0.95和0.95,各抽取一件进行检验。
(Ⅰ) 求恰有一件不合格的概率; (Ⅱ) 求至少有两件不合格的概率。(精确到0.001)
在某次花样滑冰比赛中,发生裁判受贿事件。竞赛委员会决定将裁判由原来的9名增到14名,但只取其中7 名裁判的评分作为有效分。若14名裁判中有2人受贿,则有效分中没有受贿裁判的评分的概率是 。(结果用数值表示)
某国际科研合作项目成员由11个美国人、4个法国人和5个中国人组成。现从中随机选出两位作为成果发布人,则此两人不属于同一个国家的概率为 。(结果用分数表示)

展开更多......

收起↑

资源预览