资源简介 (共81张PPT)概率论与数理统计第一章 随机事件与概率1.1 随机事件及其运算1.1.1 随机试验1.1.2 随机事件1.1.3 随机事件的关系与运算概率论起源概率统计是一门古老的学科,它起源于十七世纪资本主义上升的初期。物质生活的丰富,人们开始重视精神娱乐。在桥牌活动中,经常要判断某种花色在对方手中的分配;在掷色子中,要判断哪点出现的次数最多。概率论与数理统计正是从研究这类问题开始的。尽管发展较早,但形成一门严谨的学科是在本世纪三十年代,前苏联数学家柯尔莫奇洛夫给出了概率的公理化定义后,才得以迅速发展。随着计算机的问世,六十年代后,形成了许多新的统计分支:时间序列分析,统计推断等等。目前它几乎遍及所有的学科技术领域。 概率论是研究什么的?前 言人们生活中所观察到的现象大体上分成两类:1.确定性现象或必然现象事前可以预知结果的:即在某些确定的条件满足时,某一确定的现象必然会发生,或根据它过去的状态,完全可以预知其将来的发展状态,如太阳必然从东方升起,上抛物体必然下落,水在冰点以下会结冰等;2.偶然性现象或随机现象事前不能预知结果:即在相同的条件下重复进行试验时,每次所得到的结果未必相同,或即使知道它过去的状态,也不能肯定它将来的状态。生活中的现象案例1.1.1 调查某省教育行业从业人员对职业的满意度,将满意度分为“满意”“基本满意”“不满意”“特别不满意”4种,现随机选取一个从业人员,询问其对职业的满意度。因为人员选取是随机的,所以调查结果具有一定的偶然性。案例1.1.2 某城市交通管理部门或者保险公司需要考察该城市每周的交通事故数,因为无法预知每周的交通事故数,所以考察结果具有一定的随机性。案例1.1.3 某灯泡生产企业希望测试某种型号灯泡的寿命(单位:h),由于测试前并不能确定其寿命,因此测试结果具有一定的随机性。案例1.1.4 某超市为了改善其经营服务质量,需要了解每位顾客在收银台结账排队的等待时间(单位:min),由于观察前并不能确定顾客的等待时间,因此观察结果具有一定的随机性。随机现象的例子概率论是研究什么的?随机现象特点:不确定性与统计规律性概率论——研究和揭示随机现象的统 计规律性的科学研究方式:大量重复观察或试验,收集数据,统计分析其表现出来的统计规律。为了研究这种规律性所做的观察或试验称为随机试验。上述案例的结果具有偶然性或随机性,也称为不确定性,随机现象是指一次观察或试验中,其结果具有随机性或偶然性,但在大量观察或试验中,其结果会呈现一定规律性的现象。1.1.1 随机试验随机试验(试验)的特点:(1)可重复性:试验可以在相同条件下重复进行;(2)可观察性:试验的可能结果不只一个,并且能预知试验的所有可能结果;(3)不确定性:每次试验之前不能确定出现何种结果,但可以确定会出现所有可能结果中的一个。具有上述三个特点的试验称为随机试验,简称试验,记为E。E1: 掷一颗骰子,观察所掷的点数是几;E2 :工商管理部门抽查产品是否合格;E3: 观察某城市某个月内交通事故发生的次数;E4 :已知物体长度在a和b之间,测量其长度;E5: 对某只灯泡做试验,观察其使用寿命;E6: 对某只灯泡做试验,观察其使用寿命是否小于200小时。(随机)试验的例子样本空间:试验的所有可能结果所组成的集合称为样本空间。记为:样本点: 试验的单个结果或样本空间的单元素称为样本点。样本空间与样本点E1: 掷一颗骰子,观察所掷的点数是几;E2 :工商管理部门抽查产品是否合格; {合格品,不合格品}E3: 观察某市某月内交通事故发生的次数;E4 :物体长度在a和b之间,测量其长度;E5: 对某只灯泡做试验,观察其使用寿命;E6: 对某只灯泡做试验,观察其使用寿命是否小于200小时。 {小于200小时,不小于200小时}(随机)试验的例子注:从集合的角度来看,样本空间就是试验的所有可能结果组成的集合,而集合中的元素就是样本点。随机事件:样本空间的任意一个子集称为随机事件, 简称“事件”.记作A、B、C。任何事件均可表示为样本空间的某个子集.基本事件:一个随机事件只含有一个试验结果。事件A发生当且仅当试验的结果是子集A中的元素。两个特殊事件:必然事件:样本空间包含了所有的样本点,且是自身的一个子集,在每次试验中总是发生。不可能事件 :不包含任何的样本点,也是样本空间的一个子集,在每次试验中总不发生。注意:样本点和基本事件的区别。1.1.2 随机事件解:为基本事件例 掷一颗色子,用 表示所掷点数。B表示“偶数点”,C表示“奇数点”,D表示“四点或四点以上”。写出样本空间,指出哪些是基本事件,表示B,C,D。例题既然事件是一个集合,因此有关事件间的关系、运算及运算规则也就按集合间的关系、运算及运算规则来处理。1.1.3 随机事件的关系与运算 是试验E的样本空间,A,B,C 是事件1.子事件(A B):“ 事件 A发生必有事件B发生”记为 A B,称 A为B的子事件。A=B A B且B A.1.1.3 随机事件的关系与运算2.和事件: “事件A与事件B至少有一个发生”,记作 A B推广:n个事件A1, A2,…, An至少有一个发生,记作1.1.3 随机事件的关系与运算3.积事件:事件A与事件B同时发生,记作 A B=ABA和B的公共部分推广:n个事件A1, A2,…, An同时发生,记作 A1A2…An1.1.3 随机事件的关系与运算4.互不相容事件(也称互斥事件): 即事件A与事件B不可能同时发生。AB= 1.1.3 随机事件的关系与运算5.对立事件(也称逆事件): A B= , 且AB= 注意:对立一定互斥,互斥不一定对立。1.1.3 随机事件的关系与运算.显然,4.差事件 :A-B称为A与B的差事件,表示事件A发 生而事件B不发生,即A去除A和B的公共部分。1.1.3 随机事件的关系与运算显然,有事件运算1、交换律:A B=B A,AB=BA2、结合律:(A B) C=A (B C),(AB)C=A(BC)3、分配律:(A B)C=(AC) (BC),(AB) C=(A C)(B C)4、自反律:5、对偶(De Morgan)律:1.1.3 随机事件的关系与运算例1.1.1 设A, B, C为3个事件,用A、B、C的运算式表示下列事件。(2)A与B都发生、C不发生:AB-C或AB(3)3个事件都发生:ABC(4)3个事件恰好发生1个:(5)3个事件恰好发生2个:(6)3个事件中至少发生1个:1.1.3 随机事件的关系与运算(1)A发生、B与C都不发生: 、A-B-C、1.1.3 随机事件的关系与运算例1.1.2 已知系统由元件A、B、C组成,连接方式如图1.1.2所示。设A、B、C分别表示事件“元件A正常”“元件B正常” “元件C正常”,则如何表示事件“系统正常”及事件“系统发生故障”呢?解:“系统正常”可理解为系统A正常且系统B或系统C至少有一个正常( ),因此可表示为 ;“系统发生故障”可理解为“系统正常”的对立事件,因此可以表示为根据对偶律也可以表示为例如:某人向目标射击,以A表示事件“命中目标”,则事件A发生的概率P(A)=?又如,掷一枚均匀硬币,“出现正面”的概率为0.5,人们能够普遍接受这一结论。但是,它的确切含义是什么?是否表示掷10次硬币,正面一定会出现5次吗? 1.2 事件的概率我们要研究随机现象,不仅仅要知道所有可能发生的结果,更主要的是要了解各种可能结果发生的可能性大小, 也就是计算各种随机事件发生的概率.古典概型是最简单、最经典的概率模型,它简单、直观,不需要做大量的重复试验,而且容易理解。下面看两个案例。1.2.1 古典概型案例 1.2.1 概率起源于早期欧洲国家贵族之间盛行的赌博。设甲、乙两个赌徒约定比赛规则为投掷两颗骰子,如果两颗骰子朝上的点数之和为 5,那么甲获胜;如果朝上的点数之和为 4,那么乙获胜,这个规则公平吗?显然基本事件总数为36,每个基本事件发生的可能性相同.,因为P(A)>P(B),即甲获胜的概率比乙大,所以如果骨子是均匀的,比赛规则不公平.分析 若骨子是均匀的,则投掷结果的样本空间为解 令A表示事件“甲获胜(两颗骰子点数之和为5)”, B表示事件“乙获胜(两颗骰子点数之和为4)”,则1.2.1 古典概型案例 1.2.2 选择题是标准化考试中常用的题型. 假设考生完全不会做某个单选题,随机地从A,B,C,D四个选项中任选一个作为答案,其答对的概率是多少?如果该考生做某个多选题,其答对的概率又是多少?考生选中15个备选答案中任何一个的可能性相同,而正确答案只有一个,因此,答对的概率是1/15。分析 显然,如果是做单选题,则其样本空间为因为考生完全不会做,其选中四个选项中任何一个的可能性是相同的,因此答对的概率是25%.如果是做多选题,则其样本空间为在这两个案例中,样本空间共同的特点是:只有有限个基本事件(样本点);每个基本事件发生的可能性相同. 具有这两个特点的概率模型通常称之为古典概型.若某试验E满足:1.有限性:样本空间2.等可能性:则称E为古典概型也叫等可能概型(定义1.2.1)。1.2.1 古典概型古典概型中概率的求法试验E的结果有有限种:样本点是有限个: 1,…, nΩ={ 1}∪{ 2 }∪…∪{ n}{ i}是基本事件,且各自发生的概率相等。于是,有1=P(Ω)=P({ 1}∪{ 2 }∪…∪{ n})=P({ 1})+P({ 2 })+…+P({ n})=n P({ i}), i=1,2,…,n。从而, P({ i})= 1/n,i=1,2,…,n.因此,若事件A 包含 k 个基本事件,即则古典概型中概率的求法例1.2.1 投掷一对均匀骰子一次,求两枚骰子之和为7点或者11点的概率.古典概型中概率的求法解 掷一对骰子一次的样 本空间如图所。(a,b)表示第一枚骰子为a点,第二枚骰子为b点。由于骰子是均匀的,故样本点总数为36. 设A表示事件“骰子之和为7点或11点”,则A为图中阴影部分, 显然A包含了8个样本点, 因此依据古典概型中概率计算公式得例1.2.2 箱子中有10个标有号码为的乒乓球, 从中依次随机地取两个球,在下列两种情形下分别求两个球中恰有一个号码超过6的概率:(1)有放回情形; (2)无放回情形.古典概型中概率的求法解 设事件A表示“两个乒乓球中恰有一个号码超过6”. 现从中依次取两个乒乓球,每一种取法视作一个基本事件。显然,样本空间仅有有限个元素,且每个基本事件发生是等可能的。(1)有放回情形, 先确定样本点总数n,第一次取时有10个球可供选择,有10种取法.由于取后放回,故第二次取时仍有10种取法,由计数法的乘法原理,共有10×10种取法, n = 100再确定A包含的样本点数,有两种情形:一是第一次取到号码大于6的球且第二次取到小于等于6的,共有4×6种取法;二是第一次取到号码小于等于6的球且第二次取到超过6的,共有6×4种取法,由加法原理可得例1.2.2 箱子中有10个标有号码为的乒乓球, 从中依次随机地取两个球,在下列两种情形下分别求两个球中恰有一个号码超过6的概率:(1)有放回情形; (2)无放回情形.古典概型中概率的求法(2)无放回情形:先确定样本点总数n,第一次取时有10个球可供选择,有10种取法。由于取后无放回,故第二次取时有9种取法,由计数法的乘法原理,共有10×9种取法,即n=90。再确定A包含的样本点数,也有两种情形:一是第一次取到号码大于6的球且第二次取到号码小于或等于6的球,共有 4×6 种取法;二是第一次取到号码小于或等于6的球且第二次取到号码大于6的球,共有6×4种取法,由加法原理可得例1.2.3 设有n个球,每个都能以同样的概率1/N落到N个格子(N>n)的每一个格子中,试求:(1)某指定的n个格子中各有一个球的概率;(2)任何n个格子中各有一个球的概率.古典概型中概率的求法解 这是一个古典概型问题,由于每个球可落入N个格子中的任一个,所以n个球在N个格子中的分布相当于从N个元素中任取n个进行有重复的排列,故共有Nn 种可能。在第一个问题中,包含的样本点数相当于n个球在那指定的n个格子中全排列,总数为n!, 因而所求概率为在第二个问题中,n个格子可以是任意的,即可以从N个格子中任意取出n个来,这种取法共有种,对于每种取定的n个格子,包含的样本点数与第一个问题一样为n!, 故所求概率为古典概型中概率的求法这个例子是古典概型中一个很典型的问题,不少实际问题可以归结为此模型。概率论历史上有一个颇为有名的问题: 求参加某次聚会的n个人中没有两个人生日相同的概率. 若把n个人看作上面问题中的n个球,而把一年的365天作为格子,则 N=365.这时P2就是所求的概率. 例如:当n=40时P2≈0.109, 说明40人中没有两人同一天生日的概率很小。此外还有分房、投信、上下电梯等等类似的问题都可以采用类似的思路求解。古典概型是可应用于可能结果为有限的情形,对于试验的可能结果有无穷多种的情形,概率的古典定义并不适用。 因此需要把这种做法推广到无限多个可能结果而又有某种等可能性的场合。请看下面几个简单的例子。案例1.2.3 设甲地至乙地的地铁每隔15分钟发一趟. 某人来到地铁站前并不知道发车时刻表,求他等车时间少于10分钟的概率.案例1.2.4 如果在一个5万km2海域里有表面积达40km2的海域储着石油,假如在这海域里随意选定一点钻探,问钻到石油的概率是多少?案例1.2.5 在200亳升自来水中有一个大肠杆菌. 今从中随机取出20亳升水样放到显微镜下观察,求发现大肠杆菌的概率。我们很自然的认为上述案例中的答案分别是。 事实上,在求这些概率时,我们利用了几何的方法,并假定了某种等可能性。1.2.2 几何概型试验的可能结果是某区域内中的一个点,向内随机地投掷一点M,点M落在的任一子区域G()内的可能性与G的长度(或面积,或体积等)成正比,而与G的形状、位置无关,设A={M落入G内},令:P(A)=其中在一维(二维或三维)情形下,表示长度(面积或体积),这种模型一般是采用几何的方法求概率,故将其称为几何概型.1.2.2 几何概型例 1.2.4(会面问题) 甲、乙两人约定于中午 12:00 至 13:00 在预定地点会面,先到的人等候另一个人 20min 后,方可离开。计算甲、乙两人能会面的概率。假设他们在 12:00 至13:00 内的任意时刻到达预定地点的可能性是相同的。古典概型中概率的求法解 设甲、乙两人到达预定地点的时刻离12:00的分钟数为x,y,则样本空间为设A表示“二人能会面”,则如图所示因此案例 1.2.6(蒲丰投针试验) 平面上有一些等距的平行线,它们之间的距离为 a。现向平面投掷一枚长为 l(l古典概型中概率的求法解 设事件A={针与平面上任一平等线相交},且x表示针的中点M到最近一条平行线的距离,表示针与平等线的夹角(如图)。因此样本空间为而针与平行线相交的充要条件是 , 即事件A为所求的概率为定义1.2.2 在相同条件下,事件A在n次重复试验中发生次,则称比值称为事件A在n次试验中发生的频率,记为fn(A).1.2.3 频率与概率注意:fn(A)称为“n次试验发生的频率”,是因为随着n的取值不同, fn(A)的值有可能不同。历史上曾有人做过试验,试图证明抛掷匀质硬币时,出现正反面的机会均等。实验者 n nH fn(H)De Morgan 2048 1061 0.5181Buffon 4040 2048 0.5069K. Pearson 12000 5981 0.4984K. Pearson 24000 12012 0.5005从表中不难发现:事件A在n次试验中发生的频率具有随机波动性。当n较小时,波动的幅度较大;当n较大时,波动的幅度较小;最后随着n的逐渐增大,频率fn(A)逐渐稳定于固定值0.5(教材的例1.2.5 中计算机模拟抛一枚硬币试验的结果可作佐证)。1.2.3 频率与概率这些试验的结果很有启发性:虽然在一次试验或观察中某一个随机事件A是否发生是偶然的,但当试验次数越来越大时,事件A出现的频率总在某个固定常数p附近摆动,而且一般来说次数越大,摆动的幅度越小,则称p为随机事件A的概率. 这一规律称为频率的稳定性,即前面提到的统计规律性,这是概率的统计定义。定义1.2.3 设随机事件A在n次重复试验中发生了次。若当n越来越大时,频率稳定地在某一个数p(01.2.3 频率与概率从定义来看,当试验足够大时可以用频率作为概率的近似值。频率的稳定性说明了随机事件发生的概率是随机事件本身固有的、不随人们意志而改变的一种客观属性,可以对它进行度量,从中也可以看出频率和概率有十分密切的联系,又有本质区别。概率的统计定义是数理统计的基础,有着十分重要的意义:(1)它提供了估计概率的方法:如在选举中通过抽样调查得到一部分选民的选票来估计全部选民对某候选人的支持率;在工业生产中,可抽取部分产品进行质检,根据这些产品的检验结果,去估计全部产品的次品率;在医学上可根据积累的资料去估计某种疾病的死亡率等等;(2)它提供了检验理论正确与否的准则:例如,依据某种理论算出了事件A的概率p,为了验证其准确性,可用大量重复试验得到的频率与p相比较,若两者很接近,则可认为试验的结果支持有关理论,否则认为理论有问题。1.2.3 频率与概率1.2.4 概率的公理化定义及性质定义1.2.4 若对样本空间 中的每一事件A,定义一个实数P(A)与之对应,如果P(A)满足条件:(1)非负性: P(A) ≥0;(2) 规范性: P( )=1;(3) 可列可加性:若事件A1,A2,…, 两两互斥,即AiAj= ,(i j), i , j=1, 2, …, 有P( A1 A2 … )= P(A1) +P(A2)+….则称实数P(A)为事件A的概率。概率的性质:(1) P(Φ)=0 ;(2) 有限可加性:设事件A1,A2,…An 两两斥,即AiAj= ,(i j), i , j=1, 2, …, n ,则有P( A1 A2 … An)= P(A1) +P(A2)+… P(An);(3)单调不减性:若事件 ,则P(B-A)=P(B)-P(A) ,P(B)≥P(A)注意:一般情况下,P(B-A)=P(B)-P(AB)1.2.4 概率的公理化定义及性质(4) 对任一事件A, ;(5) 互补性:P()=1- P(A);(6) 加法公式:对任意两事件A、B,有P(A B)=P(A)+P(B)-P(AB)该公式可推广到任意n个事件A1,A2,…,An的情形;1.2.4 概率的公理化定义及性质例1.2.6 袋中有8个黑球和10个白球,球的大小、形状和重量都一样,从中任意摸出4个球,计算至少有一个黑球的概率。古典概型中概率的求法解 解法一 设Ai为“恰有i个黑球”,A为“至少有一个黑球”, 则解法二 设A为“摸出至少有一个黑球”, 则为“摸出的全是白球”, 显然例1.2.7 设有任意两个事件A,B,若P(A)=0.5,P(B)=0.3,P(AB)=0.1, 求:(1)A发生但B不发生的概率;(2)A不发生但B发生的概率;(3)至少有一个事件发生的概率;(4)A,B都不发生的概率;(5)至少有一个事件不发生的概率.。古典概型中概率的求法解在实际问题中,经常会遇到这样的情形:在已知某事件(一般与被研究的事件有关)发生的条件下,确定被研究事件发生的概率。换句话说,在已有一些信息(条件)时,计算某一事件的概率应用考虑已知信息,此时得到的概率就是条件概率.1.3 条件概率案例 1.3.1 有两个班的同学参加概率论与数理统计的考试,考试结果如表所示。从表中,显然可知这次考试同学们的及格的概率为。假设,现在已知某同学是一班的,请问他考试及格的概率?自然我们从一班的数据中可以算出该同学及格的概率为。显然这两个概率不一样,为什么呢?因为样本空间不一样了。在这我们记“某同学是一班”为事件B,“考试及格”为事件A. 则“已知某同学是一班的,求他考试及格的概率”可以理解为事件B已经发生的条件下,求事件A发生的概率,这就是条件概率,记作P(A|B)。1.3.1 条件概率的定义在引例中,容易验证基于上述引例的启发,下面给出条件概率的定义:定义1.3.1 设A和B是样本空间中的两个事件, 且 ,称P(A|B)为事件 B 发生的条件下事件 A 发生的概率,简称为 A 关于 B 的条件概率。1.3.1 条件概率的定义 “条件概率”是“概率”吗?条件概率P(A|B)满足概率定义中的三个条件:非负性:P(A|B) ≥0,对每个事件A;规范性:P(Ω)=1;(3)可列可加性:设A1,A2,…, 是一列两两斥的事件,即AiAj= ,(i j), i , j=1, 2, …, 有P(( A1 A2 … )|B)= P(A1|B) +P(A2|B)+….(4)(5)1.3.1 条件概率的定义例1.3.1 有10个产品, 内有3个次品, 从中一个个地抽取(不放回) 检验, 问第一次取到次品后第二次再取到次品的概率。解:样本空间是从 10 个产品中有序取出 2 个产品的不同方法,这是一个排列问题,可知的样本点数为10× 9 =90。设 A ={第一次取出的是次品},B ={第二次取出的是次品},则事件 AB 中的样本点数为3×2=6,事件 A 中的样本点数为 3×9=27(第一次从 3 个次品中取出 1 个次品有 3 种取法,第二次从剩余 9 个产品中任取 1 个有 9 种取法),故1.3.1 条件概率的定义例1.3.2 掷两个骰子,观测出现的点数,设 x、y 分别为第一枚、第二枚骰子掷出的点数, 记A={(x,y)|x+y≥9},B= {(x,y) |x>y},求 P(A|B)和 P(B|A)。解:掷一对骰子一次的样本空间如图所示。(x,y)表示第一枚骰子为 x 点,第二枚骰子为 y 点。由于骰子是均匀的,故样本点总数为 36。A 的样本点数为 10,B 的样本点数为 15,AB的样本点数为 4,可得显然, P(A|B) P(B|A),说明这两个条件概率含义不同。1.3.1 条件概率的定义1.3.2 乘法公式定理1.3.1 设A、B ,P(A)>0,P(B)>0时,则 P(AB)=P(A)P(B|A),P(AB)=P(B)P(A|B),称为事件A、B的概率乘法公式。还可推广到三个事件的情形:P(ABC)=P(A)P(B|A)P(C|AB);一般地,有下列公式:P(A1A2…An)=P(A1)P(A2|A1)...P(An|A1…An-1)。上面公式的右边看似麻烦,其实在实际中很容易算出,这是在未知 n 个事件之间的相互关系时,计算 n 个事件同时发生的重要公式。例 1.3.3 某人忘了饭店电话号码的最后一个数字,随机拨号,计算他三次之内拨通电话的概率。解:令 Ai={第 i 次打通电话},i = 1, 2, 3,则1.3.2 乘法公式案例 1.3.2 某味精生产企业流水线生产的味精按 100 袋装箱,味精出厂的检验标准是从每箱产品中抽取 12 袋进行检验,若没有发现不合格产品,则通过检验,否则开箱逐袋检验。据统计每箱产品中的次品数不超过 3,每箱产品中有 i 袋次品的概率如下表所示。试问:(1)检验部门能否预估每箱产品的通过率,以及不能通过检验需要的开箱率?(2)每箱抽检的产品数少于 12 或多于 12 时,通过率与开箱率如何变化?企业若要严控质量,则应增加还是减少抽检的产品数?请给出量化说明。1.3.3 全概率公式案例 1.3.2 试问:(1)检验部门能否预估每箱产品的通过率,以及不能通过检验需要的开箱率?(2)每箱抽检的产品数少于 12 或多于 12 时,通过率与开箱率如何变化?企业若要严控质量,则应增加还是减少抽检的产品数?请给出量化说明。分析:设事件 A 表示“按照检验标准,某箱产品能够通过检验”,A是否发生显然与箱中的次品数有关。设事件Bi表示“箱中有i袋次品”(i=0,1,2,3),则事件A与这组事件Bi密切相关,Bi满足 。如何求解A呢?在此先引入相关的概念。1.3.3 全概率公式定义1.3.2 事件组B1,B2,…,Bn (n可为 ),称为样本空间 的一个划分,若满足:定理1.3.2 设B1,…, Bn是 的一个划分,且P(Bi)>0,(i=1,…,n),则对任何事件A 有1.3.3 全概率公式称为全概率公式。它的理论和实用意义在于:在较复杂情况下,直接计算P(A)不容易, 但总可以适当地构造一组两两互斥的Bi , 使A伴随着某个Bi 的出现而出现,且每个 P( ABi ) 容易计算。可用所有 P( ABi ) 之和计算 P(A).1.3.3 全概率公式案例 1.3.2 解:(1)条件概率具体结果如下表所示。由全概率公式,可得因此,当每箱抽检 12 袋且每次不放回时,通过率为 0.809,不能通过检验需要的开箱率为1-0.809=0.191。1.3.3 全概率公式案例 1.3.2 解:(2)设每箱抽检的产品数为 n,以 n=8,10,12,15,18 为例,将各种情况下通过检验的事件都记为A,参照(1)计算每箱产品通过检验的概率,具体结果如下表所示。可见,抽取的产品数越多,通过率越低,不能通过检验需要的开箱率越高。因此,企业若要严控质量,则需要增加抽检的产品数。1.3.3 全概率公式例1.3.4 一条狗在野营后走失,猜想狗可能有三种去向:A:它已回家。B:仍在原地啃骨头。C:已走失到附近的树林中。根据狗的习性粗略估计上述三种去向的概率分别为 0.25、0.5、0.25。一个小孩被派回去找狗,如果狗仍在原地啃骨头,那么小孩找到狗的概率为 0.9;如果狗已走失到附近的树林中,那么小孩找到狗的概率为 0.5。计算小孩找到狗的概率。解:显然,{A, B, C}是对样本空间的一个分割,设事件 D 为“小孩找到狗”,则P(A)=0.25,P(B)=0.5,P(C)=0.25,P(D|A)=0, P(D|B)=0.9, P(D|C)=0.5,由全概率公式可得P(D)=P(A)P(D|A)+P(B)P(D|B)+P(C)P(D|C)=0.5751.3.3 全概率公式例1.3.5 设某厂产品的一个零部件是由三家上游厂商提供的,第 1 个厂提供 50%的零部件,第 2 个厂和第 3 个厂分别提供 25%的零部件。已知第 1 个厂的次品率是 1%,第 2 个厂的次品率是 3%,第 3 个厂的次品率是 4%,现从该厂产品中任取一个产品,计算该产品的零部件是次品的概率。解:设 Bi ={取到的产品零部件是第 i 个厂生产的},i=1,2,3,易见{B1,B2,B3}是对样本空间的一个分割,且 P(B1) = 0.5,P(B2) = P(B3) = 0.25,设事件 A 为“该产品的零部件是次品”,则有P(B1) = 0.5,P(B2) = P(B3) = 0.25,P(A|B1)=0.01,P(A|B2)=0.03,P(A|B3)=0.04,由全概率公式可得P(A) == 0.01×0.5+0.03×0.25+0.04×0.25=0.02251.3.3 全概率公式案例 1.3.3 对于例 1.3.5,若取出产品的零部件是次品,则该零部件最有可能是由哪个厂提供的?分析:沿用例 1.3.5 的假设,已知 P(Bi)、P(A|Bi),要明确该零部件最有可能是由哪个厂提供则需要计算各厂生产的概率 P(Bi|A),比较这三个概率的大小即可。根据条件概率公式,可得1.3.4 贝叶斯公式定理1.3.3 设B1,…, Bn是Ω的一个划分,且P(Bi) > 0,(i=1,…,n),则对任何事件A Ω,有称为贝叶斯公式。1.3.4 贝叶斯公式案例 1.3.3 解:1.3.4 贝叶斯公式计算得到的三个概率中, P(B3| A) 最大,因此该零部件最可能是由第三个厂生产的。案例 1.3.4(续案例 1.3.2) 每箱有 100 袋味精,从中抽检 12 袋,若没有发现不合格产品,则通过检验,否则不能通过检验。按照原先的认识,每箱产品中有 i 袋次品的概率如下表所示。试问:(1)若某箱味精通过了该检验,你对原次品率的认识是否改变?(2)若某箱味精没有通过该检验,你对原次品率的认识是否也会改变?1.3.4 贝叶斯公式解:沿用案例 1.3.2 中的假设,即 A 表示“按照检验标准,某箱产品能够通过检验”,事件 Bi表示“箱中有 i 袋次品”(i=0,1,2,3),则根据贝叶斯公式,某箱通过检验的味精中恰有 i 袋次品的概率为1.3.4 贝叶斯公式同理,某箱没有通过检验的味精中恰有 i 袋次品的概率为代入相关数据,具体结果如下表所示。从计算结果不难看出,每箱(100 袋味精)中有 0 袋次品的概率为 0.1。如果通过检验,那么有 0 袋次品的概率上升为 0.134;如果没有通过检验,那么有 0 袋次品的概率显然为 0,通过贝叶斯公式计算的结果也是 0,其他情况类似。这些结果当然与我们的直觉吻合,也就是说如果某箱产品通过了检验,那么检验部门一定会对该箱中次品率的认识有所改变,而如果某箱产品没有通过检验,那么同样也会对该箱中次品率的认识有所改变。例1.3.6 诊断癌症的试剂的临床试验记录如下:患癌症病人采用该试剂测试为阳性的概率为 95%,无癌症病人为阳性的概率为 2%。采用该试剂在某社区进行癌症普查,假设该社区的癌症发病率为 0.5%,计算:(1)一次测试为阳性时患癌症的概率;(2)两次测试皆为阳性时患癌症的概率。1.3.4 贝叶斯公式解:(1)设 A={测试为阳性},B={被诊断者患癌症},则计算 P(B|A)涉及典型的因果关系互换,只能用贝叶斯公式。例1.3.6 诊断癌症的试剂的临床试验记录如下:患癌症病人采用该试剂测试为阳性的概率为 95%,无癌症病人为阳性的概率为 2%。采用该试剂在某社区进行癌症普查,假设该社区的癌症发病率为 0.5%,计算:(1)一次测试为阳性时患癌症的概率;(2)两次测试皆为阳性时患癌症的概率。1.3.4 贝叶斯公式解:(2)两次测试皆为阳性时患癌症的概率可以理解为第一次测试为阳性,根据(1)的计算结果,被诊断者患癌症的概率由 0.005 提高为 0.193,进行第二次测试时,同样假设 A={测试为阳性},B={被诊断者患癌症},则有同理说明如果第二次测试仍为阳性,被诊断者患癌症的概率就调整为 0.919。计算表明,三次测试都为阳性时患癌症的概率高达 0.998。例1.3.7 某商品由三个厂家供应,甲厂的供应量是乙厂的 2 倍,乙厂的供应量与丙厂相等。甲厂、乙厂、丙厂的次品率分别为 2%、2%、6%。若从市场上随机抽取一件此种商品,发现是次品,请问该商品是哪个厂生产的概率最大?1.3.4 贝叶斯公式解:用 1、2、3 分别表示甲厂、乙厂、丙厂,设 Ai=“取到工厂 i 的产品”(i=1,2,3),B=“取到次品”,可得由贝叶斯公式,可得从中可知,商品由丙厂生产的可能性最大。条件概率条件概率小结缩减样本空间定义式乘法公式全概率公式贝叶斯公式1.4 事件的独立性一般而言,P(A)≠P(A|B),说明事件 B 的发生影响了事件 A 发生的概率,但也存在事件 B 的发生不影响事件 A 发生的概率的情况,即P(A)=P(A|B),我们先看一个简单的案例。案例 1.4.1 某公共健康研究中心为了研究乙肝病毒感染与养成良好卫生习惯之间的关系,通过调研掌握的数据如下:我国人口乙肝病毒感染的概率为 7%,该机构随机抽查了 100个卫生习惯良好的人,其中有 7 个乙肝病毒感染者;又随机抽查了 100 个卫生习惯不好的人,其中也有 7 个乙肝病毒感染者。请问该机构能否根据这些统计数据推断卫生习惯对乙肝病毒感染的影响?分析:设事件 A 和 B 分别表示“某人感染乙肝病毒”和“某人卫生习惯良好”,则 P(A|B)表示某人在卫生习惯良好的条件下感染乙肝病毒的概率,P(A|B)表示某人在卫生习惯不好的条件下感染乙肝病毒的概率。根据案例中的数据不难算出:P(A)=P(A|B)=P(A|)=0.07因此,根据这些数据得到结论:无论卫生习惯好坏,感染乙肝病毒的可能性都一样,因此无法推断出卫生习惯对乙肝病毒感染的影响。1.4 事件的独立性定义1.4.1 设A、B是两事件,P(A) ≠0,若P(B)=P(B|A)则称事件A与B相互独立。表明事件B的发生不影响A的发生。等价于:P(AB)=P(A|B)P(B)=P(A)P(B)若A、B互斥,且P(A)>0, P(B)>0, 则 A与B不独立。P(AB)=0,P(A) ≠0,P(B) ≠0, P(AB) ≠P(A)P(B)其逆否命题是:若A与B独立,且 P(A)>0, P(B)>0, 则 A与B一定不互斥。请问:能否在样本空间Ω中找到两个事件, 它们既相互独立又互斥 所以,Φ与Ω独立且互斥。不难发现: Φ(或Ω)与任何事件都独立。可以思考:互斥和独立之间的联系定理1.4.1 以下四件事等价:(1)事件A、B相互独立;(2)事件A、B相互独立;(3)事件A、B相互独立;(4)事件A、B相互独立。证明: 仅证A与 B独立。P(A B)= P(A- A B) = P(A) - P(AB)= P(A) - P(A) P(B)= P(A)[1 - P(B)]= P(A)P(B),概率的性质A与B独立定义 1.4.2 设三个事件 A、B、C,若以下四个等式同时成立:P(AB)= P(A)P(B),P(AC)= P(A)P(C) ,P(BC)= P(B)P(C) , P(ABC)= P(A)P(B)P(C)称事件A, B, C相互独立。若前三个等式成立,则称 A、B、C 两两独立。这个定义也可以推广到 n 个事件的情形。例 1.4.1 a、b、c 三人独立地破译密码, 每人能破译密码的概率为 。请问密码能被破译的概率为多少?解:设 D={密码被破译},A、B、C 分别表示 a、b、c 三人能破译密码这三个事件,由独立性,可得1.4 事件的独立性例 1.4.2 在电子元件的可靠性研究中,如图所示的两种电路,1~4 表示 4 个继电器,它们是否开通是相互独立的,设继电器开通的概率为 p(01.4 事件的独立性例 1.4.2 在电子元件的可靠性研究中,如图所示的两种电路,1~4 表示 4 个继电器,它们是否开通是相互独立的,设继电器开通的概率为 p(0解: 图(a)为串联后并联,图(b)为并联后串联,记 Ai={第 i 个继电器开通},则图(a)中的 L 到 R 的通路可以表示为 A1A2∪A3A4, 图(b)中的 L 到 R 的通路可以表示为(A1∪A2)∩(A3∪A4),由于1.4 事件的独立性故同理由于 ,故串联后并联的电路比并联后串联的电路的可靠性高。本章由六个概念(随机试验、样本空间、事件、概率、条件概率、独立性),四个公式(加法公式、乘法公式、全概率公式、贝叶斯公式)和两个概型(古典概型、几何概型)组成第一章 小结 展开更多...... 收起↑ 资源预览