资源简介 (共60张PPT)统 计 学第五章 概率和概率分布第五章 概率和概率分布§1 概率的问题§2 离散变量的概率分布§3 连续变量的概率分布§1 概率的问题§1.1 事件§1.2 概率§1.3 概率分布§1.1 事件§1.1.1 事件的定义事件可以理解为每一个可能的结果。随机事件:是可能出现也可能不出现的结果。不可能事件:是指一定不会出现的结果。必然事件:是指一定出现的结果。§1.1 事件§1.1.2 事件的关系事件的包含;事件的互斥;事件的并(或和);事件的交(或积);事件的差;事件的逆。§1.1 事件以两个事件A与B为例:1.事件的包含事件的包含是指若事件A发生必然意味着事件B发生,则称事件B包含事件A,或事件A包含于事件B,记作 或 。2.事件的互斥事件的互斥是指事件A和事件B不可能同时发生,互斥的充要条件是两个事件没有公共样本点§1.1 事件3.事件的并事件的并(或和)是指事件A与B至少有一个发生的事件。它是由属于事件 A 或事件 B 的所有样本点组成的集合,记为 或( )4.事件的交事件的交(或积)是指事件 A 与 B 同时发生的事件。它是由属于事件A也属于事件B的公共样本点组成的集合,记为 或 ( )。§1.1 事件5.事件的差事件的差是指事件A发生但事件B不发生的事件。它是由属于事件A而不属于事件B的那些样本点组成的集合,记为 。6.事件的逆事件的逆是指若事件B与事件A互斥,且事件B与事件A组成了整个样本空间,则称事件B是事件A的逆事件。它是由样本空间中所有不属于事件A的样本点组成的集合,记为 。§1.1 事件§1.1.3 事件的性质交换律结合律分配律§1.1 事件设A、B和C为三个事件:1.交换律:2.结合律:§1.1 事件3.分配律:§1.2 概率§1.2.1 事件的概率事件A的概率是对事件A出现的可能性大小的一种度量,数学表示为概率的数学性质有:非负性规范性可加性§1.2 概率1.非负性对任意事件A,有2.规范性对必然事件 ,有 ,对不可能事件 ,有3.可加性若事件A与B互斥,有推广到两两互斥的事件,则有§1.2 概率§1.2.2 概率的定义1.概率的古典定义如果某一随机试验的结果数量有限,并且在公平性对称性的原则下,每个结果出现的可能性相同,则事件A发生的概率为该事件所包含的基本事件个数m与样本空间中所包含的基本事件个数n的比值,记为:§1.2 概率2.概率的统计定义在相同条件下进行n次随机试验(说明试验可重复进行),事件A出现 m 次,则比值 m/n 称为事件A发生的频率。随着n的增大,该频率围绕某一常数P上下摆动,且波动的幅度逐渐减小,趋向于稳定,这个频率的稳定值即可以看作事件A的概率,记为:3.概率的主观定义概率的主观定义叫主观概率,也叫个人概率。是个人根据相关信息,对某事件发生的可能性的一种估计和判断。§1.2 概率§1.2.3 概率的加法1.加法的特殊定理两个互斥事件之和的概率,等于两个事件的概率之和。即若事件A与B互斥,有:推广到两两互斥的事件,则有:特别的,若事件A与B互斥,并且事件A与B的和组成了整个样本空间,即。此时,事件A与B互为逆事件。有 ,这个式子还可以写成 。或写作: 。上式也叫概率的补偿定理。§1.2 概率2.加法的一般定理有的事件并不是互斥的,有可能同时发生,存在交集。要计算两个事件之和的概率,要减去一次交集的概率,否则这部分就包括了两次,重复多算了一次。一般意义上,两个事件之和的概率,为:对于两个互斥事件而言,有加法的特殊定理是一般定理的一个特例。§1.2 概率§1.2.4 概率的乘法1.条件概率在事件B已经发生的条件下,求事件A发生的概率,称这种概率为事件A的条件概率,记为若 ,事件A的条件概率(事件B发生的条件下),与事件A本身的概率相等,意味着事件B的信息对于事件A没有影响,说明这两个事件是独立的。§1.2 概率2.乘法的特殊定理两个独立事件之积(同时发生)的概率,等于两个事件的概率之积。即若事件A与B独立,有:推广到两两独立的事件,则有:3.乘法的一般定理更多的时候,事件并不是独立的,概率的计算是有条件的。一般意义上,两个事件之积(同时发生)的概率,为:上式也可以写作§1.2 概率求两个以上事件之积(同时发生)的概率与之相似。以三个事件A、B、C为例。事件A、B、C同时发生的概率为:§1.2 概率§1.2.5 全概公式和贝叶斯公式1.全概率公式设n个事件 两两互斥,并有 ,说明n个事件两两互斥没有交集,并且组成了整个样本空间,满足这两个条件的事件组称为一个完备事件组。若 ,则对任意事件B,有:§1.2 概率【例5.1】某高校硕士研究招生包括在职硕士研究生、全日制专业型硕士研究生、全日制学术型硕士研究生三种类型,根据历年的录取人数和报考人数,可知这三种类型硕士研究生的录取率依次为60%、55%、40%,已知今年招生三种类型硕士研究生的人数分别占总人数的10%、40%、50%,如果一个考生参加了此高校的硕士研究生考试,求此考生被录取的概率。解:令事件 表示“录取为在职硕士研究生”,事件 表示“录取为全日制专业型硕士研究生”,事件 表示“录取为全日制学术型硕士研究生”,事件B表示“被录取为硕士研究生”。根据全概率公式,有§1.2 概率所以,此考生被录取的概率是48%。§1.2 概率2.贝叶斯公式贝叶斯公式与全概率公式要解决的问题正好相反。它是在条件概率的基础上寻找事件发生的原因(或事件是在什么条件下发生的)。贝叶斯公式也称作逆概公式。设n个事件 两两互斥,并有就是贝叶斯公式(逆概公式),它是基于事件B已发生的结果,推导事件B是在 情况下发生的概率。§1.2 概率已知事件B发生了,未知(想去知道)的是事件B是在什么情况下发生,这可以通过计算逆概率来做出判断。§1.2 概率【例5.2】 某高校硕士研究招生包括在职硕士研究生、全日制专业型硕士研究生、全日制学术型硕士研究生三种类型,根据历年的录取人数和报考人数,可知这三种类型硕士研究生的录取率依次为60%、55%、40%,已知今年招生三种类型硕士研究生的人数分别占总人数的10%、40%、50%,如果一个考生参加了此高校的硕士研究生考试被录取,求此考生被录取为在职硕士研究生、全日制专业型硕士研究生、全日制学术型硕士研究生的概率。解:令事件 表示“录取为在职硕士研究生”,事件 表示“录取为全日制专业型硕士研究生”,事件 表示“录取为全日制学术型硕士研究生”,事件B表示“被录取为硕士研究生”。根据全概率公式,有§1.2 概率根据贝叶斯公式,有所以,考生被录取为在职硕士研究生的概率是12.5%,全日制专业型硕士研究生的概率约为45.83%,全日制学术型硕士研究生的概率约为41.67%。§1.3 概率分布概率分布指的是随机变量的概率分布。对离散变量,列出其所有可能的取值以及随机变量取这些值的概率,便构成了离散变量的概率分布。对连续变量,可计算某段(区间)取值的概率(或概率密度),相应地便构成了连续变量的概率分布。§2 离散变量的概率分布首先看离散型随机变量的概率分布。为得到离散型随机变量X的概率分布,通常需要列出X的所有可能取值,以及X取这些值的概率。用下面的表格来表示:§2 离散变量的概率分布称为离散型随机变量的概率函数。并有:期望为各可能取值 及其概率 的乘积之和。为:X的方差为各可能取值 与期望值的离差平方和的期望。为§2 离散变量的概率分布几种主要的离散变量概率分布§2.1 0-1分布§2.2 二项分布§2.3 泊松分布§2.4 超几何分布§2.1 0-1分布当离散型随机变量X的只有两个可能的取值,并且其中一个赋值为1,另一个赋值为0,则X服从0-1分布。设取1的概率为 ,则取0的概率对于服从0-1分布的离散型随机变量X,有:§2.2 二项分布二项分布研究的是类型变量,并且类型只能够表现为两种形式,这与0-1分布一致。二项分布其实是多个0-1分布的结合。0-1分布是一次实验,二项分布则是多次试验。二项分布的多次试验中,每次试验都是独立于其他试验的,试验之间也不会互相影响。§2.2 二项分布设成功的概率为p,则失败的概率为q=1-p。试验的总次数为n,则n次试验中成功的次数X服从二项分布。记作:X的取值为0到n之间的整数。有:显然,有:还有:当 时,二项分布简化为0-1分布。§2.2 二项分布二项分布随机变量的期望和方差为:§2.3 泊松分布n很大而p很小时二项分布的极限形式叫做泊松分布。设参数 ,代表某结果出现次数的期望,若试验总次数为n,某结果每次出现的概率为p,当n很大而p很小时, 。某结果出现的次数X在服从泊松分布的情况下,X的取值为 ,有:§2.3 泊松分布泊松分布随机变量的期望和方差为:§2.4 超几何分布超几何分布被用于分析样本较少时两个类型变量的取值个数。设总体共两个类型A和B(如红球和黑球,男性和女性),类型A的数量为,类型B的数量为 ,总体总数量为 。类型A的数量比例为在总体随机的n个样本单元中,类型A的数量X服从超几何分布,有:§2.4 超几何分布超几何分布随机变量的期望和方差为:当M较大n较小时,有:§3 连续变量的概率分布连续型随机变量可以取整个实数轴 或某一区间上的任意一个值。在任意两个值之间都有其他的值,某个特定取值的概率都为0,所以不能列出所有可能的值及其对应的概率。设X为一连续型随机变量,x为任意实数,X的概率密度函数记为 ,它需满足两个条件:(1)(2)§3 连续变量的概率分布为计算某一段区间取值的概率,对于任意实数 , ,取值从 到 的概率等于概率密度函数曲线从 到 的积分值。即有:连续型随机变量X的概率可以用分布函数 来描述。分布函数的定义为:并有:§3 连续变量的概率分布根据分布函数 , 可以写成:连续型随机变量的期望和方差通过概率密度函数来计算。有§3 连续变量的概率分布几种主要的连续变量的概率分布§3.1 均匀分布§3.2 指数分布§3.3 正态分布§3.4 正态分布衍生的几个重要分布§3.1 均匀分布当连续型随机变量X的概率密度值为常数,即 都相同,则X服从均匀分布。设所有可能的取值从a到b,由 ,得X的概率密度函数为:称X服从在区间 的均匀分布。分布函数为:§3.1 均匀分布并有:§3.2 指数分布指数分布可以用来表示独立随机事件发生的时间间隔。服从指数分布的随机变量X,其概率密度函数为:其中 为常数。分布函数为:并有:§3.3 正态分布正态(normal)分布是描述连续型随机变量最重要的分布。服从正态分布的随机变量X,其概率密度函数为:分布函数为:其中, 为均值, 为标准差, , 。§3.3 正态分布若随机变量X服从期望为方差为的正态分布,记作:只要有均值 与标准差 ,就可以构成一个正态分布。因此,每一对均值和标准差就有一个正态分布。并有:§3.3 正态分布(1)每一对 与 都可以形成一条曲线,这意味着正态曲线可以看成是一族曲线,在编制曲线时需要并且只需要与 。(2)曲线为钟形,而且对称。期望 为变量取值的中间点和对称点。方差 反映了变量的离散程度, 越小曲线越尖, 越大曲线越扁平。(3)在正态分布中,变量的均值、中位数和众数都是相等的。(4)概率密度值在对称点 取到最大值,越往两边值越小,直至无限趋近于0,在理论上永不相交。(5)正态分布的随机变量,大部分取值在中间点 附近,极大极小值的个数都较少。实际上几乎所有的数值位于均值加减三个标准差之间,也就是说全距离为 。(6)曲线下总面积为1。曲线从对称点往右或往左的面积都是0.5。xf (x)正态分布概率密度函数曲线正态分布的特征:§3.3 正态分布为了得到更加一般意义和标准的正态分布,我们可以采取标准化处理,把所有均值为 方差为 的正态分布,都转化为均值为0方差为1的正态分布,即通过线性变换的标准化处理,把正态分布转化为标准正态分布。设 ,标准化处理为:并有:§3.3 正态分布便得到了服从标准正态分布的Z变量,有:Z变量的概率密度函数为:Z变量的分布函数为:标准正态分布的概率密度函数和分布函数是唯一的。概率密度函数 一般用 表示,分布函数 一般用 表示。§3.3 正态分布对于一般的正态分布 ,有:§3.3 正态分布标准正态分布表的使用事项有:(1)标准化处理为(2)查标准正态分布表即得概率 。其中 , ,(3)对于负的z,可由 得到。(4)(5)§3.3 正态分布【例5.3】 设 ,求以下概率:(1)(2)(3)(4)§3.3 正态分布解:(1)(2)(3)(4)§3.3 正态分布【例5.4】 设 ,求以下概率:(1)(2)解:X标准化处理 ~ ,(1)(2)§3.4 正态分布衍生的几个重要分布§3.4.1 卡方分布常应用于拟合优度检验中。设 个随机变量 相互独立,且都服从标准正态分布 ,则它们的平方和服从自由度为 的卡方分布。记作:卡方分布的期望为:卡方分布的方差为:卡方分布具有可加性即若 , ,且 与 独立,则:§3.4 正态分布衍生的几个重要分布§3.4.2 t分布t分布与正态分布相似,但适用于小样本中。设随机变量 服从标准正态分布,即 ,随机变量 服从自由度为 的卡方分布,即 ,且 与 独立,则随机变量服从自由度为 的 分布。记作:t分布的自由度越大,则该t分布的曲线就越接近标准正态分布。当自由度大于30时,很难看出t分布与标准正态分布的差别。当自由度大于50时,两者几乎完全相同。§3.4 正态分布衍生的几个重要分布当 时,t分布的期望为:当 时,t分布的方差为:关于t分布,还有一种较复杂的情况。设 个随机变量相互独立,且都服从正态分布 ,得到, 则随机变量 服从自由度为 的 分布。记作:§3.4 正态分布衍生的几个重要分布§3.4.3 F分布设随机变量 和 分别服从自由度为 和 的卡方分布,且 与 独立,则随机变量 服从自由度为的F分布。记作:F分布有两个自由度,第一自由度即为分子卡方分布的自由度,第二自由度即为分母中卡方分布的自由度。当 时,F分布的期望为:当 时,F分布的方差为: 展开更多...... 收起↑ 资源预览