第五章 概率和概率分布 课件(共60张PPT)- 《《统计学(第二版) 》同步教学(人民大学版)

资源下载
  1. 二一教育资源

第五章 概率和概率分布 课件(共60张PPT)- 《《统计学(第二版) 》同步教学(人民大学版)

资源简介

(共60张PPT)
统 计 学
第五章 概率和概率分布
第五章 概率和概率分布
§1 概率的问题
§2 离散变量的概率分布
§3 连续变量的概率分布
§1 概率的问题
§1.1 事件
§1.2 概率
§1.3 概率分布
§1.1 事件
§1.1.1 事件的定义
事件可以理解为每一个可能的结果。
随机事件:是可能出现也可能不出现的结果。
不可能事件:是指一定不会出现的结果。
必然事件:是指一定出现的结果。
§1.1 事件
§1.1.2 事件的关系
事件的包含;
事件的互斥;
事件的并(或和);
事件的交(或积);
事件的差;
事件的逆。
§1.1 事件
以两个事件A与B为例:
1.事件的包含
事件的包含是指若事件A发生必然意味着事件B发生,则称事件B包含事件A,或事件A包含于事件B,记作 或 。
2.事件的互斥
事件的互斥是指事件A和事件B不可能同时发生,互斥的充要条件是两个事件没有公共样本点
§1.1 事件
3.事件的并
事件的并(或和)是指事件A与B至少有一个发生的事件。它是由属于事件 A 或事件 B 的所有样本点组成的集合,记为 或
( )
4.事件的交
事件的交(或积)是指事件 A 与 B 同时发生的事件。它是由属于事件A也属于事件B的公共样本点组成的集合,记为 或 ( )。
§1.1 事件
5.事件的差
事件的差是指事件A发生但事件B不发生的事件。它是由属于事件A而不属于事件B的那些样本点组成的集合,记为 。
6.事件的逆
事件的逆是指若事件B与事件A互斥,且事件B与事件A组成了整个样本空间,则称事件B是事件A的逆事件。它是由样本空间中所有不属于事件A的样本点组成的集合,记为 。
§1.1 事件
§1.1.3 事件的性质
交换律
结合律
分配律
§1.1 事件
设A、B和C为三个事件:
1.交换律:
2.结合律:
§1.1 事件
3.分配律:
§1.2 概率
§1.2.1 事件的概率
事件A的概率是对事件A出现的可能性大小的一种度量,数学表示为
概率的数学性质有:
非负性
规范性
可加性
§1.2 概率
1.非负性
对任意事件A,有
2.规范性
对必然事件 ,有 ,
对不可能事件 ,有
3.可加性
若事件A与B互斥,有
推广到两两互斥的事件,则有
§1.2 概率
§1.2.2 概率的定义
1.概率的古典定义
如果某一随机试验的结果数量有限,并且在公平性对称性的原则下,每个结果出现的可能性相同,则事件A发生的概率为该事件所包含的基本事件个数m与样本空间中所包含的基本事件个数n的比值,记为:
§1.2 概率
2.概率的统计定义
在相同条件下进行n次随机试验(说明试验可重复进行),事件A出现 m 次,则比值 m/n 称为事件A发生的频率。随着n的增大,该频率围绕某一常数P上下摆动,且波动的幅度逐渐减小,趋向于稳定,这个频率的稳定值即可以看作事件A的概率,记为:
3.概率的主观定义
概率的主观定义叫主观概率,也叫个人概率。
是个人根据相关信息,对某事件发生的可能性的一种估计和判断。
§1.2 概率
§1.2.3 概率的加法
1.加法的特殊定理
两个互斥事件之和的概率,等于两个事件的概率之和。即若事件A与B互斥,有:
推广到两两互斥的事件,则有:
特别的,若事件A与B互斥,并且事件A与B的和组成了整个样本空间,即。此时,事件A与B互为逆事件。有 ,这个式子还可以写成 。或写作: 。上式也叫概率的补偿定理。
§1.2 概率
2.加法的一般定理
有的事件并不是互斥的,有可能同时发生,存在交集。要计算两个
事件之和的概率,要减去一次交集的概率,否则这部分就包括了两
次,重复多算了一次。
一般意义上,两个事件之和的概率,为:
对于两个互斥事件而言,有
加法的特殊定理是一般定理的一个特例。
§1.2 概率
§1.2.4 概率的乘法
1.条件概率
在事件B已经发生的条件下,求事件A发生的概率,称这种概率为事件A的条件概率,记为
若 ,事件A的条件概率(事件B发生的条件下),与事件A本身的概率相等,意味着事件B的信息对于事件A没有影响,说明这两个事件是独立的。
§1.2 概率
2.乘法的特殊定理
两个独立事件之积(同时发生)的概率,等于两个事件的概率之积。即若事件A与B独立,有:
推广到两两独立的事件,则有:
3.乘法的一般定理
更多的时候,事件并不是独立的,概率的计算是有条件的。一般意义上,两个事件之积(同时发生)的概率,为:
上式也可以写作
§1.2 概率
求两个以上事件之积(同时发生)的概率与之相似。
以三个事件A、B、C为例。事件A、B、C同时发生的概率为:
§1.2 概率
§1.2.5 全概公式和贝叶斯公式
1.全概率公式
设n个事件 两两互斥,并有 ,说明n个事件两两互斥没有交集,并且组成了整个样本空间,满足这两个条件的事件组称为一个完备事件组。
若 ,则对任意事件B,有:
§1.2 概率
【例5.1】某高校硕士研究招生包括在职硕士研究生、全日制专业型硕士研究生、全日制学术型硕士研究生三种类型,根据历年的录取人数和报考人数,可知这三种类型硕士研究生的录取率依次为60%、55%、40%,已知今年招生三种类型硕士研究生的人数分别占总人数的10%、40%、50%,如果一个考生参加了此高校的硕士研究生考试,求此考生被录取的概率。
解:令事件 表示“录取为在职硕士研究生”,事件 表示“录取为全日制专业型硕士研究生”,事件 表示“录取为全日制学术型硕士研究生”,事件B表示“被录取为硕士研究生”。根据全概率公式,有
§1.2 概率
所以,此考生被录取的概率是48%。
§1.2 概率
2.贝叶斯公式
贝叶斯公式与全概率公式要解决的问题正好相反。
它是在条件概率的基础上寻找事件发生的原因(或事件是在什么条件下发生的)。
贝叶斯公式也称作逆概公式。
设n个事件 两两互斥,并有
就是贝叶斯公式(逆概公式),它是基于事件B已发生的结果,推导事件B是在 情况下发生的概率。
§1.2 概率
已知事件B发生了,未知(想去知道)的是事件B是在什么情况下发生,这可以通过计算逆概率来做出判断。
§1.2 概率
【例5.2】 某高校硕士研究招生包括在职硕士研究生、全日制专业型硕士研究生、全日制学术型硕士研究生三种类型,根据历年的录取人数和报考人数,可知这三种类型硕士研究生的录取率依次为60%、55%、40%,已知今年招生三种类型硕士研究生的人数分别占总人数的10%、40%、50%,如果一个考生参加了此高校的硕士研究生考试被录取,求此考生被录取为在职硕士研究生、全日制专业型硕士研究生、全日制学术型硕士研究生的概率。
解:令事件 表示“录取为在职硕士研究生”,事件 表示“录取为全日制专业型硕士研究生”,事件 表示“录取为全日制学术型硕士研究生”,事件B表示“被录取为硕士研究生”。根据全概率公式,有
§1.2 概率
根据贝叶斯公式,有
所以,考生被录取为在职硕士研究生的概率是12.5%,全日制专业型硕士研究生的概率约为45.83%,全日制学术型硕士研究生的概率约为41.67%。
§1.3 概率分布
概率分布指的是随机变量的概率分布。
对离散变量,列出其所有可能的取值以及随机变量取这些值的概率,便构成了离散变量的概率分布。
对连续变量,可计算某段(区间)取值的概率(或概率密度),相应地便构成了连续变量的概率分布。
§2 离散变量的概率分布
首先看离散型随机变量的概率分布。
为得到离散型随机变量X的概率分布,通常需要列出X的所有可能取值,以及X取这些值的概率。用下面的表格来表示:
§2 离散变量的概率分布
称为离散型随机变量的概率函数。并有:
期望为各可能取值 及其概率 的乘积之和。为:
X的方差为各可能取值 与期望值的离差平方和的期望。为
§2 离散变量的概率分布
几种主要的离散变量概率分布
§2.1 0-1分布
§2.2 二项分布
§2.3 泊松分布
§2.4 超几何分布
§2.1 0-1分布
当离散型随机变量X的只有两个可能的取值,并且其中一个赋值为1,另一个赋值为0,则X服从0-1分布。
设取1的概率为 ,则取0的概率
对于服从0-1分布的离散型随机变量X,有:
§2.2 二项分布
二项分布研究的是类型变量,并且类型只能够表现为两种形式,这与0-1分布一致。
二项分布其实是多个0-1分布的结合。0-1分布是一次实验,二项分布则是多次试验。
二项分布的多次试验中,每次试验都是独立于其他试验的,试验之间也不会互相影响。
§2.2 二项分布
设成功的概率为p,则失败的概率为q=1-p。试验的总次数为n,则n次试验中成功的次数X服从二项分布。记作:
X的取值为0到n之间的整数。有:
显然,有:
还有:
当 时,二项分布简化为0-1分布。
§2.2 二项分布
二项分布随机变量的期望和方差为:
§2.3 泊松分布
n很大而p很小时二项分布的极限形式叫做泊松分布。
设参数 ,代表某结果出现次数的期望,若试验总次数为n,某结果每次出现的概率为p,当n很大而p很小时, 。
某结果出现的次数X在服从泊松分布的情况下,X的取值为 ,有:
§2.3 泊松分布
泊松分布随机变量的期望和方差为:
§2.4 超几何分布
超几何分布被用于分析样本较少时两个类型变量的取值个数。
设总体共两个类型A和B(如红球和黑球,男性和女性),类型A的数量为
,类型B的数量为 ,总体总数量为 。类型A的数量比例为
在总体随机的n个样本单元中,类型A的数量X服从超几何分布,有:
§2.4 超几何分布
超几何分布随机变量的期望和方差为:
当M较大n较小时,有:
§3 连续变量的概率分布
连续型随机变量可以取整个实数轴 或某一区间上的任意一个值。在任意两个值之间都有其他的值,某个特定取值的概率都为0,所以不能列出所有可能的值及其对应的概率。
设X为一连续型随机变量,x为任意实数,X的概率密度函数记为 ,它需满足两个条件:
(1)
(2)
§3 连续变量的概率分布
为计算某一段区间取值的概率,对于任意实数 , ,取值从 到 的概率等于概率密度函数曲线从 到 的积分值。即有:
连续型随机变量X的概率可以用分布函数 来描述。分布函数的定义为:
并有:
§3 连续变量的概率分布
根据分布函数 , 可以写成:
连续型随机变量的期望和方差通过概率密度函数来计算。有
§3 连续变量的概率分布
几种主要的连续变量的概率分布
§3.1 均匀分布
§3.2 指数分布
§3.3 正态分布
§3.4 正态分布衍生的几个重要分布
§3.1 均匀分布
当连续型随机变量X的概率密度值为常数,即 都相同,则X服从均匀分布。
设所有可能的取值从a到b,由 ,得X的概率密度函数为:
称X服从在区间 的均匀分布。分布函数为:
§3.1 均匀分布
并有:
§3.2 指数分布
指数分布可以用来表示独立随机事件发生的时间间隔。
服从指数分布的随机变量X,其概率密度函数为:
其中 为常数。
分布函数为:
并有:
§3.3 正态分布
正态(normal)分布是描述连续型随机变量最重要的分布。
服从正态分布的随机变量X,其概率密度函数为:
分布函数为:
其中, 为均值, 为标准差, , 。
§3.3 正态分布
若随机变量X服从期望为方差为的正态分布,记作:
只要有均值 与标准差 ,就可以构成一个正态分布。因此,每一对均值和标准差就有一个正态分布。并有:
§3.3 正态分布
(1)每一对 与 都可以形成一条曲线,这意味着正态曲线可以看成是一族曲线,在编制曲线时需要并且只需要
与 。
(2)曲线为钟形,而且对称。期望 为变量取值的中间点和对称点。方差 反映了变量的离散程度, 越小曲线越尖, 越大曲线越扁平。
(3)在正态分布中,变量的均值、中位数和众数都是相等的。
(4)概率密度值在对称点 取到最大值,越往两边值越小,直至无限趋近于0,在理论上永不相交。
(5)正态分布的随机变量,大部分取值在中间点 附近,极大极小值的个数都较少。实际上几乎所有的数值位于均值加减三个标准差之间,也就是说全距离为 。
(6)曲线下总面积为1。曲线从对称点往右或往左的面积都是0.5。
x
f (x)
正态分布概率密度函数曲线
正态分布的特征:
§3.3 正态分布
为了得到更加一般意义和标准的正态分布,我们可以采取标准化处理,把所有均值为 方差为 的正态分布,都转化为均值为0方差为1的正态分布,即通过线性变换的标准化处理,把正态分布转化为标准正态分布。
设 ,标准化处理为:
并有:
§3.3 正态分布
便得到了服从标准正态分布的Z变量,有:
Z变量的概率密度函数为:
Z变量的分布函数为:
标准正态分布的概率密度函数和分布函数是唯一的。概率密度函数 一般用 表示,分布函数 一般用 表示。
§3.3 正态分布
对于一般的正态分布 ,有:
§3.3 正态分布
标准正态分布表的使用事项有:
(1)标准化处理为
(2)查标准正态分布表即得概率 。其中 , ,
(3)对于负的z,可由 得到。
(4)
(5)
§3.3 正态分布
【例5.3】 设 ,求以下概率:
(1)
(2)
(3)
(4)
§3.3 正态分布
解:
(1)
(2)
(3)
(4)
§3.3 正态分布
【例5.4】 设 ,求以下概率:
(1)
(2)
解:
X标准化处理 ~ ,
(1)
(2)
§3.4 正态分布衍生的几个重要分布
§3.4.1 卡方分布
常应用于拟合优度检验中。
设 个随机变量 相互独立,且都服从标准正态分布 ,
则它们的平方和服从自由度为 的卡方分布。
记作:
卡方分布的期望为:
卡方分布的方差为:
卡方分布具有可加性
即若 , ,且 与 独立,则:
§3.4 正态分布衍生的几个重要分布
§3.4.2 t分布
t分布与正态分布相似,但适用于小样本中。
设随机变量 服从标准正态分布,即 ,随机变量 服从自
由度为 的卡方分布,即 ,且 与 独立,则随机变量
服从自由度为 的 分布。记作:
t分布的自由度越大,则该t分布的曲线就越接近标准正态分布。
当自由度大于30时,很难看出t分布与标准正态分布的差别。
当自由度大于50时,两者几乎完全相同。
§3.4 正态分布衍生的几个重要分布
当 时,t分布的期望为:
当 时,t分布的方差为:
关于t分布,还有一种较复杂的情况。设 个随机变量
相互独立,且都服从正态分布 ,得到
, 则随机变量 服从自
由度为 的 分布。记作:
§3.4 正态分布衍生的几个重要分布
§3.4.3 F分布
设随机变量 和 分别服从自由度为 和 的卡方分布,
且 与 独立,则随机变量 服从自由度为
的F分布。记作:
F分布有两个自由度,第一自由度即为分子卡方分布的自由度,第二
自由度即为分母中卡方分布的自由度。
当 时,F分布的期望为:
当 时,F分布的方差为:

展开更多......

收起↑

资源预览