高中数学第二章概率2.5随机变量的均值和方差素材(打包41套)苏教版选修2-3

资源下载
  1. 二一教育资源

高中数学第二章概率2.5随机变量的均值和方差素材(打包41套)苏教版选修2-3

资源简介

随机变量的数字特征
学习目的与要求:
本章主要讨论随机变量的数字特征,概率分布全面地描述随机变量取值的统计规律性,而数字特征则描述这种统计规律性的某些重要特征。本章总的要求是:理解期望与方差的概念,掌握期望与方差的性质与计算,会计算随机变量函数的期望;掌握两点分布、二项分布、泊松分布、均匀分布、指数分布和正态分布的期望与方差;了解协方差、相关系数的概念和性质,会求相关系数,知道矩与协方差阵的概念及求法。重点内容是:期望、方差、协方差的计算,随机变量函数的数字期望;难点内容是:随机变量函数的数学期望。
3.1 数学期望与方差
3.2 协方差、相关系数、协方差矩阵
3.3 条件数学期望与回归
3.4 特征函数及其性质
3.1 数学期望与方差
1. 随机变量的期望
1)离散型随机变量的期望
设离散型随机变量的分布律为,
则的数学期望(简称均值或期望)为。
2)连续型随机变量的期望
设连续型随机变量的概率密度为,
则随机变量的数学期望(或称期望或均值),记为,即 。
连续型随机变量函数的数学期望
设为连续型随机变量,其概率密度为,又随机变量,则 。
3)二维随机变量函数的期望
若为离散型随机变量,若其分布律为 ,边缘分布律为和
则,
若为二维连续型随机变量,,,分别为的概率密度与边缘概率密度,则,。
设为连续函数,对于二维随机变量的函数,
若为离散型随机变量,则;
若为连续型随机变量,则。
2. 期望的性质
   1)常数的期望等于这个常数,即,其中为常数。
常数与随机变量乘积的期望等于该常数与随机变量的期望的乘积,即
随机变量和的期望等于随机变量期望的和,即,
若,是相互独立的随机变量,则
3. 随机变量的方差
1)随机变量的方差:设随机变量的期望存在,则称为随机变量的方差,记作,即=,称为的标准差(或均方差)。
2)离散型随机变量的方差
设为离散型随机变量,其分布律为,则
3)连续型随机变量的方差
设为连续型随机变量,其概率密度为,则
4)方差计算的重要公式:
4 方差的性质
1)常数的方差等于零,随机变量与常数之和的方差等于随机变量的方差,即, 。
2)常数与随机变量乘积的方差等于这个常数的平方与随机变量方差的乘积,即 ,其中为常数。
3)若,是相互独立的随机变量,则。
5. 几种重要的随机变量的数字特征汇总表
离散型
分布
期望
方差
服从参数为的0-1分布
服从二项分布
服从泊松分布
连续型
均匀分布
指数分布
正态分布
3.2 协方差、相关系数、协方差矩阵
1. 协方差
设有二维随机变量,且存在,如果存在,则称此值为与的协方差,记为,即。
当为二维离散型随机变量时,
其分布律为
则。
当为二维连续型随机变量时,为的概率密度,则 。
协方差有下列计算公式:(重要公式)
,特别的取时,

2. 协方差的性质

,其中为任意常数;

若,是相互独立的随机变量,则。
3. 相关系数
若,称为与的相关系数,记为,即。
4. 相关系数的性质
1) ;
2)的充分必要条件是存在常数使且。
两个随机变量的相关系数是两个随机变量间线性联系密切程度的度量,越接近1, 与之间的线性关系越密切。当时,与存在完全的线性关系,即;时,与之间无线性关系。
若相关系数,则称与不相关。
很明显,当时,随机变量与不相关的充分必要条件是。
注意:若随即变量与相互独立,则 ,因此与不相关,
反之,随机变量与不相关,但与不一定相互独立。
若二维随机变量服从二维正态分布,与 的相关系数,从而与不相关的充要条件是与相互独立,因此与不相关和与相互独立都等价于。
3.3 条件数学期望与回归
数学期望在实际生活中的应用
摘要
在现代快速发展的社会中,数学期望作为一门重要的数学学科,它是随机变量的重要数字特征之一,也是随机变量最基本的特征之一。通过几个例子,阐述数学期望在实际生活中的应用包括经济决策、彩票抽奖、求职决策、医疗、体育比赛等方面的一些实例,体现出数学期望在实际生活中颇有价值的应用。 通过探讨数学期望在实际生活中的应用,以起到让大家了解知识与人类实践紧密联系的丰富底蕴,切身体会到“数学的确有用”。 所谓的求数学期望其实就是去求随机变量的以概率为权数的加权平均值,而平均值这一概念又是我们在实际应用中最常用的一个指标,在预测中使用是很具有科学性的。
关键词:数学期望 随机变量 性质 实际应用
Abstract

In the rapid development of modern society, the mathematical expectation as an important mathematical subject, it is one of the important digital features of random variables, is also one of the basic characteristics of random variables. Through several examples, in this paper, the mathematical expectation in the practical application of life including economic decision-making, lottery tickets, job, health, sports, etc. In some instances, manifests the mathematical expectation valuable application in real life. Through discuss the application of mathematical expectation in real life to play let everybody understand the knowledge and practice closely linked human rich background, personal experience "mathematics really useful". So-called mathematical expectation is to actually ask for random variables of the probability weighted average of the weight, and mean value in actual application of this concept is our one of the most commonly used indicators, used in the forecast, it is very scientific.
Key words: Mathematical Expectation; Stochastic Variable; quality; Practical Application
目录
摘要 1
Abstract 2
第一章 绪论 4
1.1数学期望的起源及定义 4
1.2数学期望的意义 5
第二章 数学期望前瞻 5
2.1离散型 5
2.2连续型 6
2.3随机变量的数学期望值 7
2.4单独数据的数学期望的算法 7
2.5数学期望的基本性质 8
第三章 数学期望在实际中的应用 8
3.1 经济决策中的应用 9
3.2 彩票、抽奖问题 9
3.2.1彩票问题 9
3.2.2抽奖问题 11
3.3 求职决策问题 12
3.4医疗问题 13
3.5体育比赛问题 14
结论 16
参考文献 16
绪论

1.1数学期望的起源及定义
早在17世纪,有一个赌徒向法国著名数学家帕斯卡挑战,给他出了一道题目:甲乙两个人赌博,他们两人获胜的机率相等,比赛规则是先胜三局者为赢家,赢家可以获得100法郎的奖励。当比赛进行到第三局的时候,甲胜了两局,乙胜了一局,这时由于某些原因中止了比赛,那么如何分配这100法郎才比较公平?用概率论的知识,不难得知,甲获胜的概率为1/2+(1/2)*(1/2)=3/4,或者分析乙获胜的概率为(1/2)*(1/2)=1/4。因此由此引出了甲的期望所得值为100*3/4=75法郎,乙的期望所得值为25法郎。这个故事里出现了“期望”这个词,数学期望由此而来。
数学期望(mathematical expectation)简称期望,又称均值,是概率论中一项重要的数字特征,其定义我们可以通过一个数学例题来了解:掷一枚质地均匀的骰子次,观察每次出现点数.它是一个随机变量,如果用、、、、、表示出现1、2、3、4、5、6点的次数,那么每次投掷骰子出现点数的平均值为
=
表示事件投掷骰子出现点的频率,由于频率具有波动性,因此该平均值也具有波动性,并不能代表每次投掷骰子出现点数的平均值,当很大时,应稳定于,故该平均值也应该稳定于
1+2+3+4+5+6
=(1+2+3+4+5+6)=
那么,这使得平均值是真正的每次投掷骰子出现点数的平均值,他是随机变量的可能取值与所对应的概率乘积的总和,这是一个常数,可以用来描述随机变量的数学特征,称之为的数学期望,记作E。
定义1 若离散型随机变量可能取值为(=1,2,3 ,…),其分布列为(=1,2,3, …),则当<时,则称存在数学期望,并且数学期望为E=,如果=,则数学期望不存在。
定义2 设连续型随机变量的概率密度函数为, 若积分是一个有限值,则称积分为的数学期望,记作,即。
1.2数学期望的意义
数学期望在实际中的应用涉及面又大又广泛,作为数学基础理论中统计学上的数字特征,广泛应用于数据分析、经济、社会、医学等领域。其意义是解决实践中抽象出来的数学模型进行分析的方法,从而达到认识客观世界规律的目的,为进一步的决策分析等提供准确的理论依据。

数学期望前瞻
2.1离散型

离散型随机变量的分类:随机取值的变量就是随机变量,随机变量分为离散型随机变量与连续型随机变量两种(变量分为定性和定量两类,其中定性变量又分为分类变量和有序变量;定量变量分为离散型和连续型),随机变量的函数仍为随机变量。
有些随机变量,它全部可能取到的不相同的值是有限个或无限多个,这种随机变量称为"离散型随机变量"。
离散型随机变量在某一范围内的取值的概率等于它取这个范围内各个值的概率的和。
定义2.1:如果随机变量X只可能取有限个或至多可列个值,则称X为离散型随机变量。
定义2.2:设X为离散型随机变量,它的一切可能取值为X1,X2,……,Xn,……,记P=P{X=xn},n=1,2……(2.1)
称(2.1)式为X的概率函数,又称为X的概率分布,简称分布。
离散型随机变量的概率分布有两条基本性质:
(1)非负性 Pn≥0 n=1,2,…
(2)归一性 ∑pn=1
对于集合{xn,n=1,2,……}中的任何一个子集A,事件“X在A中取值”即“X∈A”的概率为
P{X∈A}=∑Pn
特别的,如果一个试验所包含的事件只有两个,其概率分布为
P{X=x1}=p(0P{X=x2}=1-p=q
这种分布称为两点分布。 如果x1=1,x2=0,有
P{X=1}=p
P{X=0}=q
这时称X服从参数为p的0-1分布,它是离散型随机变量分布中最简单的一种。由于是数学家伯努利最先研究发现的,为了纪念他,我们也把服从这种分布的试验叫伯努利试验。习惯上,把伯努利的一种结果称为“成功”,另一种称为“失败”。
2.2连续型
若随机变量X的分布函数F(x)可表示成一个非负可积函数f(x)的积分,则称X为连续性随机变量,f(x)称为X的概率密度函数(分布密度函数)。能按一定次序一一列出,其值域为一个或若干个有限或无限区间,这样的随机变量称为离散型随机变量。
离散型随机变量与连续型随机变量也是由随机变量取值范围(取值)确定,变量取值只能取离散型的自然数,就是离散型随机变量;
比如,一次掷20个硬币,k个硬币正面朝上,k是随机变量,k的取值只能是自然数0,1,2,…,20,而不能取小数3.5、无理数√20,因而k是离散型随机变量。
如果变量可以在某个区间内取任一实数,即变量的取值可以是连续的,这随机变量就称为连续型随机变量;
比如,公共汽车每15分钟一班,某人在站台等车时间x是个随机变量,x的取值范围是[0,15),它是一个区间,从理论上说在这个区间内可取任一实数3.5、√20等,因而称这随机变量是连续型随机变量。
连续型随机变量X的概率密度函数为f(x),若积分:
绝对收敛,则称此积分值为随机变量X的数学期望,记为:
2.3随机变量的数学期望值
在概率论和统计学中,一个离散性随机变量的期望值(或数学期望、或均值,亦简称期望)是试验中每次可能结果的概率乘以其结果的总和。换句话说,期望值是随机试验在同样的机会下重复多次的结果计算出的等同“期望”的平均值。需要注意的是,期望值并不一定等同于常识中的“期望”——“期望值”也许与每一个结果都不相等(我们可以用一道简单的数学题目来参照)。
假设:某大厦的一部电梯从底层出发后只能在第18、19、20层可以停靠。若该电梯在底层载有3位乘客,且每位乘客在第三层下电梯的概率均为3分之一,用期望值表示这3位乘客在第20曾下电梯的人数,求: 1.随机变量"E"(随机变量)的分布列 2.随机变量"E"(随机变量)的期望
设A为这三个乘客中在第20层下电梯人数,则A的可能取值为0,1,2,3,下面计算每一种可能取值的概率: P(A=0)=P(三个人都不在20层下)=(2/3)^3=8/27 , P(A=1)=P(其中两人不在20层下另一人在20层下) =C(3,2)(2/3)^2 1/3=4/9 , P(A=2)=P(其中两人在20层下另一人不在20层下) =C(3,2)(1/3)^2 2/3=2/9 , P(A=3)=P(三人都在20层下)=(1/3)^3=1/27 检验P(0)+P(1)+P(2)+P(3)=1 ,满足归一条件。 分布列及数学期望便即可得出:
A
0
1
2
3
P
8/27
4/9
2/9
1/27
数学期望E=1. 数学期望的计算还有更简单的方法: 每个人在三层中的任一层下电梯是等概率的,等可能事件,概率为1/3, 所以在每层下的人数的期望E=总人数*每个人在每层下的概率=31/3=1。 本题若改为有6人,则期望=61/3=2。
2.4单独数据的数学期望的算法
数学期望:E(X) = X1p(X1) + X2p(X2) + …… + Xnp(Xn)
X1,X2,X3,……,Xn为这几个数据,p(X1),p(X2),p(X3),……p(Xn)为这几个数据的概率函数。在随机出现的几个数据中p(X1),p(X2),p(X3),……p(Xn) 概率函数就理解为数据X1,X2,X3,……,Xn出现的频率f(Xi).则:
E(X) = X1p(X1) + X2p(X2) + …… + Xnp(Xn) = X1f1(X1) + X2f2(X2) + …… + Xnfn(Xn)
很容易证明E(X)对于这几个数据来说就是他们的算术平均值。
我们举个例子,比如说有这么几个数:
1,1,2,5,2,6,5,8,9,4,8,1
1出现的次数为3次,占所有数据出现次数的3/12,这个3/12就是1所对应的频率。同理,可以计算出f(2) = 2/12, f(5) = 2/12,f(6) = 1/12,f(8) = 2/12,f(9) = 1/12,f(4) = 1/12 根据数学期望的定义:
E(X) = 1f(1) + 2f(2) + 5f(5) + 6f(6) + 8f(8) + 9f(9) + 4f(4) = 13/3
所以 E(X) = 13/3,
现在算这些数的算术平均值:
Xa = (1+1+2+5+2+6+5+8+9+4+8+1)/12 = 13/3
所以E(X) = 13/3。
2.5数学期望的基本性质
设C、a、b为常数,ξ为随机变量,则有如下性质
性质1 常数的数学期望等于本身:.
证明:以离散随机变量为例来证明,对于连续随机变量可类似地证明。下同,
把常数视为概率1取本身值的离散随机变量,即得 .
性质2
证明:设随机变量的概率分布为=,(=1,2,…)则
.
性质3 .
证明:.
性质4 .
证明:利用前三个性质得。
数学期望在实际中的应用
3.1 经济决策中的应用
假设某一超市出售的某种商品,每周的需求量在10至30范围内等可能取值,该商品的进货量也在10至30范围内等可能取值(每周只进一次货)超市每销售一单位商品可获利500元,若供大于求,则削价处理,每处理一单位商品亏损100元;若供不应求,可从其他超市调拨,此时超市商品可获利300元。试计算进货量多少时,超市可获得最佳利润?并求出最大利润的期望值。
分析:由于该商品的需求量(销售量)是一个随机变量,它在区间上均匀分布,而销售该商品的利润值也是随机变量,它是的函数,称为随机变量的函数。题中所涉及的最佳利润只能是利润的数学期望(即平均利润的最大值)。因此,本问题的解算过程是先确定与的函数关系,再求出的期望。最后利用极值法求出的极大值点及最大值。
先假设每周的进货量为,则
=
=
利润的数学期望为:
=+
=-7.5+350+5250
=-15+350=0
=23.33
的最大值=-7.5+350+52509333.3元
根据结果可知,周最佳进货量为23.33(单位),最大利润的期望值为9333.3元。
3.2 彩票、抽奖问题
3.2.1彩票问题
随着社会生活的丰富,人们购买彩票,谈论彩票中奖的热潮正在兴起。报纸上不时发表谈论彩票的文章,有时也谈到摸彩与数学的关系。但众所纷纭,也说不详,论也不确。众所周知,彩票抽奖属于“独立随机事件”,彩票预测违背科学。但从总体上来说,中奖号码有服从于某些统计规律。 为了研究彩票中的概率统计问题,我们选取了体育彩票和七乐彩及一些简单的模拟实验来帮助我们研究,例如:我们进行了模红白球的实验,先进性简单的概率计算问题,我们又以体育彩票和七乐彩为辅助实验并根据。 由此我们计算出体彩的中奖概率如下(以一注为单位) 特等奖P0=1/10000000
一等奖P1=1/1000000
二等奖P2=20/1000000
三等奖P3=300/1000000
四等奖P4=4000/1000000
五等奖P5=50000/1000000
P=P0+P1+P2+P3+P4+P5=0.0543211 这就是说每1000注彩票约有54注中奖 经过公式计算我们计算出了七乐彩的中奖概率: 一等奖C30~1/2035
二等奖P1=1/290829
三等奖P2=1/13219
四等奖P3=1/4406
五等奖P4=1/420
六等奖P5=1/252
七等奖P6=1/38 一般来说,各类彩票各奖级的中奖几率总和在4%-5%左右。如果要中奖金数目大的最高奖,概率一般为几十万至几百万分之一,难度更大,是可遇不可求的。对于购买题材只能是本着对中国体育事业的支持的想法,而不能对回报有过高的期望。 彩票的中奖概率与数学里的统计学有着密切的关系,通过统计概率,我们可以更好的发现数学统计学与生活的密切关系。在彩票市场异常火爆的今天作为一个理性的彩迷,我们应该对彩票有正确的认识,买彩票是一种自愿的活动,是彩民的个人爱好,理智的彩民不该抱着赌博的心态,孤注一掷,投入极大的资金,应量力而出以平常健康重在参与的心态买彩票。
3.2.2抽奖问题
假设某百货超市现有一批快到期的日用产品急需处理,超市老板设计了免费抽奖活动来处理掉了这些商品。纸箱中装有大小相同的个球,个分,个分,从中摸出个球,摸出的个球的分数之和即为中奖分数,获奖如下:
一等奖 分,冰柜一个,价值元;
二等奖 分, 电视机一个,价值元;
三等奖 分, 洗发液瓶,价值元;
四等奖 分, 洗发液瓶,价值元;
五等奖 分, 洗发液瓶,价值元;
六等奖 分, 牙膏一盒, 价值元;
七等奖 分, 洗衣粉一袋,价值元;
八等奖 分, 香皂一块, 价值元;
九等奖 分, 牙刷一把, 价值元;
十等奖 分与分为优惠奖,只収成本价元,将获得洗发液一瓶;
解析:表面上看整个活动对顾客都是有利的,一等奖到就等奖都是白得的,只有十等奖才收取一点成本价。但经过分析可以知道商家真的就亏损了吗?顾客就真能从中获得抽取大奖的机会吗?用以上方法分析一下并求得其期望值真相就可大白了。摸出个球的分值只有种情况,用X表示摸奖者获得的奖励金额数,一等奖等分分,其对应
事件,
的取值为,概率可以类似求出,其概率分布为:
X
2500
1000
176
88
44
P
0.000 005
0.000 005
0.000 541
0.000 541
0.010 96
X
8
5
3
2
P
0.077 941
0.238 693
0.077 941
0.010 96
0.582 411
表明商家在平均每一次的抽奖中将获得元,而平均每个抽奖者将花元来享受这种免费的抽奖。从而可以看出顾客真的就站到大便宜了吗?相反,商家采用这种方法不仅把快要到期的商品处理出去了,而且还为超市大量集聚了人气,不愧为一举多得。此百货超市老板运用数学期望估计出了他不会亏损而做了这个免费抽奖活动,最后一举多得,从中也看出了数学期望这一科学的方法在经济决策中的重要性。

3.3 求职决策问题
有三家公司为大学毕业生甲提供应聘机会,按面试的时间顺序,这三家公司分别记为x、y、z,每家公司都可提供极好、好和一般三种职位。每家公司根据面试情况决定给求职者何种职位或拒绝提供职位。按规定,双方在面试后要立即做出决定提供,接受或拒绝某种职位,且不能毁约。咨询专家在为甲的学业成绩和综合素质进行评估后,认为甲获得极好、好和一般的可能性依次为0.2、0.3和0.4.三家公司的工资承诺如表:
公司
极好

一般
x
3500
3000
2200
y
3900
2950
2500
c
4000
3000
2500
如果甲把工资作为首选条件,那么甲在各公司面试时,对该公司提供的各种职位应作何种选择?
分析:由于面试从x公司开始,甲在选择x公司三种职位是必须考虑后面y、z公司提供的工资待遇,同样在y公司面试后,也必须考虑z公司的待遇。因此我们先从z公司开始讨论。由于z公司工资期望值为:
()=40000.2+30000.3+25000.4=2700元
再考虑y公司,由于y公司一般职位工资只有2500,低于z公司的平均工资,因此甲在面对y公司时,只接受极好和好两种职位,否则去z公司。如此决策时加工资的期望值为:
()=39000.2+29500.3+27000.5=3015元
最后考虑x公司,x公司只有极好职位工资超过3015,因此甲只接受公司的极好职位。否则去y公司。
甲的整体决策应该如此:先去x公司应聘,若x公司提供极好职位就接受之。否则去y公司,若y公司提供极好或好的职位就接受之,否则去z公司应聘任意一种职位。在这一决策下,甲工资的期望值为:
()=35000.2+30150.8=3112元
大学生的就业问题已引起社会的广泛关注。随着社会生产力水平的不断提高,各行各业的就业岗位已经远远不能满足即将从业者的需求。尤其是一些比较好的岗位,公司,所以兴起了公务员热,事业单位热等社会现象。对于一名即将毕业的大学生,面对强手如林的竞争场面,除了刻苦学习必备的基础知识,努力训练从业的基本技能以外,在求职过程中,应该如何进行决策,使自己的求职更顺利一些,已是一个摆在大学生面前不容忽视的问题。同时如何提高自己的创新能力,学习接受能力也是对毕业生的一大考验。
3.4医疗问题
在某地区进行某种疾病普查,为此要检验每个人的血液,如果当地有N个人,若逐个检验就需要检验N次,现在要问:有没有办法减少检验的工作量?
我们先把受检验者分组,假设每组有k个人,把这k个人的血液混合在一起进行检验,如果检验的结果为阴性,这说明k个人的血液全为阴性,因而这k个人总共只要检验一次就够了,检验的工作量显然是减少了,但是如果检验的结果是阳性,为了明确k个人中究竟是哪几个人为阳性,就要对这k个人再逐个进行检验,这时k个人检验的总次数为k+1次,检验的工作量反而有所增加,显然,这时k个人需要的检验次数可能只要1次,也可能要检验k+1次,是一个随机变量,为了和老方法比较工作量的大小,应该求出它的平均值(也是平均检验次数)。
在接受检验的人群中,各个人的检验结果是阳性还是阴性,一般都是独立的(如果这种病不是传染病或遗传吧遗传病),并且每个人是阳性结果的概率为p,就是阴性结果的概率为q=1-p,这时k个人一组的混合血液呈阴性结果的概率为,呈阳性结果的概率则为1-,现在令η为k个人一组混合检验时每人所需的检验次数,由上述讨论可知η的分布列为:
η
1+
P
1-
由此即可求得每个人所需得平均检验次数为
Eη=.+(1+)(1-)
=1-+
而按原来得老方法每人应该检验1次,所以当
1-+<1,即q>
时,用分组的办法(k个人一组)就能减少检验的次数,如果q是已知的,还可以从
Eη=1-+中选取最合适的整数,使得平均检验次数Eη达到最小值,从而使平均检验次数减少。
对一些不同的p值,如下表给出了使Eη达到最小的值。
阳性反应率
阳性反应率
0.140
3
0.016
8
0.130
3
0.015
9
0.120
4
0.014
9
0.110
4
0.013
9
0.100
4
0.012
10
0.090
4
0.011
10
0.080
4
0.010
11
0.070
4
0.009
11
0.060
5
0.008
12
0.050
5
0.007
12
0.040
6
0.006
13
0.030
6
0.005
15
0.020
8
0.004
16
0.019
8
0.003
19
0.018
8
0.002
23
0.017
8
0.001
32
我国某医疗机构在一次普查中,由于采用了上述这种分组的方法,结果每100个人的平均检验次数为21,减少工作量达79%。当然,减少的工作量的大小与p的数值由关,也与每组人数k有关。
3.5体育比赛问题
乒乓球是我们的国球,上世界兵兵球也为中国带了一些外交。中国队在这项运动中具有绝对的优势。现就乒乓球比赛的安排提出一个问题:假设德国国队(德国队名将波尔在中国也有很多球迷)和中国队比赛。赛制有两种,一种是双方各出3人, 三场两胜制, 一种是双方各出5人,五场三胜制, 哪一种赛制对中国队更有利?下面,我们利用数学期望解答这个问题。由于中国队在这项比赛中的优势,我们不妨设中国队中每一位队员德国队员的胜率都为60%。根据前面的分析,下面我们只需要比较两个队对应的数学期望即可。
在五场三胜制中,中国队要取得胜利, 获胜的场数有3、4、5三种结果。我们计算三种结果对应的概率。应用二项式定理可知,恰好获胜三场(即其中两场失利)对应的概率:;
恰好获胜四场对应的概率为:;
五场全部获胜的概率为: 。
设随机变量为x为为该赛制下中国队在比赛中获胜的场数,则可建立x分布律:
X
3
4
5
P
0.3456
0.2592
0.07776
计算随机变量X 的数学期望:
E (X ) = 30. 346 5 + 40. 259 2 + 50. 077 76= 2.465 1。在三场两胜制中,中国队取得胜利,,获胜的场数有2、3两种结果。对应的概率分别为:恰好获胜两场(其中有一场失利)对应的概率:;
三场全部获胜的概率为:
设随机变量Y为该赛制下中国队在比赛中获胜的场数, 则可建立Y的分布律:
Y
2
3
P
0.432
0.216
E ( Y) = 20. 432+ 30. 216= 1. 512
比较两个期望值得:E (X ) > E ( Y)。所以我们可以得出结论,五场三胜制对中国队更有利。
结论
数学期望是反映随机变量总体取值平均水平的一个重要的数字特征,而在现实社会中由于不确定因素太多,加上商业竞争太严重,因此人们在做经济决策时就会相当谨慎,常常会在多个决策中找出最好的一个方案。数学期望则成为了决策者们首选的一个帮助决策的科学方法。本文通过举例来说明了数学期望在实际生活中的重要应用,它作为一个数学工具被我们的管理者们广泛的运用着。通过以上的举例还总结出了数学期望在经济决策中运用的一般方法。要学会用数学的眼光去观察我们身边发生的事情,用数学眼光看世界。通过运用我们所学习的排列。组合及概率的知识,综合运用分类计数分部计数原理,插孔法、间接法等培养了我们分析问题,解决问题的能力及应用数学的意识。
参考文献
[1] 魏宗舒.概率论与数理统计教程[M].2版.北京:高等教育出版社,2008:95,160.
[2] 严士健. 概率论基础[ M] . 北京: 科学出版社, 1982
[3] 盛骤.概率论与数理统计[M].1版.北京:高等教育出版社,2002 :38-39.
[4] 段丽凌.浅析数学期望在经济生活中的运用.商场现代化2008.4第536期
[5] 林侗芸.利用数学期望求解经济决策问题.龙岩学院报.2006.12
[6] 郭明之. 平均比赛局数的估计[ J]. 云南师范大学学报: 自然科学版, 2004, 24( 6): 6- 8.
[7] 陈昭木,陈清华,王华雄,等.高等代数[M ].福州:福建教育出版社,1991.
数学期望在生活中的应用
摘 要: 数学期望是随机变量的重要数字特征之一,也是随机变量最基本的特征之一。通过几个例子,阐述了概率论与数理统计中的教学期望在生活中的应用,文章内容包括决策、利润、彩票、医疗等方面的一些实例,阐述了数学期望在经济和实际问题中颇有价值的应用。    关键词: 随机变量, 数学期望, 概率 , 统计      
数学期望(mathematical expectation)简称期望,又称均值,是概率论中一项重要的数字特征,在经济管理工作中有着重要的应用。本文通过探讨数学期望在经济和实际问题中的一些简单应用,以期起到让学生了解知识与人类实践紧密联系的丰富底蕴,切身体会到“数学的确有用”。
随机变量的数学期望值:
在概率论和统计学中,一个离散性随机变量的期望值(或数学期望、或均值,亦简称期望)是试验中每次可能结果的概率乘以其结果的总和。换句话说,期望值是随机试验在同样的机会下重复多次的结果计算出的等同“期望”的平均值。需要注意的是,期望值并不一定等同于常识中的“期望”——“期望值”也许与每一个结果都不相等。(换句话说,期望值是该变量输出值的平均数。期望值并不一定包含于变量的输出值集合里。)
单独数据的数学期望值算法:
  对于数学期望的定义是这样的。数学期望
  E(X) = X1*p(X1) + X2*p(X2) + …… + Xn*p(Xn)
  X1,X2,X3,……,Xn为这几个数据,p(X1),p(X2),p(X3),……p(Xn)为这几个数据的概率函数。在随机出现的几个数据中p(X1),p(X2),p(X3),……p(Xn)概率函数就理解为数据X1,X2,X3,……,Xn出现的频率f(Xi).则:
  E(X) = X1*p(X1) + X2*p(X2) + …… + Xn*p(Xn) = X1*f1(X1) + X2*f2(X2) + …… + Xn*fn(Xn)
  很容易证明E(X)对于这几个数据来说就是他们的算术平均值。
1 决策方案问题  决策方案即将数学期望最大的方案作为最佳方案加以决策。它帮助人们在复杂的情况下从可能采取的方案中做出选择和决定。具体做法为:如果知道任一方案Ai(i=1,2,…m)在每个影响因素Sj(j=1,2,…,n)发生的情况下,实施某种方案所产生的盈利值及各影响因素发生的概率,则可以比较各个方案的期望盈利,从而选择其中期望盈利最高的为最佳方案。      1.1投资方案   假设某人用10万元进行为期一年的投资,有两种投资方案:一是购买股票;二是存入银行获取利息。买股票的收益取决于经济形势,若经济形势好可获利4万元,形势中等可获利1万元,形势不好要损失2万元。如果存入银行,假设利率为8%,可得利息8000元,又设经济形势好、中、差的概率分别为30%、50%、20%。试问应选择哪一种方案可使投资的效益较大?   比较两种投资方案获利的期望大小:   购买股票的获利期望是E(A1)=4×0.3+1×0.5+(-2)×0.2=1.3(万元),存入银行的获利期望是E(A2)=0.8(万元),由于E(A1)>E(A2),所以购买股票的期望收益比存入银行的期望收益大,应采用购买股票的方案。在这里,投资方案有两种,但经济形势是一个不确定因素,做出选择的根据必须是数学期望高的方案。   1.2面试方案   设想某人在求职过程中得到了两个公司的面试通知,假定每个公司有三种不同的职位:极好的,工资4万;好的,工资3万;一般的,工资2.5万。估计能得到这些职位的概率为0.2、0.3、0.4,有0.1的可能得不到任何职位。由于每家公司都要求在面试时表态接受或拒绝所提供职位,那么,应遵循什么策略应答呢?   极端的情况是很好处理的,如提供极好的职位或没工作,当然不用做决定了。对于其他情况,我们的方案是,采取期望受益最大的原则。 先考虑现在进行的是最后一次面试,工资的数学期望值为: E(A1)=4×0.2+3×0.3+2.5×0.4+0×0.1=2.7万。   那么在进行第一次面试时,我们可以认为,如果接受一般的值位,期望工资为2.5万,但若放弃(可到下一家公司碰运气),期望工资为2.7万,因此可选择只接受极好的和好的职位。这一策略下工资总的期望 如果此人接到了三份这样的面试通知,又应如何决策呢?   最后一次面试,工资的期望值仍为2.7万。第二次面试的期望值可由下列数据求知:极好的职位,工资4万;好的,工资3万;一般的,工资2.5万;没工作(接受第三次面试),2.7万。期望值为:E(A2)=4×0.2+3×0.3+2.5×0.4+2.7×0.1=3.05万。   这样,对于三次面试应采取的行动是:第一次只接受极好的职位,否则进行第二次面试;第二次面试可接受极好的和好的职位,否则进行第三次面试;第三次面试则接受任何可能提供的职位。这一策略下工资总的期望值为4×0.2+3.05×0.8=3.24万。故此在求职时收到多份面试通知时,应用期望受益最大的原则不仅提高就业机会,同时可提高工资的期望值。   2 生产和销售利润问题   在经济活动中,不论是厂家的生产还是商家的销售,总是追求利润的最大化,供大于求或供不应求都不利于获得最大利润。但供应量和需求量又不是预先知道的。理性的厂家或商家往往根据过去的数据(概率),用数学期望结合微积分的有关知识,制定最佳的生产或销售策略。   假定某公司计划开发一种新产品市场,并试图确定其产量。估计出售一件产品,公司可获利m元,而积压一件产品,可导致损失n元,另外,该公司预测产品的销售量X为一个随机变量,其分布为p(χ),那么,产品的产量该如何制定,才能获得最大利润。   假设该公司每年生产该产品χ件,尽管χ是确定的,但由于需求量(销售量)是一个随机变量,所以收益Y是一个随机变量,它是X的函数:   公司收益的数学期望为:Eζ=pmX+(1-p)n(x-X)   问题转化为,当χ为何值时,期望收益可以达到最大值。这个问题的解决,就是求目标函数期望的最大最小值。   3 彩票问题   3.1设每张福利彩票售价5元,各有一个兑奖号。每售出100万张设一个开奖组,用摇奖器当众摇出一个6位数的中奖号码(可以认为从000000到999999的每个数等可能出现),兑奖规则如下: 如果兑奖号与中奖号的最后一位相同者获六等奖,奖金10元(中奖概率为0.1);兑奖号与中奖号的最后二位相同者获五等奖,奖金50元(中奖概率为0.01);兑奖号与中奖号的最后三位相同者获四等奖,奖金500元(中奖概率为0.001);兑奖号与中奖号的最后四位相同者获三等奖,奖金5000元(中奖概率为0.0001);兑奖号与中奖号的最后五位相同者获二等奖,奖金50000元(中奖概率为0.00001);兑奖号与中奖号全部相同者获一等奖,奖金500000元(中奖概率为0.000001)。另外规定,只领取其中最高额的奖金,试求每张彩票的平均所得。   所以彩民的每张彩票的售价数学期望所得为:Eζ=10*0.1+50*0.01+500*0.001+5000*0.0001+50000*0.00001+500000*0.000001=3.5    那么,一个开奖组(100万张)可将所筹得的500万元中的350万元以奖金形式返还给彩民,其余150万元则可用于福利事业及管理费用。因此,彩票中奖与否虽然是随机的,但一种彩票的期望所得是可以预先算出的,计算期望所得也是设计一种彩票的基础。
3.2还有一种玩法和设奖方法:
彩票的玩法比较简单,2元买一注,每一注填写一张彩票,每一张彩票由一个6位数字和一个特别号码组成,每位数字均可填写0、1、……、9这10个数字中的一个。每期设六个奖项,由彩票中心随机开出一个奖号--一个6位数号码另加一个特别号码。中奖号码情况如下所示(假设一等奖号码是123456,特别号码是7):
?
奖级 中奖号码 每注奖金
特等奖 123456+7 不一定
一等奖 123456 不一定
二等奖 12345△、△23456 不一定
三等奖 1234△△、△2345△、△△3456 300元
四等奖 123△△△,△234△△、△△345△、△△△456 20元
五等奖 12△△△△、△23△△△、△△34△△、△△△45△、△△△△56 5元
§3.1中奖概率
以一注为单位,计算每一注彩票的中奖概率:
特等奖 P0 = 1/10000000 = 0.0000001
一等奖 P1 = 1/1000000 = 0.000001
二等奖 P2 = 20/1000000 = 0.00002
三等奖 P3 = 300/1000000 = 0.0003
四等奖 P4 = 4000/1000000 = 0.004
五等奖 P5 =50000/1000000 = 0.05
合起来,每一注总的中奖概率为:
P = P0+ P1+ P2 +P3+ P4+ P5 = 0.0543211
这就是说每1000注彩票约有54注中奖(包括五等奖到特等奖)
§3.2彩票中奖的期望值
从理论上讲彩票奖金的返还率50%,所以每一注彩票的期望值应该是1元。现在,我们来实际计算一下,看是否如此。
体育彩票各奖级的概率、奖金数额列如下: ?
奖级 中奖概率 每注奖金
特等奖 00000001 2500000(元)
一等奖 0000001 50000(元)
二等奖 000002 5000(元)
三等奖 00003 300(元)
四等奖 0004 20(元)
五等奖 005 5(元)
期望值 Eζ = 0.0000001×2500000+0.000001×50000+0.0002×5000+0.0003×300+0.004×20+0.05×5≈0.82(元)
即每一注体育彩票中奖的期望值约为0.82元。这与理论值1元相差不大,误差的原因主要是对前三级奖金的估计不够精确。
4 医疗问题
在某地区进行某种疾病普查,为此要检验每个人的血液,如果当地有N个人,若逐个检验就需要检验N次,现在要问:有没有办法减少检验的工作量?
我们先把受检验者分组,假设每组有k个人,把这k个人的血液混合在一起进行检验,如果检验的结果为阴性,这说明k个人的血液全为阴性,因而这k个人总共只要检验一次就够了,检验的工作量显然是减少了,但是如果检验的结果是阳性,为了明确k个人中究竟是哪几个人为阳性,就要对这k个人再逐个进行检验,这时k个人检验的总次数为k+1次,检验的工作量反而有所增加,显然,这时k个人需要的检验次数可能只要1次,也可能要检验k+1次,是一个随机变量,为了和老方法比较工作量的大小,应该求出它的平均值(也是平均检验次数)。
在接受检验的人群中,各个人的检验结果是阳性还是阴性,一般都是独立的(如果这种病不是传染病或遗传吧遗传病),并且每个人是阳性结果的概率为p,就是阴性结果的概率为q=1-p,这时k个人一组的混合血液呈阴性结果的概率为,呈阳性结果的概率则为1-,现在令η为k个人一组混合检验时每人所需的检验次数,由上述讨论可知η的分布列为:
η
1+
P
1-
由此即可求得每个人所需得平均检验次数为
Eη=.+(1+)(1-)
=1-+
而按原来得老方法每人应该检验1次,所以当
1-+<1,即q>
时,用分组的办法(k个人一组)就能减少检验的次数,如果q是已知的,还可以从
Eη=1-+中选取最合适的整数,使得平均检验次数Eη达到最小值,从而使平均检验次数减少。
对一些不同的p值,如下表给出了使Eη达到最小的值。
阳性反应率
阳性反应率
0.140
0.130
0.120
0.110
0.100
0.090.
0.080
0.070
0.060
0.050
0.040
0.030
0.020
0.019
0.018
0.017
3
3
4
4
4
4
4
4
5
5
6
6
8
8
8
8


0.016
0.015
0.014
0.013
0.012
0.011
0.010
0.009
0.008
0.007
0.006
0.005
0.004
0.003
0.002
0.001
8
9
9
9
10
10
11
11
12
12
13
15
16
19
23
32
我国某医疗机构在一次普查中,由于采用了上述这种分组的方法,结果每100个人的平均检验次数为21,减少工作量达79%。当然,减少的工作量的大小与p的数值由关,也与每组人数k有关。
     
参考文献:   [1]高鸿业:西方经济学[M]. 中国人民大学出版社,2006 .   [2]赵秀恒等:概率论与数理统计 [M]. 河北教育出版社,2006 .   [3]盛骤等:概率论与数理统计 [M]. 高等教育出版社,2003 .   [4]魏宗舒等:概率论与数理统计 [M]. 高等教育出版社,1983 .
数学期望的计算方法及其应用
摘要:在概率论中,数学期望是随机变量一个重要的数字特征,它比较集中的反映了随机变量的某个侧面的平均性,而且随机变量的其他数字特征都是由数学期望来定义的,因此对随机变量的数学期望的计算方法的研究与探讨具有很深的实际意义。本论文着重总结了随机变量的数学期望在离散型随机变量分布与连续型随机变量分布下的一些常用的计算方法,如利用数学期望的定义和性质,利用不同分布的数学期望公式等等,并通过一些具体的例子说明不停的计算方法在不同情况下的应用,以达到计算最简化的目的。本文还通过介绍了一些随机变量数学期望的计算技巧,并探讨了各种简化计算随机变量数学期望的方法,利用一些特殊求和与积分公式,利用数学期望定义的不同形式,利用随机变量分布的对称性、重期望公式以及特征函数等,并通过例题使我们更加了解和掌握这些计算技巧,已达到学习该内容的目的。
关键词:离散型随机变量 连续型随机变量 数学期望 计算方法
ABSTRACT:
离散型随机变量数学期望的计算方法及应用
利用数学期望的定义,即定义法[1]
定义:设离散型随机变量X分布列为
……
……
则随机变量X的数学期望E(X)=
注意:这里要求级数绝对收敛,若级数不收敛,则随机变量X的数学期望不存在
例1 某推销人与工厂约定,永川把一箱货物按期无损地运到目的地可得佣金10元,若不按期则扣2元,若货物有损则扣5元,若既不按期又有损坏则扣16元。推销人按他的经验认为,一箱货物按期无损的的运到目的地有60﹪把握,不按期到达占20﹪,货物有损占10﹪,不按期又有损的占10﹪。试问推销人在用船运送货物时,每箱期望得到多少?
解 设X表示该推销人用船运送货物时每箱可得钱数,则按题意,X的分布为
8 5 -6
0.6 0.2 0.1
按数学期望定义,该推销人每箱期望可得
10×0.6+8×0.2+5×0.1-6×0.1=7.5元
公式法
对于实际问题中的随机变量,假如我能够判定它服从某重点性分布特征(如二项分布,泊松分布,超几何分布等),则我们就可以直接利用典型分布的数学期望公式来求此随机变量的期望。
二点分布:~,则
二项分布:,,则
几何分布:,则有
泊松分布:,有
超几何分布:,有
例2 一个实验竞赛考试方式为:参赛者从6道题中一次性随机抽取3道题,按要求独立完成题目.竞赛规定:至少正确完成其中2题者方可通过,已知6道备选题中参赛者甲有4题能正确完成,2题不能完成;参赛者乙每题能正确完成的概率都是,且每题正确完成与否互不影响. 分别求出甲、乙两参赛者正确完成题数的数学期望.
解 设参赛者甲正确完成的题数为,则服从超几何分布,其中,

设参赛者乙正确完成的题数为,则
,
1.3 性质法
利用数学期望的性质求期望,主要性质有:

其中为随机变量,为常数。
例3 某工程队完成某项工程的时间(单位:月)是一个随机变量,它的分布列为


(1)试求该工程队完成此项任务的平均月数;
(2)社该工程队所获利润为,单位为万元。试求工程队的平均利润。
解(1)根据题意,我们可求平均月数为:

(2)由(1)知,则可得

利用逐项微分法
这种方法是对于概率分布中含有参数的随机变量而言的,我们可以通过逐项求微分的方法求解出随机变量的数学期望,关键步骤是对分布列的性质两边关于参数进行求导,从而解出数学期望。
例5 设随机变量,求。
解 因为,故 其中
则 (1)
对(1)式两边关于求导得

根据数学期望的定义知:且知
因此上式可以写成:
从而解得
1.6 利用条件数学期望公式法
条件分布的数学期望称为条件数学期望,它主要应用于二维随机变量。在为二维离散随机变量场合下,其计算公式为:

例6 设二维离散随机变量的联合分布列为

0 1 2 3
0
1
2
3
4
5
0 0.01 0.01 0.01
0.01 0.02 0.03 0.02
0.03 0.04 0.05 0.04
0.05 0.05 0.05 0.06
0.07 0.06 0.05 0.06
0.09 0.08 0.06 0.05
试求和
解 要求,首先得求
同理可得

用同样的方法,我们可得
1.7 利用重期望公式法
重期望是在条件期望的基础之下产生的,是的函数,对的不同取值,条件期望的取值也在变化,因此我们可以把看作一个随机变量。重期望的公式是,此公式的前提是存在。如果是一个离散随机变量,则重期望公式可改写成为
例7 口袋中有编码为的个球,从中任取一球,若取到1号球,则得1分,且停止摸球;若取得号球,则得分,且将此球放回,重新摸球。如此下去,试求得到的平均总分数。
解 记为得到的总分数,为第一次取到的球的号码,则
又因为,而当时, 所以
由此解得
第二节 连续型随机变量数学期望的计算方法及应用
连续型随机变量的数学期望的定义和含义完全类似于离散随机变量的,只要在离散随机变量的数学期望定义中用密度函数代替分布列,用积分是代替和式,即得到连续场合下数学期望的定义。
2.1 定义法
设连续随机变量有密度函数,如果积分
有限(收敛),
则称 为的数学期望。
若 无限(不收敛),则说的数学期望不存在。
例8 设随机变量服从均匀分布,求它的数学期望。
解 由于,则它的密度函数为

则根据定义它的数学期望为


可见,均匀分布的数学期望位于区间的中点,即均匀分布具有对称性,下一节中我们将介绍利用分布图像的对称性来求数学期望。
例9 密度函数为 的分布称为柯西分布。
其数学期望不存在,这是因为积分 无限。
2.2 特殊积分法
连续型随机变量的数学期望为,在计算连续型随机变量的数学期望时,常常会用到一些特殊的求积分的性质和方法,如基函数在对称区间的积分值为0,还有第一换元积分等,都会给我们的计算带来简便。
例10 设随机变量,证明.
证 在的积分表达始终做变换
可得

由于上式右端第一个积分的被积函数为奇函数,鼓起积分为0,第二个积分恰为,故得.
2.3 利用特征函数
特征函数的定义:设是一个随机变量,称 , ,为的特征函数,设连续随机变量有密度函数,则的特征函数为

根据上式,我们可以求出随机变量分布的特征函数,然后利用特征函数的性质:求出数学期望,即.
例11 设随机变量,求.
解 因为随机变量,则的特征函数为
其一阶导数为

由特征函数的性质得
注:此题关键是球正态分布的特征函数,我们可以先求出标准正态分布的特征函数,在利用特征函数的性质求出正态分布的特征函数。
2.4 逐项微分法
这种方法同样适用于密度函数中含有参数的连续型随机变量分布,也是对两边对参数求导数来解出数学期望。
例12 设随机变量服从指数分布即,求
解 因为,则的密度函数
则由, 得

对两边关于参数求导得

从而解得
2.5 条件数学期望公式
在连续型随机变量场合下,条件数学期望同样适用,其计算公式为

例13 设二维随机变量的联合密度函数为

试在.
解 由题意知,


2.6 利用重期望公式
在是一个连续随机变量时,重期望公式可改写成为.
例14 设电力公司每月可以供应某工厂的电力服从上的均匀分布,而该工厂每月实际需要的电力服从上的均匀分布。如果工厂能从电力公司得到足够的电力,则每电可以创造30万元的利润,若工厂得不到足够的电力,则不足部分由工厂通过其他途径解决,由其他途径得到的电力每获利10万元,失球该厂每个月的平均利润。
解 从题意知,每月供应电力,而工厂实际需要电力。若设工厂每月的利润为万元,则按题意可得

在给定时,仅是的函数,于是当时,的条件期望为
当时,的条件期望为
然后用的分布对条件期望再作一次平均,即得
所以该厂每月的平均利润为433万元.
第三节 随机变量数学期望的计算技巧
3.1 利用数学期望的性质,化整为零
当一个随机变量的分布列较为复杂时,若直接求它的数学期望会很困难,我们可以通过将它转化成比较常见的简单的随机变量之和来解决。主要是利用数学期望的性质来时问题简单化。
例15 设一袋中装有只颜色各不相同的球,每次从中任取一只,有放回地摸取次,以表示在次摸球中摸到球的不同颜色的数目,求
解 直接写出的分布列较为困难,其原因在于:若第种颜色的球被取到过,则此种颜色的球又可被取到过一次、二次次,情况较多,而其对立事件 “第种颜色的球没被取到过”的概率容易写出为
为此令
这些相当于是计数器,分别记录下第种颜色的球是否被取到过,而是取到过的不同颜色总数,所以.由可得

所以
例16 设,求
解 由题意知,,
方法一:根据数学期望的定义有

方法二:令表示贝努力试验中的出现的次数,则相互独立而且同分布,均服从
3.2 利用二重积分的极坐标变换求解
这种方法只是用于二维连续型随机变量数学期望的求解。
例17 设随机变量相互独立,且均服从分布,求的数学期望。
解 由题意知的密度函数为
可得
令 则可得
3.3 巧用特殊求和公式
例18 对一批产品进行检验,如果检查到第件仍未发现不合格品就认为这批产品合格,如在尚未超过第件时已检查到不合格品即停止继续检查,且认为这批产品为不合格.设产品数量很大,可以认为每次检查查到不合格品的概率都是,问平均每批要检查多少件?
解 设表示每批所需检验的产品数,那的分布列是
注:这里主要用到的求和公式是.
3.4利用分布图象的对称性6
当分布列或密度函数具有对称性时,随机变量数学期望的取值集中位置就是对称中心或对称轴,我们可以利用对称性使比较复杂的问题简单化。尤其,当随机变量服从均匀分布时,它的数学期望取值为它的对称中心,即;当随机变量服从正态分布时,我们由它的图象知是它的对称轴,故它的数学期望取值为.
例19 若正的独立随机变量,服从相同的发布,是证明
证明 由分布的对称性知 同分布,故
例20 设在区间上随机地取个点,以表示相距最远的两点间的距离,求
解 由题意知,个点把区间分成了段,它们的长度依次记为,根据对称性,每个都有相同的概率分布和数学期望,且,故,又因为个点中相距最远的两点间的距离为,所以
魏宗舒,概率论与数理统计[M].高等教育出版社,2006,96~112.
茆诗松、程依明、濮晓龙概率论与数理统计教程. 高等教育出版社,2004
赵强、赖兴珲,离散随机变量数学期望的几种求法.玉林师范学院学报.(自然科学版)2006
茆诗松、周纪芗,概率论与数理统计.中国统计出版社,2000
郑章元,应用概率统计﹝上﹞.南京师范大学出版社,1999
覃光莲,数学期望的计算方法探讨.高等理科教育,2006
概率论与数理统计公式整理 第1章 随机事件及其概率
随机试验和随机事件
如果一个试验在相同条件下可以重复进行,而每次试验的可能结果不止一个,但在进行一次试验之前却不能断言它出现哪个结果,则称这种试验为随机试验。
试验的可能结果称为随机事件。
基本事件、样本空间和事件
在一个试验下,不管事件有多少个,总可以从其中找出这样一组事件,它具有如下性质:
①每进行一次试验,必须发生且只能发生这一组中的一个事件;
②任何事件,都是由这一组中的部分事件组成的。
这样一组事件中的每一个事件称为基本事件,用来表示。
基本事件的全体,称为试验的样本空间,用表示。
一个事件就是由中的部分点(基本事件)组成的集合。通常用大写字母A,B,C,…表示事件,它们是的子集。
为必然事件,?为不可能事件。
不可能事件(?)的概率为零,而概率为零的事件不一定是不可能事件;同理,必然事件(Ω)的概率为1,而概率为1的事件也不一定是必然事件。
)事件的关系与运算
①关系:
如果事件A的组成部分也是事件B的组成部分,(A发生必有事件B发生):
如果同时有,,则称事件A与事件B等价,或称A等于B:A=B。
A、B中至少有一个发生的事件:AB,或者A+B。
属于A而不属于B的部分所构成的事件,称为A与B的差,记为A-B,也可表示为A-AB或者,它表示A发生而B不发生的事件。
A、B同时发生:AB,或者AB。AB=?,则表示A与B不可能同时发生,称事件A与事件B互不相容或者互斥。基本事件是互不相容的。
-A称为事件A的逆事件,或称A的对立事件,记为。它表示A不发生的事件。互斥未必对立。
②运算:
结合率:A(BC)=(AB)C A∪(B∪C)=(A∪B)∪C
分配率:(AB)∪C=(A∪C)∩(B∪C) (A∪B)∩C=(AC)∪(BC)
德摩根率: ,
概率的公理化定义
设为样本空间,为事件,对每一个事件都有一个实数P(A),若满足下列三个条件:
1° 0≤P(A)≤1,
2° P(Ω) =1
3° 对于两两互不相容的事件,,…有
常称为可列(完全)可加性。
则称P(A)为事件的概率。
古典概型
1° ,
2° 。
设任一事件,它是由组成的,则有
P(A)= =
几何概型
若随机试验的结果为无限不可数并且每个结果出现的可能性均匀,同时样本空间中的每一个基本事件可以使用一个有界区域来描述,则称此随机试验为几何概型。对任一事件A,
。其中L为几何度量(长度、面积、体积)。
加法公式
P(A+B)=P(A)+P(B)-P(AB)
当P(AB)=0时,P(A+B)=P(A)+P(B)
减法公式
P(A-B)=P(A)-P(AB)
当BA时,P(A-B)=P(A)-P(B)
当A=Ω时,P()=1- P(B)
条件概率
定义 设A、B是两个事件,且P(A)>0,则称为事件A发生条件下,事件B发生的条件概率,记为。
条件概率是概率的一种,所有概率的性质都适合于条件概率。
例如P(Ω/B)=1P(/A)=1-P(B/A)
)乘法公式
乘法公式:
更一般地,对事件A1,A2,…An,若P(A1A2…An-1)>0,则有
…………。
独立性
①两个事件的独立性
设事件、满足,则称事件、是相互独立的。
若事件、相互独立,且,则有
若事件、相互独立,则可得到与、与、与也都相互独立。
必然事件和不可能事件?与任何事件都相互独立。
?与任何事件都互斥。
②多个事件的独立性
设ABC是三个事件,如果满足两两独立的条件,
P(AB)=P(A)P(B);P(BC)=P(B)P(C);P(CA)=P(C)P(A)
并且同时满足P(ABC)=P(A)P(B)P(C)
那么A、B、C相互独立。
对于n个事件类似。
全概公式
设事件满足
1°两两互不相容,,
2°,
则有

贝叶斯公式
设事件,,…,及满足
1° ,,…,两两互不相容,>0,1,2,…,,
2° ,,

,i=1,2,…n。
此公式即为贝叶斯公式。
,(,,…,),通常叫先验概率。,(,,…,),通常称为后验概率。贝叶斯公式反映了“因果”的概率规律,并作出了“由果朔因”的推断。
伯努利概型
我们作了次试验,且满足
每次试验只有两种可能结果,发生或不发生;
次试验是重复进行的,即发生的概率每次均一样;
每次试验是独立的,即每次试验发生与否与其他次试验发生与否是互不影响的。
这种试验称为伯努利概型,或称为重伯努利试验。
用表示每次试验发生的概率,则发生的概率为,用表示重伯努利试验中出现次的概率,
,。
第二章 随机变量及其分布
(1)离散型随机变量的分布律
设离散型随机变量的可能取值为Xk(k=1,2,…)且取各个值的概率,即事件(X=Xk)的概率为
P(X=xk)=pk,k=1,2,…,
则称上式为离散型随机变量的概率分布或分布律。有时也用分布列的形式给出:

显然分布律应满足下列条件:
(1),, (2)。
(2)连续型随机变量的分布密度
设是随机变量的分布函数,若存在非负函数,对任意实数,有

则称为连续型随机变量。称为的概率密度函数或密度函数,简称概率密度。
密度函数具有下面4个性质:
1° 。
2° 。
(3)离散与连续型随机变量的关系
积分元在连续型随机变量理论中所起的作用与在离散型随机变量理论中所起的作用相类似。
(4)分布函数
设为随机变量,是任意实数,则函数
称为随机变量X的分布函数,本质上是一个累积函数。
可以得到X落入区间的概率。分布函数表示随机变量落入区间(– ∞,x]内的概率。
分布函数具有如下性质:
1° ;
2° 是单调不减的函数,即时,有 ;
3° , ;
4° ,即是右连续的;
5° 。
对于离散型随机变量,;
对于连续型随机变量, 。
(5)八大分布
0-1分布
P(X=1)=p, P(X=0)=q
二项分布
在重贝努里试验中,设事件发生的概率为。事件发生的次数是随机变量,设为,则可能取值为。
, 其中,
则称随机变量服从参数为,的二项分布。记为。
当时,,,这就是(0-1)分布,所以(0-1)分布是二项分布的特例。
泊松分布
设随机变量的分布律为
,,,
则称随机变量服从参数为的泊松分布,记为或者P()。
泊松分布为二项分布的极限分布(np=λ,n→∞)。
超几何分布
随机变量X服从参数为n,N,M的超几何分布,记为H(n,N,M)。
几何分布
,其中p≥0,q=1-p。
随机变量X服从参数为p的几何分布,记为G(p)。
均匀分布
设随机变量的值只落在[a,b]内,其密度函数在[a,b]上为常数,即
?
其他,
则称随机变量在[a,b]上服从均匀分布,记为X~U(a,b)。
分布函数为
?
?
?
?
当a≤x1
指数分布
?
?
?
?其中,则称随机变量X服从参数为的指数分布。
X的分布函数为

?
?
?记住积分公式:
正态分布
设随机变量的密度函数为
, ,
其中、为常数,则称随机变量服从参数为、的正态分布或高斯(Gauss)分布,记为。
具有如下性质:
1° 的图形是关于对称的;
2° 当时,为最大值;
若,则的分布函数为

参数、时的正态分布称为标准正态分布,记为,其密度函数记为
,,
分布函数为

是不可求积函数,其函数值,已编制成表可供查用。
Φ(-x)=1-Φ(x)且Φ(0)=。
如果~,则~。

(6)分位数
下分位表:;
(7)函数分布
离散型
已知的分布列为
?,
的分布列(互不相等)如下:

若有某些相等,则应将对应的相加作为的概率。
连续型
先利用X的概率密度fX(x)写出Y的分布函数FY(y)=P(g(X)≤y),再利用变上下限积分的求导公式求出fY(y)。
第三章 二维随机变量及其分布
(1)联合分布
离散型
如果二维随机向量(X,Y)的所有可能取值为至多可列个有序对(x,y),则称为离散型随机量。
设=(X,Y)的所有可能取值为,且事件{=}的概率为pij,,称
为=(X,Y)的分布律或称为X和Y的联合分布律。联合分布有时也用下面的概率分布表来表示:
Y
X
y1
y2

yj

x1
p11
p12

p1j

x2
p21
p22

p2j

xi
pi1


这里pij具有下面两个性质:
(1)pij≥0(i,j=1,2,…);
(2)
连续型
对于二维随机向量,如果存在非负函数,使对任意一个其邻边分别平行于坐标轴的矩形区域D,即D={(X,Y)|a则称为连续型随机向量;并称f(x,y)为=(X,Y)的分布密度或称为X和Y的联合分布密度。
分布密度f(x,y)具有下面两个性质:
f(x,y)≥0;
(2)
(2)二维随机变量的本质
(3)联合分布函数
设(X,Y)为二维随机变量,对于任意实数x,y,二元函数
称为二维随机向量(X,Y)的分布函数,或称为随机变量X和Y的联合分布函数。
分布函数是一个以全平面为其定义域,以事件的概率为函数值的一个实值函数。分布函数F(x,y)具有以下的基本性质:
(1)
(2)F(x,y)分别对x和y是非减的,即
当x2>x1时,有F(x2,y)≥F(x1,y);当y2>y1时,有F(x,y2) ≥F(x,y1);
(3)F(x,y)分别对x和y是右连续的,即
(4)
(5)对于
.
(4)离散型与连续型的关系
(5)边缘分布
离散型
X的边缘分布为

Y的边缘分布为

连续型
X的边缘分布密度为
Y的边缘分布密度为
(6)条件分布
离散型
在已知X=xi的条件下,Y取值的条件分布为
在已知Y=yj的条件下,X取值的条件分布为
连续型
在已知Y=y的条件下,X的条件分布密度为

在已知X=x的条件下,Y的条件分布密度为
(7)独立性
一般型
F(X,Y)=FX(x)FY(y)
离散型
有零不独立
连续型
f(x,y)=fX(x)fY(y)
直接判断,充要条件:
①可分离变量
②正概率密度区间为矩形
二维正态分布
=0
随机变量的函数
若X1,X2,…Xm,Xm+1,…Xn相互独立, h,g为连续函数,则:
h(X1,X2,…Xm)和g(Xm+1,…Xn)相互独立。
特例:若X与Y独立,则:h(X)和g(Y)独立。
例如:若X与Y独立,则:3X+1和5Y-2独立。
(8)二维均匀分布
设随机向量(X,Y)的分布密度函数为
其中SD为区域D的面积,则称(X,Y)服从D上的均匀分布,记为(X,Y)~U(D)。
例如图3.1、图3.2和图3.3。
y
1
D1
O 1 x
图3.1
y
1

O 2 x
图3.2
y
d
c
O a b x
图3.3
(9)二维正态分布
设随机向量(X,Y)的分布密度函数为
其中是5个参数,则称(X,Y)服从二维正态分布,
记为(X,Y)~N(
由边缘密度的计算公式,可以推出二维正态分布的两个边缘分布仍为正态分布,
即X~N(
但是若X~N(,(X,Y)未必是二维正态分布。
(10)函数分布
Z=X+Y
根据定义计算:
对于连续型,fZ(z)=
两个独立的正态分布的和仍为正态分布()。
n个相互独立的正态分布的线性组合,仍服从正态分布。

Z=max,min(X1,X2,…Xn)
若相互独立,其分布函数分别为,则Z=max,min(X1,X2,…Xn)的分布函数为:
分布
设n个随机变量相互独立,且服从标准正态分布,可以证明它们的平方和
服从自由度为n的分布,记为W~。
所谓自由度是指独立正态随机变量的个数,它是随机变量分布中的一个重要参数。
分布满足可加性:设

t分布
设X,Y是两个相互独立的随机变量,且
可以证明函数
服从自由度为n的t分布,记为T~t(n)。
F分布
设,且X与Y独立,可以证明
服从第一个自由度为n1,第二个自由度为n2的F分布,记为F~f(n1, n2).
第四章 随机变量的数字特征
(1)一维随机变量的数字特征
离散型
连续型
期望
期望就是平均值
设X是离散型随机变量,其分布律为P()=pk,k=1,2,…,n,
(要求绝对收敛)
设X是连续型随机变量,其概率密度为f(x),
(要求绝对收敛)
函数的期望
Y=g(X)

Y=g(X)
方差
D(X)=E[X-E(X)]2,
标准差


①对于正整数k,称随机变量X的k次幂的数学期望为X的k阶原点矩,记为vk,即
νk=E(Xk)= , k=1,2, ….
②对于正整数k,称随机变量X与E(X)差的k次幂的数学期望为X的k阶中心矩,记为,即
=, k=1,2, ….
①对于正整数k,称随机变量X的k次幂的数学期望为X的k阶原点矩,记为vk,即
νk=E(Xk)=
k=1,2, ….
②对于正整数k,称随机变量X与E(X)差的k次幂的数学期望为X的k阶中心矩,记为,即
=
k=1,2, ….
切比雪夫不等式
设随机变量X具有数学期望E(X)=μ,方差D(X)=σ2,则对于任意正数ε,有下列切比雪夫不等式
切比雪夫不等式给出了在未知X的分布的情况下,对概率
的一种估计,它在理论上有重要意义。
(2)期望的性质
E(C)=C
E(CX)=CE(X)
E(X+Y)=E(X)+E(Y),
E(XY)=E(X) E(Y),充分条件:X和Y独立;
充要条件:X和Y不相关。
(3)方差的性质
D(C)=0;E(C)=C
D(aX)=a2D(X); E(aX)=aE(X)
D(aX+b)= a2D(X); E(aX+b)=aE(X)+b
D(X)=E(X2)-E2(X)
D(X±Y)=D(X)+D(Y),充分条件:X和Y独立;
充要条件:X和Y不相关。
D(X±Y)=D(X)+D(Y) ±2E[(X-E(X))(Y-E(Y))],无条件成立。
而E(X+Y)=E(X)+E(Y),无条件成立。
(4)常见分布的期望和方差
期望
方差
0-1分布
p
二项分布
np
泊松分布
几何分布
超几何分布
均匀分布
指数分布
正态分布
n
2n
t分布
0
(n>2)
(5)二维随机变量的数字特征
期望
函数的期望


方差
协方差
对于随机变量X与Y,称它们的二阶混合中心矩为X与Y的协方差或相关矩,记为,即
与记号相对应,X与Y的方差D(X)与D(Y)也可分别记为与。
相关系数
对于随机变量X与Y,如果D(X)>0, D(Y)>0,则称
为X与Y的相关系数,记作(有时可简记为)。
||≤1,当||=1时,称X与Y完全相关:
完全相关
而当时,称X与Y不相关。
以下五个命题是等价的:
①;
②cov(X,Y)=0;
③E(XY)=E(X)E(Y);
④D(X+Y)=D(X)+D(Y);
⑤D(X-Y)=D(X)+D(Y).
协方差矩阵
混合矩
对于随机变量X与Y,如果有存在,则称之为X与Y的k+l阶混合原点矩,记为;k+l阶混合中心矩记为:
(6)协方差的性质
cov (X, Y)=cov (Y, X);
cov(aX,bY)=ab cov(X,Y);
cov(X1+X2, Y)=cov(X1,Y)+cov(X2,Y);
cov(X,Y)=E(XY)-E(X)E(Y).
(7)独立和不相关
若随机变量X与Y相互独立,则;反之不真。
若(X,Y)~N(),
则X与Y相互独立的充要条件是X和Y不相关。
第五章 大数定律和中心极限定理
(1)大数定律
切比雪夫大数定律
设随机变量X1,X2,…相互独立,均具有有限方差,且被同一常数C所界:D(Xi) 特殊情形:若X1,X2,…具有相同的数学期望E(XI)=μ,则上式成为
伯努利大数定律
设μ是n次独立试验中事件A发生的次数,p是事件A在每次试验中发生的概率,则对于任意的正数ε,有
伯努利大数定律说明,当试验次数n很大时,事件A发生的频率与概率有较大判别的可能性很小,即
这就以严格的数学形式描述了频率的稳定性。
辛钦大数定律
设X1,X2,…,Xn,…是相互独立同分布的随机变量序列,且E(Xn)=μ,则对于任意的正数ε有
(2)中心极限定理
列维-林德伯格定理
设随机变量X1,X2,…相互独立,服从同一分布,且具有相同的数学期望和方差:,则随机变量
的分布函数Fn(x)对任意的实数x,有
此定理也称为独立同分布的中心极限定理。
棣莫弗-拉普拉斯定理
设随机变量为具有参数n, p(0(3)泊松定理
若当,则

其中k=0,1,2,…,n,…。
二项分布的极限分布为泊松分布。
第六章 样本及抽样分布
(1)数理统计的基本概念
总体
在数理统计中,常把被考察对象的某一个(或多个)指标的全体称为总体(或母体)。我们总是把总体看成一个具有分布的随机变量(或随机向量)。
个体
总体中的每一个单元称为样品(或个体)。
样本
我们把从总体中抽取的部分样品称为样本。样本中所含的样品数称为样本容量,一般用n表示。在一般情况下,总是把样本看成是n个相互独立的且与总体有相同分布的随机变量,这样的样本称为简单随机样本。在泛指任一次抽取的结果时,表示n个随机变量(样本);在具体的一次抽取之后,表示n个具体的数值(样本值)。我们称之为样本的两重性。
样本函数和统计量
设为总体的一个样本,称
()
为样本函数,其中为一个连续函数。如果中不包含任何未知参数,则称()为一个统计量。
常见统计量及其性质
样本均值
样本方差
样本标准差
样本k阶原点矩
样本k阶中心矩
,,
,,
其中,为二阶中心矩。
(2)正态总体下的四大分布
正态分布
设为来自正态总体的一个样本,则样本函数
t分布
设为来自正态总体的一个样本,则样本函数
其中t(n-1)表示自由度为n-1的t分布。
设为来自正态总体的一个样本,则样本函数
其中表示自由度为n-1的分布。
F分布
设为来自正态总体的一个样本,而为来自正态总体的一个样本,则样本函数
其中

表示第一自由度为,第二自由度为的F分布。
(3)正态总体下分布的性质
与独立。
第七章 参数估计
(1)点估计
矩估计
设总体X的分布中包含有未知数,则其分布函数可以表成它的k阶原点矩中也包含了未知参数,即。又设为总体X的n个样本值,其样本的k阶原点矩为

这样,我们按照“当参数等于其估计量时,总体矩等于相应的样本矩”的原则建立方程,即有
由上面的m个方程中,解出的m个未知参数即为参数()的矩估计量。
若为的矩估计,为连续函数,则为的矩估计。
极大似然估计
当总体X为连续型随机变量时,设其分布密度为,其中为未知参数。又设为总体的一个样本,称
为样本的似然函数,简记为Ln.
当总体X为离型随机变量时,设其分布律为,则称
为样本的似然函数。
若似然函数在处取到最大值,则称分别为的最大似然估计值,相应的统计量称为最大似然估计量。
若为的极大似然估计,为单调函数,则为的极大似然估计。
(2)估计量的评选标准
无偏性
设为未知参数的估计量。若E ()=,则称 为的无偏估计量。
E()=E(X), E(S2)=D(X)
有效性
设和是未知参数的两个无偏估计量。若,则称有效。
一致性
设是的一串估计量,如果对于任意的正数,都有
则称为的一致估计量(或相合估计量)。
若为的无偏估计,且则为的一致估计。
只要总体的E(X)和D(X)存在,一切样本矩和样本矩的连续函数都是相应总体的一致估计量。
(3)区间估计
置信区间和置信度
设总体X含有一个待估的未知参数。如果我们从样本出发,找出两个统计量与,使得区间以的概率包含这个待估参数,即
那么称区间为的置信区间,为该区间的置信度(或置信水平)。
单正态总体的期望和方差的区间估计

设为总体的一个样本,在置信度为下,我们来确定的置信区间。具体步骤如下:
(i)选择样本函数;
(ii)由置信度,查表找分位数;
(iii)导出置信区间。
已知方差,估计均值
(i)选择样本函数
(ii) 查表找分位数
(iii)导出置信区间
未知方差,估计均值
(i)选择样本函数
(ii)查表找分位数

(iii)导出置信区间
方差的区间估计
(i)选择样本函数
(ii)查表找分位数

(iii)导出的置信区间
第八章 假设检验
基本思想
假设检验的统计思想是,概率很小的事件在一次试验中可以认为基本上是不会发生的,即小概率原理。
为了检验一个假设H0是否成立。我们先假定H0是成立的。如果根据这个假定导致了一个不合理的事件发生,那就表明原来的假定H0是不正确的,我们拒绝接受H0;如果由此没有导出不合理的现象,则不能拒绝接受H0,我们称H0是相容的。与H0相对的假设称为备择假设,用H1表示。
这里所说的小概率事件就是事件,其概率就是检验水平α,通常我们取α=0.05,有时也取0.01或0.10。
基本步骤
假设检验的基本步骤如下:
提出零假设H0;
选择统计量K;
对于检验水平α查表找分位数λ;
由样本值计算统计量之值K;
将进行比较,作出判断:当时否定H0,否则认为H0相容。
两类错误
第一类错误
当H0为真时,而样本值却落入了否定域,按照我们规定的检验法则,应当否定H0。这时,我们把客观上H0成立判为H0为不成立(即否定了真实的假设),称这种错误为“以真当假”的错误或第一类错误,记为犯此类错误的概率,即
P{否定H0|H0为真}=;
此处的α恰好为检验水平。
第二类错误
当H1为真时,而样本值却落入了相容域,按照我们规定的检验法则,应当接受H0。这时,我们把客观上H0。不成立判为H0成立(即接受了不真实的假设),称这种错误为“以假当真”的错误或第二类错误,记为犯此类错误的概率,即
P{接受H0|H1为真}=。
两类错误的关系
人们当然希望犯两类错误的概率同时都很小。但是,当容量n一定时,变小,则变大;相反地,变小,则变大。取定要想使变小,则必须增加样本容量。
在实际使用时,通常人们只能控制犯第一类错误的概率,即给定显著性水平α。α大小的选取应根据实际情况而定。当我们宁可“以假为真”、而不愿“以真当假”时,则应把α取得很小,如0.01,甚至0.001。反之,则应把α取得大些。
单正态总体均值和方差的假设检验
条件
零假设
统计量
对应样本
函数分布
否定域
已知
N(0,1)
未知
未知

展开更多......

收起↑

资源列表