资源简介 (共44张PPT)概率论与数量统计数理统计学的基本概念第六章01数理统计学的基本问题数理统计学的基本问题01【例6.1.1】某工厂每天生产A型钢筋根,为了了解这批钢筋的抗拉强度的分布情况,随机抽检100根钢筋,得到100个抗拉强度数据。这里,我们的研究对象是一天内所生产的根钢筋的抗拉强度,它成为问题中的统计总体,抽检的100根钢筋的抗拉强度成为总体的一个样本。有如下的一些问题:(1)根据样本的100个抗拉强度数据,估计总体的均值和方差;(2)设国家标准规定A型钢筋的抗拉强度不小于a,根据抽取的样本,判断这批产品是合格品还是不合格品.(3)根据该样本的100个抗拉强度的差别,分析造成数据之间差异的原因纯粹是生产中的随机因素还是某些特定的因素。(4)若钢筋的强度与某种因素(如原材料的含锰量)有关,根据样本提供的数据如何分析钢筋抗拉强度和该因素的相关关系 02总体、样本、统计量与分位数总体、样本、统计量与分位数02总体与样本数理统计学中,通常将研究对象的全体称为总体或母体(population),而组成总体的每个基本单元视为一个个体(unit或sample piece) 。数理统计学中所研究的总体,实际上是指与总体相联系的某个数量指标X取值的全体。例如,以X表示钢筋的抗拉强度的值,对于不同的个体,X的取值不同。对任意抽取的一根钢筋,抗拉强度X的值是一个随机变量,称X为表征总体的随机变量,也称总体,对于全体(根)钢筋而言,X的取值满足一定的概率分布,这个分布称为总体的分布。定义6.1 在数理统计学中,一个随机变量称为一个总体。总体、样本、统计量与分位数02总体与样本抽取样本的目的是根据样本提供的信息对总体的特征进行统计推断,所以抽取的样本应尽可能地反映总体的特性。为此,一般所取样本应满足下列要求。1.随机性。从总体中抽取的样本必须是随机的,即每个个体被抽到的概率要一样,换句话说,样本()中,每个要与总体X同分布,这样抽到的样本才具有代表性。2.独立性。在抽取的样本中,是相互独立的,即每次的观察结果都不影响其他各次的观察结果。这就要求,如果试验是破坏性的,那么总体应该是无限的,如果总体是有限的,那么抽取应该是有放回的。总体、样本、统计量与分位数02总体与样本定义6.2 设()是一个维随机向量,且(1)均与X同分布;(2)相互独立,则称()为取自总体X的一个简单随机样本(simple random saple),简称样本,称为样本容量(sample size)。样本()取定的一组具体值()可视为样本的一个观察值,简称样本值或样本点。若将()理解为维向量空间的一个点,则将()所有可能取值的集合称为样本空间。总体、样本、统计量与分位数02总体与样本【例1】设5个学生的数学考试成绩分别为70,81,95,95,64。(1)写出由这5个学生的数学考试成绩构成的总体X的概率分布;(2)从该总体中抽取一个容量为2的样本,并写出它的观察值;总体、样本、统计量与分位数02总体与样本【例1】设5个学生的数学考试成绩分别为70,81,95,95,64。(3)写出该样本的联合概率分布。解:样本联合分布列为总体、样本、统计量与分位数02统计量定义6.3 设()是总体X的一个样本,T()是禾知量的一个不含未知参数的函数,则称T()是一个统计量(statistic)。确定一个样本的函数T()是否为统计量,重要的一-点是它不应含有未知参数,将样本值(,)代入统计量,得到的T()是一个具体的实数,T()称为统计量T(的观察值。总体、样本、统计量与分位数02统计量常见得统计量如下。(1)样本均值(sample mean)样本均值的观察值记为 。总体、样本、统计量与分位数02统计量(2)样本均值(sample mean)样本方差的观察值记为 。称样本方差的平方根为样本标准差(sample standard deviation)。样本标准差的观察值为总体、样本、统计量与分位数02统计量(3)样本矩(sample moment)样本k阶原点矩为样本k阶中心矩为可以看到总体、样本、统计量与分位数02统计量定理6.1 设总体X得k阶原点矩存在,,则样本k阶原点矩依概率收敛与。证明:因独立且与X同分布,故独立且均与同分布,所以于是根据辛钦大数定律,对任意得,有总体、样本、统计量与分位数02分位数定义6.4 设X是一个随机变量,为满足的实数,若数满足则称为X的上分位数(quantile)(见图6.1),简称分位数,或分位点,或临界值。03经验分布函数与频率直方图经验分布函数与频率直方图03经验分布函数从总体X中抽取样本(),设样本值为(),将样本值按从小到大的顺序排列成设的值为,,则称()为样本()的顺序统计量(orderstatisti)。由于共有个值,因此每个值出现的概率都是,假设各个均不相等,定义一个在整个数轴上都有定义的函数经验分布函数与频率直方图03经验分布函数容易看出是一个单调、非减、右连续的阶梯函数,,且,(见图6.3),称为总体X的经验分布函数(empirical distribution function)或样本分布函数。经验分布函数与频率直方图03频率直方图对连续型总体X,当试验数据很多时,也常常利用频率直方图来估计总体的分布密度函数。频率直方图的作法如下。设是X的分布密度函数,()是取自X的样本,()是样本观察值。以记观察值中最小的数,以记观察值中最大的数。首先确定样本值的取值区间[a,b],考虑观察值可能存在误差及分割区间的方便,取a等于或略小于,取b等于或略大于,然后对区间[a,b]进行分割,在[a,b]中插入分点将[a,b]划分为个左闭、右开的小区间,i=1,2,…,m。这样傲的目的是将得到的数据分组。为了使每个数据不落在区间的端点上,通常取的值比多一位小数。对于的取法,在实践中通常是先取等分组,然后依据每个小区间所包含的观察数据不少于5个的原则,将若干相邻区间合并,分组数不宜太少,但也不宜过多,通常控制在8~15为宜。经验分布函数与频率直方图03频率直方图设区间的长为,=,,观察值落入的个数称为频数,将称为观测值落入区间的频率(frequency)。对为底、以为高,作一排长方形,每块长方形的面积为·=,这样得到的台阶曲线称为频率直方图(见图6.4)。04抽样分布与抽样分布定理抽样分布与抽样分布定理04抽样分布1.分布定义6.5 设总体,()是取自X的容量为的一个简单随机样本,则称随机变量服从的分布自由度( degree of freedom)为的分布,记为~(n)。其中的自由度是指上述平方和中相互独立的标准正态随机变量的个数。抽样分布与抽样分布定理04抽样分布1.分布分布具有如下重要性质。性质1 设,则性质2 当n增大时,渐近于正态分布,即设。则对任意x有抽样分布与抽样分布定理04抽样分布性质一的证明过程如下抽样分布与抽样分布定理04抽样分布1.分布性质3 分布对参数具有可加性,即设, ,则抽样分布与抽样分布定理04抽样分布2.t 分布定义6.6 设,,且X和Y相互独立,令T服从的分布称为自由度为n的t分布,记为T~t(n)。抽样分布与抽样分布定理04抽样分布3.F 分布定义6.7 设,,且X和Y相互独立,令F服从的分布称为自由度为(,)的F分布,记为F~F(,),称为第一自由度,称为第二自由度。抽样分布与抽样分布定理04抽样分布定理定理6.2 设总体,()是取自X的样本,则样本均值为定理6.3 设总体,则样本均值 与样本方差 相互独立,且抽样分布与抽样分布定理04抽样分布定理定理6.2证明过程如下抽样分布与抽样分布定理04抽样分布定理定理6.3证明过程如下抽样分布与抽样分布定理04抽样分布定理定理6.3证明过程如下抽样分布与抽样分布定理04抽样分布定理定理6.3证明过程如下抽样分布与抽样分布定理04抽样分布定理定理6.4 设总体,则定理6.5 设()是从总体中抽取的容量为的样本,是其样本方差;()是从总体中抽取的容量为的样本,是样本方差,且两个样本相互独立,则式中,抽样分布与抽样分布定理04抽样分布定理定理6.4证明过程如下抽样分布与抽样分布定理04抽样分布定理定理6.5证明过程如下抽样分布与抽样分布定理04抽样分布定理定理6.5证明过程如下抽样分布与抽样分布定理04抽样分布定理定理6.6 设从总体)中抽取的容量为的样本,其方差为,从总体中抽取的容量为的样本,其方差为,且两个样本相互独立,则随机变量抽样分布与抽样分布定理04抽样分布定理定理6.6证明过程如下抽样分布与抽样分布定理04抽样分布定理【例1】设总体X~ N(),()为取自X的样本,为样本均值,为样本方差。抽样分布与抽样分布定理04抽样分布定理【例1】设总体X~ N(),()为取自X的样本,为样本均值,为样本方差。抽样分布与抽样分布定理04抽样分布定理【例1】设总体X~ N(),()为取自X的样本,为样本均值,为样本方差。抽样分布与抽样分布定理04抽样分布定理【例1】设总体X~ N(),()为取自X的样本,为样本均值,为样本方差。抽样分布与抽样分布定理04抽样分布定理【例2】设总体X~N(,),()是n =10的一个简单随机样本,是样本方差,已知,求常数a。感谢观看,再见!概率论与数量统计 展开更多...... 收起↑ 资源预览