资源简介 (共49张PPT)统计学原理第五章 分布的数值特征§1、数据分布集中趋势的测定—平均指标§2、数据分布离散程度的测定——标志变异指标§3、数据分布的偏度与峰度§1、数据分布集中趋势的测定—平均指标一、数值平均数二、位置平均数三、平均数的适用范围和运用原则平均指标(Mean)是用来描述统计数据分布集中趋势的主要指标,又称平均数。与总量指标、相对指标一样,是统计常用的综合指标。平均数是将同一总体中各单位标志值的差异抽象化,用来表示总体各单位某一数量标志在一定时间、地点、条件下所达到的一般水平。根据各种平均数的具体代表意义和计算方式的不同,平均数可分为“数值平均数”和“位置平均数”两大类。数值平均数位置 平均数简单算术平均数加权算术平均数调和算术平均数几何平均数中位数众数一、数值平均数数值平均数是根据数据分布的全部标志值(或变量值)来计算的平均数,也称均值,是反映数据分布集中趋势的重要指标。它包括算术平均数、调和平均数和几何平均数。(一)算术平均数算术平均数是分析社会经济现象一般水平的最基本指标,其基本计算公式是:算术平均数由于掌握的资料不同,可分为简单算术平均数和加权算术平均数。1、简单算术平均数:主要用于处理未分的原始资料。强度相对数与平均数的区别:强度相对数1、强度相对数是由两个不同质但有联系的总体的指标数值对比求得。2、强度相对数的分子与分母不存在一一对应关系。3、强度相对数是反映两个有联系的总体之间的数量联系。平均数1、平均数是在同质总 体内进行计算的。2、平均数的分子与分母是一一对应关系。分母是分子(标志值)的承担者。3、平均数是反映一般水平或集中趋势的。2、加权算术平均数单项式数列组距式数列f:就是权数在总体单位数较多时,计算平均数就需要采用加权算术平均数的方法。(1)、单项式数列计算加权算术平均数第一、把各组的标志值乘以相应数的单位数,求出各组的标志总量;第二、再把各组的标志总量相加,求得总体标志总量;第三、把各组的单位数相加,求得总体单位总量;第四、用总体标志总量除以总体单位总量,求得平均数。(2)、组距式数列计算加权算术平均数第一、确定各组的组中值;第二、把各组的组中值乘以相应的单位数,求出各组的标志总量;第三、再把各组的标志总量相加,求得总体标志总量;第四、把各组的单位数相加,求得总体单位总量;第五、用总体标志总量除以总体单位总量,求得平均数。平均数的大小受两个因素的影响:1、变量值本身水平的大小;2、标志值在各组出现次数的多少。即权数大小的影响。次数被称为权数,而标志值与次数相乘,则被称为加权。在标志值水平一定时,权数的大小影响平均数的大小:权数越大,平均数就越接近这组标志值;权数越小,平均数就离这组标志值越远。权衡轻重3、算术平均数的数学性质:各个变量值与算术平均数的离差总和等于零。各个变量值与算术平均数的离差平方总和为最小值。(二)调和算术平均数:调和平均数是常用的另一种平均指标,它是根据标志值的倒数计算的,又称为倒数平均数。例4:已知某产品在三个生产企业的平均生产成本及产值资料如表所示,计算该产品的平均生产成本。企 业单位生产成本(元)(X)总成本(元)(M)生产量(件)(M/X)(甲)(1)(2)(3)=(2)÷(1)甲10030000300乙15030000200丙14035000250合 计-95000750加权平均数与调和平均数应用的条件:加权算术平均数一般用在未知分子的情况下。即总体标志总量未知。调和算术平均数一般用在未知分母的情况下。即总体单位数未知。(三)几何平均数(Geometric Mean)1.简单几何平均数式中:表示几何平均数;表示连乘符号。几何平均数主要用来计算平均比率和平均速度,2.加权几何平均数式中:f为各变量值的次数或权数例、某投资银行有笔投资的年利率是按复利计算的,25年的年利率分配如下:有1年为3%,有4年为5%,有8年为8%,有10年为10%,有2年为15%,求平均年利率。根据计算结果,25年的平均年利率的发展速度为108.65%,即年平均利率为8.65%。常用的数值平均数的一般数量关系由于三种平均数之间存在着上述不等式关系,因而在计算平均数时应根据社会经济现象的性质和统计研究的目的选择适当的计算方法。二、位置平均数位置平均数是根据其在总体中所处的位置或地位确定的。位置平均数不是根据统计总体的全部标志值或变量值计算的。位置平均数有两种:众数(Mo)、中位数(Me)。1、众数:是一个统计总体或分布数列中出现频数最多、频率最高的标志值。由单项式数列确定众数:只需找出出现次数最多的标志值。由组距式数列确定众数:第一步:找出频数(频率)最大的组,即“众数组”第二步:按公式近似地计算众数值。计算众数的公式:2、中位数(Me):是一个统计总体或分布数列中处于中间位置的变量值。中位数将全部总体单位按标志值的大小平分成两半:一半比它大,一半比它小。用一个中等水平的标志值来表示分布数列的集中趋势,有非常直观的代表性意义。确定中位数的方法分为两种:未分组的原始资料:1、将标志值按大小顺序排列。2、确定中位数的位次。3、确定中位数。当n是奇数时,则处于中间位置的标志值就是中位数;当n是偶数时,则处于中间位置的两个标志值的算术平均数就是中位数。由已分组资料确定中位数:第一:计算向上累计数(下限公式) 或向下累计数(上限公式);第二:确定中位数所在组;∑f /2第三;按公式计算中位数。(三)中位数、众数与算术平均数的关系:1.判别总体分布特征(对称分布)(正偏态分布)(负偏态分布)2.互相推算(在偏斜不大时)例:一组工人的月收入众数为700元,月收入的算术平均数为1000元,则月收入的中位数近似值是:三、平均数的适用范围和运用原则(一)平均数的适用范围(二)平均数的运用原则1.平均数只适用于同质总体2.用组平均数补充说明总平均数3.根据具体条件选择平均方法4.平均数与典型值和分配数列结合分析第二节 数据分布离散程度的测定——标志变异指标一、全距二、四分位差三、平均差四、标准差和方差五、离散系数六、标志变动度的作用七、属性总体的概念和特征值的计算标志变异指标(Variable Indicant)是反映同质总体各单位标志值差异程度的指标,也称标志变动度。标志变异指标主要有:全距(R)、四分位差(Q.D.)、平均差(A.D.)、标准差(σ)和离散系数等。一、全距(R)全距=最大值—最小值全距的意义明确,计算简单。但它只考虑极值的大小,而不考虑其他变量值的分布情况,因而,用全距来测定数列的离散程度就不全面。二、四分位差四分位差也称四分位距或修正极差,是将总体各单位标志值按大小顺序排列后,将数列四等分,形成三个分割点(Q1、Q2、Q3),这三个分割点称为四分位数。其中,第二个四分位数(Q2)就是数列的中位数Me;第三个四分位数(Q3)与第一个四分位数(Q1)的差就是四分位差,三、平均差:是每一个变量值与总体平均数的平均差异程度。平均差因取绝对值,计算处理过程繁琐,数学性质也不理想,所以,应用较少。四、标准差:也是平均差的意义。只是采用了平方的方法解决正负方向问题。其计算过程简便且数学性质也最优。是最常用,也是最重要的标志变异指标。五、离散系数:概念:数据的离散系数又称变异系数,是标志变动度指标与平均数的比率。比较:两个水平不等的数列比较。两个性质不同的数列比较。两个计量单位不同的数列的比较。离散系数的计算公式六、标志变动度的作用(一)衡量平均指标的代表性(二)反映社会经济活动过程的均衡性(三)比较产品质量的稳定性七、属性总体的概念和特征值的计算(一)属性总体的概念属性总体就是将总体单位分为具有某种标志的单位和不具有某种标志的单位。总体变量总体(其取值可以是多种多样的)属性总体(是非总体,其取值只能是0或1)设总体单位数为N,N = N1+ N0成数(P):就是N1/ N,即P = N1/ Nq = N0/ Np + q = 1 q = 1-p(二)属性总体特征值的计算方法属性总体的总体平均数:属性总体的方差: 展开更多...... 收起↑ 资源预览