资源简介 (共110张PPT)应用统计学数据分布特征描述33.1总量指标3.2相对指标3.3平均指标3.4标志变异指标3.5 Excel在描述统计指标中的应用学习目标1.理解总量指标的概念、作用及种类;2.掌握六种相对指标的概念和计算;3.掌握数值平均数和位置平均数的计算方法,理解平均指标的人生哲学;4.了解平均差的含义,掌握标准差、方差的计算和运用;5.掌握标志变异系数的计算方法,理解变异数的人生哲学;6.能用以上指标对社会经济现象进行分析与应用,谨防掉进平均数的陷阱。鳗鱼的公共繁殖场所费希尔在1952年的一篇文章中举了一个例子,说明如何由基本的描述统计量的知识引出一个重要的发现。20世纪早期,哥本哈根卡尔堡实验室的施密特发现不同地区所捕获的同种鱼类的脊椎骨和腮腺的数量有很大不同;甚至在同一海湾内不同地点所捕获的同种鱼类,也发现同样的倾向。然而,鳗鱼的脊椎骨的数量变化不大。施密特从欧洲各地、冰岛、亚速尔群岛和尼罗河等几乎分离的海域里所捕获的鳗鱼的样本中,计算发现了几乎一样的均值和标准偏差值。施密特由此推断:所有各个不同海域内鳗鱼是由海洋中某公共场所繁殖的。后来名为“戴纳”的科学考察船在一次远征中发现了这个场所。开篇案例问题:施密特是如何做出推断的?在对鳗鱼样本中所计算出的均值和标准偏差值对推断有何作用吗?通过本章有关样本数据的特征的学习就可以明白其中的道理了。开篇案例描述统计分析3.1 总量指标033.1总量指标3.1.1 总量指标的概念和作用3.1.2 总量指标的种类3.1.3 计算和应用总量指标的原则3.1.4 几个重要的总量指标1. 总量指标的基本概念3.1.1 总量指标的概念和作用总量指标是指反映在一定时间、空间与条件下的社会经济现象的总体规模、总体水平或工作总量的统计指标。例:2016年上半年,华为公司消费者业务实现销售收入774亿元人民币,同比增长41%;智能手机发货量6056万部,同比增长25%。2016年上半年,华为实现销售收入2455亿元。指标名称指标数值计量单位构成要素概念2. 总量指标的作用3.1.1 总量指标的概念和作用第一,总量指标是反映一个国家、地区或一个企业的人力、物力、财力状况和加强宏观经济管理与企业经济核算的基本指标。第二,总量指标是计算相对指标和平均指标的基础指标。相对指标和平均指标一般都是由两个有联系的总量指标对比的结果,它们是总量指标的派生指标。3.1.2 总量指标的种类总量指标种类1总体总量和标志总量23时期指标和时点指标实物指标、价值指标和劳动量指标时期指标和时点指标时期指标反映现象在 一段时间 内发展变化的总量指标特点:可加性,可以累计计算;大小与时间长短有直接关系据统计,2020年我国GDP为1015986亿元。举例:国内生产总值、产品生产量、工作量、消费额时点指标反映现象在 某一时刻 所达到的总量指标特点:不可加性,不可以累计计算;大小与时间长短无直接关系截止至2020年12月31日,某学校校园占地面积900亩,在校学生人数12000人。特殊时点指标:人口指标:人口数、职工人数存量指标:库存、存款、牲畜存栏数网点指标:银行网点、企业个数3.1.3 计算和应用总量指标的原则A正确确定指标的含义和计算范围BCD计算实物总量指标时只有同类的才能相加使用统一计量单位总量指标和相对指标、平均指标要结合运用3.1.4 几个重要的总量指标01国内生产总值(GDP)04工业总产值06总负债03总投资02总消费05总资产3.2 相对指标033.2相对指标3.2.1 相对指标的概念和表现形式3.2.2 相对指标的种类及计算方法3.2.3 计算和应用相对指标的原则相对指标是将两个 有联系的 指标进行对比所得的数量关系指标。相对指标的表现形式有两种:有名数与无名数。除强度相对数为有名数外,其余的五个相对指标均为无名数,通常用系数、倍数、成数、百分比或千分比表示。3.2.1 相对指标的概念和表现形式3.2.2 相对指标的种类及计算方法相对指标同一总体内部的比较不同总体之间的比较同一总体的自我比较(1)结构相对数结构相对数=用来说明某一部分在总体中所占的比重。例如:第七次全国人口普查结果显示,全国总人口为144350万人,其中,男性人口为72334万人,占51.24%;女性人口为68844万人,占48.76%。1. 同一总体的内部比较(2)比例相对数比例相对数=通过与另一部分比较,来说明该部分的比重。例如:第七次全国人口普查结果显示,我国总人口中,男性人口/女性人口=105.07%1. 同一总体的内部比较(1)性质相同的不同总体比较:比较相对数比较相对数=用来说明同一事物在不同空间下的差异程度。例如:2019年,收入极低的埃塞俄比亚,劳动力成本只有909美元,为中国的1/4。 H&M、Tesco和沃尔玛等已经开始从埃塞俄比亚的工厂采购产品。2. 不同总体之间的比较(2)性质不同的不同总体比较:强度相对数强度相对数=两个性质不同但有一定联系的总量指标之间的对比,用来表明现象的强度、密度和普及程度。强度:劳动生产率 个/人举例: 密度:人口密度 人/平方公里普及度:人均电脑拥有量 台/人2. 不同总体之间的比较(1)动态相对数动态相对数=动态相对数是将同一事物在不同时间的指标数值进行对比,也称发展速度。用来反映某一事物的动态发展状况。例如:我国2019年GDP为99.09万亿元,2020年GDP为101.6万亿元,动态相对数=101.6/99.09×100%=102.53%3. 同一总体的自我比较(2)计划完成程度相对数计划完成程度相对数=派生公式:以产量、产值增长率计算的相对数计划完成程度相对数=以产品成本降低百分数计算的相对数计划完成程度相对数=3. 同一总体的自我比较(2)计划完成程度相对数例:某公司劳动生产率计划规定2020年比2019年提高8%,实际提高10%,求该公司计划完成程度相对数。解:计划完成程度=3. 同一总体的自我比较(2)计划完成程度相对数例:某产品上年度实际成本为400元,本年度计划降低5%,实际降低6%,求单位成本的计划完成程度。解:单位成本的计划完成程度=3. 同一总体的自我比较3.2.3 计算和应用相对指标的原则两个对比指标要有可比性相对指标要与总量指标结合运用各种相对指标结合运用3.3 平均指标033.3平均指标3.3.1 平均指标的概述3.3.2 数值平均数3.3.3 位置平均数3.3 平均指标 正态分布3.3 平均指标较大和较小的观测值出现的频率比较低,大多数观测值密集分布在中心附近,使得全部数据呈现出向中心聚集或靠拢的态势。3.3 平均指标峰 度偏 态数据的特征和测度分布的形状集中趋势离散程度众 数中位数变异系数方差和标准差四分位差全距位置平均数数值平均数算术平均数调和平均数几何平均数1. 平均指标的基本概念概念:平均指标反映同类现象的 一般水平 ,是总体内各单位参差不齐的标志值的代表值,也是对变量分布 集中趋势 的测定。2. 平均指标的特点仅代表总体各单位标志值的一般水平;平均值消除了个别标志值的偶然性波动,反映的是总体单位标志值分布的集中趋势,可以通过排序以及标志值的计算来确定。3.3.1 平均指标的概述同质性代表性抽象性数值平均数就是通过对统计数列的所有各项数据进行计算得到的平均数,可以反映所有各项数据的平均水平。数列中任何一项数据的变动,最终将在一定程度上影响到数值平均数的最终结果。常用的数值平均数有:3.3.2 数值平均数算术平均数几何平均数调和平均数算术平均数,也叫均值。在数学上有简单与加权两种形式。在统计上简单算术平均数主要用于处理未分组的原始资料,而加权算术平均数应用于分组资料。计算公式3.3.2 数值平均数\算术平均数总体标志总量总体单位总量算术平均数=简单算术平均数加权算术平均数3.3.2 数值平均数\算术平均数加权(Weighting)是什么?希望这种属性的个体达到的规模具有某一属性的个体的现有规模权重 =加权:通过对总体中的各个元素设置不同的数值系数(即加权因子/权重),使元素表现出所希望的相对重要性程度;简单地说,就是要“让一些人变得比另一些人更重要!”100 个被访者:40个男性60个女性想要让男性:女性=1:1设置权重男性 = 1.25女性 = 0.83加权后数据:男性:40 x 1.25 = 50女性:60 x 0.83 = 50一个简单的例子:3.3.2 数值平均数\算术平均数算术平均数的陷阱:受极端值影响失真!张家有财一千万,九个邻居穷光蛋,平均起来算一算,个个都是张百万。3.3.2 数值平均数\算术平均数按贷款额分组 组中值x 贷款企业数(个)f 各组贷款额xf10万元以下 10-20 20-30 30-40 40万元以上 5 15 25 35 45 20 10 22 34 14 1001505501190630合 计 100 2620求平均贷款额度在计算算术平均数时,由于某项数据的缺失,而无法直接计算,只有根据已知数据推导未知数据,进而计算算术平均数。3.3.2 数值平均数\调和平均数原来只是计算时使用了不同的数据从本质上说,调和平均数是算术平均数的变形形式,又称为倒数平均数。主要应用于由相对数、平均数计算平均数的场合。公式:3.3.2 数值平均数\调和平均数即:3.3.2 数值平均数\调和平均数适用于总体资料未经分组整理、尚为原始资料的情况适用于总体资料经过分组整理形成变量数列的情况式中: 为第 组的变量值; 为第 组的标志总量。简单调和平均数加权调和平均数3.3.2 数值平均数\调和平均数例:市场上早、中、晚蔬菜的价格分别是:早晨0.67公斤/元,中午0.5公斤/元,晚上0.4公斤/元。 现在,我们分别按四种方法购买蔬菜,分别计算蔬菜的平均价格(不管用什么方法购买,平均价格都应该等于花费的现金除以所购买蔬菜的数量)。第一种买法:早、中、晚各买一斤,则蔬菜平均价格为:第二种买法:早买1公斤、中买2公斤、晚买3公斤,则蔬菜平均价格为:3.3.2 数值平均数\调和平均数第三种买法:早、中、晚各买一元。这种情况下,计算蔬菜平均价格比上述两种方法稍微复杂一些,我们得先计算出一元钱所购买的蔬菜数量,然后再计算蔬菜的平均价格。要计算蔬菜的平均价格,首先应该计算出早、中、晚各花费1元钱所购买的蔬菜数量。其中:早晨购买的蔬菜数量=1/0.67=1.5(公斤)中午购买的蔬菜数量=1/0.5=2(公斤)晚上购买的蔬菜数量=1/0.4=2.5(公斤)则蔬菜平均价格为:3.3.2 数值平均数\调和平均数第四种买法:早买1元、中买2元、晚买3元。 和第三种买法一样,我们还是得先计算出早、中、晚所购买的蔬菜数量,然后再计算平均价格。其中:早晨购买的蔬菜数量=1/0.67=1.5(公斤)中午购买的蔬菜数量=2/0.5=4(公斤)晚上购买的蔬菜数量=3/0.4=7.5(公斤)则蔬菜平均价格为:在上述计算平均价格的过程中,早、中、晚三个时段购买蔬菜所花费的现金是计算平均价格的权数,这种方法我们称为加权调和平均法。3.3.2 数值平均数\调和平均数企业名称 流通费用率% 流通费用额(万元)甲 16 256乙 10 475丙 12 480合计 —— 1211计算:三家企业的平均流通费用率。注:流通费用率=流通费用/商品销售额某企业两车间生产同种产品,产量和成本资料如下:3.3.2 数值平均数\调和平均数车间 2020 2019 单位成本(元) 产量 (吨) 单位成本 (元) 总成本(万元)甲 600 1200 620 93乙 700 1800 667 133.4要求:(1)2020年、2019年甲乙两车间平均单位成本;(2)甲乙两车间平均单位成本。(1)2020年平均单位成本2019年平均单位成本3.3.2 数值平均数\调和平均数(2)甲车间平均单位成本乙车间平均单位成本3.3.2 数值平均数\调和平均数适用于平均速度的计算。公式:3.3.2 数值平均数\几何平均数简单几何平均数加权几何平均数适用于总体资料未经分组整理尚为原始资料的情况适用于总体资料经过分组整理形成变量数列的情况是环比相对数,也即的分子与的分母必须是同一数值3.3.2 数值平均数\几何平均数例:某流水生产线有前后衔接的五道工序。某日各工序产品的合格率分别为95%、92%、90%、85%、80%,求整个流水生产线产品的平均合格率。设最初投产100A个单位 ,则第一道工序的合格品为100A×0.95;第二道工序的合格品为(100A×0.95)×0.92;……第五道工序的合格品为(100A×0.95×0.92×0.90×0.85)×0.80;3.3.2 数值平均数\几何平均数因最终合格品即为第五道工序的合格品, 故总合格品为100A×0.95×0.92×0.90×0.85×0.80;则该流水线产品总的合格率为:即该流水线总的合格率等于各工序合格率的连乘积,符合几何平均数的适用条件,故需采用几何平均法计算。3.3.2 数值平均数\几何平均数若上题中不是由五道连续作业的工序组成的流水生产线,而是五个独立作业的车间,且各车间的合格率同前,又假定各车间的产量相等均为100件,求该企业的平均合格率。各车间彼此独立作业,所以有第一车间的合格品为:100×0.95;第二车间的合格品为:100×0.92;……第五车间的合格品为:100×0.80。则该企业全部合格品应为各车间合格品的总和,即总合格品=100×0.95+……+100×0.803.3.2 数值平均数\几何平均数不再符合几何平均数的适用条件,需按照求解比值的平均数的方法计算。又因为应采用加权算术平均数公式计算,即3.3.2 数值平均数\几何平均数例:某金融机构以复利计息。近12年来的年利率有4年为3%,2年为5%,2年为8%,3年为10%,1年为15%。求平均年利率。设本金为V,则至各年末的本利和应为:第1年末的本利和为:第2年末的本利和为:……… ………第12年末的本利和为:第2年的计息基础第12年的计息基础3.3.2 数值平均数\几何平均数则该笔本金12年总的本利率为:即12年总本利率等于各年本利率的连乘积,符合几何平均数的适用条件,故计算平均年本利率应采用几何平均法。3.3.2 数值平均数\几何平均数若上题中不是按复利而是按单利计息,且各年的利率与上相同,求平均年利率。第1年末的应得利息为:第2年末的应得利息为:第12年末的应得利息为:…… ……设本金为V,则各年末应得利息为:3.3.2 数值平均数\几何平均数则该笔本金12年应得的利息总和=V(0.03×4+0.05×2+……+0.15×1)利息率或本利率不再符合几何平均数的适用条件,需按照求解比值的平均数的方法计算。因为假定本金为V 所以,应采用加权算术平均数公式计算平均年利息率,即:(比较:按复利计息时的平均年利率为6.85﹪)例:一位投资者持有一种股票,2017、 2018、2019和2020年的收益率分别为4.5%、2.0%、3.5%、5.4%。试计算该投资者在这四年中年平均收益率。3.3.2 数值平均数\几何平均数根据变量数列中的某一特殊位置判断数据的集中趋势或平均水平。位置平均数对总体具有非常直观的代表性。重要特点:完全可以不受极端变量值的影响。3.3.3 位置平均数概念:在总体单位中,标志值出现次数最多的那个数值。众数能直观地说明客观现象次数分布中的集中趋势。只有在总体单位比较多,而且又明显的集中于某个变量值时,计算众数才有意义。计算方法:3.3.3 位置平均数\众数 Mo 众数:22岁单项式数列众数=出现次数最多的变量值353637383.3.3 位置平均数\众数 MoL —— 众数组下限U —— 众数组上限d —— 众数组组距—— 众数组频数与其前一组频数之差—— 众数组频数与其后一组频数之差下限公式上限公式组距式数列计算方法:3.3.3 位置平均数\众数 Mo某年南京市企业主要岗位高级别工资岗位分布表众数组或:3.3.3 位置平均数\众数 Mo成绩 学生数(人)60分以下 60-70 70-80 80-90 90分以上 1020403020合 计 120MO某班级统计学考试成绩分布表3.3.3 位置平均数\众数 Mo无众数原始数据: 10 5 9 12 6 8一个众数原始数据: 6 5 9 8 5 5多于一个众数原始数据: 25 28 28 36 42 42众数(众数的不唯一)适用场合:当数据分布存在明显的集中趋势,且有显著的极端值时,适合使用众数;当数据分布的集中趋势不明显或存在两个以上分布中心时,不适合使用众数(前者无众数,后者为双众数或多众数,也等于没有众数)特点:众数不受极端值的影响。适用于各种类型的数据。(主要用于分类数据,也可用于顺序数据和数值型数据)当变量数列为均匀分布、U型分布、J型分布时,不存在众数;众数缺乏敏感性。这是由于众数的计算只利用了众数组的数据信息,不像数值平均数那样利用了全部数据信息。3.3.3 位置平均数\众数 Mo概念:将总体各单位某一标志的各个标志值按大小顺序排列,处于数列中间位置的那个标志值就是中位数,用Me来表示。中位数是以它在所有标志值中所处的位置确定的全体单位标志值的代表值,不受分布数列的极端值影响。主要用于定序数据,也可用数值型数据,但不能用于类别数据。当数列中出现极大值或极小值时,中位数比数值平均数更具有代表性。3.3.3 位置平均数\中位数 MeMe50%50%计算方法:3.3.3 位置平均数\中位数 Me中位数 =中间位次的变量值单项式数列奇数项:位于 位置的标志值是中位数偶数项:位于 和 位置的两个标志值的均值是中位数3.3.3 位置平均数\中位数 MeL —— 中位数组下限U —— 中位数组上限d —— 中位数组组距—— 中位数组次数—— 总次数—— 向上累计至中位数组前一组止的次数—— 向下累计至中位数组后一组止的次数向上累计公式:向下累计公式:组距式数列计算方法:3.3.3 位置平均数\中位数 Me计算向上累计次数 S ;1确定中位数组:若S 首次≥ ,即确定;2将各符号代入公式中。3[ 计算步骤 ]工资分布 (万元) 岗位数 (个) 累计频数(向上累计)3~5 5~10 10~15 15~20 20以上 3 9 10 7 2 312222931合计 31 某年南京市企业主要岗位高级别工资累计频数(频率)分布表3.3.3 位置平均数\中位数 Me中位数组频数首次大于(31/2)向上累计至中位数组前一组止的次数或:3.3.3 位置平均数\中位数 Me支出额(元) 户数(户) 向上累计 向下累计800元以下 800-1000 1000-1200 1200-1400 1400元以上 10 30 50 40 10 10 40 901005010合 计 140MefmSm-1Sm+1求Me、Mo课堂练习学习时间 学生数(人)f xf 向上累计12小时以上 12-10 10-8 8-6 6-4 4 小时以下 20 30 60 20 10 10 260 330 540 140 50 30合 计 150 1350用众数、中位数与算术平均数确定学生的平均学习时间。课堂练习解析或:或:算术平均数、中位数、众数的区别对于具有单峰分布的大多数数据而言,众数、中位数和平均数之间具有以下数量关系:均值是对数值型数据的计算,利用了全部数据信息,具有优良的数学性质,是实际中应用最广泛的集中趋势测度值。中位数是一组数据中间位置上的代表值,其特点是不受数据极端值的影响,主要适合于作为顺序数据的集中趋势测度值。众数是一组数据分布的峰值,它也是一种位置代表值,不受极端值的影响,主要适合于作为分类数据的集中趋势测度值。对称分布均值=中位数=众数左偏分布均值中位数众数右偏分布众数中位数均值算术平均数、中位数、众数的区别算术平均数 中位数 众数英文名 Arithmetic mean Median Mode别称 均值 中值定义 n个变量的和除以n 一组数据排序后处于中间位置上的变量值 一组数据中出现次数最多的变量值优点 利用了全部数据信息,实际应用最广泛 一组数据中间位置上的代表值,不受极端值的影响 一组数据分布的峰值,不受极端值的影响缺点 易受极端值的影响 需要先排序 不唯一,可能有0到多个众数适用场景 数值型数据的集中趋势测度值 顺序数据的集中趋势测度值 分类数据的集中趋势测度值你被平均了吗?2020年,江苏省城镇非私营单位就业人员年平均工资为103621元;城镇私营单位就业人员年平均工资为63830元。你的收入有没有达标?是不是拖后腿了?有没有被平均?3.3 平均指标\小结分析数据平中众,比较接近选平均,相差较大看中位,频数较大用众数;所有数据定平均,个数去除数据和,即可得到平均数;大小排列知中位;整理数据顺次排,单个数据取中问,双个数据两平均;频数最大是众数。3.4 标志变异指标033.4标志变异指标3.4.1 标志变异指标概念和作用3.4.2 标志变异指标的测定平均指标虽然能反映总体单位数量标志值的一般水平以及分布的集中趋势,但具有很强的抽象性,无法揭示各总体单位之间的差异。概念:标志变异指标反映总体各单位对其平均数这个中心的离散趋势,是与平均指标相匹配的指标。作用:是对平均数的代表性程度的量度反映变量分布的离散趋势是对事物发展均衡性的量度3.4.1 标志变异指标概念和作用3.4.1 标志变异指标概念和作用集中趋势弱、离散趋势强集中趋势强、离散趋势弱标志变异指标的种类:反映总体各单位标志值变动范围:全距。反映总体各单位标志值对平均数离差程度:平均差、标准差及标准差系数。3.4.2 标志变异指标的测定全距(range)是指一组数据中最大值与最小值之差,以此来衡量数据变动的总体范围,一般用 R 表示全距。全距也称为极差。一般说来,全距越小,表明标志值变动越集中;全距越大,表明标志值变动越分散。公式:3.4.2 标志变异指标的测定\全距未分组数列组距式数列R= Umax - Lmin平均差是各个数据与其均值的离差绝对值的算术平均数。反映各个数据与其均值的平均差距。通过各变量与均值之间的距离来判断变异的程度。公式:3.4.2 标志变异指标的测定\平均差A.D简单平均差加权平均差平均差的意义与评价:经济意义:平均差越小,变量X越趋中,变异性越小,稳定性越好,或平均值的代表程度越高。评价:优点:计算简便,反映全部数据分布状况,具有充分的代表性。局限性:平均差受极端值影响极大,易掩盖其真实水平,须用其他公式加以纠差。此外,以绝对值的方式消除离差的正负号,不合乎统计上的数字处理。3.4.2 标志变异指标的测定\平均差3.4.2 标志变异指标的测定\平均差按销售额分组 连锁(家)80-100 100-150 150-200 200-250 250万元以上 20 50 120 280 130 1800 6250 21000 63000 35750 24604400456033608060合 计 600 127800 22840求平均差?标准差采用平方法来消除离差的正负号,并通过平方根予以还原,因而比平均差更符合数学处理的要求。3.4.2 标志变异指标的测定\标准差未分组时采用简单法计算3.4.2 标志变异指标的测定\标准差标准差和方差会经常用到,是重点!3.4.2 标志变异指标的测定\标准差学生甲 学生乙数学 成绩 82 80 82 76 80 8075826895合计 400 400甲的成绩更稳定试求哪位同学的成绩更稳定?分组情况下采用加权平均法3.4.2 标志变异指标的测定\标准差标准差和方差会经常用到,是重点!3.4.2 标志变异指标的测定\标准差按销售额分组 连锁(家)80-100 100-150 150-200 200-250 250万元以上 20 50 120 280 130 30258038720017328040320499720合 计 600 1403100求标准差?标准差优缺点优点:适宜相同性质数据集的比较,是统计分析中最常用、最重要的变异指标。缺点:受计量单位和平均水平的影响,不便于不同类数据集的比较。3.4.2 标志变异指标的测定\标准差学生甲与学生乙数学成绩稳定性的比较如:某省所有钢铁企业的生产量标准差为5万吨;该省所有电视机企业的生产量标准差为5万台。如:中国各省市自治区人口数之间的标准差为x;尼泊尔各省人口数之间的标准差为y。以千万记以万记为了对比分析不同平均水平或者不同计量单位的变量数列之间标志值的变异程度3.4.2 标志变异指标的测定\标准差就必须消除平均水平或计量单位不同的影响变异系数是以相对数形式表示的变异指标,一般用V表示。一般采用平均差变异系数与标准差变异系数计算。其数值的经济含义与平均差、标准差的相同。3.4.2 标志变异指标的测定\标志变异系数既消除了平均水平的影响,也消除了计量单位的影响。平均差变异系数标准差变异系数3.4.2 标志变异指标的测定\标志变异系数成绩 男生 女生60分以下60-70 70-80 80-90 90分以上 10 20 40 20 101020303010合计 100 100哪一组学生的平均成绩更具代表性?为什么?成绩 组中值60分以下 60-70 70-80 80-90 90分以上 55 65 75 85 95 10 20 40 20 10 10 20 30 30 10 550 1300 3000 1700 950 550 1300 2250 2550 950 4000 2000 0 2000 4000 441024203024303610合计 100 100 7500 7600 12000 129003.4.2 标志变异指标的测定\标志变异系数可以求出可以求出可以求出可以求出3.4.2 标志变异指标的测定\标志变异系数例:假设两企业获得如下资料3.4.2 标志变异指标的测定\标志变异系数试计算平均月工资和标准差,比较甲、乙两个企业在工资分配上的差异。月工资额(元) 甲企业人数 乙企业人数1500元 30 802000-3000元 60 183000-5000元 20 126000元 15 60合计 125 1703.4.2 标志变异指标的测定\标志变异系数3.4.2 标志变异指标的测定\标志变异系数例题:哪一品种具有更好的推广价值?3.4.2 标志变异指标的测定\标志变异系数神舟一号嫦娥二号3.4.2 标志变异指标的测定\标志变异系数3.4.2 标志变异指标的测定\标志变异系数某大商场策划了一次“返利给顾客”活动,凡一次购物满100元以上(含100元)均可当场抽奖。奖金分配如下:思考:商场欺骗顾客了吗?奖金等级 一等奖 二等奖 三等奖 四等奖 幸运奖奖金数额/元 15000 8000 1000 80 20中奖人次 4 10 70 360 560商场提醒:平均每份奖金249元!抽奖抽奖返利给顾客思考:商场欺骗顾客了吗?你认为商场的说法能够很好的代表中奖的一般金额吗?商场欺骗顾客了吗?说说你的看法,以后我们再遇到开奖问题应该关心什么?抽奖抽奖返利给顾客商场在欺骗我们顾客,我们中只有2人获得80元,其他人都是20元,可气!思考:商场欺骗顾客了吗?奖金等级 一等奖 二等奖 三等奖 四等奖 幸运奖奖金数额/元 15000 8000 1000 80 20中奖人次 4 10 70 360 560平均奖金额的获奖人数只有84人,仅仅是全部中奖者的8.4%。商场没有欺骗顾客,因为奖金的平均数确实是249元,但是奖金的平均数不能很好地代表中奖的一般金额,91.6%的奖券的奖金不超过80元。平均数隐藏了数据内部的差异,掩盖了总体内部的尖锐矛盾。让人们感到不真实。在实际问题中,仅仅有平均数是不够的,如果遇到开奖问题应该关心中奖金额的众数等数据信息,同时我们还要考虑到数据的离散差异程度。思考:商场欺骗顾客了吗?3.5 Excel在描述统计指标中的应用033.5Excel在描述统计指标中的应用3.5.1 描述统计分析工具3.5.2 实例应用数据分析工具库中含有多个分析工具,其中描述统计工具用来生成描述所给数据的标准统计量,包括平均值、标准误差、中位数、众数、标准差、方差、峰度、偏度、最小值、最大值、总和、观测数和置信度等。只需要执行“数据分析”命令,然后在分析工具库中选择“描述统计”工具即可。3.5.1 描述统计分析工具例:2020年我国31个地区人口数资料如表1所示。试用“描述统计”分析工具对其进行分析。3.5.2 实例应用地区 总人口 地区 总人口 地区 总人口北京 2189 山东 10153 安徽 6103天津 1387 河南 9936 福建 4154河北 7461 湖北 5775 青海 592山西 3491 湖南 6644 新疆 2585内蒙古 2405 广东 1260 江西 4519辽宁 4259 广西 5013 云南 4721吉林 2407 海南 1008 西藏 365黑龙江 3185 重庆 3205 陕西 3953上海 2487 四川 8367 宁夏 720江苏 8475 贵州 3856 甘肃 2502浙江 6457 表1 2020年全国各地区人口统计 (单位:万人)操作步骤:(1)新建Excel工作簿,命名为“2020年全国各地区人口描述统计分析”,并将样本数据和相关文字输入到工作表中,如图3.1所示。(2)单击【数据】选项卡中的【数据分析】按钮,随即弹出【数据分析】对话框,在【分析工具】一栏中选择【描述统计】选项,如图3.2所示,然后单击【确定】按钮。3.5.2 实例应用图3.1 数据输入图3.2 【数据分析】对话框(3)在【描述统计】对话框中,单击“输入区域”文本框后的折叠按钮,然后选中单元格区域B1:B32,因为输入区域的数据是按列排列的,所以“分组方式”选择“逐列”;因为“输入区域”包含了标志项,所以选中“标志位于第一行”复选框;单击“输出区域”单选按钮,在右侧的文本框中输入单元格C1;选中“汇总统计”、“平均数置信度”、“第K大值”、“第K小值”复选框,并在“平均数置信度”右侧输入所需要的置信度,这里设置为默认值“95%”(后面第四章抽样推断中会介绍);在“第K大值”、“第K小值”右侧输入所需要的K值,这里设置为默认值“1”,如图3.3所示。(4)单击【确定】按钮,得到描述统计计算结果,如图3.4所示。3.5.2 实例应用图3.3 【描述统计】对话框图3.4 描述统计输出结果实例的结果分析:从图3.4的输出结果,我们很容易地看出对2020年全国各地区人口描述统计结果,包括描述人口数集中趋势的指标——平均值、众数和中位数,描述人口数离中趋势的指标——极差(可由最值求得)、方差和标准差,以及描述人口数分布形态的指标——偏度和峰度。“平均值”即均值,反映了全国各地区人口的平均水平;“标准误差”为均值的标准差;“众数”即出现次数最多的标志值,由于本例中31个标志值互不相同,所以没有众数;“标准差”为总体标准差;“方差”为总体方差;峰度的值小于零,表示人口分布更分散,分布呈扁平状态;偏度的值大于零,说明分布呈正偏斜,即大部分标志值是大于平均值的。3.5.2 实例应用归纳小结本章小结本章的重点时期指标和时点指标的区别相对指标的种类和计算方法五种平均指标的含义及计算变异指标的测定方法Excel在描述统计指标中的应用谢谢观看! 展开更多...... 收起↑ 资源预览