资源简介 (共53张PPT)统计学:思想、方法与应用第9章 时间序列和指数9.1 时间序列的成分9.2 平滑技术9.3 趋势分析9.4 指数学习目标知道时间序列的四个组成部分。能够计算几种移动平均。确定趋势方程,利用趋势方程对未来时期进行预测。指数的含义。懂得加权与非加权指数的区别。建立并解释拉氏价格指数、帕氏价格指数以及价值指数。阐述消费者价格指数是如何建立的。了解一些重要的经济指数。通过观察某产品过去时期的实际销售资料,我们可以得到销售的一般水平及趋势,如销售量随时间增长或下降的趋势。对这些资料的进一步观察可以显示一种季节轨迹,如每年的销售高峰出现在第三季度,而销售低谷出现在第一季度之后。通过观察历史资料,我们可以对过去的销售轨迹,有较好的了解,因此对产品的未来销售情况,可以做出较好的推断。所谓时间序列(time series)是指一段时间内记录的一组数据——逐周、逐月、逐季或者逐年记录等等。通过对历史——一个时间序列——的分析,管理者可以做出当前的决定,并且可以用来进行预测,制定一个长期的计划。9.1 时间序列的成分实际上,在很多领域,如生产、销售、运输等等领域都会产生时间序列数据。表9.1给出了一个时间序列例子,描述的是17年间某只3个月期国库券的平均收益率。年份 平均收益率(%)1 14.032 10.693 8.634 9.585 7.486 5.987 5.828 6.699 8.1210 7.5111 5.4212 3.4513 3.0214 4.2915 5.5116 5.0217 5.079.1 时间序列的成分9.1.1 长期趋势9.1.2 循环波动9.1.3季节波动季节波动是指时间序列中一年内的变化模式,该模式每年重复一次。衡量季节波动的时间单位为季度或者月度。几乎所有的商业运营都有周而复始的季节模式。例如,成人和儿童服装在圣诞节前销售量非常大,但是圣诞节以后以及夏季销售量则相对较小。尽管我们一般考虑时间序列的季节成分是在一年内出现,但是季节成分也可以用来描述任何持续时间小于一年的、有规则的、重复的运动。比如,每天的交通流量资料显示在一天内的“季节”情况,在上、下班拥挤时刻出现高峰,在午夜到清晨出现小流量,在一天的其他时间出现中等流量,9.1.4 不规则变动时间序列的不规则成分是剩余的或“包罗万象”的因素,它用来说明在分离了趋势、循环和季节成分后,时间序列值的真正偏差。不规则成分是由那些影响时间序列的短期的、不可预期的和不重复出现的因素引起的。不规则变动反映了时间序列中的随机变动,它是无法预测的,因为我们不能预测它对时间序列的影响。9.2 平滑技术本节介绍几种预测方法:移动平均法、加权移动平均法和指数平滑法。因为每一种方法的目的都是要“消除”由时间序列的不规则成分所引起的随机波动,所以它们被称为平滑方法。平滑方法很容易使用,而且对近距离的预测,如下一个时期的预测,可以提供较高的精度水平。9.2.1移动平均法移动平均方法(moving-average method)使用时间序列中最近几个时期的数据值的平均数作为下一个时期的预测值。计算公式为移动平均数是一个对每一个所考察的新时期都进行更新或重新计算的平均数。每个移动平均数都利用了最新的信息。我们通过一个例子来介绍移动平均法。9.2.1移动平均法移动平均方法(moving-average method)使用时间序列中最近几个时期的数据值的平均数作为下一个时期的预测值。计算公式为移动平均数是一个对每一个所考察的新时期都进行更新或重新计算的平均数。每个移动平均数都利用了最新的信息。我们通过一个例子来介绍移动平均法。9.2.1移动平均法9.2.1移动平均法9.2.1移动平均法我们用来确定平滑常数 的合理值的准则与我们在计算移动平均数中提出的确定所包含时期个数的准则相同,即我们选择使均方误差(MSE)达到最小的 值。因此,对不同的 值进行尝试计算,我们可以确定合适的平滑常数值。我们可以利用基于这个 值的在指数平滑模型对未来进行预测。对较晚的资料,当新时间序列的观测值得到之后,我们分析这个新收集的时间序列资料,以决定为了提供好的预测结果是否要调整平滑常数。9.2.1移动平均法例9.1 下面的数据是某个企业在过去12月中的产品销售额。月 销售额(万元) 月 销售额(万元)1 27 7 302 31 8 283 29 9 324 33 10 305 28 11 256 26 12 329.2.1移动平均法图9.4给出了该数据的线图。尽管图9.4表明有随机波动,但时间序列却呈现平稳状态。9.2.1移动平均法月份 销售额 移动平均预测值 预测误差 预测误差的平方1 272 313 294 33 29 4 165 28 31 -3 96 26 30 -4 167 30 29 1 18 28 28 0 09 32 28 4 1610 30 30 0 011 25 30 -5 2512 32 29 3 9总计 - - 0 92误差平方和的平均值通常称为均方误差(MSE),它是最常用的预测方法精度的测度方法。9.2.1移动平均法图9.5显示了销售额的原始数据和3月移动平均法计算的预测值。可以看到,与实际值相比,移动平均数被“平滑”了,它们的波动性减小了,而且看上去符合数据的一般规律。9.2.2 加权移动平均在移动平均法中,计算移动平均数时每个观测值都使用了相同的权数。但有时候,我们可能希望对某些时期的数据赋予比其他数据更高的权数。例如,预测者可能认为上个月的数据比其他月份的数据重要3倍。如果某些时期得到的权数不同于其他时期的权数,则移动平均被称为加权移动平均(weighted moving average)。9.2.2 加权移动平均在大多数情况下,最近时期的观测值应取得最大的权数,而比较远的时期的权数应该依次递减。例如,我们用表9.1的数据来说明3月加权移动平均数的计算。最近时期的观测值的权数为最远时期观测值的3倍,中间时期观测值的权数为最远时期的2倍,则第4月的预测值为9.2.3 指数平滑指数平滑(exponential smoothing) 是加权移动平均法的一种特殊情形。指数平滑的原理为:当利用过去观测值的加权平均来预测未来的观测值时,离得越近的观测值要给以更多的权数。我们只需要选择一个权数 ,即最近时期观测值的权数,其他时期数据值的权数可以自动推算出来。“指数”就意味着:按照已有观测值“陈旧”程度增加的方向,在其上所加的权数按指数速度递减,权数变得越小。9.2.3 指数平滑月份 (t) 销售额 (Y t) 指数平滑预测值(F t) 预测误差 (Y t -F t) 预测误差的平方(Y t -F t)21 272 31 27.00 4.00 16.003 29 27.80 1.20 1.444 33 28.04 4.96 24.605 28 29.03 -1.03 1.076 26 28.83 -2.83 7.987 30 28.26 1.74 3.038 28 28.61 -0.61 0.379 32 28.49 3.51 12.3410 30 29.19 0.81 0.6611 25 29.35 -4.35 18.9412 32 28.48 3.52 12.38总计 - - - 98.80MSE=98.80/11=8.98表9.4 某企业产品销售额的指数平滑预测和预测误差(平滑常数 =0.2)9.2.3 指数平滑图9.6是时间序列的实际值和预测值的折线图。尤其要注意的是,预测值“消除”了时间序列中的不规则波动。9.3 趋势分析9.3.1 线性回归趋势许多经济时间序列,比如销售额、出口量、产量等的长期趋势可以用直线来近似。例9.2 考虑一个工厂过去11年的销售额时间序列,数据见表9.5。尽管图9.7显示在过去11年中销售额有上、下波动,但时间序列总的趋势是增长的或向上的。年份 时期 销售额(百万元)2000 1 6.62001 2 7.92002 3 10.52003 4 6.92004 5 8.92005 6 12.52006 7 16.52007 8 14.72008 9 13.62009 10 16.42010 11 19.89.3.1 线性回归趋势线性趋势方程为:9.3.1 线性回归趋势SUMMARY OUTPUT回归统计Multiple R 0.907236R Square 0.823078Adjusted R Square 0.80342标准误差 1.952401观测值 11方差分析 df SS MS F Significance F回归分析 1 159.6023 159.6023 41.86982 0.000115残差 9 34.30682 3.811869总计 10 193.9091 系数 标准误差 t Stat P-valueIntercept 4.981818 1.262559 3.945812 0.003376时期 1.204545 0.186154 6.47069 0.0001159.3.1 线性回归趋势图9.8给出了11个时期(年)中销售额的Excel散点图。由图可见,拟合的趋势线穿过了数据点。可以看到,数据呈现总体向上的趋势。9.3.2 非线性趋势前面的讨论侧重于上升或下降趋势近似于直线的时间序列,当认为数据平均每期上升或者下降的数量相同的时候,用线性趋势方程代表该时间序列。如果数据在一段时间内以递增的数量上升(或者下降),当在有数学刻度的纸上画出该数据时候,会呈现出曲线形状。换言之,具有相同百分比或者相同比例增长(或下降)的数据在刻度纸上呈现为曲线形状(参见图9.9)。9.3.2 非线性趋势对数趋势方程的一般形式如下:9.3.2 非线性趋势年份 时期 进口量(万元) Log(进口量)1998 1 3 0.481999 2 4.2 0.622000 3 5.7 0.762001 4 8.3 0.922002 5 11.5 1.062003 6 16 1.202004 7 22.4 1.352005 8 31 1.492006 9 44.5 1.652007 10 60.1 1.782008 11 84.3 1.932009 12 118.6 2.072010 13 163.9 2.219.3.2 非线性趋势SUMMARY OUTPUT回归统计Multiple R 0.999955R Square 0.999911Adjusted R Square 0.999902标准误差 0.005579观测值 13方差分析 df SS MS F Significance F回归分析 1 3.829651 3.829651 123043.7 1.27E-23残差 11 0.000342 3.11E-05总计 12 3.829993 系数 标准误差 t Stat P-valueIntercept 0.332549 0.003282 101.3143 1.08E-17时期 0.145059 0.000414 350.7758 1.27E-239.4 指数在日常生活中,我们经常遇到或者需要各种指数(index)。例如,每月发布的居民消费价格指数(CPI),工业品出厂价格指数(PPI),采购经理人指数(PMI),以及道·琼斯工业平均指数和标准普尔500股平均指数。9.4 .1 简单指数和未加权价格总指数指数是表示价格、数量或价值相对于一个基础时期的百分比变化。表9.9给出了我国50个城市27种主要食品在2010年1月21-31日和2011年1月21-31日的平均价格数据。我们想以2010年为基期,得到2011年这些食品的总的价格指数,即这里2010= 100。9.4 .1 简单指数和未加权价格总指数商品名称 规格等级 单位 2010年平均价格(元) 2011年平均价格(元) 简单指数大 米 粳米 千克 4.19 5.25 125.30面 粉 富强粉 千克 4.14 4.85 117.15面 粉 标准粉 千克 3.39 3.97 117.11豆制品 豆腐 千克 3.44 3.69 107.27花生油 压榨一级 升 18.79 21.95 116.82大豆油 5L桶装 升 9.93 11.6 116.79菜籽油 一级散装 千克 10.7 12.65 118.22猪 肉 猪肉后臀尖(后腿肉) 千克 20.54 24.25 118.06猪 肉 五花肉 千克 19.51 23.53 120.60牛 肉 腿肉 千克 35.21 37.33 106.02羊 肉 腿肉 千克 35.4 45.29 127.94鸡 白条鸡 千克 15.09 17.93 118.82鸡 鸡胸肉 千克 17.76 19.5 109.80鸭 白条鸭 千克 14.66 16.54 112.82鸡 蛋 散装鲜鸡蛋 千克 8.15 10.22 125.40活鲤鱼 千克 10.83 12.72 117.45活草鱼 千克 13.13 13.84 105.41带 鱼 千克 19.96 26.11 130.81大白菜 千克 2.34 2.13 91.03油 菜 千克 4.85 4.57 94.23芹 菜 千克 4.42 4.95 111.99黄 瓜 千克 5.48 7.33 133.76西红柿 千克 5.84 6.65 113.87豆 角 千克 7.41 12.25 165.32土 豆 千克 3.42 4.44 129.82苹 果 富士苹果 千克 7.98 10.99 137.72香 蕉 国产 千克 4.18 5.71 136.609.4 .1 简单指数和未加权价格总指数如果一个指数是用来度量一个指标或项目的相对变化,那么我们称它为简单指数(simple index)。我们以2010年为基期,2011年为报告期,对每一项食品来计算简单指数。大米的简单指数为125.3,用下面的式子计算得到:这样,2011年1月的每千克大米价格是2010年1月的125.3%,意味着在此期间每千克大米价格有25.3%的增长。同样地,我们可以计算出其他各项主要食品的简单指数,见表9.9最后一列。9.4 .1 简单指数和未加权价格总指数指数也可以比较两个不同的指标或项目。比如,2011年1月每千克大米的价格相对于每千克标准面粉价格的指数是132.2,由以下得到:这表明每千克大米的价格是每千克标准面粉价格的1.322倍,或者每千克大米的价格比每千克标准面粉价格高32.2%。9.4 .1 简单指数和未加权价格总指数尽管简单指数能解释单个商品价格随时间变动的情况,但我们更感兴趣的是多个商品整体价格变动的一般情况。如果包含多个商品,就可能需要多组指数。这时,我们想要一个总指数来全面反映生活费用随时间变动的情况。例如,我们会对大学生的花费指数感兴趣,这个指数可能包含书本费、学费、住宿、饮食和娱乐。未加权价格总指数:简单平均指数和简单综合指数简单平均指数是源自于把这些简单指数作一个平均的自然想法。在我们的例子中,指数为119.49,由下式计算得到:表明2010年到2011年这组商品的指数平均增长了19.49%。简单综合指数是把两个时期的价格(而不是指数)求和,在总和的基础上计算简单综合指数。9.4 .2加权价格总指数当商品数量不同时,加权指数是一个较好的对比方法。加权综合指数的原理是对多个商品整体中的每一个商品,依据其重要性进行加权。因此,编制加权指数首先要确定合理的权数,然后根据实际情况确定适当的计算公式。在大多数情况下,数量是测量其重要性的较好的尺度。因此,对整体中各个商品需要有其所用数量的资料。9.4 .2.1加权综合指数我们用一个例子来说明如何编制加权综合指数。表9.11中给出了表9.9中6种食品的价格,同时也包括了2010年和2011年一个家庭一年所消费的每种食品的数量。商品名称 规格等级 单位 2010年 平均价格 2010年 购买量 2011年 平均价格 2011年购买量大 米 粳米 千克 4.19 50 5.25 55面 粉 富强粉 千克 4.14 45 4.85 35花生油 压榨一级 升 18.79 12 21.95 10猪 肉 猪肉后臀尖(后腿肉) 千克 20.54 25 24.25 22鸡 蛋 散装鲜鸡蛋 千克 8.15 28 10.22 30香 蕉 国产 千克 4.18 25 5.71 209.4 .2.1加权综合指数要编制这些主要食品的价格总指数,需要把各种食品报告期和基期的价格分别加总,再将两个时期的价格进行对比。然而,这些食品的使用价值不同,计量单位也不同,如果直接将价格加总,没有实际意义。同样,如果要编制这些主要食品的购买量总指数,把各主要食品的购买量直接加总也是没有意义的。要解决这个问题,需要引进一个媒介因素。由于每种食品的价格和购买量的乘积即食品支出是可以加总的,食品支出的变化恰好反映了价格的涨跌和购买量的增减。因此,在编制价格总指数时,可以通过购买量这个媒介因素,将价格转化为可以加总的食品支出额;在编制购买量总指数时,可以通过价格这个媒介因素,将购买量也转化为可以加总的食品支出额。要注意的是,需要将媒介因素固定起来以单纯的反映被研究指标的变动情况。9.4 .2.1加权综合指数价格总指数购买量总指数在加权综合指数中,媒介因素起着权数的作用。接下来的问题是权数固定在什么时期,由此产生著名的拉氏指数和帕氏指数。9.4 .2.2 拉氏指数德国著名经济统计学家拉斯贝尔(Etienne Laspeyres)于1864年提出了一种利用基期加权计算加权指数的方法,称为拉氏指数,其计算公式为:9.4 .2.2 拉氏指数例3 我们基于表9.11中的6种食品的价格和数量,用拉氏方法计算加权价格指数,并解释所得结果。从以上分析我们可以看出,这一组食品在1年中价格增长了21.25%。这种方法比简单综合指数优越的地方在于它考虑了每种食品的权重。拉氏指数的主要缺点是它假定基期的数量在报告期仍然是真实的。也就是说,6种食品在2010年的数量大约等于在2011年的数量。请注意,本例中大米的购买量上升了20%,面粉的购买数量下降了22%,其他食品业存在购买量上升或下降的情况。9.4 .2.3 帕氏指数1874年德国学者帕舍(Paasche)提出的帕氏指数是拉氏指数的一个替换方法。计算过程是相似的,不同点只是使用报告期权数而不是基期权数,这就利用了更接近现期的数量信息。如果从基期起消费数量有所变化,这种变化就能被帕氏指数所反映,计算公式如下所示:9.4 .2.3 帕氏指数例4 用表9.11中的数据来确定帕氏指数,讨论应该使用哪些指数。同样由于计算的重复性,我们用Excel来进行计算,结果显示在下面的输出表格中。该结果表明在2010年到2011年期间,一篮子主要食品的价格有21.52%的增长。也就是说,购买这些商品在2011年比在2010年要多花费21.52%的费用。综合起来考虑,由于2010年到2011年期间购买的商品数量的变化,帕氏指数更能反映报告期的变化。拉氏指数 帕氏指数优点 仅仅需要基期的数量数据。它能在一段时期上进行更有意义的对比,指数的变化归因于价格的变化。 由于它使用报告期的数量,因而反映出报告期的购买习惯。缺点 不能反映在一段时期上购买方式的变化,它也可能过于加重价格上涨的商品的权数。 需要每年的数量数据,这些数据可能难以得到。因为每年使用的数量都不一样,所以不可能把指数的变化仅仅归因于价格的变化。它倾向于过于加重那些价格下跌的商品的权数。它需要的价格每年都重新计算。9.4.3 居民消费价格指数居民消费价格指数(consumer price index,CPI)是综合反映一定时期内居民所买的各种消费品(包括货物和服务)的价格变动程度的相对数。该指数可用于分析消费品市场物价的基本动态及其对居民消费开支的影响程度,调整货币工资以得到实际工资水平,等等。9.4.5 一些重要的经济指数9.4 .5 .1 生产指数和生产者价格指数例7 某公司的销售额在2002年是875000元,2005年增长到1482000元,2008年为1491000元,2010年为1502000元。在这期间,生产中使用的原材料的价格也在增长,所以该公司希望平减销售来解释原材料的价格的增长。以2002年的销售额为基准,2005、2008和2010年的平减销售是多少?即以2002年的稳定收入来表示2005、2008和2010年的销售是多少?生产价格指数(PPI)是每月发布的指数,可以在国家统计局网站上获得该指数。PPI是用来平减制造商销售的适当的指数。这个公司的销售在表9.13的第2列列出,PPI在第3列,紧接着得一列是除以PPI后的销售,右手边的一列是计算的详细过程。年份 销售额 PPI 平减值 计算过程2002 875000 100 875000 (875000/100)*1002005 1482000 127.9 1158718 (1482000/127.9)*1002008 1491000 130.9 1139037 (1491000/130.9)*1002010 1502000 138 1088406 (1502000/138)*1009.4.5 一些重要的经济指数9.4.5.2 消费者信心指数消费者信心指数(Consumer Confidence Index ,CCI)是反映消费者信心强弱的指标,是综合反映并量化消费者对当前经济形势评价和对经济前景、收入水平、收入预期以及消费心理状态的主观感受,是预测经济走势和消费趋向的一个先行指标,是监测经济周期化不可缺少的依据。第一个消费者信心指数是20世纪40年代美国密西根大学的调查研究中心为了研究消费需求对经济周期的影响而编制的,随后欧洲一些国家也先后开始建立和编制消费者信心指数。 消费者信心指数由消费者满意指数和消费者预期指数构成。消费者的满意指数和消费者预期指数分别由一些二级指标构成:对收入、生活质量、宏观经济、消费支出、就业状况、购买耐用消费品和储蓄的满意程度与未来一年的预期及未来两年在购买住房及装修、购买汽车和未来6个月股市变化的预期。9.4.5 一些重要的经济指数9.4 .5 .3 采购经理人指数采购经理人指数(Purchasing Manager's Index,PMI)是一个综合指数,按照国际上通用的做法,由五个扩散指数即新订单指数(简称订单)、生产指数(简称生产)、从业人员指数(简称雇员)、供应商配送时间指数(简称配送)、主要原材料库存指数(简称存货)加权而成。PMI指数计算公式如下:PMI=订单×30%+生产×25%+雇员×20%+配送×15%+存货×10%9.4.5 一些重要的经济指数9.4 .5 .4 股票价格指数股价指数可以衡量整个股票市场价格变动的基本趋势,人们形象地称之为市场经济的"晴雨表"。股价指数的编制方法多种多样,各有所长,综合指数是其中的一种重要编制方法。9.4 .5 .5农副产品收购价格指数农副产品收购价格指数旨在反映各种农副产品收购价格的综合变动程度。由此可以考察收购价格变化对农业生产者收入和商业部门支出的影响。我国的农副产品收购价格指数的编制方法是:从11类农副产品中选择276种主要产品,以它们各自的计算期收购额作为权数,通过加权调和平均方法得到各类别的农副产品收购价格指数和农副产品收购价格总指数。 展开更多...... 收起↑ 资源预览