资源简介 (共59张PPT)统 计 学第十一章 时间序列分析第十一章 时间序列分析§1 时间序列的描述§2 时间序列的分解§3 时间序列的平滑法§4 时间序列的ARMA模型2§1 时间序列的描述§1.1 时间序列及其分类§1.2 图形描述§1.3 水平变动描述§1.4 速度变动描述3§1.1 时间序列及其分类时间序列定义时间序列是同一现象按照时间顺序排列而成的一组观测值;由现象在不同时间上的观测值和现象所属的时间构成。时间序列分类绝对数时间序列时期序列 时点序列相对数时间序列平均数时间序列4§1.2 图形描述图形描述展示时间序列特征最直观、有效的形式,通常作为时序分析的第一步。给定一个时间序列,可以首先通过作图来观察数据随时间变化的规律,然后在此基础上展开分析和建模。5§1.2 图形描述【例11.1】表11.1以年份形式给出1996—2011年我国国内生产总值、年末总人口、人口自然增长率、居民消费价格指数四个时间序列,通过作图描述这四个时间序列的特征和变化趋势。解:根据表11.1作图,可以判断我国国内生产总值呈现上升的趋势,并且增长率逐年增加;年末总人口一直在增长,但增长率逐渐减少;人口自然增长率呈现线性下降的趋势;居民消费价格指数序列没有明显的趋势,但呈现出一定的循环变动。6§1.2 图形描述表11.1 国内生产总值等指标的时间序列表资料来源:《中国统计年鉴2012》,中国统计出版社,2013年。7年份 国内生产总值(亿元) 年末总人口(万人) 人口自然增长率(‰) 居民消费价格指数1996 71176.6 122389 10.42 108.31997 78973.0 123626 10.06 102.81998 84402.3 124761 9.14 99.21999 89677.1 125786 8.18 98.62000 99214.6 126743 7.58 100.42001 109655.2 127627 6.95 100.72002 120332.7 128453 6.45 99.22003 135822.8 129227 6.01 101.22004 159878.3 129988 5.87 103.92005 184937.4 130756 5.89 101.82006 216314.4 131448 5.28 101.52007 265810.3 132129 5.17 104.82008 314045.4 132802 5.08 105.92009 340902.8 133450 4.87 99.32010 401512.8 134091 4.79 103.32011 472881.6 134735 4.79 105.4§1.2 图形描述图11.1 不同时间序列的图形描述8§1.3 水平变动描述1.发展水平与平均发展水平在时间序列中,令 表示现象所属的时间, 表示现象在不同时间上的观测值,也称为发展水平。若将整个观测期内的发展水平与参照基期 的发展水平作对比,则 对应的发展水平 称为基期发展水平。分析研究的其他时期称为报告期,对应指标值称为报告期发展水平。平均发展水平是对整个观测期的发展水平取平均数。9§1.3 水平变动描述平均发展水平计算时间序列观测值的表现形式不同,平均发展水平的计算方法不尽相同。(1)绝对数时期序列平均发展水平即各期发展水平的简单算术平均。其计算公式为:10§1.3 水平变动描述【例11.2】根据表11.1国内生产总值的时序数据,计算1996—2011年间我国的平均国内生产总值。解:根据11§1.3 水平变动描述绝对数时点序列平均发展水平计算步骤1. 计算出相邻两个时点观测值的平均数 ,将其视为这两个时点所夹的时间段 的发展水平近似值;2. 以时间段 为权数,对所有时间段的发展水平近似值作加权算术平均。其计算公式为特别地,若 相等( ),计算公式为12§1.3 水平变动描述【例11.3】某公司一年内各个统计时点的职工人数见表11.2,计算该年度公司平均职工人数。表11.2 职工人数统计 单位:人13§1.3 水平变动描述解:根据1-3月平均职工人数: (人)4-6月平均职工人数: (人)7-8月平均职工人数: (人)9-12月平均职工人数: (人)14(人)§1.3 水平变动描述【例11.4】根据表11.1年末总人口的时序数据,计算1996—2011年间我国的年平均人口。解:根据15§1.3 水平变动描述(2)相对数或平均数时间序列的平均发展水平相对数或平均数时间序列的观测值通常由两个绝对数相比而成,即因此,其平均发展水平应分别计算分子和分母绝对数的平均发展水平,然后再相比得到,计算公式为:16§1.3 水平变动描述【例11.5】根据表11.1国内生产总值和年末总人口的时序数据,计算1996—2011年间我国人均国内生产总值的平均发展水平。解:根据例11.2和例11.4的计算结果,1996—2011年间我国年平均国内生产总值为196596.08亿元,年平均人口数为129296万人。由17(元/人)§1.3 水平变动描述 2.增长量与平均增长量增长量用来描述现象在观测期内增长的绝对数量,由报告期发展水平减去基期发展水平得到。增长量按基期的选择分类1. 逐期增长量2. 累计增长量18§1.3 水平变动描述设时间序列观测值为 ( ),增长量为 。计算公式为逐期增长量 ( )累计增长量 ( )各逐期增长量之和等于最末期的累计增长量平均增长量是各期逐期增长量的平均数,计算公式为19§1.3 水平变动描述【例11.6】根据表11.1国内生产总值的时序数据,计算1996-2011年我国国内生产总值的逐期增长量、累计增长量和平均增长量。表11.3 1996-2011年国内生产总值的增长量 单位:亿元20年份 1996 1997 1998 1999 2000 2001国内生产总值 71176.6 78973 84402.3 89677.1 99214.6 109655.2逐期增长量 7796.4 5429.3 5274.8 9537.5 10440.6累计增长量 7796.4 13225.7 18500.5 28038 38478.6年份 2002 2003 2004 2005 2006 2007国内生产总值 120332.7 135822.8 159878.3 183217.4 216314.4 265810.3逐期增长量 10677.5 15490.1 24055.5 23339.1 31377 49495.9累计增长量 49156.1 64646.2 88701.7 112040.8 145137.8 194633.7年份 2008 2009 2010 2011国内生产总值 314045.4 340902.8 401512.8 472881.6逐期增长量 48235.1 26857.4 60610 71368.8累计增长量 242868.8 269726.2 330336.2 401705§1.3 水平变动描述解:根据逐期增长量和累计增长量的公式得表11.3。由我国国内生产总值的平均增长量为21§1.4 速度变动描述1.发展速度根据对比的基期不同,发展速度可以分为环比发展速度和定基发展速度:环比速度描述现象逐期变化程度定基速度描述现象在观测期内总的变化程度22§1.4 速度变动描述设时间序列观测值为 ,发展速度为 ,计算公式为环比发展速度: ( )定基发展速度: ( )各期环比发展速度的连乘积等于相应的定基发展速度:相邻两个定基发展速度之商等于相应的环比发展速度:23§1.4 速度变动描述2.增长速度(增长率)根据基期的不同选择,增长速度可以分为环比增长速度和定基增长速度。设时间序列观测值为 ,增长速度为G,计算公式为环比增长速度: ( )定基增长速度: ( )24§1.4 速度变动描述【例11.7】根据表11.1国内生产总值的时序数据,计算2011年的环比发展速度、环比增长速度、定基发展速度、定基增长速度;假设2011年、2012年与2013年的环比增长率相等,预测2012年和2013年的国内生产总值。解:环比:定基:2012年和2013年的国内生产总值预测值为25§1.4 速度变动描述3.平均发展速度与平均增长速度平均发展速度: ( )平均增长速度: ( )26§1.4 速度变动描述【例11.8】根据表11.1中国内生产总值的时序数据,计算1996-2011年的平均发展速度、平均增长速度,并根据平均增长速度预测2012年和2013年的国内生产总值。解:1996-2011年的平均发展速度和平均增长速度依次为2012年和2013年的国内生产总值预测值为27§1.4 速度变动描述变动描述分析注意事项:1. 正确选择基期2. 在速度变动描述中,报告期和基期不允许有0和负数3. 速度与水平应该结合分析:采用增长1%的绝对值来弥补增长率分析的局限性。增长率1%的绝对值反映增长率每增加一个百分点对应的绝对增长量,该指标一般与环比增长率结合使用,其计算公式为:增长1%的绝对值28§2 时间序列的分解§2.1 时间序列的分解模型§2.2 时间序列的分解步骤§2.3 利用时间序列分解模型进行预测29§2.1 时间序列的分解模型时间序列的变动分解长期趋势(T)季节变动(S)循环变动(C)不规则变动(I)30§2.1 时间序列的分解模型1.长期趋势长期趋势(long term trend)是时间序列在较长时期内持续上升或下降的发展态势;可以是线性的,也可以是非线性的;通常由某种固定性因素长期作用于事物产生,其发展具有持续性,有利于根据以往的观测值对未来进行预测。2.季节变动季节波动(seasonal fluctuation)是时间序列在一年内重复出现的周期性波动; “季节”不仅指一年中的四季,还可以指一年中任何一种周期,如月、周、日、时等;季节波动多是由于自然因素和生产或生活条件的影响引起的,其波动具有重复性。31§2.1 时间序列的分解模型3.循环变动循环变动(cyclical fluctuation)是时间序列较长时间内(通常为一年以上)上下起伏的周期性波动。循环变动是一种涨落相间的交替波动;循环变动的周期长短不一、幅度高低不同,不具有重复性。4.不规则变动不规则变动(irregular variation)包含时间序列中所有没有明显规律性的变动;不规则变动是时间序列剔除长期趋势、季节变动、循环变动后的偶然性波动,又称剩余变动或随机变动。32§2.1 时间序列的分解模型构建时间序列分解模型(设 为时间序列的指标值)1. 加法模型:2.乘法模型:33§2.2 时间序列的分解步骤时间序列的分解步骤1.图形描述2.长期趋势的测定3.季节变动的测定4.循环变动的测定5.不规则变动的测定34§2.2 时间序列的分解步骤【例11.9】表11.4是2000-2008年我国社会消费品零售总额月度时间序列。选择恰当的分解模型将该时间序列分解,并分别测算各个变动。表11.4 2000-2008年我国社会消费品零售总额月度数据 单位:亿元35§2.2 时间序列的分解步骤1.图形描述36图11.2 社会消费品零售总额月度时序图§2.2 时间序列的分解步骤2.长期趋势的测定对于含有长期趋势的时间序列,首先采用移动平均法剔除季节变动和不规则变动,再对得到的新时间序列拟合长期趋势。37图11.3 零售总额长期趋势图§2.2 时间序列的分解步骤3.季节变动的测定在时间序列的乘法模型中,季节变动是通过季节指数来估算的;季节指数可以描述现象由于受季节因素的影响偏离其总平均水平的相对程度,可以通过按季平均法得到。按季平均法的前提是时间序列呈水平趋势,计算步骤如下:1. 对多年同季数据进行简单平均,以消除不规则运动。2. 将同季平均数与总平均数作比,得到季节指数 。38§2.2 时间序列的分解步骤39图11.4 零售总额季节指数图§2.2 时间序列的分解步骤4.循环变动的测定由于循环波动的周期长短不一、波动大小不同,且常与不规则运动交织在一起,通常采用剩余法得到;剩余法是以时间序列的分解模型为基础,从时间序列中分离趋势变动、季节变动和不规则变动,从而得到循环波动;由于分离的结果容易受其他变动因素估算效果的影响,实际通常还要结合定性分析方法。将序列 除以 ,即得到循环变动 。40§2.2 时间序列的分解步骤5.不规则变动的测定不规则变动没有规律可循,因此也采用剩余法得到。将序列SI除以S,即得到不规则变动I,41§2.3 利用时间序列分解模型进行预测进行预测的具体步骤1. 对各个变动历史观测值的分析和建模2. 分项预测未来值3. 合成时间序列的预测值注:由于不规则变动没有规律、无法预测,所以时间序列的预测模型只包含长期趋势、季节变动和循环变动三个成分。42§2.3 利用时间序列分解模型进行预测【例11.10】在例11.9所建变动模型的基础上,对2009年1月至6月我国社会消费品零售总额进行预测。解:按照上述步骤,可以得到2009年上半年我国社会消费品零售月度总额的预测值,如表11.8。以2009年1月为例,其长期趋势为:43(亿元)§2.3 利用时间序列分解模型进行预测通过循环变动C的图形我们可以判断,该序列循环变动的周期较长,相对长期趋势的波动较和缓,如图11.5所示。因此直接选取2008年6月的循环变动值作为预测值:44图11.5 零售总额的循环变动图§2.3 利用时间序列分解模型进行预测已知该时间序列1月的季节指数为110.15%。根据时间序列乘法预测模型我们可以得到2009年1月我国社会消费品月度零售总额的预测值:最终得到2009年上半年6个月的预测值见表11.8。表11.8 2009年上半年社会消费品月度零售总额预测值45(亿元)§2.3 利用时间序列分解模型进行预测将2009年上半年社会消费品月度零售总额预测值与2000-2008年实际值联合绘图,可以看出预测值很好地沿承了原序列的变动特征,如图11.6所示。46图11.6 零售总额的原序列与预测值图§3 时间序列的平滑法平滑法基本思想通过加权平均等方式消除随机波动的影响,使序列平滑化,从而展示其长期的发展趋势。平滑技术分类移动平均指数平滑平滑法运用平滑时间序列,描述序列趋势短期预测47§3 时间序列的平滑法§3.1 移动平均法§3.2 指数平滑法§3.3 预测方法的评估48§3.1 移动平均法1.简单移动平均法设时间序列已有的 期观察值为 ,取移动平均期数为 ( ),则第 期的预测值:第 期的预测值:49§3.1 移动平均法【例11.11】根据表11.9中我国城市居民消费价格指数数据,分别取k=3和k=5,采用简单移动平均法计算各年城市居民消费价格指数的预测值,并对预测模型进行比较。(表11.9见书)解:移动平均的结果如表11.9。以3项移动平均为例,表11.9中1993年的预测值就是1990年、1991年、1992年3年的平均值;依次类推,2008年的预测值就是2005年、2006年、2007年3年的平均值。3项移动平均的均方误差是1993年至2007年误差平方的平均值。50§3.1 移动平均法各年城市居民消费价格指数的观测值与移动平均预测值如图11.7所示。51图11.7 消费价格指数的移动平均预测值§3.1 移动平均法2.加权移动平均法取移动期数为 ( ),权数为 ( ),其中:52§3.2 指数平滑法指数平滑法指数平滑法是加权移动平均法的一种特殊形式,对距离越远的观测值赋予的权重越小,并且权重随着时间间隔的增大呈指数衰减。指数平滑法分类(依据修匀次数)1. 一次指数平滑(适合对水平的时间序列进行预测)2. 二次指数平滑(适合对有趋势的时间序列进行预测)3. 多次指数平滑(适合对有趋势的时间序列进行预测)53§3.2 指数平滑法【例11.12】根据表11.10中我国城市居民消费价格指数数据,选择 、 、 ,采用指数平滑法计算各年城市居民消费价格指数的预测值,并对预测模型进行比较。(表11.10见书)解:指数平滑的结果如表11.10。以 为例,设 , 有依次类推,2008年的预测值即2007年实际值与预测值的加权组合:54§3.2 指数平滑法各年城市居民消费价格指数的观测值与指数平滑预测值如图11.8所示。55图11.8 消费价格指数的移动平均预测§3.2 指数平滑法预测结果:平滑系数为0.1的指数平滑预测均方误差为60.79平滑系数为0.5的指数平滑预测均方误差为37.75平滑系数为0.9的指数平滑预测均方误差为23.82就本例而言,平滑系数为0.9的指数平滑预测效果更好,选择104.2作为2008年我国城市居民消费价格指数的预测值。56§3.3 预测方法的评估衡量预测误差常用指标(1)平均绝对误差(mean absolute deviation,MAD)(2)均方误差(mean square error,MSE)(3)平均绝对百分比误差(mean absolute percentage error,MAPE)注: 为时间序列第 期观测值, 为第 期预测值。57§4 时间序列的ARMA模型ARMA模型ARMA模型适合对平稳的、非纯随机时间序列建模。ARMA模型描述了时间序列观察值之间的相关关系,并利用这种关系预测未来值。ARMA模型分类1. 自回归模型(auto-regressive)2. 移动平均模型(moving average)3. 混合模型(auto-regressive and moving average)58§4 时间序列的ARMA模型自回归模型由前面 个观测值的线性组合加上随机误差项 (服从独立同分布)得到,简记为 ,其模型为移动平均模型是当期的随机误差项和前面 个随机误差项的线性组合,简记为 ,其模型为自回归移动平均模型是 和 的组合,简记为 ,其模型为59 展开更多...... 收起↑ 资源预览