面向季节性产品的非平稳时间序列组合预测及其应用毕业论文
2020-02-15 23:37:19
摘 要
在市场发展日新月异的今天,快速满足消费者需求成为衡量企业服务水平的重要因素。季节性产品的需求具有很大的不确定性,因此对其销量进行科学合理地预测显得尤为重要。
为了更好地探究季节性产品时间序列的特点,以全国家用空调2009年至2018年销量作为实例研究对象,分析该时间序列的平稳性以及构成成分。选取2014至2017年的空调销量作为观察值,采用季节性多元回归模型以及Holt-Winters乘法模型对2018年的空调销量进行预测,选取2015年至2017年的销量作为观察值采用时间序列分解法预测2018年销量,并与实际值比较求出每种模型的预测精度。通过对单项预测模型精确度的比较,发现Holt-Winters乘法模型的预测效果更好。然后通过修正模型,预测2019年的空调销量。在单项预测模型的基础上,本文将MAPE原则、最小二乘法原理及两者相结合求权重系数的方法相比较,得到组合预测模型。结果表明,组合预测模型比单项预测模型的预测效果好。
论文对2014年至2017年的销量进行预测,并以预测值为自变量、实际值为因变量作回归分析,检验该模型是否能用于对全国家用空调销量的中短期预测。采用两种权重方法相结合的方式确定权重系数,将单个预测模型在组合预测模型的贡献程度给予MAPE和误差平方和两方面的制约,从而提高预测精度。
关键词:季节性产品;组合预测;时间序列分解法;季节性多元回归模型;Holt-Winters乘法模型
Abstract
With rapid development of the market, the quick response to consumer has become an important factor in measuring the service level of enterprises. There is a great uncertainty about the demand for seasonal products, so it is particular important to make scientific prediction about their sales.
In order to better acknowledge the characteristics of the seasonal product time series, we collected the sales of domestic air-conditioning from 2009 to 2018 as the object of example, and analyzed the smoothness and composition of this time series. With the sales from 2014 to 2017 selected as the observation value, the Time-series Decomposition method, the Seasonal Multivariable Regression model and the multiplicative Holt-Winters model were used to predict the 2018 sales, and the MAPE of each model was obtained compared with the actual values. By comparing the accuracy of the single prediction model, it was found that the prediction effect of the Holt-Winters multiplication model was better. Then the 2019 sales were predicted by correcting the models. On the basis of the single prediction model, we used the method of combining the MAPE principle with the least squares principle to find the weight coefficient, and got the combined prediction model. The results showed that the combined prediction model had better prediction effect than the single prediction model.
We predicted the sales from 2014 to 2017, which would be the independent variable of the regression analysis and the actual value as the due variable to test whether the model can be used for the forecast of air-conditioning sales. By combining the two weighting methods, the weight coefficients were determined, and the contribution degree of the single prediction model to the combined prediction model were mearsured by MAPE and the error squared so as to improve the prediction accuracy.
Key words:the seasonal products;the combined prediction model;the Time-series Decomposition method;the Seasonal Multivariable Regression model;the multiplicative Holt-Winters model
目 录
摘 要 I
Abstract II
第1章 绪论 1
1.1 论文研究背景与问题提出 1
1.2 国内外相关研究文献综述 1
1.3 研究目的与意义 3
1.3.1 研究目的 3
1.3.2 研究意义 4
1.4 研究内容与方法 4
第2章 非平稳时间序列分析 5
2.1 时间序列及其构成成分分析 5
2.2 时间序列平稳性分析方法 6
2.3 非平稳时间序列的主要影响因素 7
2.4 典型季节性产品的非平稳时间序列分析 7
2.5 小结 12
第3章 面向季节性产品的非平稳时间序列多种预测方法 14
3.1 引言 14
3.2 时间序列分解法 14
3.2.1 原理 14
3.2.2 实例分析 14
3.3 季节性多元回归模型 20
3.3.1 原理及应用 20
3.3.2 结果检验 22
3.3.3 模型修正及预测 24
3.4 Holt-Winters乘法模型 25
3.4.1 原理 25
3.4.2 实例分析 26
3.4.3 模型修正及预测 28
3.5 小结 29
第4章 面向季节性产品的非平稳时间序列组合预测方法 31
4.1 引言 31
4.2 组合预测方法基本思路 31
4.3 组合预测过程 32
4.3.1 确定权重系数 32
4.3.2 组合预测 33
4.4 结果分析 34
4.5 小结 34
第5章 总结与展望 35
5.1总结 35
5.2 展望 35
参考文献 36
附 录 37
致 谢 39
第1章 绪论
1.1 论文研究背景与问题提出
市场发展日新月异,市场竞争日趋激烈,快速响应客户需求成为决定企业服务水平的关键因素之一,企业必须进行科学管理,才能提高自己的竞争力,因此对产品未来销量进行科学合理地预测尤为重要。对时间序列进行研究,再根据已获取的时间序列数据预测未来的发展变化,并确定已有的时间序列变化特点,假定这种特点会延续到未来。通过分析往年的销量数据,对未来的销售量进行比较准确的预测,确定产品的最佳生产或采购数量,从而降低库存成本,最终获得更多利润。
季节性产品指的是在供应和需求上有显著季节性特点的产品,如粮食、蔬菜之类的农副产品,雪糕、空调之类的夏凉产品,以及取暖器、保暖衣之类的冬令产品等。季节性产品的销量可以分为两种类型:一种是单峰型,在一个销售周期内只有一次达到销售高峰;另一种是双峰型,在一个销售周期内有两次达到销售高峰。在日常生活中,许多商品的供应和需求存在明显的季节性,表现在旺季时,订单量显著增加,而淡季时需求量显著减少,比如冰淇淋在夏季畅销,空调在冬夏销量增加等。
如果对季节性产品的供应量不能满足需求量,企业将承受缺货损失,如果其供应量远远大于需求量,导致库存量增多,会导致成本增加,因此,对季节性产品的销量进行科学预测显得尤为重要。如何制定合理的生产或采购计划,既能满足旺季需求,减少缺货成本,又能降低库存成本,成为企业提高竞争力的关键。
季节性时间序列具有复杂的非线性结构和周期性特征,因此,在建立模型时,既要体现其周期性,还要能够很好地拟合其非线性的变化趋势。然而每种预测模型都有其优势和劣势,选择合适的组合预测方法,充分利用单项模型的优势,并尽量避免劣势,更好地预测季节性产品的需求量,从而促进季节性产品预测模型体系的建立与完善。
1.2 国内外相关研究文献综述
一般来说,时间序列分析的基础由三种模型构成——自回归(Auto Regressive, AR)模型、移动平均(Moving Average, MA)模型和自回归移动平均(Auto Regressive Moving Average, ARMA)模型,研究单变量、同方差的平稳序列时可以使用这三种模型。而被称为时间序列分析的重要里程碑的是在1970年出版的刊物《时间序列分析:预测和控制》,它为实际工作者提供了分析时间序列的特点并进行预测的方法,以及识别、估计和诊断自回归积分滑动平均(Autoregressive Integrated Moving Average, ARIMA)模型的系统方法。这种时间序列分析方法主要用于分析单一变量、相同方差的线性模型,也可以用于分析非平稳时间序列,主要思想是先对非平稳时间序列进行一次或多次差分处理,直至其变为平稳序列,然后再使用ARMA模型来拟合差分后的平稳时间序列。
杨斌清等人即是利用这种思路研究铝价预测,以长江有色A00铝价日均价格为样本,针对现实数据往往具有非平稳的特点,选用自回归移动平均模型,建立非平稳时间序列ARIMA(1,1,1)模型,对铝价进行预测分析,结果表明,该模型拟合精度高,适合于中短期模拟预测铝价价格,并且结果对诸如上海期货和南海有色铝价同样具有一定的参考价值[1];曹聪梅等人则利用积分型自回归ARI模型,先对数据做差分处理,再建立AR模型,最后用水稻总产量为例对预测结果进行验证,结果表明ARI模型在农产品供求量变化平缓的年份预测更为精确[2]。
时间序列通常是在相等时间间隔的基础上,按照时间的先后顺序对某种现象的某一个统计指标的观测数值进行排列而形成的序列。时间序列的数据在本质上反映的是某个或者某些随机变量随着时间不断变化而形成某种趋势,而时间序列预测方法的核心就是从这些数据中寻找出这种规律,并利用其来估计将来的数据。在杨海民等人的《时间序列预测方法综述》中,针对时间序列预测方法,着重介绍了传统的时间序列预测方法、基于机器学习的时间序列预测方法和基于参数模型的在线时间序列预测方法,并表示研究者们应继续研究如何将基于参数模型的在线时间序列预测方法与现实世界中时间序列数据本身的特点相结合,如何将在线时间序列预测方法与多元时间序列模型相结合,如何处理时间序列数据中的异常点等[3]。
根据季节性产品的时间序列的周期性、季节性、随机性和趋势成分,学者们不断探索着准确度更高的时间序列预测方法。危万虎等人为了研究空调销量与气象条件之间的关系,采取了相关分析、逐步回归分析等方法,并以武汉市夏季空调销售量与气象因子之间的关系作为实例研究对象,结果表明,武汉市空调销量与夏季高温天数等气象因子有明显的相关性,并以此为基础,研制了一套空调销售指数[4];张智广根据一部分季节性商品销量的变化具有趋势性和季节性的特点,以时间序列分析方法为基础,给出了一种对于季节性商品未来销量较为有效的预测方法——Winter指数平滑法,实例表明其有较高精确度[5];王腾龙为寻求内陆多箱与空箱的平衡问题,对内陆进出口箱量的历史数据进行分析,发现内陆进出口箱量的季节性特征较为明显,淡季与旺季的用箱需求存在较大差异,于是分别采用季节性多元回归模型与时间序列分解模型预测内陆用箱需求,结果表明采用时间序列分解模型的准确度更高[6]。
各类预测方法各有优、缺点,时间序列的类型不同,其预测精度也各不相同。在分析较为复杂的时间序列时,如果采用某一种预测方法往往是很片面的,并且预测误差会比较大,如果组合预测选取得当则会获得较好的预测精度。
陈建华等人为了对需求增长型企业的供应量预测方法进行研究,首先采用了时间序列分解法、回归分析法和定性预测法等单项预测方法进行分析,然后根据“误差决定权重”的思想对各种单一预测方法所占权重进行动态分配,并以空调生产企业为例,结果表明综合预测方法能使精确度总体上得到显著提高[7];白朝阳等人为了研究装备制造业的物料需求量的时间序列,根据此时间序列数据是非平稳时间序列的特性,提出一种基于经验模态分解(简称EMD)和最小二乘支持向量机(简称LSSVM)的组合预测模型,实证结果表明 EMD-LSSVR 组合预测可以高效预测非平稳物料需求时间序列且相比传统方法预测精度较高[8];段青玲等人根据水产品价格序列的非线性、非平稳和周期性特点,提出了一种基于时间序列遗传优化(genetic algorithm, GA)支持向量回归(support vector regression,SVR)的水产品价格预测模型,并与SVR和BPANN模型对比,结果表明GA-SVR能更好地预测水产品的价格[9];赵珍祥提出了用组合模型预测方法对城市轨道交通客流进行预测,对ARIMA-RBF、GA-WNN等组合预测模型的实际应用进行了阐述[10]; Ping-Feng Pai等人将Fuzzy C-Means(FCM)与对数最小二乘支持向量回归(LLS-SVR)技术相结合,能够更加准确地预测旅游需求[11];而陆利军为了研究互联网时代旅游消费者出行规律,提出了一种基于网络搜索指数的EMD-ARIMA-BP组合模型,先对网络搜索行为数据进行指数合成,再利用EMD算法对游客量和网络搜索数据进行去噪处理,最后将ARIMA模型和BP神经网络进行组合,大幅度的提高了对游客量的预测精度[12];Liljana Ferbar Tratar等人则开发出了一种新的预测方法——EHW(the extended Holt-Winters),该方法能比经典和具阻尼趋势的Holt-Winter方法提供更好的短期预测[13]。
国内学者往往采用经季节调整后的数据以避开季节波动影响或采用传统季节线性模型对时间序列动态特征及其相关特性进行统计分析。国内非常缺乏季节波动非线性相关研究,危黎黎等人采用能同时刻画季节波动与周期波动都具有非线性特征的SEASTAR模型研究我国出口波动总特征,并将其与季节线性模型及采用季节调整法得到的模型分别进行效果比较[14]。
对于组合预测,确定权重系数是非常关键的一步。陈华友等人从统计的角度,建立组合预测的线性模型,并给出了权重的LS估计及其假设检验,以提高预测精度[15];陈华友等人综述了组合预测模型的分类以及权重计算方法等,并展望了在不确定环境下组合预测方法以及未来研究方向[16];王丰效使用预测有效度的概念选择由哪几种单项预测模型进行组合,才能更好地提高组合预测有效度[17];李佩等人提出将平均绝对百分数误差 (MAPE) 和最小二乘法相结合来确定组合预测模型的权重值,并对湖北省国内生产总值进行预测,结果表明组合权重比单一权重的预测精度更高[18]。
1.3 研究目的与意义
1.3.1 研究目的
家用空调是一个具有代表性的季节性产品,本文以2009至2018年的全国家用空调销量(包括内销量和进口量)为观测值,研究季节性产品时间序列的特征,通过对2018年空调销量的预测值与实际值的误差计算对各个模型进行评价,并通过修正模型对空调销量进行为期一年的预测。
本文的研究,首先是对全国家用空调销量的时间序列进行平稳性分析,判断其为非平稳还是平稳时间序列;然后对时间序列进行成分分析,分析其包含季节性、周期性、随机性以及趋势等四个特征中的几种,确定时间序列的类型,选择多种合适的预测方法进行预测,并选择合适的方法确定权重系数建立组合模型进行预测,从而更加准确的预测产品未来的销量,为企业的生产或采购计划提供依据,从而降低缺货成本以及库存成本,获得更大利润。
1.3.2 研究意义
本文的分析和研究从理论上将进一步充实和完善对季节性产品供应量或需求量预测的方法,以及证明新的时间序列预测方法组合的可能性。同时,本文结合实例分析,可以对某些企业对季节性产品的生产或采购提供理论指导和实践借鉴意义。
1.4 研究内容与方法
本文将主要以季节性产品(如空调)的销量为研究对象,结合案例从实证分析的角度,重点从以下四个方面进行分析和探讨: