基于支持向量回归的金融时间序列预测研究毕业论文
2021-10-08 18:51:41
摘 要
外汇市场是中国金融市场的重要组成部分,其所具有的稳定、交易快、透明等优点使得投资人对其青睐有加,成为中国金融市场中一股不可忽视的力量。外汇市场是确定性混淆的,这一特点使得对其的短期预测成为可能。除了金融人士通过其交易经验对外汇市场进行预测外,目前也有很多研究通过机器学习的方式对其进行研究预测。外汇市场每天的海量交易数据为研究者与投资人通过机器学习的方式对其预测提供了可能。支持向量机作为一种基于统计学习理论的机器学习方式,泛化性能较高,使用相对简单,在研究中广受关注。支持向量机分为两个部分,支持向量分类机主要用于数据分类模式识别方面,而支持向量回归机则用于数据的回归,例如股票市场的回归预测。同时,外汇市场所产生的数据非常精确,但是在实际使用中,往往不需要这么精确的数值,使用精确的数据将会较为繁琐,因此需要采用模糊化的方法将精确的数据模糊表示以供后续的研究使用。
本文以外汇市场中欧元兑美元的数据为基础,通过交叉验证的算法为支持向量回归机在一定的范围内选择最优的参数,选择RBF核函数作为支持向量回归的核函数,分别对开盘价、收盘价、最高价与最低价进行预测。同时采用模糊逻辑理论对精确的四维K线数据模糊为一维数据表示。研究结果表明,良好选择的支持向量回归可以在一定时期内对外汇市场数据做出较为准确的预测,模糊逻辑理论在误差范围内能够比较正确地表达外汇市场数据。
关键词:支持向量回归;模糊表示;预测;外汇市场
Abstract
The foreign exchange market is one of the important part of Chinese financial market. Because of its stability, velocity of trading and transparency, it draws much attention of investors, and has become a powerful strength in market. The foreign exchange market is deterministic chaotic, which makes it can be predicted accurately in short term. Expect the prediction based on financial experience, there are also many studies that based on Machine Learning to predict foreign exchange market. The massive quantity of trading data from foreign exchange market makes it possible to apply Machine Learning. Support Vector Machine is a machine learning algorithm base on SLT, it can be used easily and applied extensively. SVM ought to be divided into two parts – SVC and SVR. The first one is usually used in Pattern Recognition and classification, and the second is used in Regression, such as the regression of the stock market. And meantime, the data from foreign exchange is very precise, and when it is used in application, it could be very complex. So the precise K-Line data should be fuzzied by Fuzzy Logistic Theory to apply it in further study.
In this paper, the basic data is EUR-USA exchange rate, and the parameters are selected by the means of CV. The core function of this SVR is RBF function. The SVR will predict the open price, close price, highest price and the lowest price separately. And this paper will use Fuzzy Logistic Theory to change the data from precise 4-D data to 1-D fuzzy data. The study result shows that the SVR with good choice can predict the foreign exchange market well in somewhat peried, and the fuzzy logic theory can present the foreign exchange market data correctly.
Keywords: SVR; Fuzzy Presentation; Prediction; Foreign Exchange Market
目 录
摘 要 I
Abstract II
第1章 绪论 1
1.1 研究背景 1
1.2 国内外研究综述 2
1.2.1 SVM理论研究 2
1.2.2 SVM(SVR)与其他技术的结合应用 3
1.3 研究目的 4
1.4 论文组织结构 4
第2章 模糊K线理论 5
2.1 外汇市场数据表示——K线图 5
2.2 模糊逻辑理论 6
第3章 支持向量回归 8
3.1 支持向量机理论 8
3.1.1 基础分类问题 8
3.1.2 VC维与结构风险最小化 10
3.1.3 核函数 10
3.2 支持向量回归理论 11
3.3 Libsvm支持向量机工具 12
3.4 SVM参数寻优 12
第4章 K线模糊表示与SVR实现 14
4.1 SVR预测仿真实验 14
4.1.1训练集与标签的选择 14
4.1.2交叉验证选择最优参数 15
4.1.3 SVR实验结果及分析 17
4.2 K线序列建模实验 18
4.2.1 论域间隔选择与符号化 18
4.2.2 预测值与真实值模糊对比 20
第5章 总结与展望 22
5.1 本文总结 22
5.2 研究展望 22
参考文献 24
致 谢 25
第1章 绪论
支持向量机(SVM)是Vapnik等人基于统计学习理论所提出的一种机器学习方法,属于有监督的学习模型,其通常被用来进行模式识别、分类,以及回归分析。这一算法具有理论支持较好,算法复杂度相对较低,泛化能力较强,全局优化能力较好等优点。支持向量机分为支持向量分类(SVC)与支持向量回归(SVR)。SVM目前已经成为国内外研究的热点,其在分类方面的应用已经较为广泛成熟,而受关注较晚的SVR在量化投资领域得到了越来越多的认可。在先前研究的基础上,本文将对外汇市场的时间序列数据使用支持向量回归进行分析,从而对未来的外汇市场走向与价格做出预测。在实际的使用中,市场中的精确值较为繁琐,因此本文将引入模糊逻辑理论对市场数据进行模糊化,以使得能够以相同的标准简单表示数据。
1.1 研究背景
随着经济全球化的不断深入,中国与其他国家的经济往来更加密切。因此,作为世界经济的重要组成部分的外汇市场,也在中国经历了从无到有再到壮大的发展,具有较大的发展空间。外汇市场与股票市场等具有某些共性,是一个开放的复杂系统,受到经济、政策等多方面因素的共同影响。与股票市场相比较,外汇市场也具有其特殊性。外汇市场具有投资灵活、客观公正、盈利机会多、交易费用低的特点,因此受到了越来越多投资人的青睐。更重要的是,与股票、期货的不同,外汇市场以国家货币为主体,货币的规律性更强,出现突变的可能性比较低。此外,外汇市场所积累的海量数据全部是公开的,所有投资人都能够免费得到。这些特点决定投资人可以利用技术手段对市场进行分析,能够让投资人对市场变化的预测更加准确,对利润的获取更加具有把握。外汇市场所提供的金融数据是金融市场中一类重要的时间数据类型,对于这类数据的预测既有重要的科研意义,也有重要的经济意义。
对于外汇市场的分析预测目前已经有了较多的研究,这些研究主要包括两个方面,一个方面是金融专业人士通过自己的从业经验进行判断。另一个方面,由于外汇市场所产生的数据属于金融时间序列的一种,金融时间序列被认为是一种复杂的非线性动态系统,其具有的一个特点是确定性混沌的(deterministic chaotic) [1],这一特性使得外汇市场是可以通过统计方法在短时期内预测。因此一些理工科的非金融人士采用人工智能为基础的方法来进行汇率的预测,如使用BP-神经网络进行判断[8]。第一种方法需要投资者拥有大量的从业经验才能做出相对准确的判断,而一般的投资者往往缺乏这些专业知识与经验。在以人工智能算法为基础的第二种方法中,研究[6]表明SVR的结果一般来说优于人工神经网络,在数据噪声水平较高时拥有更大的精度。这主要是因为人工神经网络有着一些目前尚未解决的缺点,如理论基础不完善,只能找出局部最优解而无法找到全局最优解,高维问题无法解决等等。支持向量机则避免了这些问题,其建立在一套坚实的理论之上——统计学习理论,能够得到全局最优解并且能够避免数据的“维度灾难”。其通过风险最小化原则与核函数的方法解决了算法复杂性与推广型之间的矛盾,因此在很多领域(如生物信息学、自然语言处理、模式识别等)取得了较为成功的应用。由于支持向量机打的性能较为出色,泛化能力强,现在已经成为了机器学习研究领域的热点。