登录

  • 登录
  • 忘记密码?点击找回

注册

  • 获取手机验证码 60
  • 注册

找回密码

  • 获取手机验证码60
  • 找回
毕业论文网 > 毕业论文 > 理工学类 > 信息与计算科学 > 正文

基于支持向量机和时间序列的市场股价预测对比分析毕业论文

 2021-11-06 20:11:33  

摘 要

在当今大数据算法发展愈渐成熟的情况下,它在金融领域的应用也越来越广泛,特别是在股市的应用也为越来越多的投资者所关注,其中股价由于其不确定性的特性,单靠一般的基本面来知悉它的走势已为大部分人所淘汰,转而使用量化分析的方法来预测股价已成为主流,如果能够知道股价走势,无论是对政府控制宏观经济还是对于企业以及投资者来最大化自身的利益,都具有重要的意义。所以本文基于时间序列分析和支持向量回归来建立了一个对比模型,比较传统方法和大数据算法在股价预测方面的异同,并基于模型结果的分析总结了这两种方法在股市的适用情况。

本文选取了先是对备选的50只上证50成分股的收盘价进行了描述与走势分析,分别对各个行业进行总体的权重分析和贡献点分析,分析得出金融行业的权重最大贡献点最多,最后选择了金融个股中离差最小的浦发银行的股票收盘价作为研究对象。

在时间序列分析模型中,我对数据进行了平稳性检验,发现为不平稳序列,所以我再进行了差分运算,结果一阶差分也为白噪声序列,我再对原始数据进行二阶差分运算,得到了平稳非白噪声序列。接下来我建立了ARIMA模型,通过建立AIC信息表,最终确定了模型,模型方差,泰尔系数,模型的预测效果较理想,再使用此模型对测试集进行了预测,得到预测值。

在支持向量回归模型中,我通过经验法对线性核函数等四种核函数的参数进行确定,再比较四种核函数的预测效果,得到高斯核函数SVM的均方误差MES=0.0043,拟合优度,均为四种中的最好效果,所以最后确定了使用高斯核来预测。

最后是两种方法的预测结果对比,得到时间序列分析预测序列的均方误差MSE=0.066,支持向量回归预测序列的均方误差MSE=0.0032,所以在本模型中,支持向量机的预测精度更高。同时,我结合实况分析了两种方法的预测序列跟原始数据序列在某些波段相差较大的原因,得出结论,在市场政策无大变化的情况下,时间序列分析适合静态预测,即短期预测,适用于使用以往数据来预测明后几天的数值,这也符合时间序列分析的特性,而支持向量回归更适合长期预测。

但是由于本文只选择了一只股票作为研究对象,所以模型的普适性还需进一步研究,且在进行量化分析的时候,股票的其他指标,比如市盈率等都可以纳入考虑范围。另外,在对支持向量机的核函数的参数进行选择的时候,可以考虑交叉试验来确定最优参数。

关键词:大数据;股价预测;时间序列分析;支持向量回归;均方误差

Abstract

This article selects first to describe and analyze the closing prices of the 50 selected stocks of the 50 stocks. According to the different industries of the stocks, the overall weight analysis and contribution point analysis of each industry are carried out, and the financial industry is analyzed. The weight of the largest contribution point is the most, and then the dispersion of individual stocks in the financial industry is calculated.

In this paper, the stock closing price of SPD Bank is selected as the research object. In the time series analysis model, I first performed a smoothness test on the data, and the result was not stable. Therefore, I performed a differential calculation. Since the first-order check result was white Noise test, so I performed a second order difference operation on the original data and got a stationary non-white noise sequence. Next I established the ARIMA model. By establishing the AIC information table, I finally determined the model, and got the equation , model variance Theil coefficient , model prediction effect Ideally, this model is used to predict the testing set, and the predicted value is obtained.

In the support vector regression model, I used empirical methods to determine the parameters of the four kernel functions of the linear kernel function, polynomial kernel function, Sigmoid kernel function, and Gaussian kernel function, and then compared the prediction effects of the four kernel functions to get Gaussian. The mean square error MES of the kernel function SVM = 0.0043 and the goodness of fit are the best results of the four kinds, so the Gaussian kernel was used to predict.

The mean square error MSE = 0.066 of the time series analysis prediction sequence and the mean square error MSE = 0.0032 of the support vector regression prediction sequence, so in this model, the prediction accuracy of the support vector machine is higher. At the same time, I combined the facts to analyze the reason why the prediction sequence of the two methods differs greatly from the original data sequence in certain bands. I concluded that time series analysis is suitable for static prediction, that is, short-term Prediction is suitable for using the previous data to predict the values for the next few days, which is also consistent with the characteristics of time series analysis, and support vector regression is more suitable for long-term prediction.

However, since only one stock is selected as the research object in this article, the universality of the model needs further research, and other indicators of the stock, such as the price-earnings ratio, can be taken into consideration when conducting quantitative analysis. In addition, when selecting the parameters of the kernel function of the support vector machine, cross-tests can be considered to determine the optimal parameters.

Keywords: Mega Data; Stock price prediction; Time series analysis;SVR; Mean square error

目录

第1章 绪论 1

1.1 研究背景及意义 1

1.1.1 股票收盘价研究的意义 1

1.1.2 机器学习在金融领域的发展现状及意义 1

1.2 文献综述 2

1.2.1 量化分析法 2

1.2.2 时间序列分析 3

1.2.3 支持向量机 3

1.3 本文结构与创新 4

1.3.1 本文结构 4

1.3.2 本文创新点 4

第2章 个股选择 6

2.1 上证50指数描述 6

2.2 金融行业个股分析 7

第3章 时间序列分析理论 9

3.1 时间序列简述 9

3.2 常用时间序列模型及建模基本步骤 9

3.3 数据预处理 10

3.3.1 序列检验 11

3.3.2 趋势平稳和差分平稳 12

3.4 ARMA和ARIMA原理及步骤 13

3.4.1 一般自回归模型AR() 13

3.4.2 移动平均模型MA() 13

3.4.3 自回归移动平均模型ARMA() 13

3.4.4 整合移动平均自回归模型ARIMA() 15

第4章 支持向量机相关理论 16

4.1 支持向量机SVM 16

4.2 支持向量分类问题SVC 16

4.2.1 线性可分SVC 16

4.2.2 非线性可分SVC 17

4.2.3 常用核函数Kernel Function 18

4.3 支持向量回归问题SVR 19

4.4 基于SVM预测股价的模型构建 19

第5章 实证分析 21

5.1 时间序列分析模型 21

5.1.1 平稳性检验 21

5.1.2 差分平稳 22

5.1.3 模型估计及诊断 24

5.1.4 时间序列分析数据 26

5.2 SVM模型 27

5.2.1 核函数选择 27

5.2.2 支持向量回归预测 28

5.3 结果对比分析 29

第6章 总结与展望 31

6.1 总结 31

6.2 不足与展望 31

参考文献 33

致谢 35

第1章 绪论

1.1 研究背景及意义

1.1.1 股票收盘价研究的意义

1986年9月,“静安证券交易柜台”在上海设立并开业运营,这个OTC市场是我国最早的股票流通市场,这表明我国资本市场的初步形成。我国的股票市场发展近30年来,已然扩容为一个庞然大物,无以计数的公司借此融资上市。这几年由于国内的财务杠杠等政策以及美股的下跌,连带着我国的A股市场相较以前也显得低迷,整体来说,相较几年前牛市的频生,A股市值大量蒸发,股价震荡走低。虽然2019年相较2018年稍有回升,但也不容乐观而茫然投入股市。

股票作为一种权益类证券,它的高收益高风险的特征尤为突出,而我国的股票市场并不完全成熟,投资者们也不够成熟,羊群效应显著,人们经常会受到外部的影响,从而形成从众心理,再加上股票价格具有很强的不确定性,所以对股票的未来价值进行分析对于投资者来说是非常有必要的。比如,把握股票价格的变化对于投资者来说可以更好的理解股票市场的运行规律从而可以从中获取更多的利益。而对于股票研究员来说,了解股票价格的变化可以更好的把握货币政策的传导机制从而做出更严谨的分析。从国家宏观层面来说,股票价格剧烈波动情况下也有利于货币政策的制定和实施,有利于削弱甚至消除来自股票市场的不稳定因素,从而加强和提高国家宏观经济的运行质量。

股票的收盘价是一系列股票研究指标中为投资者们所共同认可和关注的一个指标,它也代表着这一天中市场参与者们所能接受的价格,研判收盘价往往能反映出市场参与者们在当日的心理变化,无论股市如何震荡,投资者们的心理因素以及从众心理会使得最终股价都会定格在收盘价上。此外,虽然股票庄家(即主力)可以凭借相当雄厚的资本来操纵收盘价,但这也只是一定程度上的,周线可能取决于资本,但是月线的收盘价操纵较困难,因为随着时间的延长,耗费的资金会越来越大,并且不可控外来因素也会变多,因此资本做出月线是不太可能的。从这个方面来看,月线的收盘价相比周线更具有研判意义。本文选取上证50指数中的浦发银行个股的收盘价为研究目标,时间跨度为2019年整个一年,分别使用传统方法——时间序列分析和智能算法——支持向量机来对股票的收盘价进行分析和预测,比较它们的优劣。

1.1.2 机器学习在金融领域的发展现状及意义

随着互联网和信息技术的发展,互联网金融也成为一个热点名词,越来越多的人投身于此去研究它。在互联网金融飞速发展的当前,海量的信息也倾泻而出。在这样的大数据量面前,许多投资者不知道如何分析和做出决定,以实现自身利益最大化。股票有一个真实的价值,在市场上有一定的供求规则,这也是基本面分析的假设前提,显然供求关系是会影响股价的。基本面分析应根据金融市场过去的规律和现在的走势,预测股价的变动并分析未来的趋势。其中市场外因素、市场因素、以及公司因素都属于基本因素,公司因素是单体因素,只对个股产生影响即对公司本身产生影响,而市场外因素则是综合因素,不仅有经济周期、汇率、货币供需量、行业景气动向的因素,还有更为复杂的政治因素在里面,市场外因素会影响整个大盘。而市场因素则主要是市场机制以及监管政策的影响。所以基本面分析对于投资者来说显得太为繁琐,而更多是使用更为精准的数理统计方法结合智能算法来进行分析。

您需要先支付 80元 才能查看全部内容!立即支付

企业微信

Copyright © 2010-2022 毕业论文网 站点地图