基于机器学习算法的股票市场预测研究毕业论文
2021-06-08 00:08:17
摘 要
本文股票预测有两种形式,一种形式是宏观的离散型的预测结果,一种形式是微观的连续型的预测结果。
离散型的预测结果是根据算法原理建立了决策树模型,并通过朴素贝叶斯算法来验证算法得到的决策树分类规则的正确性,这是本文的创新点之一。得到的结论是当机构的成交方向是卖出,即机构卖出的股票总价格比买入的股票总价格要高,股票的换手率达到10%以上,股票成交额达到1亿以上的时候,预测股票的价格将会下跌。本文就ST恒立公司在2016年5月23号的股票价格进行了预测,预测5月23号,股票价格将会上涨。正好5月20号股票收盘价是8.39,而5月23号是8.81,验证了决策树分类规则的准确性。
连续型的预测结果是以ST恒立公司从2016年4月7号到5月20号的股票收盘价格为数据基础,预测5月23号的股票收盘价。建立了时间的线性趋势模型,模型,模型,模型,这几个模型预测5月23号的收盘价分别为9.676,8.32,8.444,8.650,而5月23号真实收盘价为8.81,其中模型的预测效果是最好的。其中用补齐缺失数据是本文的第二个创新点。
关键词:算法;朴素贝叶斯算法;模型;模型;模型
Abstract
Stock prediction can be divided into two kinds, one kind is discrete prediction results, one kind is the continuity of predicted results.
Discrete prediction result is according to the principle of ID3 algorithm of decision tree model, and verified by Naive Bayes algorithm, this is the first innovative points. Get to the conclusion that when the transaction is to sell, stock turnover rate above 10%, equity turnover reached more than 100 million, predict the price of the stock will fall. In this paper, forecasting the stock price of ST company on May 23, the stock price will rise. Just May 20 stock's closing price is 8.39, on May 23 is 8.81, verify the accuracy of the decision tree classification rules.
Continuum model predicted results based on ST company from April 7, 2016 to May 20 stocks closing price as the foundation of data, predict the stock's closing price on May 23.Time of linear trend model, AR (1) model, MA (6) model, ARIMA (1,1,5) model, this a few models respectively predicted on May 23, the closing price of 9.676, 8.32, 8.444, 8.650, and the actual closing price of 8.81 on May 23, ARIMA (1,1,5) model of the prediction effect is the best. The filling missing data using the AR (1) model is the second innovation point of this article.
Key Words: ID3 algorithm; Naive Bayes algorithm; AR model; MA model; ARIMA model
目 录
摘 要 I
Abstract II
第1章 绪论 1
1.1 问题来源和研究意义 1
1.1.1 问题来源 1
1.1.2 研究意义 1
1.2 国内外研究进展 2
1.2.1 国内研究进展 2
1.2.2 国外研究进展 2
1.3 本文主要研究思路与框架 2
第2章 机器学习 4
2.1 机器学习的产生以及定义 4
2.2 机器学习的主要功能和主要算法 4
2.2.1 机器学习的主要功能 4
2.2.2 机器学习的主要算法 5
第3章 机器学习在股票预测市场的应用 7
3.1 决策树分类算法在股票预测市场的应用 7
3.1.1 算法的基本原理 7
3.1.2 数据准备及预处理 7
3.1.3基于算法的决策树分类的应用分析 8
3.2 朴素贝叶斯算法在股票预测市场的应用 10
3.2.1 朴素贝叶斯分类算法的原理 11
3.2.2 用朴素贝叶斯算法验证算法结论 11
3.3时间序列模型预测股票收盘价 11
3.3.1 时间序列模型原理介绍 11
3.3.2 时间序列模型实证分析 12
第4章 结果分析和展望 20
4.1 结果分析 20
4.2 展望 21
参考文献 22
致 谢 23
第1章 绪论
1.1 问题来源和研究意义
1.1.1 问题来源
股票市场的建立始于19世纪,作为一个高风险高收益的投资领域,其倍受投资者们的关注和喜爱。但是股票市场是一个由各种因素相互作用形成的复杂系统,受政治形势,金融政策,以及公司状况和各种重大消息等多方面因素的影响,股票走势变化难以琢磨。同时,我们知道股票是市场经济作用的产物,在一个国家的金融领域备受关注,它影响着人们的经济生活。股市的一涨一跌都会对个人乃至金融市场产生一定的震荡。
股票市场因其风险很高,收益也高的特点,使得人们为了得到收益,避免风险,不断地研究股票的内在变化规律,寻找有用的预测方法以及工具。然而,因为股票市场是一个受众多影响因素共同作用的复杂系统,所以各因素间相关关系盘根交错,主次关系无法确定,数量关系更是难以定量分析。
对于股票信息,这种不断变化且无序的数据,利用机器学习的方法来预测股票走势是目前的一个很受欢迎的预测股票走势的方式。而我们又知道机器学习分成监督学习和非监督学习,两者的最主要的区别就是监督学习需要知道目标变量的分类信息以及具体的预测数值。因此在本文中我们使用监督学习算法来预测股票走势。
1.1.2 研究意义
股票市场在中国不断发展,投资者的数量不断增加,股民遍中国。分析和预测股票价格走势有一定的研究意义。
目前来看,随着人们生活水平地不断提高,我们将会寻求除了银行存储以外的其他理财途径。就欧美发达国家而言,证券投资在居民家庭财产构成中占了很大比重,美国家庭财产的30%左右是基金和股票,并且有超过一半的家庭参与股票的投资。在我们能够正确地认识股票市场的运行规律的情况下,我们就可以指引股民进行正确的投资,为投资者带来可观的利益。