机器学习方法在股票价格预测中的应用毕业论文
2022-01-18 21:35:56
论文总字数:17971字
摘 要
本文使用多种机器学习方法对于股票趋势变化做出预测,如逻辑回归算法、SVM算法、决策树算法和KNN算法,以及在最后使用集成学习的方法将多种机器学习方法结合到一起。
本文使用中国工商银行的2012到2018年的股票数据,作为本文的数据集,选择该股票的一些特征作为因子,以今日收盘价和昨日收盘价之间的关系作为分类标签,假定交易成本为千分之一,若今日收盘价减去昨日收盘价的差值与昨日收盘价相比大于昨日收盘价的千分之一,就判定为上涨,标签记为1,将其他情况记为0。将训练数据集放入各个算法中去,训练完成后,将测试训练集放入,得到各个机器学习算法对于股票数据测试集的预测结果。
本文中SVM算法、决策树算法和KNN算法对于数据测试集的预测准确率表明各个算法对于股票数据的预测率均高于0.65。证明运用机器学习在股票价格预测中有着重要意义。
关键词:机器学习,逻辑回归,SVM,决策树,KNN,集成学习
Application of Machine Learning in Stock Price Prediction
ABSTRACT
In this paper, a variety of machine learning methods, such as logistic regression algorithm, SVM algorithm, decision tree algorithm and KNN algorithm, are used to make prediction of stock trend changes. At last, a variety of machine learning methods are combined together with integrated learning method.
This article use the industrial and commercial bank of China's stock data from 2012 to 2018, as a data set, this paper select the stocks of some of the characteristics as a factor, the relationship between today and yesterday's closing price of closing quotation price as category labels, assume that the transaction cost is one over one thousand, if the closing price minus the yesterday's closing price difference today compared with yesterday's closing price is greater than one over one thousand of the yesterday's closing price, is determined to rise, the label to 1, other information will be down to 0. The training data set is put into each algorithm. After the training is completed, the test training set is put in to obtain the prediction results of each machine learning algorithm for the stock data test set.
In this paper, the prediction accuracy of SVM algorithm, decision tree algorithm and KNN algorithm for data test set shows that the prediction rate of each algorithm for stock data is higher than 0.65. It is proved that machine learning is of great significance to stock price prediction.
Keywords: machine learning, logistic regression, SVM, decision tree, KNN, integrated learning
目录
第一章 引言 3
1.1 研究背景和意义 3
1.2 本课题研究现状 4
第二章 相关技术和理论 6
2.1 常见的经典机器学习模型 6
2.1.1基于逻辑回归的分类概率模型——Logistic回归 6
2.1.2支持向量机学习 6
2.1.3决策树学习 10
2.1.4 KNN算法 12
2.2.5集成学习 12
第三章、股票预测模型的构建 15
3.1 特征的选取 15
3.2 数据查询 16
3.3 数据预处理 16
3.4 通过降维来压缩数据集 17
3.5 各个模型的预测结果 19
第四章 总结 21
参考文献: 22
致谢 24
附录 25
第一章 引言
1.1 研究背景和意义
人工智能的研究从20世纪40年代已经开始,再近80年发展中经历了数次大起大落。自从2016年AlphaGo战胜顶尖的人类围棋选手之后,人工智能再一次进入了人们的视野,成为了当今的热门话题。机器学习也成为了当代激动人心的技术,在这个激动人心的领域已经开启了许多新的可能性,已经在日常生活中不可或缺。智能手机的语音助手、为客户推荐合适的产品、防止信用卡欺诈、过滤垃圾邮件、检测和诊断疾病等都是明证。
在这个互联网的时代里,我们能够获取到更多的数据和信息,让我们有机会更加深入的认识社会、探索世界掌握规律。其次,在大数据的处理上,越来越多的数据处理方式出现,这使得我们能够有效的对各种数据进行分类并进行有效的处理。再次,计算机硬件的发展使得其计算能力得到了巨大的提升,这为人工智能和机器学习的普及和应用提供了计算基础。在这几项技术发展的基础之上,机器学习在未来的计算机科学研究或者是在日常生活中都会扮演着越来越重要的角色。
在这个数据丰沛的时代,计算机可以通过算法,来实现对数据的处理,将不规则的信息从大量的杂乱的数据中提取出来,成为我们判断和分析数据的重要依据。机器学习比起一般的数据分析方法,他不需要我们耗费大量的时间和精力去处理无序的信息和数据,而是提供一种足够强大的算法,在算法中让机器通过不断的学习和记忆,通过不断的完善自身的信息最后由机器自身来完成对大量数据的分析。在股票预测这一个大的项目中,股票天生就拥有着与生俱来的大量的杂乱的但是有隐藏着许多信息的数据,利用机器学习并从中提取和学习股票数据中的潜在规则,成为了当前在股票预测和机器学习方面的热门问题,越来越多的专家学者开始利用机器学习来讨论股票,并尝试建立模型去预测股票价格走势。
自从股票这一种金融衍生物出现在人们的视野里,人们就开始尝试进行股票价格的预测。如果人们正确的预测股票走势的变化,就能为投资人带来合理的丰厚的回报,同时能够规避更多的投资风险。股票市场的波动,往往是不规则的,非线性的,而机器学习在非线性方面拥有较好的优越性。与一般的股票预测方法相比较,运用机器学习对股票走势进行预测将会拥有更好的预测能力,即在运用机器学习进行股票预测的情况下,我们的数据会拥有更高的准确性,得到的结果也更加具有实用性。随着机器学习的不断发展,机器学习目前正逐步广泛应用于股票预测及其相关研究中。
请支付后下载全文,论文总字数:17971字