登录

  • 登录
  • 忘记密码?点击找回

注册

  • 获取手机验证码 60
  • 注册

找回密码

  • 获取手机验证码60
  • 找回
毕业论文网 > 文献综述 > 计算机类 > 软件工程 > 正文

基于Python的股票数据分析文献综述

 2020-04-15 17:39:20  

1.目的及意义

随着经济水平的提高,我国股票市场也发展迅速,股票逐渐成为一种重要的投资手段。股票具有高风险、高噪声、不可控、不稳定、非常规分布等特点,因此如何提高收益降低风险是股票分析的主要问题。

对于股票投资,最基础的工作就是对股票的走势进行正确预测,这是每个股民都希望能做到的事。但是股票市场是一个及其复杂的、不断变化的经济系统,它会受到宏观经济运行、政策变化、行业发展周期、投资者群体等多种因素的综合影响,使得人们很难准确找到股价走势的规律与逻辑。现如今科学技术升级,新增许多预测模型,也已有相关机构研发出许多技术指标帮助股民进行股票的技术分析,如随机指标KDJ一般适用于股票分析的统计体系,根据统计学原理来计算相关值来研判股票走势。

目前的股市技术指标可能存在以下几个方面的问题:1、任何单一的技术指标都有其局限性,非技术因素涨跌现象经常出现,这必然会影响某些技术指标的客观性;2、某些技术指标难以理解,投资人难以对这些指标进行理解学习进而产生一些较为直观的认识;3、股市数据庞大复杂,每天都会新产生数量巨大没有章法的数据,很难从中获取到有效的规律信息。

进行投资决策是需要对股票市场中产生的大量历史交易数据和财务数据进行分析以选择投资方向,而人脑数据处理能力有限无法处理这些数据,所以可利用数据挖掘来处理这些海量数据。数据挖掘技术主要适用于处理数量巨大的、无明显规则、无章无序的数据,并能从这些数据中挖掘出隐含在数据中的信息与规律。对数据进行分析,发现其数据模式及特征,进行合理的投资分析和预测,并对多个技术指标进行相互补充,还可由技术消噪或者多指标融合来削减这些现象的影响,更容易作出准确的预测,进而分析出更好的投资决策。另外数据挖掘还能够对不断获得的新数据进行模型的动态更新,非常适合应用于新环境。

在国内,随着我国国内经济的高速发展,许多学者和专家都开始将目光转移到利用数据挖掘技术对股票市场进行研究。如孙媌于 2011 年在其研究股票数据的文章中,将股票的财务数据作为研究目标,并将决策树和聚类分析应用于股票的财务指标数据的分析中,并把支持向量机和神经网络应用到上证指数股票交易数据中进行比较,对于预测长期股票时,支持向量机的效果显著,对短期股票预测时,神经网络的效果显著。

而国外的股票市场出现的时间比国内更早,利用数据挖掘技术研究股票的时间更长,研究的内容更丰富。Lapede 最先将神经网络应用于股票走势预测,使得股票预测的精度提高了很多,自此之后,致力于股票研究的专家与学者倍增。 此外还有很多关于数据挖掘技术应用与股票数据分析的文献,这些文献在股票分析研究的课题中具有重大贡献。

{title}

2. 研究的基本内容与方案

{title}

本论文基本内容:在获取股票数据信息的前提下,分别选用神经网络、支持向量机、决策树和聚类技术建立数据挖掘模型对股票进行分析与预测应用,建立相应的数据模型,对不同算法之间的预测结果进行比较,并与股票的实际走势进行对比分析。而在进行股票投资过程中,投资者需要解决选择什么样的股票投资与买卖时机两个问题。然而,股票价格的震荡起伏关联因素众多。长期投资者往往更侧重于对上市公司的经营管理状况进行分析,中短期的投资者则着重于对各种不确定影响因素和趋势本身的研究。本文通过对短期投资和长期投资的需求分析,把股票的基本分析和技术分析结合起来,应用到数据挖掘中,从两个方面对股票进行预测和分析。

研究的基本目标:使用合理的数据挖掘算法对股市产生的海量数据进行有效处理。希望运用数据挖掘技术,从大量数据中提取隐藏的信息,分析出有效的信息,并应用于最后的决策中。在股市投资中,则是为了利用技术分析来解决投资者最为关心的如何选择股票和投资时点的问题,为投资者的投资决策提供有价值的参考。

本文拟采用数据挖掘中的神经网络、支持向量机、决策树和聚类技术算法来完成,利用Python语言作为基础来实现相关功能。首先使用Python编写网络爬虫从数据源网站获取有效的数据,然后对数据进行一般性检查和无效值及缺失值的处理来进行数据清洗。对清洗过的数据用关联规则找出影响股票涨跌的重要因素,然后用决策树规则对数据进行分类并挖掘出有投资价值的股票组合,最后使用遗传算法规则找出投资组合中各股票的投资比例。

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

企业微信

Copyright © 2010-2022 毕业论文网 站点地图