数据挖掘在A股分析预测中的应用研究文献综述
2020-04-14 19:52:04
1.1目的及意义
随着经济社会的快速发展,股市一直受着投资者们的密切关注,掌握股市走势的规律以及是否有办法来对其走势进行预测,一直是人们关注的焦点。近些年来,随着互联网技术的飞速发展,人们可以从网络上得到海量的金融数据,如何运用这些信息也成为了我们密切关注的内容。善用这些金融数据信息,挖掘其内在的有价值的信息,达到为我们的投资提供向导的目的。因此,挖掘数据,对数据进行分析,发现市场潜在规律,成为了一个重要的工作。本次毕业设计的目的就是基于Python软件开发平台,对A股股票数据集进行分析与处理,分析目标股票数据中的潜在信息,一定程度上预测未来股票走向,给我们的投资提供一定程度上的指导
1.2数据挖掘技术的研究现状
数据挖掘(Data mining)又译为资料探勘、数据采矿。它是数据库知识发现(英语:Knowledge-Discovery in Databases,简称:KDD)中的一个步骤。数据挖掘一般是指从大量的数据中通过算法搜索隐藏于其中信息的过程。数据挖掘通常与计算机科学有关,并通过统计、在线分析处理、情报检索、机器学习、专家系统(依靠过去的经验法则)和模式识别等诸多方法来实现上述目标。1989年8月召开的第11届国际人工智能联合会议的专题讨论会上首次出现了知识发现(KDD)这个术语。1997年底,共同促进电子商务发展提案的提出,使得人们越发关注数据挖掘技术。2000年,人们给出了数据挖掘技术的定义:“数据挖掘就是在大型数据库中寻找有意义、有价值的信息”。2012年《时代》周刊指出奥巴马总统连任成功背后两年来相关网络数据的搜集,分析和挖掘,随同大数据时代的来临,共同将数据挖掘技术推上了时代的风口浪尖。当今,人们利用数据挖掘技术,将存在的大量信息数据转化成有用的信息和知识,广泛应用于商务管理,生产控制,市场分析,工程设计和科学探索。
1.3机器学习理论的研究现状
机器学习(MachineLearning, ML)是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。1952年,ArthurSamuel在IBM研发出了会下跳棋的程序。该程序能够观察位置并学习得出一个模糊的模型,指导其为以后的情况做出更好的移动。 Samuel借此反驳了公众关于机器执行的命令不能够超出所写代码并如人类一般学习的认知。他创造了“机器学习(machinelearning)”这一术语。在2000年以前,机器学习的理论主要是基于神经网络,例如1957年,Rosenblatt的提出的Perceptron(感知器)模型,但是随之而来的著名的亦或问题和Perceptron在线性不可分割数据分布的无力,使得神经网络社区的发展停滞。2000年,SVM(支持向量机)的出现,使得机器学习有了巨大的突破。2005年,机器学习迎来了又一次的崛起,神经网络模型拥有了完成许多任务的能力,如物体识别,演讲识别,自然语言处理。深度学习近年来在多个领域取得了令人赞叹的成绩,推出了一批成功的商业应用,诸如谷歌翻译,苹果语音工具siri,微软的Cortana个人语音助手,蚂蚁金服的Smileto Pay扫脸技术。2016年3月,谷歌的AlphaGo与围棋世界冠军、职业九段棋手李世石进行围棋人机大战,以4比1的总比分获胜,使得全世界人的焦点聚集在深度学习领域。
{title}2. 研究的基本内容与方案
{title}2.1研究目标
本次毕业设计将研究如何编写爬虫程序,并利用爬虫技术从网络上获取到我们想要研究的股票数据,并利用机器学习相关算法,分析股票数据的各项指标,挖掘出其内在信息。通过机器学习算法的分析和处理,从而达到挖掘出其内在规律走向的目的。
2.2研究基本内容
(1)学习Python开发平台,学习Python编程语言。