股票数据预处理与时间序列分析模型毕业论文
2020-04-21 16:58:44
摘 要
我国股票市场的规模在不断发展壮大,目前,在上海证券交易所上市的公司超过一千家近1700 家。与此同时,家实体企业逐步扩大,最终涵盖市场的各行各业,为大量融资支持,为我国国民经济的发展提供了动力与源泉。
股票数据以天为单位,且具有固定的数据格式,是一类具有时间序列的数据。证券市场时时刻刻都在产生大量的数据,需要处理这些海量的数据,找出其中的规律,并利用这些规律来指导投资者的决策。
本文对时间序列分析模型探讨。文章首先分析了国内外对于证券行业股票的研究成果,探讨处理大量数据的数据挖掘方法。然后介绍了股票数据获取的方法,概述了股票数据预处理的基本方法。第三章重点介绍了时间序列分析模型的基础理论知识和基本模型,在第四章利用所介绍模型对沪深300指数日收益建立合适的模型进行拟合,进行实证分析,并得出结论。
关键词: 数据挖掘,股票分析,时间序列分析,股票预处理
Abstract
After decades of development, k market has been gradually developing and expanding.Shanghai stock in shenzhen . Similarly, after decades of development, China's listed companies gradually expanded from the first few entity enterprises, and finally covered all sectors of the socialist market economy, providing financing support for a large number of companies and providing power and source for the development of China's national economy.
Stock data is a kind of data with time series, which takes days as unit and has fixed data format. The securities market produces a large amount of data all the time, so it is necessary to process these massive data, find out the rules, and use these rules to guide the decisions of investors.
This paper brieflyof time series Firstly, this paper analyzes the research results of stock in securities industry at home and abroad, and discusses the data mining methods to deal with a large number of data. Then the method ofstock data is introduced and the basic methods of preprocessing are summarized. The third chapter mainly introduces the basic theoretical . In the fourth chapter, an appropriate model is established to fit the daily earnings of csi 300 index, and an empirical analysis is carried out to draw conclusions.
Keyword: Data mining,Stock analysis,Time series analysis,Stock preprocessing
目录
摘要 II
Abstract III
目录 IV
绪论 1
1.1 论文研究背景和研究的意义 1
1.2有关研究内容的国内外研究现状 2
1.3 论文的主要研究内容及其框架 3
第二章 股票数据获取和预处理 4
2.1股票数据的获取 4
2.1.1 基于Tushare库获取沪深300股票数据 4
2.1.2 基于聚宽(JoinQuant)获取沪深300指数数据 4
2.2股票数据预处理 5
2.2.1 数据标准化(Normalization) 5
2.2.2 min-max标准化 (Min-max normalization) 5
第三章 时间序列分析的基本模型 6
3.1时间序列分析方法简介 6
3.2 时间序列模型的预处理 6
3.2.1 平稳性检验 6
3.2.2 纯随机性检验 7
3.3 ARMA模型 7
3.3.1 模型定义 7
3.3.2 模型的统计性质 8
3.3.3 建立模型的步骤 9
3.4 ARIMA模型 9
3.4.1 差分运算 9
3.4.2 模型定义 10
3.4.3 建立模型的步骤 11
3.5 ARCH和GARCH模型 11
3.5.1 ARCH模型 11
3.5.2 GARCH模型 12
第四章 沪深300指数的实证分析 13
4.1 数据的选取 13
4.2数据的预处理 13
4.3 模型定阶 14
4.4 参数估计及分析 15
4.5 实证结果 16
第五章 结论与建议 17
参考文献 17
附录 19
致谢 22
绪论
1.1
,越来越多的人们选择购买股票。上海证券交易,促进替代的重要作用,,健康发展的重要平台,为我国国民经济的发展提供了不竭的动力与源泉。
我国的A股市场已。国有,国有资产增值效应明显,在业板的上市公司的要求建立现代发展方向的科技型创新提供了重要支持。
时间序列分析是量化定时间内按某个变量的取值序列,通过对时间序列的观察、研究和分析,寻找数据之间的变化规律,时间序列分析通过数据的处理,建立相应的时间序列分析模型,在模型拟合之后再去对股票进行预测分析。在金融学领域,具有深远意义,时间序列分析研究的是,时间序列分析在工程学、。
人们通过时间法从基础的方法开,且在很多得领域之中发挥着至关重要的作用。一个热门的研究领域,,时间序列预测发确的预测是人们不断追求的目标。研究工作者一直致力于该问题的研究。逐步的出现与完善,时间序列分析和预测方法依托于此,得到了进一步的发展。但其效果在很多题需要解决。
股票市场的特征是高风险和高收益并存,对于股票投资者们来说,要时刻关心股市的情况减少投资的风险,就是如何。股票投资者通过对股票的正确预测来进行有益的投资,既可以推动国家的经济发展,自己又获得了丰厚的经济利益。正是由于股市高收益与高风险并存的特性,如何最大程度的取得高收益,规避高风险成为人们密切关注的问题。所以对于股票数据的的建模预测对于股票预测和经济发展具有极其重要的意义。
1.2有关研究内容的国内外研究现状
股票数据以天为单位,且具有固定的数据格式,是一类具有时间序列的数据。证券市场时时刻刻都在产生大量的数据,需要处理这些海量的数据,找出其中的规律,并利用这些规律来指导投资者的决策。