基于股票相似性的投资策略研究与实现毕业论文
2021-11-05 19:35:49
摘 要
在股市中,部分股票在走势上存在一定的相似性,这种相似但又不同步的股价变化关系称为股票之间的领先-滞后关系。对同一板块的股票进行相似性度量,可以利用领先股票为滞后股票提供有力的预测依据,从而帮助投资者设计相对正确的投资策略,获得稳定的收益。
通过对股票之间的领先-滞后关系进行研究,本文提出了一种基于股票相似性的股票投资策略。该方法使用一种新的k-l划分方法,将数据集k-l划分后利用欧式距离进行相似性搜索,然后将搜索结果放入非线性回归模型中预测股票未来的变化情况。
本文随机选取了IT行业板块进行投资策略设计,并在回测系统上对投资策略的效果进行评测。假设对每只股票投入相等的金额,根据预测结果,本文选择了两种投资策略,一种是小周期优先,总体平均涨幅为5.23%。另一种是大周期优先,总体平均涨幅为3.84%。
关键词:时间序列;股票预测;相似性度量;k-l划分
Abstract
In the stock market, some stocks have some similarities in the trend, this similar but unsynchronized stock price changes called the lead-lag relationship between stocks. To measure the similarity of stocks in the same sector, leading stocks can be used to provide a strong forecast basis for lagging stocks, thus helping investors to design relatively correct investment strategies and obtain stable returns.
By studied the lead-lag relationship between stocks, this thesis puts forward a stock investment strategy based on stock similarity. This method uses a new k-l division method to divide the data set and then uses European distance to search for similarity, and then puts the search results into the nonlinear regression model to predict future changes in stocks.
This thesis randomly selected the IT industry sector to design investment strategy, and on the back test system to evaluate the effect of investment strategy. Assuming an equal amount of money is invested in each stock, this thesis chooses two investment strategies according to the forecast results. The first one is small cycle priority, and the overall average increase is 5.23%. The other is a large cycle first, with an overall average gain of 3.84%.
Key Words: Time Series ;Stock Prediction; Similarity Measurement; k-l Division
目 录
第1章 绪论 1
1.1 研究背景 1
1.2 国内外研究现状 2
1.2.1 相似性度量 2
1.2.2 股票预测 2
1.3 研究内容 3
1.4 本文内容框架 3
第2章 股票相似性搜索与预测 4
2.1 时间序列基本概念 4
2.2 常用距离度量方法 5
2.2.1 欧式距离 5
2.2.2 动态时间弯曲 5
2.3 股票相似性搜索 6
2.3.1 股票每日利润率 6
2.3.2 股价模式 7
2.3.3 k-l划分 7
2.3.4 相似性度量方法选择 8
2.3.5 股票相似性搜索流程 8
2.4 基于股票相似性的预测方法 8
2.4.1 影响股票价格的因素 8
2.4.2 基于股票相似性的股价预测 9
2.5 本章小结 9
第3章 数据采集与预处理 10
3.1 股票数据获取 10
3.1.1 Tushare简介 10
3.1.2 股票数据获取 10
3.1.3 特征选择 12
3.2 股票关系 12
3.2.1 行业板块关系 12
3.2.2 领先-滞后关系 13
3.3 股票数据可视化 13
3.3.1 K线图 13
3.3.2 可视化工具 14
3.4 本章小结 15
第4章 实验分析 16
4.1 模型训练 16
4.1.1 训练条件 16
4.1.2 预测模型结构 16
4.1.3 评估指标 17
4.1.4 参数设置 17
4.2 预测结果及分析 18
4.3 投资策略设计与回测 19
4.4 本章小结 21
第5章 总结与展望 22
5.1 总结 22
5.2 展望 22
参考文献 24
致 谢 25
第1章 绪论
1.1 研究背景
近些年来,随着我国的经济的不断发展以及人们文化水平的不断提高,越来越多的人参与到投资理财中来,股票投资成为了一种备受欢迎理财方式。股票投资的主要策略是以较低的价格购买具有增值潜力的优质股票,在未来的某个时间以较高的价格卖出股票,从而获得超额收益。每个投资者都希望自己能在股票市场中获取高收益,但是对于普通投资者而言,仅凭经验和感觉进行投资是不可取的,要想获得稳定收益,就必须找到一个好的投资策略,这要求投资者掌握一定的股票分析方法。
股票预测旨在根据股价历史交易信息以及股票相关的市场信息对股票未来价格涨跌趋势进行预测[1],以帮助投资者做出良好的投资决策。股票市场具有动态性、不可预测性和非线性的特点。股票价格预测是一项艰巨的任务,因为股票价格的变化取决于各种因素,包括但不限于政治条件、全球经济、公司的财务报告和业绩等[2]。为了使利润最大化和损失最小化,分析过去几年的趋势来提前预测股票价值的技术被证明对股票市场的变动预测非常有用[3]。传统上,预测一个组织的股票价格有两种主要方法。技术分析方法是使用股票的历史价格,如收盘价和开盘价、交易量、相邻收盘价等,用于预测股票的未来价格。第二种类型的分析是定性的,它是基于外部因素进行的,如公司概况、市场形势、政治和经济因素、金融新闻文章形式的文本信息、社交媒体,甚至是经济分析师的博客[4]。
随着股票市场的不断发展,产生了大量的股票数据,信息量巨大,信息来源渠道多种多样。通过对股票市场的研究,我们发现,股票市场总是有着很强的相关性,股票价格走势不仅取决于个股走势的历史,而且也取决于其他相关股票的涨跌停板情况[5]。在股市中,部分股票在走势上存在一定的相似性,比如同板块的第二与第三大股之间常常可以看到这一特点。股票之间以一种非同步的方式运动,这种相似但又不同步的价格运动有时称为一组股票之间的领先-滞后关系,这种现象是由于信息传播速度不同而引起的。当股票市场受到新的信息影响时,某些股票的反应快于其他股票,反应快的股票成为领先股票,反应慢的成为滞后股票。对同一板块的股票进行相似性度量,可以利用领先股票为滞后股票提供有力的预测依据,帮助投资者设计相对正确的投资策略,从而获得稳定的收益。