基于主成分分析和logstic回归分析的股票价格预测开题报告
2020-04-24 10:15:17
1. 研究目的与意义(文献综述)
随着我国经济的快速发展,金融体系的逐渐完善,股票价格成为了中国绝大多数公民关心的问题,也是经济,系统科学领域研究的热点问题。随着我国加入wto,各方面的贸易制度逐渐完善,股市作为衡量经济发展的重要因素也在与国际看齐和接轨,逐渐走向成熟,规范也成了必然趋势。在国家对证券市场的开放以及政策调控水平的提高的大背景下,投资集团群体和个人利用相应的数学知识和计算机软件预测股市的走向成为了一种自觉的思维活动。投资者们时刻在关心股市、分析股市、试图预测股市的发展趋势,然而影响股票价格的因素很多,其作用机制也相当复杂,令股市的预测非常的困难。主要因为我们缺乏信息对市场影响的传导系统的结构和系统模型,并且不能准确把握金融政策、利率政策、公司状况、国际市场及投资者心理承受能力等因素的变化及其对市场的影响方式和作用。因此,对我国证券投资预测的研究,不仅可以使投资者获得风险既定下的最大收益或收益最大下的最小风险,而且对研究证券价格的形成机制、评价证券市场效率以及对证券市场实施有效监管都具有重要作用。也正因为如此,如何判断或预测股票市场价格走势引起了众多经济金融学家和市场分析人员的极大兴趣,各种预测方法相继涌现,证券投资领域可以说是研究和运用各种预测方法最多的领域之一。股市预测是经济预测的一个分支,它是以准确的调查统计资料和股市信息为依据,从股票市场的历史现状和规律性出发,运用科学的方法,对股票市场的未来发展前景做出测定。2013年10月14日,2013年10月14日,瑞典皇家科学院在授予美国经济学家尤金·法玛、拉尔斯·皮特·汉森以及罗伯特·席勒该年度诺贝尔经济学奖时指出:几乎没有什么方法能准确预测未来几天或几周股市债市的走向,但也许可以通过研究对三年以上的价格进行预测。股票投资方法的预测有大致两种分析方法:基本分析和技术分析,技术分析着重于分析股票价格的波动规律,基本分析侧重于研究股票的长期投资价值。本次研究着重于预测股票指数的的涨跌,运用技术分析的方法就显得更有必要。
随着机器学习和数据挖掘的快速发展,国内科学家以及学者们更加倾向研究神经网络与其他统计学和计量经济学数学模型的结构使用,从而优化设计,得到更好的预测结果。比如肖著等人针对传统bp神经网络在时间序列预测中容易陷入局部极小值(局部最优解)的问题,结合lm算法,建立了三层bp神经网络预测,避免bp算法陷入局部最优。与此同时,他也利用遗传算法对传统bp神经网络神经元连接权值和阂值进行了优化,从而提高模型的精度与准度。利用 matlab进行了实证测试,通过实验对比出改进前后的效果,但是文章中并没有包括数据的预处理,所以略显主观。张品,曹旭等人认为证券的价格波动受到经济、政治和公司经营状况等基本面的影响,各个因素自身还具有模糊性和混乱性,所以,他们选用模糊神经网络来解预测股票价格,建立了基于模糊神经网络的预测模型,同时实证研究了沪深300指数,取得了较为理想的效果,但该神经网络模型仍不具稳定性。台湾的tsung-jung hsieh等将小波变换、人工蚁群算法和周期性bp神经网络相结合。利用小波变换方法将股价数据预处理之后,带入神经网络中训练,最后利用人工蚁群算法优化神经元连接的权值。针对中国股票市场,国内的学者展开了各种研究。总的来说,采用的数据全部都是中国a股市场的股票或指数。但由于中国股市仍属于政策市,并非基于价值取向。这也是国外发达国家与发展中国家的本质区别。所以中国股市的市场化程度并不是很高,所以基于神经网络的技术性分析有一定局限性。我国学者在此并未对出对比研究。
2. 研究的基本内容与方案
2.1基本内容:
首先阐述证券市场股票预测的必要性,证券市场作为我国经济的重要组成部分,与国民的生活和国家政策的制定息息相关。对我国证券投资预测的研究,不仅可以使投资者获得风险既定下的最大收益或收益最大下的最小风险,而且对研究证券价格的形成机制、评价证券市场效率以及对证券市场实施有效监管都具有重要作用。然后分析证券市场中股票价格变动的部分规律和变化理论,阐述证券市场中股票预测在我国的历史发展历程,以及国外的发展发展现状,并且讨论讨论了我国与西方大国之间在证券市场上的发展差距。
然后分析了以主成分分析(pca)为理论依据的选取主成分的基础理论,从诸多上证指数股票历史行情数据中选取合适的主成分。在股票预测以上证指数股票历史行情数据为基础,将历史数据分为训练数据和测试数据,对历史行情数据进行主成分分析,选取合适的主成分,采用logstic回归分析方法预测股价指数次日的涨跌情况,并给出涨跌概率。
3. 研究计划与安排
1-3周:查阅文献,完成开题报告
第1周查阅股票的相关知识,了解各数据和术语代表的含义,并从相关网站上下载上证指数的历史行情数据。
第2周从图书馆和相关网站查询股票预测研究进程的发展,查阅国内外相关文献。
4. 参考文献(12篇以上)
[1] 阮敬.python数据分析基础[m].中国统计出版社.2017.
[2] 华校专,王正林编著.python大战机器学习[m]:数据科学家的第一个小目标.中国工信出版集团:电子工业出版社,2017.
[3] [美]michaael broles著.python机器学习预测分析核心算法[m].沙赢,李鹏译.中国工信出版集团:人民邮电出版社,2017.
[4] 陈俏,梁利利,谢丽娟.股票预测的研究进展[j].商业文化(下半月),2012第6期.
[5] 胡照跃,白艳萍.基于pca-svm组合模型的股票价格预测[j].商洛学院学报,2016年第2期.
[6] 李杰,王建中,胡红萍.基于pca的bp神经网络股票预测研究[j].太原师范学院学报(自然科学版),2011年第3期.
[7] 李斌,林彦,唐闻轩.ml—tea:一套基于机器学习和技术分析的量化投资算法[j].系统工程理论与实践,2017年第5期.
[8] 赵宏宝,孙欣.基于logistic回归法从购物篮数据研究消费状况[j].南阳理工学院学报,2017年第2期.