基于文本挖掘的股市趋势预测研究开题报告
2021-12-27 21:33:08
全文总字数:1621字
1. 研究目的与意义及国内外研究现状
大数据时代背景下,数据信息蕴含着极大的价值。近年来,随着股市和互联网的发展,财经资讯成为热门话题,广大股民通过网络媒体获取最新的财经报道后,了解了股市行情,同时通过社交网站例如股票贴吧等进行经验交流,综合专家和股民朋友的综合建议后,作出最终的决策。
本文所述的股票价格预测系统,是基于文本挖掘技术的一种研究。先采集股票资讯和股评信息,采用文本挖掘技术和情感分析技术分析投资者情绪,结合股票价格走势分析投资者情绪与价格的关系,预测价格走势,以便对投资者的投资行为给予相应的建议,指导他们进行理性科学地决策。
国内外研究现状
对于自然语言的处理研究历史较短,存在较大的研究空间。国外在此方面的研究较为突出。国际上一些发达国家,已把对自然语言的处理当成人工智能和计算机的核心课题来重点研究。brendan oconnor等人采用文本挖掘技术挖掘tweets的用户情感,调查在2008年到2009年期间消费者信心和政治观点,发现他们与在twitter消息中的情绪词频率有关。在一些情况下,相关性高达80%。消费者信心和政治观点,也可以预测未来投票的民意。
2. 研究的基本内容
首先,通过对大数据文本挖掘技术的研究,确定系统构架的设计以及处理流程,进而明确系统实现的方法。
其次,采集关注度较高的股票的资讯、评论以及股票价格走势,采用文本挖掘技术,对资讯、股评进行分词、结构化,提取出关键词。
接着,筛选出关键词中的情感词,对这些关键词进行情感词性标注,根据相应算法量化出文本的情绪指数。
3. 实施方案、进度安排及预期效果
2016年2月:阅读相关文献,了解毕业论文框架以及流程,进行知识储备
2016年3月:学习编程以及文本处理、量化的方法;对需要处理的数据进行统计
2016年4月:量化文本的情绪指数、建立回归模型
4. 参考文献
[1]孙绍峰.《财经咨询的多维分类聚合技术在股市中的应用研究》.北京交通大学.2014
[2]卢瀚.《投资者关注度与股票市场表现——基于百度指数的相关性分析和交互效应分析》.南京大学,2016
[3]王东东.《大数据背景下投资者关注对“一带一路”概念股预测能力的实证检验》.2015