随机森林算法在股票优选中的应用开题报告
2020-04-12 09:01:50
1. 研究目的与意义(文献综述)
选择优资股票是股票投资中的关键抉择部分,是正确投资的必要选择,所谓的优质股票指的是股市中投资回报高,抗风险能力强,成长性好的优良股票。而股票的价格受到诸多因素的影响,表现出“毫无规律变化”的随机游动特性,因此选择其中的优质股票的难度比较大。在股票优化和选择问题中,主要可以归为两方面:影响价格的维度选择,即多个维度指标体系的决定和选择模型分类算法的确定,本文选择随机森林算法,解决股票投资中选择优质股票的实际问题。
随机森林(random forest) 是集成学习 (ensemble learning) 算法的一种,它利用多棵树对样本进行训练并预测的一种分类器,同样也可用户回归,其输出的类别是由个别树输出的类别的众数而定。 该算法最早由leo breiman和adele cutler提出, 而”random forests”是他们注册的商标。这个术语是1995年由贝尔实验室的tin kam ho所提出的随机决策森林(random decision forests)而来的。简单来说,随机森林就是由多棵cart(classification and regression tree)构成的。对于每棵树,它们使用的训练集是从总的训练集中有放回采样出来的,这意味着,总的训练集中的有些样本可能多次出现在一棵树的训练集中,也可能从未出现在一棵树的训练集中。
2. 研究的基本内容与方案
研究的基本内容:
-
选取某一类型股票,采集其近几年(3年)来的数据信息,
-
对数据信息进行预处理,得到有效数据
剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!3. 研究计划与安排
- 学期末,选题
- 寒假期间,自学了解并掌握随机森林算法原理和股票优化方法知识
- 1-3周,查阅文献,完成开题报告
- 4-6周,总体设计,完成论文综述
- 7-10周,设计算法,功能模块设计
- 11-13周,编码和测试,并修改完善
- 14-15周,写论文,提交初稿,给老师检查,修改定稿,答辩
4. 参考文献(12篇以上)
1.加权随机森林算法研究.杨飚等.微型机与应用.2016.3:28-30.
2.基于云计算平台的随机森林算法的研究与实现.于延等.科技通报.2013,vol.29(4),50-52.
3.correlation and variable importance in random forests.
剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付 -