基于随机森林方法的投资组合分析开题报告
2020-04-05 10:57:27
1. 研究目的与意义(文献综述)
1.项目背景及研究意义
1.1 研究背景及意义
十九世纪九十年代以来,随着我国资本市场的不断发展壮大,资本市场对国民经济的影响显著增强,资本市场已经成为我国经济生活中的重要组成部分,越来越多的投资者进入到资本市场之中。
harrym.markowitz(1991)提出的均值-方差现代投资组合理论,对为什么要进行分散化投资以及怎样进行分散化投资提供了深刻的阐述,这也为指数化投资策略的出现奠定了基础。自20世纪50年代现代投资组合理论诞生之后,传统的以股票选择和时机选择为主的积极投资管理策略变得逐渐不受推崇。尤其是20世纪70年代以来,以指数化投资为代表的消极投资策略开始出现。随着指数化投资的增长,新型指数化投资产品的涌现,投资者们有了更多且简便易行的选择。研究指数化投资对于促进我国资本市场的稳定发展具有重要的现实意义。
随机森林(random forest)是breiman(2001)提出的一种统计学方法。随机森林作为一种优良的变量筛选方法,在生物信息学、生态学、医学、天文学等方面都有着广泛应用。而随机森林在金融经济领域的应用也在不断发展。利用随机森林在变量重要性度量和变量筛选中的优势,将其应用到指数化投资的投资组合的构建中,可以丰富分层抽样指数化投资的内容,同时也扩展了随机森林在金融领域的应用。
2. 研究的基本内容与方案
2.2技术方案
2.2.1分层抽样法
分层抽样法是一种两阶段优化法,即第一阶段是抽样,第二阶段则是权重的优化再配置。其选择投资对象的过程分为两个步骤:首先,将市场上所有证券按某一特征分成几个或几十个互不影响的行业类别,以不同行业类别在目标指数中所占的权重来决定在该行业类别内的投资量;然后,分别从每个行业类别中按照与行业整体相关性、总市值及市盈率水平等有关指标的综合评价结果,选取最能代表该行业类别的样本证券构造投资组合来拟合目标指数。当行业的划分比较适当的时候,采用分层抽样法可以对市场变化的主要部分进行较好的控制。
可见,分层抽样法在两个不同的步骤上分别结合了完全复制法和优化抽样法的长处,同时又巧妙地回避了两者的不足之处,使其成为一种较为实用有效的方法。当然,如果行业的划分不科学,使用分层抽样法同样难以取得满意的效果。因此,合理的行业划分是分层抽样法中最重要的环节。
3. 研究计划与安排
| 任务内容 | 时间节点 |
1 | 查阅文献,了解综合评价方法及国内外研究现状并完成开题报告; | 第1-3周 |
2 | 总体设计,深入学习理论基础,精读重要参考文献,确定文章总体思路并完成论文综述; | 第4-6周 |
3 | 设计算法程序,完成功能模块的设计; | 第7-10周 |
4 | 编程进行测试,与实际情况进行核对; | 第11-13周 |
5 | 提交论文初稿,给老师检查后修改定稿,答辩。 | 第14-15周 |
4. 参考文献(12篇以上)
[1] 范旭东. 跟踪误差与优化指数投资策略[d]. 西南财经大学, 2006.
[2] 韩燕龙. 基于随机森林的指数化投资组合构建研究[d]. 华南理工大学, 2015.
[3] 马骥. 指数化投资[d]. 吉林大学, 2004.