XGBoost在选股中的应用开题报告
2023-02-20 18:28:35
1. 研究目的与意义
近年来随着世界各地产业的不断创新、发展与升级,金融业也随之产生巨大的变化,具体体现在股市上就是主观预测与技术性指标的失灵,这是因为新兴产业相继崛起,这些产业与传统产业的运作模式不同,没有先例来作参考和研究,所以各个产业之间存在的隐秘的掣肘制衡关系难以发现和解释,因此股市走向愈发错综复杂,而仅靠某个专家的观点和单个技术性指标都不足以解释股市变化形势,更别说仅靠这些观点和技术性指标来有效筛选、选择股票,因此在股市分析的领域里,传统的定量因素模型已经过时,不再具备有效分析和预测股市的能力。同时股市体量愈发庞大、复杂,仅依靠统计软件已难以对股市数据做详实、全面的分析,因此机器学习作为先进的模型方法为愈发复杂的股市提供了可靠的分析方式。XGBoost算法是基于GBDT优化后的一种算法,是一种高效的机器学习集成算法,适用于庞大繁杂的数据的处理、分析。本研究将在现有中国股市背景下,探究XGBoost在选股方面如何应用。
2. 研究内容和预期目标
xgboost是基于梯度提升决策树的改进的算法,可以对庞大的数据进行高效的分析与处理,它利用弱分类器迭代提高了预测准确率,加上其具有良好的鲁棒性和运算速度快,使得其在很多领域都得到了深入应用。本研究从xgboost本身的性能入手,逐步探究其在当今中国股市的选股中可以得到哪些应用、如何应用以及针对既有问题如何解决、优化。
研究内容:xgboost在当今中国股市的选股中可以得到哪些应用、如何应用以及针对既有问题(过拟合)如何解决、优化。
3. 国内外研究现状
(一)国外研究综述
国外对于量化选股的研究相比于国内来说较成熟。在量化投资领域,国外学者深入和系统的研究成果对量化投资在国内发展提供了很好的参考。然而,国内市场体制与国外成熟市场相比并不相同,我国金融市场的有效性还未有明确定论。所以,在国内研究相关领域时可以借鉴海外成熟的研究方法,但也要综合考虑我国目前的经济状况与市场体制。
4. 计划与进度安排
2022年1月5日 至 2022年3月31日完成初稿和中期检查
2022年4月1日 至 2022年5月10日 完成论文修改,定稿
2022年5月11日 至 2022年5月30日准备及参加论文答辩
5. 参考文献
[1]曹维凡. 基于boosting算法的股票量化多因子选股研究[d].浙江工商大学,2021.
[2]张璟航. 基于xgboost的价值量化选股策略研究[d].西北大学,2021.
[3]王怡宁. 基于xgboost的高频交易选股研究[d].东华大学,2021.