GARP量化选股策略模型开题报告
2020-02-28 00:32:11
1. 研究目的与意义(文献综述)
1950 年量化投资在国外开始出现,国外学者在对数据进行量化处理的同时,对于量化和投资的融合逐渐开始研究,但由于数据量过大,量化投资发展较为缓慢,而真正意义上的量化投资基金直至 2004 年才开始出现。随着计算机技术的快速发展,国内各大券商开始对量化基金和量化选股进行了深入研究,并逐渐推出量化基金产品,但对于我国个人投资者来说量化投资的概念是在 2008年金融危机之后才被熟知。
股票市场千变万化,人脑判断的浅薄显而易见,而且由于人性本身的缺陷,总是容易犯错误。市场的投资者越多,投资的不确定性越大,大部分时间处于未知的状态,无法判断未来会怎样,唯一能做的就是把握大概率的己会,并且把控制风险和资金管理放在首位。量化投资是通过一种理性的方式,通过程序选出股票,实现一种大概率化的投资,最大限度的克服热型的恐惧和贪婪。
garp 策略即growth at a reasonable price(合理价格成长投资策略)是一种混合选股策略,它将两大主流策略——成长策略和价值策略有机结合。其核心投资思想是高成长和低价格之间寻求平衡,目标是找寻具有持续增长潜力但价格合理或低估的股票。与成长策略投资者类似,garp 投资者非常关注公司未来盈利增长情况,那些具备高速成长潜力的公司股票更受garp 投资者的青睐。但这仅仅是一个方面,garp 策略亦重视股票的投资价值,采用该策略的投资者并不会无视股票价格而一味追求企业的高成长性。从这个意义上来说,garp 策略兼顾股票的成长性和投资价值,试图挖掘股票价格明显低于公司内在价值的成长型股票的投资机会,并在实现股票价值回归和高速成长带来的双重收益的同时有效地控制了风险。另外,本文以多因子选股模型来选取有效稳定的古兹因子和成长因子,可以大大地加强对信息的使用效率和挖掘的深度。
2. 研究的基本内容与方案
GARP策略通过市盈率、市净率、PEG、净利润增长率、营业收入增长率,每股收益增长率,净资产收益率多个指标评估投资标的的估值水平、成长潜力,并且在基本面分析的基础上借由数量化选股模型进行分析、筛选择出合适的品种构建股票池。数量化投资方法大大增强GARP 策略对信息的挖掘深度和使用效率,选股过程也更为客观、理性、透明,从而较好地弥补了仅依赖基本面研究的传统投资方式的局限性。
1. GARP指标的选取
a) 价值指标旨在寻找低估值的股票构建组合。这里我们选择市盈率pe和市净率pb作为价值指标。
b) 成长指标只在寻找高增长的股票构建组合。这里我们主要选择净利润增长率nprg、主营业务收入增长率mbrg、每股收益增长率epsg和净资产收益率roe作为成长指标。
c) 由于我们选择的多元线性回归模型不允许各个变量因子之间存在关系且pb=pe*roe,所以价值指标我们选择为pe和roe,成长指标我们选择为nprg、mbrg和epsg。
表1 GARP选股指标
分类 | 指标 | 定义 |
价值指标 | Pe | k.close_price(收盘价)/eps(每股收益) eps=归属于普通股股东的当期净利润÷当期发行在外普通股的加权平均数。具体时间为每小组选择的是具体时间。Eps可直接从tushare中获取。 |
Roe | 净利润/公司股东权益,可直接从tushare中获取。 | |
成长指标 | Nprg | (当期净利润-上期净利润)/上期净利润*100%,可直接从tushare中获取。 |
Mbrg | (本期主营业务收入-上期主营业务收入)/上期主营业务收入*100%,可直接从tushare中获取。 | |
Epsg | (本期每股收益-上期每股收益)/abs(上期每股收益)*100%,可直接从tushare中获取。 |
技术方案
TuShare是一个免费、开源的python财经数据接口包。主要实现对股票等金融数据从数据采集、清洗加工到 数据存储的过程,能够为金融分析人员提供快速、整洁、和多样的便于分析的数据,为他们在数据获取方面极大地减轻工作量,使他们更加专注于策略和模型的研究与实现上。
利用python编码计算涨幅,分别找出各个季度以来,每季度涨幅最大(此涨幅不包含除权造成的虚假涨幅)的前50只股票,总计400只,利用python第三方数据库tushare获取该400只样本股的预备指标、价值指标和成长指标。
从挑选出来的400只样本股的指标值来确定GARP策略的指标值,首先利用四分法确定各个指标的合理取值范围,剔除异常值。其次,先利用roe对股票进行筛选,再利用多元线性回归模型对股票进行打分,Score=w0 w1*pe w2*pe w3*nprg w4*mbrg w5*epsg.在模型中已经默认使用75%的数据来进行训练得出w0,w11,w2,w3,w4,w5,利用25%的数据来进行测试,以均方根误差来作为判断标准。
由于tusahre中pe,pb数据不能获取较多的bvp数据,无法计算pb值,而且多元线性回归模型中不允许各个自变量因子之间存在关系,因此我们采用roe对pb来进行替代。Pb=pe*roe,因此我们现在的预备指标为roe,价值指标为pe,roe,成长指标为nprg,mbrg和epsg。模型确为:Score=w0 w1*pe w2*roe w3*nprg w4*mbrg w5*epsg。
3. 研究计划与安排
第1-4周:收集和整理资料。
第5-6周:拟定提纲,提交开题报告。
第7-13周:撰写论文初稿和修改稿,保持与指导教师的沟通。
4. 参考文献(12篇以上)
[1]闻云. 嘉实garp策略基金迎来业绩爆发[n]. 经济参考报,2017-08-25(015).
[2]本报记者 徐文擎. 嘉实garp策略组:寻找长跑潜力股[n]. 中国证券报,2017-04-11(a07).
[3]杨阳.嘉实基金garp策略组:寻找潜力股 构建高信念组合[j].股市动态分析,2017(13):54.