基于机器学习算法的信用卡违约风险研究文献综述
2020-05-01 08:39:15
个人信用在现如今的社会变得愈来愈重要,它不仅是现代社会的润滑剂和市场工具,同时也是金融活动和发展的衍生基础。
所以个人信用的风险评估也就成为了个人信用体系中的一个重要环节。
本文的最终研究目的将学习利用深度学习法并基于多种因素对个人信用进行分析和评估,并运用Python操作系统对数据进行处理,进一步深化拓展个人信用风险评估的基础理论和方法体系。
从风险管理理论的发展来看,风险管理理论于20世纪30年代萌芽,50年代形成体系,70年代以后逐渐发展成为全球范围内广受认可的一门新兴管理学科,主要和企业经营管理和保险业务相关,而关于信用卡风险管理的内容大量分布于各种不同的报刊杂志上,没有形成系统的、完整的理论[1-2]。
随着国内外对信用评分研究的不断深入,个人信用评分模型也经历了由统计学方法到非参数方法、运筹学方法再到人工智能方法的演变,同时由单一模型到组合模型逐渐演进[3]。
国内的诸多学者主要基于统计学方法法对个人信用评估进行了进一步的研究,logistic模型在现如今的个人信用评价中仍为主流,Logistic 回归模型是研究因变量非连续型变量情况的分析模型。
其中,解决这个问题的核心方法称为极大似然估计法。
在此模型中,我们通常把因变量 Y 定义为:Y=1 违约客户,Y=0 非违约客户,在模型中,如果某客户得到的P的估计值大于0.5,则该客户被认为是违约客户,即 Y=1,反之则 Y=0。
我们可以利用贷款人的历史数据及定量方法,根据贷款申请人的不同特征变量,对申请人还款和违约的行为进行分析;接下来通过交叉表来初步分析自变量和因变量的关联性;将指标引入模型并使用 SPSS统计软件进行 Logistic回归分析;最后根据结果得出logistic方程来对借贷人的信用进行评判[4-8]。
Logistic回归目前在信用评价领域应用最为广泛,从预测结果也可以看出,模型的稳健性是 Logistic 回归的优点,但精度却不是很高,随后李卯[9]将logistic回归和随机森林法进行了对比,结果显示随机森林算法,其模型的训练效果和预测精度都高于logistic回归。