基于神经网络的信贷记录数据挖掘算法设计毕业论文
2021-03-13 22:25:37
摘 要
近些年来,金融机构对客户的信用风险评估越来越受重视,因此本文提出了预测资产是否违约的多个模型,并且建立集成模型来提高模型预测准确性。本文分别采用了传统逻辑回归模型、反向传播神经网络模型和卷积神经网络模型来构建集成模型,对待测评资产进行违约预测,所得结果对于金融机构具有重要的指导意义。
研究结果表明:大量数据情况下,神经网络模型和逻辑回归模型在信用风险评估中都具有较高的预测准确率,小批量数据下神经网络模型较逻辑回归模型而言有一定的优势。神经网络模型和逻辑回归模型均可以较为准确的预测出大量资产情况下违约的笔数,训练出的模型预测准确性较高,可用性较强。
本文的特色:训练卷积神经网络模型进行信用风险评估;构建集成模型提高模型预测的准确性。
关键词:信用风险评估;反向传播神经网络模型;卷积神经网络模型;逻辑回归模型
Abstract
In recent years, the credit risk assessment of financial clients has been paid more and more attention. Therefore, this paper proposes multiple models to predict whether or not to default, and establishes an integrated model to improve the accuracy of model prediction. In this paper, the traditional logical regression model, the back propagation neural network model and the convolution neural network model are used to construct the integrated model to carry out the default forecasting of the assets. The results are of great significance to the financial institutions.
The results show that the neural network model and the logistic regression model have high prediction accuracy in the case of a large number of assets in the credit risk assessment. In the small batch data, the neural network model has some advantages over the logistic regression model. Both the neural network model and the logistic regression model can predict the number of defaults in the case of a large number of assets. The trained model has higher prediction accuracy and stronger availability.
The characteristics of this paper: training the convolution neural network model for credit risk assessment; constructing cluster model to improve the accuracy of model prediction.
Key Words:Credit risk assessment;Back propagation neural network model;Convolution neural network model;Logical regression model
目 录
第1章 绪论 1
1.1 研究的目的和意义 1
1.2 国内外研究现状 2
1.2.1 国外研究现状 2
1.2.2 国内研究现状 2
1.3 研究内容及预期目标 3
第2章 系统方案设计 4
2.1 系统设计任务及要求 4
2.2 方案设计及选择 4
2.2.1 后端模块方案设计与选择 5
2.2.2 前端模块方案设计与选择 6
2.2.3 前后端通信服务模块方案设计与选择 6
2.3 总体方案 7
第3章 系统后端设计 8
3.1 数据接口 8
3.1.1 数据获取 8
3.1.2 数据预处理 9
3.2 评价指标 10
3.2.1 预测准确性 10
3.2.2 混淆矩阵 10
3.2.3 AUC 11
3.3 机器学习算法 11
3.3.1 逻辑回归 11
3.3.2 反向传播神经网络 13
3.3.3 卷积神经网络 17
3.3.4 集成学习方法 20
3.3.5 平均影响值算法 21
第4章 系统前端及前后端通信服务设计 22
4.1 系统前端设计 22
4.1.1 训练模型模块 22
4.1.2 模型应用模块 24
4.2 前后端通信服务设计 25
第5章 系统调试及分析 26
5.1 系统调试 26
5.2 模型对比分析 27
5.2.1 小批量数据 27
5.2.2 大量数据 29
第6章 总结 32
参考文献 33
致 谢 34
第1章 绪论
1.1 研究的目的和意义
互联网金融的快速发展正在不断的改变人们的生活方式,从早期的第三方支付到现在的互联网实质性金融业务,在相对较为宽松的政策环境、技术支持和消费诉求下,互联网金融展现出其强劲的生命力。互联网金融的发展模式包括众筹、P2P网贷、第三方支付、信息化金融机构、互联网金融门户和大数据金融[1]。诸多金融产品能够风靡市场的背后原因是互联网企业的科技创新和受到金融机构和用户共同关注的风险控制工作。互联网金融公司在不断的发展,并且越来越受欢迎,因为他能为传统金融机构所不能服务的人群提供一些独有的服务,而能提供这些独有服务的核心关键是当今备受投资人关注的风险控制能力,尤其是互联网金融信用风险评估机制。信用风险评估机制一般是依照“5C”模型建立的,分别是能力、品质、抵押、资本和条件,从这5个方面对客户的还款意愿和能力进行评估,从而确定风险程度,具体含义如下:
- 能力:指客户还款的能力,即一笔借款能否按期还款的客观因素,通常以用户的收入水平、职业性质、所在职位、婚姻状况和个人信用等作为主要指标。
- 品质:指客户还款的意愿,也指还款的意念和想法,通常从客户的不良信用记录、生活习惯和违约成本等方面考虑。
- 抵押:指客户发生违约行为时通过抵押来偿还债务,这对于没有信用记录的客户是极为重要的
- 资本:指客户的经济实力和经济状况,一般用客户收入反应客户的经济背景。
- 条件:指可能会导致客户违约的经济环境,比如客户在经济困难时期的消费记录等。
由于从企业获取到的数据有限,并没有涵盖“5C”模型的所有方面,本文从客户维度(能力、品质)和贷款维度(资本)两个角度建立信用风险评估模型。
对金融机构来说,信用风险评估极为重要:金融机构一直以来都在考虑客户的信用风险,以便在特定时期就是否向客户放贷以及放贷额度等问题上做出正确的决策,帮助这些决策的模型称为信用风险评估模型,可用于进行信用风险评估的信息包括申请人的申请表单和申请人信用参考机构持有的信息。信用风险评估模型分析申请人的客户维度信息和贷款维度信息将该笔资产分为违约资产或正常资产,正常资产很有可能在还款期间偿还债务责任,而违约资产很有可能在还款期间发生逾期行为。如果客户晚于计划日期还款,发生逾期行为,那么金融机构就会面临一定的风险损失,基于这种情况,如果能准确评估客户的信用风险,就可以使金融机构更大限度盈利的同时,尽量免受因客户违约造成的损失,创造更多的经济价值[2]。