登录

  • 登录
  • 忘记密码?点击找回

注册

  • 获取手机验证码 60
  • 注册

找回密码

  • 获取手机验证码60
  • 找回
毕业论文网 > 毕业论文 > 理工学类 > 数学与应用数学 > 正文

基于贝叶斯网络模型的个人信用评价研究毕业论文

 2022-01-30 20:06:33  

论文总字数:16450字

摘 要

当前时代背景下,大数据越来越深入地改变和影响人们的生活,个人信用在此背景下变得愈加重要。个人的信用评价方法决定了个人信用。信用评价(估)实质上是数据中的分类问题,即将借款人按其属性分为正类客户和负类客户(违约客户),从而评估和预测未来借款人的违约风险。

本文以贝叶斯网络理论为基础,通过IBM SPSS modeler18.0软件,构建基于贝叶斯网络的个人信用评价模型。首先深入研究了贝叶斯网络的理论基础和统计性质。然后介绍了树增强朴素贝叶斯网络分类模型,进而引出本文所采用的方法--树增强朴素贝叶斯方法。其中,由于指标较多,本文又采用随机森林算法对各个指标的重要性进行了预测。

最后,本文以人人贷数据为研究样本建立树增强朴素贝叶斯网络模型,进行实证研究。通过modeler计算出了各个节点的条件概率,并对结果进行了分析。同时通过对样本内和样本外预测精度的考察,验证了本文建立的模型的稳健性。

关键词:贝叶斯网络,随机森林,个人信用评价,树增强朴素贝叶斯网络模型

Research on Personal Credit Evaluation Based on Bayesian Network Model

Abstract

In the context of the current era, Big Data has changed and influenced people's life more and more deeply, and personal credit has become increasingly important in this context. Personal credit rating methods determine personal credit. Credit evaluation (assessment) is essentially a classification problem in data. It means that borrowers are divided into positive customers and negative customers according to their attributes (default customers), so as to assess and predict default risk of future borrowers.

Based on Bayesian network theory, this paper constructs a personal credit evaluation model based on Bayesian network through IBM SPSS modeler18.0 software. Firstly, the theoretical basis and statistical properties of Bayesian network are deeply studied. Then the Tree Augmented Naive Bayesian Network classification model is introduced, and then the method adopted in this paper is called Tree Augmented Naive Bayes Method. Among them, due to the large number of indicators, this paper also uses the random forest algorithm to predict the importance of each index.

Finally, this paper uses the Renren Credit Data as a research sample to establish a tree augmented naive Bayesian network model and conduct an empirical study. The conditional probability of each node was calculated by modeler, and the results were analyzed. At the same time, the robustness of the model established in this paper is verified through the investigation of the in-sample and out-sample prediction accuracy.

Keywords: Bayesian network, random forest, personal credit evaluation, Tree Augmented Naive Bayesian network classification model,

目录

第一章 引言 1

1.1 研究目的及意义 1

1.2 研究相关背景 1

1.2.1 国外相关研究回顾 1

1.2.2 国内相关研究回顾 1

1.3 本文的研究方法及创新点 3

第二章 树增强朴素贝叶斯网络分类模型 4

2.1 贝叶斯定理 4

2.2 贝叶斯网络模型 4

2.2.1 贝叶斯网络简介 4

2.2.2 贝叶斯网络结构形式 5

2.3 树增强朴素贝叶斯网络分类模型(TAN) 7

2.4 变量筛选模型——随机森林模型 9

第三章 基于贝叶斯网络模型的个人信用评价实证研究 11

3.1 模型构建 11

3.1.1 数据选取 11

3.1.2 模型构建 11

3.2 实验结果与分析 13

3.2.1随机森林筛选变量与预测 13

3.2.2 树增强朴素贝叶斯网络结果 15

3.2.3 模型检验 23

第四章 结论与建议 25

参考文献 26

致谢 28

第一章 引言

1.1 研究目的及意义

近年来,人们的消费观随着经济的高速发展也不断地产生了转变。个人信贷问题早已贯穿人们生活的各个方面,比如房贷、车贷等等。然而这些信贷是基于个人信用评估的。信用评估主要就是为授信方提供借款者的相关信息(比如信用与违约概率),进而为授信方提供最终决策依据。

随着市场经济的发展与完善,出现大量的借贷网络平台,P2P就是其中之一。P2P网贷是指借款人与贷款人通过网络借贷平台完成资金的无抵押贷款,其一般流程为:借款人在P2P网贷平台注册,通过对平台的检查,贷款信息(例如贷款的额度、期限和利率)是独立于传统金融机构的一种新的投融资方式,P2P网贷的健康发展既有利于拓宽投融资渠道、降低交易成本和提高金融服务水平,又有利于加快利率市场化进程、提高金融体系的包容性和普惠性。

对于P2P视角下个人信用评价的研究文献非常多,通过不同的方法进行研究,比如LASSO回归模型、社会网络分析法等等。然而通过贝叶斯网络对个人信用评估进行研究的文献少之甚少,而贝叶斯网络对大型且复杂的系统的表达能力简单又高效,早已从之前的人工智能与数据挖掘等领域走出,成为其他领域的研究人员的研究热点。

1.2 研究相关背景

1.2.1 国外相关研究回顾

国外研究贝叶斯网络(BN)比较早,然而研究BN基础性的人较少。Singh和Valtorta 联合提出了一种算法,即混合算法[1] (1993),在BN结构学习中,通过改进 K2[2]算法来决定节点顺序,继而利用依赖分析的方法建立贝叶斯网络结构。Man Leung Wong[3](2008) 等人共同提出一个基于融合改进算法和传统EM算法的初始网络的方法。

1.2.2 国内相关研究回顾

国内研究BN模型及其应用起步较晚,但近来已将BN大规模地应用于模式的分类识别、挖掘数据、处置垃圾邮件和医学上的诊断等方面。例如,宫秀军提出了一种基于BN的增量贝叶斯分类器,并在BN潜在语义的基础之上研究了半监督WEB的挖掘问题[4];李俭川和邓勇研究了BN在模型诊断和故障定位等问题中的应用[5-6];周志远等人共同开展了BN在情报预测中的应用研究[7];李硕豪、张军分析并总结了完备数据情况下BN结构学习的方法[8],并对BN结构的学习流程进行了介绍,同时根据学习的方法的不同对BN学习的方法进行分类;郭春香等人联合建立了BN个人信用评价模型[9],系统阐述BN分类模型及其优缺点,进一步地开展了实证研究,同时与WEST构建的神经网络分类结果进行比较;周国华,彭波使用BN方法分析了建设项目质量管理风险的因素[10]

请支付后下载全文,论文总字数:16450字

您需要先支付 80元 才能查看全部内容!立即支付

企业微信

Copyright © 2010-2022 毕业论文网 站点地图