登录

  • 登录
  • 忘记密码?点击找回

注册

  • 获取手机验证码 60
  • 注册

找回密码

  • 获取手机验证码60
  • 找回
毕业论文网 > 毕业论文 > 理工学类 > 统计学 > 正文

大学生网贷信用风险评估研究毕业论文

 2020-02-15 22:54:47  

摘 要

近些年来,网贷业务得到快速发展,但是在发展过程中也出现了一些问题,这其中最重要的是借贷人的信用风险,因此对借贷人的信用风险评估显得尤为重要,本文针对大学生这个特殊的群体,构建一套适合大学生的信用风险评价指标体系,并且通过结合Lasso算法的Logistics回归模型构建了大学生信用风险评价模型,通过回归模型得到影响违约的主要指标,并且基于以上研究内容给出相应的建议意见。

首先,本文依照系统性、典型性、简明科学性、可比、可操作、可量化以及客观公正性的原则,参考个人信用风险评价指标体系以及相关大学生信用风险的研究,将个人信用风险评价的指标大学生化,最终从大学生的基本信息、信用历史、借贷特征以及平台评价四个方面构建了大学生信用风险评价体系。

其次,本文通过比较分析多种信用评分模型,发现Logistic回归模型适用于大学生信用评价,通过结合Lasso算法对评价指标进行筛选,最终构建了大学生信用风险评价模型,为了方便模型的构建,本文先对指标数据进行量化处理,然后运用R软件中的Glmnet程序包对获得的指标数据进行分析,得到了影响大学生违约率的指标变量有:性别、学历、户籍省份、违约次数、违约金额、借款的利率、信用分。

最后,结合前文的研究,从网贷平台、平台投资者以及大学生借贷者三个方面分别提出了相应的建议意见,促进大学生网贷市场的良好发展。

本文将Lasso算法与Logistics回归模型相结合,降低了模型的复杂性,使得到的模型更加简单,运算结果更快,模型的解释效果更好,预测的准确性也更好。

关键词:大学生网贷;信用风险评价;Lasso-logistic回归;R软件

Abstract

In recent years, online lending business has developed rapidly, but there have been some problems in the development process. The most important of these is the credit risk of borrowers. Therefore, the credit risk assessment of borrowers is particularly important. A special group is used to construct a set of credit risk evaluation index system suitable for college students. The credit risk evaluation model of college students is constructed by using the Logistic regression model of Lasso algorithm. The main indicators affecting default are obtained through regression model, and corresponding suggestions are given based on the above research content.

First of all, based on the principles of systemic, typical, concise scientific, comparable, operable, quantifiable and objective and fair, this paper refers to the personal credit risk evaluation index system and the related credit risk research of college students, and the indicators of personal credit risk evaluation. In college students, the credit risk evaluation system of college students is constructed from four aspects: basic information, credit history, loan characteristics and platform evaluation.

Secondly, this paper compares and analyzes multiple credit scoring models and finds that the logistic regression model is suitable for credit evaluation of college students. By combining Lasso algorithm to screen evaluation indicators, the credit risk evaluation model of college students is constructed. In order to facilitate the construction of the model, this paper firstly The indicator data is quantified, and then the Glmnet package in R software is used to analyze the obtained index data, and the index variables that affect the college students' default rate are: gender, education, household registration, number of defaults, default amount, the interest rate of the loan, and credit score.

 Finally, combined with the previous research, it puts forward corresponding suggestions from the three aspects of online lending platform, platform investors and college borrowers to promote the good development of college students' online loan market.

This paper combines the Lasso algorithm with the Logistics regression model, which reduces the complexity of the model, simplify the model, make the operation result is faster, the interpretation effect of the model is better, and the prediction accuracy is better.

Key Words: College student online loan; credit risk assessment; Lasso-logistic regression; R software

目 录

摘 要 I

Abstract II

第1章 绪论 1

1.1 研究背景与意义 1

1.1.1 研究背景 1

1.1.2 研究意义 1

1.2 国内外研究现状 2

1.3 研究内容及方法 3

1.4 本文组织结构 4

第2章 大学生网贷信用风险评价指标体系 5

2.1 构建评价指标体系的原则 5

2.2 指标筛选思路 5

2.3 指标的选择与说明 7

2.3.1 大学生基本信息 7

2.3.2 大学生信用历史 8

2.3.3 大学生的借款特征 8

2.3.4 平台评价 8

第3章 大学生信用风险评价模型的构建与分析 10

3.1 数据来源及预处理 10

3.1.1 样本数据的来源 10

3.1.2 样本数据的预处理 10

3.2 信用评分的主要模型 11

3.2.1 判别分析 12

3.2.2 Logistic回归分析 12

3.2.3 决策树法 12

3.2.4 神经网络方法 12

3.2.5 四种方法的比较分析 13

3.3 Lasso-logistic回归模型 13

3.3.1 Lasso理论 13

3.3.2 Lasso-logistic模型 14

3.3.3 模型计算步骤 15

第4章 大学生网贷信用风险评价模型的实证分析 16

4.1 原始数据的采集 16

4.2 描述性统计 16

4.3 指标量化处理 17

4.4 变量选择与模型构建 18

4.5模型的准确度 21

第5章 对策与建议 22

5.1 对平台的建议 22

5.2 对平台投资者的建议 22

5.3 对大学生借贷者的建议 23

第6章 总结与展望 24

参考文献 25

致谢 27

第1章 绪论

1.1 研究背景与意义

1.1.1 研究背景

P2P作为一种新型借贷方式,它允许个人在基于互联网的平台上直接贷款或相互借贷,而无需传统的金融中介的介入,它具有门槛低,使用快捷,利润高等特点,在此基础上,它的发展受到许多个人投资者以及借贷者的热烈欢迎,然而,在其快速发展的过程中同样存在着许多问题,如平台出现的跑路、倒闭现象,目前还没有明确的法律政策去限制解决这一问题,但对于平台投资者来说,最重要的还是借贷人的信用风险[1-2],借贷人作为借贷过程的主体,他的信用决定了最终的还款与否,因而对借款人的信用分析就成为风险控制的主要内容。

大学生作为一个具有良好价值观的群体,具有良好的信誉,但是恶性网贷事件[3]却在大学生身上频发,说明大学生对P2P网贷这种新型的贷款方式不够了解,也说明网贷平台缺乏科学性规范性的风险评估体系去限制不良贷款,而传统的商业银行信用风险评估体系并不适用于大学生这一群体,因此一个针对大学生可靠的风险评估体系就显得尤为重要。

1.1.2 研究意义

通过对大学生网贷的信用风险[4]评价,能够了解借贷人的基本信息与信用风险,对网贷平台加强管理以及平台投资者合理放贷都有一定的借鉴作用。

对于网贷平台,通过构建合理的信用风险评价指标体系与评价模型,能够在平台收集借贷人的信息过程中起到一定的指导作用,促使平台设计更加合理有效的信息收集系统,为平台的风险控制提供相应的理论基础,进而减少违约事件的发生,保障平台交易的正常进行。

对于平台投资者,尽可能多的了解借贷人的基本信息,了解借贷人的信用风险,对他的投资具有重大的意义,不仅能够指导自身更好的分配投资来获取最大的收益,也能最大的减少违约带来的风险,保障自身的利益不受到损害。

对于网贷平台与平台投资者双方,网贷平台能够吸引投资人前来投资,避免出现投资人的流失给平台带来的风险隐患,保障网站能够持续运营,而投资人也能通过自己的投资获得了相应的利益,双方实现共赢,这样才能保障平台更好的运作,为平台以及投资者带来更好的效益。

1.2 国内外研究现状

网贷作为一种新型的金融模式,由于其快捷、便利的优势得到快速的发展,但是同时也因存在较大的风险而为人诟病,这其中有关借贷人信用风险评价以及借贷人的违约概率的研究显得十分重要,为解决这一问题,国内外相关专家学者都对其进行了广泛研究,在于个人信用风险评价以及网贷违约研究方面上国内外学者都有了较成熟的理论。其中国内学者的研究主要基于数据挖掘以及机器学习等数据分析方法,朱文倩[5]通过描述性统计分析以及K-means聚类方法,首先将借款人的信用情况划分为五个等级,后又对其进行判别分析,发现借款人的年龄、收入、工作年限、房产和逾期次数对分类影响较大。张冉[6]通过建立组合模型,运用随机森林以及Logistic回归预测选取借款人的有效预测指标,并将这些指标作为输入变量代入神经网络模型,对单一模型进行适当的组合,得到精确度较高的个人信用风险评价模型。朱传进和朱南[7]基于模糊数学理论,从道德风险、逆向选择风险以及不确定性风险三个方面研究影响P2P网贷信用风险,最终得到模型评价结果的准确性达到了83%。国外有关网贷个人信用风险研究较早,有影响力的模型主要有Credit Metrics模型、KMV模型、美国FICO信用评分模型、德国IPC微贷模型等等[8]。此外还有关于借贷人违约的研究,Riza等[9]发现在贷款违约中起重要作用的因素有信用等级、债务收入比、FICO得分以及循环利用率,并且发现风险率或贷款违约率的可能性随着借款人的信用风险而增加,而且对于高风险借款人收取较高的利率不足以弥补贷款违约的较高概率。Cinca等[10]分析了影响违约率的主要因素,他们从贷款目的、年收入、当前住房情况、信用记录和债务方面,通过Logistic回归预测违约,发现在所有的违约因素中P2P借贷网站分配的等级是最具预测性,此外还可以通过添加其他信息,尤其是借款人的债务水平,来提高模型的准确性。

但是目前对于大学生这个特殊群体的网贷问题的研究还较少,大学生作为一个重要的群体,在网络借款中占据了相当大的份额,并且有关大学生违约的情况越来越多,恶性网贷时间在大学生身上频发,为保障网贷平台的利益以及大学生自身的安全,对大学生网贷的研究显得格外重要,国内外的相关学者对大学生网贷问题从不同角度进行了一些研究。国内学者对大学生网贷进行研究的包括,徐庆东和刘胜题[11]构建了大学生个人信用评价体系,包括大学生的基本情况、学校概括、经济来源以及诚信行为等,并运用层次分析法分析出各指标之间的权重大小。邓秀焕[12]通过对大学生网络贷款数据搜集,利用非均衡样本,采用两种不同的算法进行建模,为大学生网贷提供很好的实用价值,进而为大学生网贷行为提供了理论依据。高姗姗和储莎莎[13]通过分析大学生网贷的金融风险以及技术风险,建立了一系列的信用风险评估体系,并且通过设计风险评估模型对研究结果进行验证。杨璐[14]策划了一个大学生网贷项目信用风险识别与度量的方案,通过对大学生客户进行细分以及特征选择,利用XGBoost算法对每个类群的网贷信用风险进行识别,并将模型结果与评分卡模型对网贷项目的信用风险进行度量,发现XGBoost模型能够有效的应用在信用风险识别问题中。国外学者的研究包括有,Looney等[15]通过对美国学生贷款拖欠以及违约的上升研究发现,违约增加的大部分与盈利性学校的借款人数量增加有关,并且与两年制机构也存在着一定的关系。Goodell[16]同样发现盈利性大学中学生借贷有着较高的违约率。Han等[17]使用了全国范围内的数据分析影响韩国学生违约的因素,从学生的人口特征、学术特点、贷款特征、财政支持特征以及制度特征五个方面出发,运用Logistic回归模型分析了五个方面下各指标对学生违约的影响。Ionescu等[18]通过建立大学投资模型,发现当政府借款限额较大时会增加大学投资,但是相应的会导致更多违约学生贷款在私人市场的出现,而学费减少会增加大学投资并降低私人市场的违约率,因此,对政府学生贷款的上限有较小的负面福利效应,而学费补贴则会增加总体福利。

由此可以得到,国内外关于大学生网贷的相关研究主要包括对于大学生网贷状况的研究以及其中存在的问题,通过对这些问题进行研究找出造成问题的原因进而给出解决措施,国内的学者更多的是研究构建大学生信用风险评价指标体系,而国外的学者则注重于探究影响违约的因素,他们只是单独考虑建立信用风险评价体系或影响违约的因素,而没有进一步将大学生网贷信用风险评价体系与大学生贷款违约相结合,本文通过对大学生网贷情况的研究建立大学生网贷信用风险评价指标体系并分析大学生网贷违约的影响因素,综合考虑这两个方面构建了大学生信用风险评价模型。

1.3 研究内容及方法

本文主要是研究有关大学生网贷信用风险的评价问题,首先构建了大学生网贷信用风险评价体系,然后采用Lasso算法对影响大学生网贷信用风险的因素进行筛查,最后结合Logistic回归方法建立了大学生网贷信用风险评价模型。

Lasso算法是一种筛选影响指标的有效方法,Logistic回归方法也具有许多独特的优点,例如对数据的要求低,模型系数具有较强的解释性,并且有较好的预测性,本文将Lasso算法与Logistic回归方法结合,提高了模型的效率与针对性。

本文首先分析我国个人信用风险评价指标体系中评价指标的选取原则,然后结合对大学生网贷信用风险的相关研究,将相关指标优化处理最终确定了大学生信用风险评价指标体系,借助数据挖掘的技术提取了影响大学生借贷者违约的关键指标,运用回归方法建立大学生信用风险评价模型,最后就完善大学生借贷市场的借贷业务提出了相应的建议意见,促进大学生借贷业务的发展。

1.4 本文组织结构

本文共分为6章,各章的主要内容如下:

第1章 主要介绍了本文的研究背景与意义,以及信用风险评价在国内外的研究现状。

第2章 构建大学生网贷信用风险评价指标体系。

第3章 比较相关信用风险评价方法,构建大学生信用风险评价模型。

第4章 对该评价模型进行实证分析,得出影响大学生违约的主要指标。

第5章 根据评价模型分别对借贷平台、平台投资者以及大学生借贷者提出相应的建议意见。

您需要先支付 80元 才能查看全部内容!立即支付

企业微信

Copyright © 2010-2022 毕业论文网 站点地图