基于KSMOTE-RF模型的P2P网贷借款人信用风险评估任务书
2020-05-26 20:47:54
1. 毕业设计(论文)的内容和要求
每一家p2p网络借贷平台,都把风险控制作为公司的工作重点,毫无疑问,信用风险作为p2p网络借贷面临的最主要风险,又称违约风险,是指借款人因种种原因,不愿或无力履行合同条件而构成违约,致使投资者遭受损失的可能性。
借款人违约预测是p2p网贷行业信用风险管理的基础,也是控制与决策、复杂系统建模与分析等领域中的研究热点问题。
据银行等金融机构大量的调查显示,现有的贷款违约数据大部分都是非平衡数据,p2p网贷交易数据也不例外。
2. 参考文献
[1]梁世栋等.信用风险模型比较分析.中国管理科学.2002,20,(1). 1722 [2]Risenbeis, R. A Problems in applying discriminant analysis in credit scoring models.Journal of Bankinn and Finace, 2, 20_5一 219. [3]邹新月.典型判别分析在企业信用风险评估中的应用.财经研究.2001.(10): 5357. [4]邹新月,李汉通.运用典型多元判别分析法评估上市公司信用风险.统计与决策2001.(7): 21 }22. [5]方洪全,曾勇.运用多元判别法评估企业信用风险的实例.预测.2004.4:6_568. [6]徐少锋.FISHER判别分析在个人信用评估中的应用.统计与决策.2006. (1):133一135. [7]李建云,邱苑华.核FISHER判别分析方法评估消费者信用风险.系统工程理论方法应用.2004. (12): 548556. [8]姜明辉,姜磊,王雅林.线性判别式分析在个人信用评估中的应用.管理科学.2003, (2): 5355. [9]McCulloch W S, Pitts W. A logical calculus of the ideas immanent in nervous activity[J]. The bulletin of mathematical biophysics, 1943, 5(4): 115-133. [10] D. Zhang, W Liu, X. Gong, and H. Jin. A Novel Improved SMOTE Resampling Algorithm based on Fractal[J]. Journal of Computational Information Systems.2011,7: 2204-2211. [11]A. Fernandez, S.Garcia, and F. Herrera. Addressing the Classification with Imbalanced Data: Open Problems and New Challenges on Class Distribution[C]. In 6th International Conference on Hybrid Artificial Intelligence Systems (HAIS).2011:1-10. [12] Li feng Zhou, Loan Default Prediction on Large Imbalanced Data Using Random Forests, TELKOMNIKA Indonesian Journal of Electrical Engineering 2012, Vo1.10 No.6, 1519-1525. [13]林成德,彭国兰.随机森林在企业信用评估指标体系确定中的应用[[J].厦门大学学报:自然科学版,2007, 46(2): 199-203. [14] Ham J, Chen丫Crawford M M, et al. Investigation of the random forest framework for classification of hyperspectral data[J]. Geoscience and Remote Sensing, IEEE Transactions on, 2005, 43(3): 492-501. [15]郭山清,高丛,姚建等.基于改进的随机森林算法的入侵检测模型(英文)[J].软件学报,2005, 8: 018. [16]庄进发,罗键,彭彦卿等.基于改进随机森林的故障诊断方法研究[[J].计算机集成制造系统,2009, 15{4): 777-785. [17]邱一卉.随机森林在电信行业客户流失预测中的应用〔D].厦门大学,2008. [18]周绮凤,洪文财,杨帆等.基于随机森林相似度矩阵差异性的特征选择[[J].华中科技大学学报:自然科学版,2010 (4): 58-61.
3. 毕业设计(论文)进程安排
起讫日期 设计(论文)各阶段工作内容 1-8至1-20 查阅中英文资料20篇以上及了解相关算法等。
1-20至1-31 提交打印好的文献综述及开题报告(围绕任务书,完成方案论证,工作思路等) 2-1至3-15 掌握KSMOTE、随机森林理论基础 3-16至4-26 学习Rtool软件基本操作方法 4-27至5-17 利用Lending Club数据集,编写相关程序,验证算法模型的可靠性,并与其他算法对比,绘制出ROC、AUC、G-means等评估图 5-18至6-08 10000字以上论文撰写,准备300字的英文摘要,完成论文提交 6-09至6-15 论文答辩