论文部分内容阅读
互联网金融的发展和个人信用商业化进程的加快,不仅使得人们可以凭借个人信用享受越来越多便利的服务,也给国家完善信用体系提供了新的思路。对提供这些服务的企业来讲,对用户的个人信用风险进行有效的预测,发现潜在的违约用户,是提高风险管理水平,保证服务质量的基础,因此,对个人信用风险预测模型进行研究,有着重要的价值和意义。传统的预测模型已经不能满足当下风险管理的需求,以分类模型为代表的数据挖掘技术成为了构建个人信用风险预测模型的主流技术,面对不同的分类模型,如何选择出能在自己的数据集上有最好表现的分类模型来进行个人信用风险预测成为了企业所关心的问题。本文基于MCDM方法,主要研究了两个问题,一是如何在单个数据集下对分类模型进行评价和选择,二是如何提高分类模型发现潜在违约用户的能力。 针对第一个问题,本文把特征空间对模型表现的影响纳入了考虑,使用多种特征选择方法,并结合 MCDM方法,构造了一种多空间多准则的模型综合评价框架。在此框架的基础上,本文以美国著名 P2P网贷平台 Prosper.com的数据集为例,使用TOPSIS方法,综合六个评价指标对五种单分类器模型在个人信用风险预测问题上的表现进行了评价和比较,为企业在特征空间的构建和分类模型的选择上提供借鉴和参考。实验发现,BPNN模型、LR模型以及 SVM模型在Prosper.com的个人信用风险预测中有着较好的综合表现。 为了进一步提高对违约用户的预测准确率(TPR),本文以这三个分类模型作为基分类器,用SMOTEBagging模型来进行集成学习。个人信用风险预测是数据不平衡问题,SMOTEBagging模型在这种情况下有比传统Bagging模型更好的TPR表现。本文基于AHP方法对其进行了改进,构建了一种AHP-Based Bagging模型,以在不牺牲SMOTEBagging模型整体表现的情况下提高TPR表现。本文先在27个不平衡数据集上对AHP-Based Bagging模型的有效性进行了验证,发现其能以相当于 SMOTEBagging模型一半的集成规模,在0.05的置信度下,得到显著优于SMOTEBagging模型的TPR表现,且在AUC和F1-Measure的表现上没有显著变差。然后将AHP-Based Bagging模型应用在Prosper.com的个人信用风险预测中,也得到了比SMOTEBagging更好的综合表现,并且进一步提高了对违约用户的预测准确率。