基于MCDM的分类模型评价与SMOTEBagging模型改进——以P2P个人信用风险预测为例

来源 :电子科技大学 | 被引量 : 0次 | 上传用户:titansea
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
互联网金融的发展和个人信用商业化进程的加快,不仅使得人们可以凭借个人信用享受越来越多便利的服务,也给国家完善信用体系提供了新的思路。对提供这些服务的企业来讲,对用户的个人信用风险进行有效的预测,发现潜在的违约用户,是提高风险管理水平,保证服务质量的基础,因此,对个人信用风险预测模型进行研究,有着重要的价值和意义。传统的预测模型已经不能满足当下风险管理的需求,以分类模型为代表的数据挖掘技术成为了构建个人信用风险预测模型的主流技术,面对不同的分类模型,如何选择出能在自己的数据集上有最好表现的分类模型来进行个人信用风险预测成为了企业所关心的问题。本文基于MCDM方法,主要研究了两个问题,一是如何在单个数据集下对分类模型进行评价和选择,二是如何提高分类模型发现潜在违约用户的能力。  针对第一个问题,本文把特征空间对模型表现的影响纳入了考虑,使用多种特征选择方法,并结合 MCDM方法,构造了一种多空间多准则的模型综合评价框架。在此框架的基础上,本文以美国著名 P2P网贷平台 Prosper.com的数据集为例,使用TOPSIS方法,综合六个评价指标对五种单分类器模型在个人信用风险预测问题上的表现进行了评价和比较,为企业在特征空间的构建和分类模型的选择上提供借鉴和参考。实验发现,BPNN模型、LR模型以及 SVM模型在Prosper.com的个人信用风险预测中有着较好的综合表现。  为了进一步提高对违约用户的预测准确率(TPR),本文以这三个分类模型作为基分类器,用SMOTEBagging模型来进行集成学习。个人信用风险预测是数据不平衡问题,SMOTEBagging模型在这种情况下有比传统Bagging模型更好的TPR表现。本文基于AHP方法对其进行了改进,构建了一种AHP-Based Bagging模型,以在不牺牲SMOTEBagging模型整体表现的情况下提高TPR表现。本文先在27个不平衡数据集上对AHP-Based Bagging模型的有效性进行了验证,发现其能以相当于 SMOTEBagging模型一半的集成规模,在0.05的置信度下,得到显著优于SMOTEBagging模型的TPR表现,且在AUC和F1-Measure的表现上没有显著变差。然后将AHP-Based Bagging模型应用在Prosper.com的个人信用风险预测中,也得到了比SMOTEBagging更好的综合表现,并且进一步提高了对违约用户的预测准确率。
其他文献
随着我国经济的发展,水利工程建设对国民经济生活的影响越来越大,原有的《水利水电工程施工合同和招标文件示范文本》(2000版)(以下简称2000条款)已经不能满足水利工程建设发展的需
随着生产和贸易全球化的不断深入,世界价值创造体系在全球出现了前所未有的垂直分离和再构。面对这一国际分工大转换的背景,全球价值链的研究解决了地方产业集群发展的联系路径
随着知识经济时代的到来,信息技术的迅猛发展使得创新活动呈现网络化发展趋势,由不同创新主体合作而形成的技术创新网络已成为现阶段企业技术创新活动的重要组织形式。技术创新
单元制造(Cellular Manufacturing, CM)是在生产单元中根据设备功能的相似性对其进行分组从而对零件族进行生产加工的一种先进生产方式。它整合了灵活的作业车间( job shop)方式和高效率的流水车间(flow shop)方式,能以近似刚性流水线的成本来生产多品种少批量商品。实践证明,单元制造系统(Cellular manufacturing system, CMS)具有缩短制
TD-SCDMA作为我国拥有自主知识产权的第三代移动通信标准,在促进科技进步、推动国民经济发展方面发挥着重要的作用,而专利价值评估是我国优化知识产权政策、合理配置专利资源的重要依据,更是促进专利科学化发展的重要保障,因此,对TD-SCDMA专利价值进行评估的重要性不言而喻。但是,由于我国目前在TD-SCDMA专利价值评估方面的理论研究还很匮乏,导致专利价值评估实践缺乏理论指导。本文研究的目的就在于