集成二次曲面支持向量机在个人信贷风险评估中的应用

来源 :西南财经大学 | 被引量 : 0次 | 上传用户:ciissyma
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着经济的高速增长和互联网应用的不断创新,互联网金融行业也在快速的发展,受到了政府和社会的高度关注,但是互联网金融高速发展的背后也伴随着风控能力缺失的问题,因此对借款人进行信贷风险评估、建立完善的互联网金融风险控制体系已成为互联网金融进一步发展应当关注的话题。由于互联网金融公司具有小额、无抵押、无担保、客群下沉的特点,传统的依靠人行征信报告的风控模式不再适用于互联网金融公司,但是互联网金融公司可以通过挖掘互联网大数据,利用统计学、机器学习技术建立信贷风险评估模型来解决这个问题。个人信贷风险评估问题本质上是一个分类问题,因此建立一个性能优异的分类模型是解决该问题的关键所在。二次曲面支持向量机作为支持向量机模型的扩展,具有分类性能更优,无需使用核函数的特点。集成学习通过组合一组基学习器来获得性能上的提升,集成模型的准确性往往要优于单个模型,并且在现实生活中取得了成功的应用。因此本文建立了集成二次曲面支持向量机模型并将其应用到个人信贷风险评估之中。在建模过程中,本文将二次曲面支持向量机的学习问题转化为Hinge损失函数,从而可以利用BFGS算法来进行求解。其次,使用了Logistic函数将二次曲面支持向量机的决策值进行后验概率转化。最后,由于普通的二次曲面支持向量机模型没有考虑样本权重问题,本文还建立了加权二次曲面支持向量机模型。之后,本文建立了基于Real Adaboost、Discrete AdaBoost和Bagging方法的集成二次曲面支持向量机模型,并且在三个不同的数据集上进行了数值实验,采用准确率作为效果评估准则,结果表明RAdaQSSVM的分类性能最优,DAdaQSSVM稍差,由于QSSVM本身就具有较好的泛化能力,对于BaggingQSSVM而言,难以构造出各个基分类器之间的差异性,导致性能提升较低。最后,介绍了集成二次曲面支持向量机在A互联网消费金融公司的应用,在建模之前,结合A公司提供的脱敏数据集介绍了数据预处理与数据降维的一些方法,利用KS、AUC等指标对模型性能进行评估,实验结果表明RAdaQSSVM模型具有最优的分类性能。在RAdaQSSVM模型的基础之上,设计了A公司新的风控流程,基于该流程,A公司的自动审批率达到52.5%,自动审批的坏客户率仅为1.98%,节约了A公司的人力成本,减少了该公司的坏客户率。
其他文献
随着技术的不断发展,快慢文化步入人们的生活,“快”的出现与效率时代和速食时代有关,当人的认知速度跟不上时代发展的脚步,便催生了“慢”文化,“慢”是对“快”的理性反思
晋北地区旱地应用机械穴灌穴播和地膜覆盖技术种植玉米,比常规机械穴播玉米出苗早5d,拔节早8d,抽雄早8d,成熟早7d,株高增加7cm,成穗数增加8463穗/hm^2,穗粒数增加17粒,千粒重增加21.0g,
茶文化是我国文化的重要内容,切实反映了我国的文化内涵和思想内涵。经过几千年的积淀和发展,茶文化逐步成为影响大众的重要文化标志。随着大众生活水平的提升,茶文化受到更
近年来,我国建筑业发展十分迅速,住房体系也在不断变化,房屋在转型,房屋维修受到人们越来越多的关注。住房维修基金的缴纳管理和使用,直接影响到居住者的利益。为合理的运用
近年来,深度神经网络在计算机视觉、自然语言处理和文本数据等各个领域取得卓越成就。但随之而来的问题是深度神经网络随着模型加深和过度参数化,其网络规模、计算量、耗电量