论文部分内容阅读
随着经济的高速增长和互联网应用的不断创新,互联网金融行业也在快速的发展,受到了政府和社会的高度关注,但是互联网金融高速发展的背后也伴随着风控能力缺失的问题,因此对借款人进行信贷风险评估、建立完善的互联网金融风险控制体系已成为互联网金融进一步发展应当关注的话题。由于互联网金融公司具有小额、无抵押、无担保、客群下沉的特点,传统的依靠人行征信报告的风控模式不再适用于互联网金融公司,但是互联网金融公司可以通过挖掘互联网大数据,利用统计学、机器学习技术建立信贷风险评估模型来解决这个问题。个人信贷风险评估问题本质上是一个分类问题,因此建立一个性能优异的分类模型是解决该问题的关键所在。二次曲面支持向量机作为支持向量机模型的扩展,具有分类性能更优,无需使用核函数的特点。集成学习通过组合一组基学习器来获得性能上的提升,集成模型的准确性往往要优于单个模型,并且在现实生活中取得了成功的应用。因此本文建立了集成二次曲面支持向量机模型并将其应用到个人信贷风险评估之中。在建模过程中,本文将二次曲面支持向量机的学习问题转化为Hinge损失函数,从而可以利用BFGS算法来进行求解。其次,使用了Logistic函数将二次曲面支持向量机的决策值进行后验概率转化。最后,由于普通的二次曲面支持向量机模型没有考虑样本权重问题,本文还建立了加权二次曲面支持向量机模型。之后,本文建立了基于Real Adaboost、Discrete AdaBoost和Bagging方法的集成二次曲面支持向量机模型,并且在三个不同的数据集上进行了数值实验,采用准确率作为效果评估准则,结果表明RAdaQSSVM的分类性能最优,DAdaQSSVM稍差,由于QSSVM本身就具有较好的泛化能力,对于BaggingQSSVM而言,难以构造出各个基分类器之间的差异性,导致性能提升较低。最后,介绍了集成二次曲面支持向量机在A互联网消费金融公司的应用,在建模之前,结合A公司提供的脱敏数据集介绍了数据预处理与数据降维的一些方法,利用KS、AUC等指标对模型性能进行评估,实验结果表明RAdaQSSVM模型具有最优的分类性能。在RAdaQSSVM模型的基础之上,设计了A公司新的风控流程,基于该流程,A公司的自动审批率达到52.5%,自动审批的坏客户率仅为1.98%,节约了A公司的人力成本,减少了该公司的坏客户率。