论文部分内容阅读
随着金融行业和互联网行业的紧密结合,国内各金融机构纷纷把个人消费贷款业务作为未来的发展战略之一,而其中个人信用风险控制作用至关重要。通过将用户在各个层面上的行为进行数据化和整合化,运用并行化和深度挖掘的方式,将用户消费和行为信息转化为个人信用的评估依据,以此来为各金融机构提供个人信用风险控制。在大数据领域,传统的风险模型存在处理效率及精确度难以适应的问题。因此,如何结合传统风险评估模型和机器学习技术,针对大数据特性,获得一个更加精准的评估模型,是一个值得研究的课题。本文的研究内容就围绕这个问题展开。主要的工作包括:(1)就模型的数据基础、表现定义及逻辑、样本分类和抽样方案等建模基础信息进行详细介绍及分析,并提出大数据环境下的个人信用风险评估模型——CEvaluation+。(2)从不同维度来构建用户信用画像,进行数据收集、数据核对、数据清洗、因子分析法等预处理方法。(3)结合高效、可解释性的Logistic算法以及高精确度和低数据分布要求的深度学习模型,构建评估预警模型。具体过程是:先对待处理的数据使用Logistic算法进行预判,对预判结果为―坏用户‖以及―中间用户‖的案例,将决策树模型与优化的遗传神经网络模型进行组合生成更具有高准确率的风险评估模型,同时根据各模型对应的错误率设置其相应的权重。论文最后从模型的区分能力、稳定性等方面验证研究搭建的CEvaluation+模型效果。将该模型与其他模型进行对比分析,并与某商业银行已使用的评分卡模型进行对比。实验表明,CEvaluation+模型在预测―坏客户‖精确度方面有了很大的提升。