论文部分内容阅读
随着互联网技术的高速发展,网络信贷业务以其审核迅速、放款门槛低等特点逐渐成为互联网金融领域的新秀。然而,网络信贷为用户带来便利的同时,也为信贷欺诈提供了可乘之机。当前信贷欺诈具有产业化、技术化的特征,如何有效地防范网络信贷业务的欺诈风险已经成为一个亟待解决的问题。目前信贷交易的欺诈检测,除了传统的专家系统规则引擎方式以外,主要是基于历史信贷交易数据,衍生交易特征,利用机器学习方法进行建模预测。然而,这些方法对于信贷交易间潜在的关联关系,没有进行有效的表征。因此,本文从以下三个方面展开研究:
首先,针对信贷交易场景存在着越来越多的黑中介、团伙欺诈等案例,本文将具有实体性质的属性和贷款申请实体抽取出来,构建异构网络二分图,提出节点收缩的同质化算法,得到信贷交易实体之间潜在的关系网络,并在此基础上,提出邻域信息聚合梯度提升决策树算法(Neighbor Information Aggregation Gradient Boosting Decision Tree,NIAGBDT),将邻居节点的属性信息聚合到当前关注的信贷交易实体上。基于国内某保险公司真实的贷款申请数据进行实验,实验表明,相比传统的机器学习欺诈检测算法,NIAGBDT在各项评估指标上的效果均显著提升10%左右。
其次,针对同质化网络中边的权重无差异性问题,建立基于Attention的实体关系信贷交易欺诈检测模型。在NIAGBDT的基础上,为进一步提升模型的欺诈检测效果,在缺乏专家经验的先验信息指导下,构建基于Attention的权重生成器,对同质化网络中的邻域节点信息进行差异化融合。实验结果表明,在之前工作的基础上,基于Attention的邻域信息聚合算法(Neighbor Information Aggregation Algorithm based on Attention,NI3A)表现出了更好的欺诈检测效果,与NIAGBDT相比,精准率和召回率都提高5%左右,KS提升约2%。
最后,围绕本文提出的基于关系网络的信贷交易欺诈检测方法,设计并实现关系行为欺诈检测子系统。该子系统主要实现三个功能:模型离线训练、模拟实时交易欺诈检测和在线分析。模型离线训练模块主要通过初始化模型训练需要的数据和参数,离线训练欺诈检测模型,并可视化训练过程;模拟实时欺诈检测模块则是通过模拟实时信贷交易的发送,加载离线训练好的模型检测当前交易的欺诈风险,主要通过实时监控方式实现;在线分析则是为业务分析人员提供一个查询交互的界面,对待查询的信贷交易给出模型反馈的可视化辅助决策工具。通过实现子系统的上述三个功能模块,验证了本文提出的模型的有效性与可用性。
综上所述,本文针对信贷交易欺诈检测任务中信贷交易之间潜在的关联关系,构建关系网络,提出NIAGBDT模型将图信息和属性信息进行有效融合,并借鉴Attention机制,构建邻域信息权重生成器,提出自注意力邻域信息聚合-梯度提升决策树的欺诈检测方法,并通过搭建关系行为欺诈检测子系统验证模型的有效性,在消费金融欺诈检测等场景中有很好的应用价值。
首先,针对信贷交易场景存在着越来越多的黑中介、团伙欺诈等案例,本文将具有实体性质的属性和贷款申请实体抽取出来,构建异构网络二分图,提出节点收缩的同质化算法,得到信贷交易实体之间潜在的关系网络,并在此基础上,提出邻域信息聚合梯度提升决策树算法(Neighbor Information Aggregation Gradient Boosting Decision Tree,NIAGBDT),将邻居节点的属性信息聚合到当前关注的信贷交易实体上。基于国内某保险公司真实的贷款申请数据进行实验,实验表明,相比传统的机器学习欺诈检测算法,NIAGBDT在各项评估指标上的效果均显著提升10%左右。
其次,针对同质化网络中边的权重无差异性问题,建立基于Attention的实体关系信贷交易欺诈检测模型。在NIAGBDT的基础上,为进一步提升模型的欺诈检测效果,在缺乏专家经验的先验信息指导下,构建基于Attention的权重生成器,对同质化网络中的邻域节点信息进行差异化融合。实验结果表明,在之前工作的基础上,基于Attention的邻域信息聚合算法(Neighbor Information Aggregation Algorithm based on Attention,NI3A)表现出了更好的欺诈检测效果,与NIAGBDT相比,精准率和召回率都提高5%左右,KS提升约2%。
最后,围绕本文提出的基于关系网络的信贷交易欺诈检测方法,设计并实现关系行为欺诈检测子系统。该子系统主要实现三个功能:模型离线训练、模拟实时交易欺诈检测和在线分析。模型离线训练模块主要通过初始化模型训练需要的数据和参数,离线训练欺诈检测模型,并可视化训练过程;模拟实时欺诈检测模块则是通过模拟实时信贷交易的发送,加载离线训练好的模型检测当前交易的欺诈风险,主要通过实时监控方式实现;在线分析则是为业务分析人员提供一个查询交互的界面,对待查询的信贷交易给出模型反馈的可视化辅助决策工具。通过实现子系统的上述三个功能模块,验证了本文提出的模型的有效性与可用性。
综上所述,本文针对信贷交易欺诈检测任务中信贷交易之间潜在的关联关系,构建关系网络,提出NIAGBDT模型将图信息和属性信息进行有效融合,并借鉴Attention机制,构建邻域信息权重生成器,提出自注意力邻域信息聚合-梯度提升决策树的欺诈检测方法,并通过搭建关系行为欺诈检测子系统验证模型的有效性,在消费金融欺诈检测等场景中有很好的应用价值。