基于关系网络的信贷交易欺诈检测模型与方法

来源 :东华大学 | 被引量 : 0次 | 上传用户:hxffxh2009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网技术的高速发展,网络信贷业务以其审核迅速、放款门槛低等特点逐渐成为互联网金融领域的新秀。然而,网络信贷为用户带来便利的同时,也为信贷欺诈提供了可乘之机。当前信贷欺诈具有产业化、技术化的特征,如何有效地防范网络信贷业务的欺诈风险已经成为一个亟待解决的问题。目前信贷交易的欺诈检测,除了传统的专家系统规则引擎方式以外,主要是基于历史信贷交易数据,衍生交易特征,利用机器学习方法进行建模预测。然而,这些方法对于信贷交易间潜在的关联关系,没有进行有效的表征。因此,本文从以下三个方面展开研究:
  首先,针对信贷交易场景存在着越来越多的黑中介、团伙欺诈等案例,本文将具有实体性质的属性和贷款申请实体抽取出来,构建异构网络二分图,提出节点收缩的同质化算法,得到信贷交易实体之间潜在的关系网络,并在此基础上,提出邻域信息聚合梯度提升决策树算法(Neighbor Information Aggregation Gradient Boosting Decision Tree,NIAGBDT),将邻居节点的属性信息聚合到当前关注的信贷交易实体上。基于国内某保险公司真实的贷款申请数据进行实验,实验表明,相比传统的机器学习欺诈检测算法,NIAGBDT在各项评估指标上的效果均显著提升10%左右。
  其次,针对同质化网络中边的权重无差异性问题,建立基于Attention的实体关系信贷交易欺诈检测模型。在NIAGBDT的基础上,为进一步提升模型的欺诈检测效果,在缺乏专家经验的先验信息指导下,构建基于Attention的权重生成器,对同质化网络中的邻域节点信息进行差异化融合。实验结果表明,在之前工作的基础上,基于Attention的邻域信息聚合算法(Neighbor Information Aggregation Algorithm based on Attention,NI3A)表现出了更好的欺诈检测效果,与NIAGBDT相比,精准率和召回率都提高5%左右,KS提升约2%。
  最后,围绕本文提出的基于关系网络的信贷交易欺诈检测方法,设计并实现关系行为欺诈检测子系统。该子系统主要实现三个功能:模型离线训练、模拟实时交易欺诈检测和在线分析。模型离线训练模块主要通过初始化模型训练需要的数据和参数,离线训练欺诈检测模型,并可视化训练过程;模拟实时欺诈检测模块则是通过模拟实时信贷交易的发送,加载离线训练好的模型检测当前交易的欺诈风险,主要通过实时监控方式实现;在线分析则是为业务分析人员提供一个查询交互的界面,对待查询的信贷交易给出模型反馈的可视化辅助决策工具。通过实现子系统的上述三个功能模块,验证了本文提出的模型的有效性与可用性。
  综上所述,本文针对信贷交易欺诈检测任务中信贷交易之间潜在的关联关系,构建关系网络,提出NIAGBDT模型将图信息和属性信息进行有效融合,并借鉴Attention机制,构建邻域信息权重生成器,提出自注意力邻域信息聚合-梯度提升决策树的欺诈检测方法,并通过搭建关系行为欺诈检测子系统验证模型的有效性,在消费金融欺诈检测等场景中有很好的应用价值。
其他文献
Arabic(Arabic:(Ejzl),al-arabīyah,(czjc),arabīy)is a Semitic language which is the liturgical language of1.8billion speakers where all varieties of Arabic combined are spoken by perhaps as many as422million speakers(native and non-native).The largest diffe
【摘要】文章主要阐释在班主任工作的实践过程中形成的点滴体会。从营造团结、温馨的班集体,建立和谐的师生关系,巧妙地处理班级的偶发事件,对班主任工作经验进行简要叙述,力图采用润物无声的理想的德育方式,实现真正意义上的教书育人。  【关键词】班集体 师生关系 冷处理 宽容  【中图分类号】G625 【文献标识码】A 【文章编号】2095-3089(2016)10-0218-01  “班主任工作是教师工作
期刊
目前,在信息化医疗领域,将患者医疗保健相关的敏感数据存储到对应的电子健康记录(EHR)发展迅速。具体而言,医疗记录的分发给医疗健康网络带来了便利。其中收集和生成健康数据是问题的关键,因此大数据起着重要作用,因为它可用于预测疾病,防止合并症致死并且节省医疗费用。但是,这会导致在数据收集过程中违反安全性规定并可能侵犯个人隐私。这项工作的文献综述探索了网络上现有的基于信任的访问控制模块,用于区分EHR和基于以太坊的区块链EHR解决方案。这些模块使用复杂的挖掘共识算法和令牌化技术,以确保记录的隐私性和数据的完整性
【摘要】电影是不同国家文化交流的重要桥梁,其片名翻译尤为重要。传统的翻译理论将片名翻译与书名翻译并列,将“忠实”视为片名翻译的基本原则。本文则认为片名翻译更倾向于广告翻译,其功能就是将影片作为宣传产品,提高上座率,从而增加利润。本文通过对近些年来的进口大片片名翻译的分析研究,发现国俗语义在电影片名的翻译中运用甚广。译者在翻译片名的过程中,需领悟影片主旨,以言简意赅的国俗语义将其翻译出来,使之更贴近
期刊
【摘要】青岛农业大学动物科技学院动物遗传育种与繁殖学科针对研究生学习缺乏主动性、实验研究缺乏创新性和就业缺乏竞争性等突出问题,创造性地实施了“1445”研究生教育管理模式(即:落实一个目标要求、构建以学科管理为核心的四重管理机制、实施四段培养程序,强化五种管理效果),并在实施过程中以导师为抓手,明确界定导师职责,发挥了导师的“目标落实”功能,“管理执行”功能和“效果检验”功能,有力地推动了学科研究
期刊
【摘要】传承与创新古老的中华文化是实现“中国梦”的题中应有之义。作为教育者,我们有责任有义务通过一系列行之有效的手段增进学生对于“非遗”文明的认识和了解,让传统文化焕发新生。本文主要以国家级非物质文化遗产南通蓝印花布为引子,将国家级非物质遗产文化及其中所蕴含的中国传统文化精髓与先进校园文化建设相联系,让“非遗”文化走进校园,通过各种活动,让青春勃发的生命获得祖国深厚传统文化的滋养。  【关键词】非
期刊
心脏是人体的重要器官,对身体健康有着至关重要的作用。心脏病是内科疾病中的常见病症,近年来先天性心脏病高发趋势尤为明显,因此对于青少年心脏病的关注度也越来越高。在临床上,心音检查是心脏疾病诊断的主要方式。医生通过听诊器去获取患者的心跳状况,然后根据自己的临床经验做出诊断。由于不同级别的医疗机构中医生的临床诊断经验可能存在差异,听诊结果会影响到患者疾病的临床诊断,导致治疗的延误。
  为了解决在心音检测中医生临床经验的差异性,本文基于上海某三甲医院的青少年心音临床检查数据,利用数据挖掘分析和机器学习算法
云计算、移动互联网和社交媒体等技术的迅猛发展,使得网络空间中所蕴含的信息量呈指数级增长。作为缓解信息过载问题的有效手段,推荐系统得到了学术界和工业界的广泛关注,相关研究成果已经融入日常生活的各项个性化服务中。矩阵分解(Matrix Factorization,MF)模型因具有较高的预测准确度和良好的可扩展性,常被用于个性化推荐系统中。
  MF模型的优化方法之一是利用附加信息来提高推荐准确度,常用的附加信息是用户与产品的属性信息。针对已有相关研究主要考虑属性信息本身而忽略了属性之间的交互关系所带来的
【摘要】少数民族预科学生作为高等教育中一个特殊的学生群体,具有自信心不足、学习基础较差、贫困学生比例较高等特点,由于课程设置、考勤管理等原因,逃课现象已然成为各个少数民族预科学生培养和管理工作的瓶颈。本文以怀化学院预科学生为例,就逃课现象进行剖析,并提出具体的研究对策。  【关键词】少数民族预科学生 逃课 剖析 对策  【中图分类号】G64 【文献标识码】A 【文章编号】2095-3089(201
期刊
【摘要】作为一名思想政治课的一线老师,我们一直在探索思政课能力本位的项目化教学改革。在探索中我们发现实地考察,对这样的改革进行实地考察是相当有必要的。延安是中国的革命圣地,是著名的爱国主义教育基地,是每一位思政工作者都应该去了解学习的地方。延安实地考察对思想政治课项目化改革有着巨大的意义,首先丰富了课堂的一手资料,其次体现了项目改革的实践性,再次补充了思想政治课的项目设置。思想政治课项目化改革中我
期刊