基于数据仓库的消费金融信用等级模型及应用研究

来源 :湖南大学 | 被引量 : 0次 | 上传用户:qjbfg123
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着“互联网+”时代的到来,消费金融逐步成为互联网金融服务的重要组成部分。由于消费金融主要面向中低收入、缺乏信用记录的客群,传统的信用风险评估模型适用性欠佳。大数据技术是IT产业一次重大技术变革,在数据爆炸的时代,大数据可以有效提高无抵押信用贷款行业的风险识别能力。随着移动互联、网络社交,以大数据技术等为核心的创新技术的驱动下,数据已经成为消费金融机构的核心财务。客户在互联网上的大量的信息,客户个人特征数据、电商类数据、社交类数据、支付类数据等,可以通过大数据进行信息集中、整合与加工,并建模开展信用评级,预测风险保证公司可持续经营。通过大数据技术与云计算的运用,为建立多层次、多维度的信用风险评估体系提供可能。论文互联网消费金融风控为研究对象,瞄准网络消费信用贷款对大数据风控和反欺诈的迫切需求,针对网络借贷提出了系统的大数据金融实证研究方案,并在此基础上建立了网络借贷信用风险评估模型,丰富和完善了信用风险管理的理论与方法。针对目前消费金融样本普遍不足和样本属性稀疏的问题,提出了一种基于生成式对抗网络(GAN)的消费金融小样本数据训练方法,通过GAN产生与真实样本具有相同特征的客户样本来扩大样本量,以解决消费金融企业初期数据样本不足的问题。采用K-means聚类算法,对某消费金融企业工薪贷产品客户数据进行训练,最终获得客户细分模型,通过对客户轮廓的细分,了解不同细分类客户的属性特征,更有针对性的实施风控策略。采用逻辑回归、随机森林等多种算法对客户的授信额度进行了训练,最终获得客户信用等级概率模型。通过该模型可针对客户的风险属性、个人属性等维度预测应授予客户的贷款额度,可以帮助实施贷前审批、贷中调额等主要业务。在上述的模型基础上设计并实现了一种支持实时高并发的数据仓库及其私有云体系结构,能集成各种分布式数据并行处理框架,并针对消费金融数据稀疏的实际特点与应用场景,提出了相应的任务调度处理方法,提升了数据读写与分析的效率,具有较好的开放性和可扩展性。
其他文献
当下全球依然笼罩在危机的阴影之下,对于此次自上世纪大萧条以来最为严重的经济危机,人类有责任与义务进行反思与总结,吸取教训以免在今后的日子里重蹈覆辙。而这就要求我们
我国的基础设施的建设呈跨越式的发展,在其建设的过程中经常遇到软弱的地基等不良的地基条件,而新型建(构)筑物对其承载能力和沉降有着越来越高的工程技术性水平和要求,对软弱地基的设计和施工处理也已经成为了基础工程建设中亟待解决的一个问题。复合地基工艺简单、施工方便、造价低廉,被广泛地应用于建筑、公路、铁路路基和水电地基处理工程中。基于此,本文提出和研究了三种新型竖向增强体复合地基,分别是废旧轮胎包覆建渣