决策树算法在银行个人信贷用户分类中的研究与应用

被引量 : 0次 | 上传用户:smarten
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着经济的发展个人生活水平得到了提高,加上国家政策相关的扶持,导致人们的消费观念发生了相应改变,个人贷款已经逐渐与人们的生活变的密不可分。而对银行来说,如何对个人借贷用户进行划分进而决定是否同意其借贷申请是一个很重要的问题。由于个人贷款的金额相对较小,无法对每一笔贷款申请的用户都一直进行跟踪,这样将大大的增加成本。而数据挖掘方法已被认同是处理这类问题的有效的工具。通过建立相关的个人信用评价模型,以信用记录数据为基准,提高用户预测的准确性,大大缩短贷款申请处理时间,同时降低人为因素的影响。本文以决策树方法为主要的建模方法,基于真实的银行信贷交易数据建立个人信用评分模型,利用这一工具对贷款申请人作出信用评价,以期解决个人信贷风险过大的问题。通过实验首先对个人信贷数据中个人信息的各个属性的重要性进行了评估,接着对模型的准确性进行分析,最后对模型的动态生成方法及其可行性进行了验证研究。主要工作如下:(1)通过对相关文献和资料调查与研究,对个人信用评分模型方法行了比较全面系统的研究分析。(2)以German Credit Data为实验数据。并进行了相应的数据预处理工作来为以后的建模工作做准备。接着运用c5.0算法和随机森林算法建立了个人信用评估模型。(3)针对银行个人信贷的业务提出一种随机森林的动态建模方法,阐述了算法思想并对其进行了实现。(4)通过实验结果对所用的银行信贷个人信息的各个数据段的重要性进行分析。并对由C5.0算法与随机森林算法的模型进行性能比较。验证了所实现的随机森林动态生成模型的可行性。
其他文献
本文首先提出"过度教育"的定义,接着概括"过度教育"在我国的表现,分析我国高等教育发展中过度教育产生的原因,为解决我国过度教育问题提供理论参考。
政府编制的各类规划是国家和地方治理体系的重要内容,但按照我国现行规划体系,各类规划分属于不同部门集权管理,自成体系、不协调的现象十分突出,规划意图难以落实,甚至有碍
摘要:进入二十一世纪,世界经济快速发展,人类对金属的需求不断增加。而矿产资源的不可再生性,使得矿产资源越来越紧缺,提高选矿技术经济指标,充分回收矿产资源中伴生的有价元
随着我国逐渐步入“老龄化”社会,老年人问题日益突出,“两代居”这种中国传统居住模式受到愈来愈多的关注。作者从“两代居”住宅所待解决的问题入手,对“两代居”住宅进行了较
江有诰《诗经韵读》和王力《诗经韵读》在韵字归部和异文处理方面均有差异。两部《诗经韵读》对个别篇章用字的认识不同,具体表现在四个方面。江有诰对某些韵字的归部错误,王
在知识经济时代,专利权已成为企业在国际市场竞争的重要工具。近年来,随着我国市场的开放,许多跨国企业纷纷涌入中国。一方面,他们利用手中的技术优势获取专利权以外的市场垄断行
早在1986年我国就提出了“社区”这个词语,同时我国民政部也第一次把“社区”这个概念引入我国的城市管理体系,随即提出要大力发展社区工作。随后,在1990年初,我国提出了“社区建
<正>考题解说"含义理解"题多考查文中词语的含义,这类题常见的提问方式有:①指出下列句子中加点词语在文中指代的具体内容。②请你说说下面句中加点词的含义。③请谈谈你对下
当代大学校园,品牌体育休闲服装越来越成为最受大学生欢迎的着装,李宁作为我国发展最迅猛的一个体育品牌,完全需要采取一些新的营销策略抢占市场份额。本文根据李宁的品牌特
摘要:二氧化碳红外传感器读出电路主要应用于基于红外光谱吸收的C02气体浓度检测的仪器中。它将基于红外光谱吸收的C02气体浓度检测电路简化为光源,传感器,读出电路以及MCU,减