基于随机森林和BP神经网络的个人信用评估比较分析

来源 :山东大学 | 被引量 : 0次 | 上传用户:lhm136
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网金融的发展,人们对于借贷与投资不再单纯的满足于传统的银行等金融机构,而是渐渐转向更加方便快捷的网络借贷,P2P网络借贷就作为重要的一部分支撑着人们借贷与投资的需求,在这种大背景下,个人信用显得尤为重要,信用风险也成为各大网络平台不可忽视的最大风险。本文聚焦于个人信用风险评估,选择集成分类器随机森林和误差反向传播神经网络来搭建信用风险评估模型。随机森林算法能够提供较高的分类精度,而且不容易产生过度拟合,有着较高的稳定性,对于特征维度较高且类型不一纷繁复杂的个人信用数据来说,随机森林算法相比于传统单分类器模型能够更好的处理信贷风险评估问题。误差反向传播神经网络具备强大的学习能力,对于复杂的个人信用数据也能提供较高的分类精度,缺点就是稳定性比较差。本文利用美国Lending Club公开数据集,通过一系列数据清洗、转换、筛选等预处理方法,分别构建了基于随机森林和BP神经网络的个人信用风险评估模型,并与Logistic回归模型作了简单的对比,发现三种模型在信贷风险评估方面各有优劣,进而将三种模型通过投票的方式组合成新的模型并用来建模,结果发现分类效果好于三种模型单独的效果。随后还试验了不同的重采样方法对模型效果的影响,结果发现上采样方法对于这类样本不平衡问题有着不错的效果。同时,本文还存在着许多不足,在特征选择和分类精度等方面模型还有进一步提高的空间,在以后的研究中还有待进一步的改进与完善。
其他文献
利用Ames试验分析2个基因型的烟草品种CS-1和CS-2烟雾提取物(CSE)对TA97,TA98,TA100和TA102标准测试菌株的基因毒性;采用亚慢性毒性试验,对SD大鼠连续烟气暴露56 d,观察其肺组
首次提出了松铺系数控制法和修补料用量控制法,以准确控制沥青路面进行坑槽修补时的投料量,使修补坑槽的密实度和平整度能同时得到保证.
在广泛调研的基础上,给出了一种新型组合式平衡阀, 介绍了其结构以及工作原理,分析了这种新型组合式平衡阀的工作性能.
自然对流广泛地存在于自然界和各种工业系统内,特别是基于工业设备内流动发展而来的侧加热腔内自然对流模型,由于其广泛的应用性,备受流体力学界重视。尤其是因为控制侧加热
温差驱动下的自然对流广泛存在于自然界和工业领域,对其的研究构成了流体力学的重要组成部分。作为分析温差驱动下自然对流的经典物理模型,侧加热分隔腔内的自然对流因为能够
罗兰·巴特①(Roland Barthes,1915—1980),法国当代著名文学理论家、文化批评家,法国结构主义的主要代表人物。巴特一生都致力于揭示个人化的生存经验,并主要通过散文式的或断片式的符号学书写方式反对“多格扎”(“doxa”)。国内外针对巴特符号学思想中的理论部分的研究颇多,然而在巴特符号学批判中重要且不容忽视的却是他对生活的符号学书写,包括衣、食、住、行,包括爱与死。其重要性在于,
氯霉素作为一种典型的抗生素,在医疗和水产养殖中被广泛应用,其造成的环境污染问题已不容忽视。而对于氯霉素的研究多集中在污染分布、残留检测、降解方式及影响因子等方面,
本研究选择本底条件较一致的亚热带天然林(阿丁枫)、次生林(米槠)、人工林(杉木)、园地(桔园)为研究对象,采集阿丁枫、米槠、杉木、桔园植被下的土壤样品,通过加入经13C标记
传统的乡村规划中,规划体系主要由“总体规划-详细规划”两个层次。详细规划规划是以行政村为单位进行编制,在编制过程中很少能够考虑周边城镇、村庄现在的发展状况与未来的