基于混合数据挖掘模型的个人信用评估方法

来源 :武汉邮电科学研究院 | 被引量 : 1次 | 上传用户:Janette
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在信贷领域,数据挖掘技术已被多次应用于客户个人信用评估模型当中,而使用最多的数据挖掘技术之一就是分类技术。前面已有学者研究指出通过使用特征选择算法(Feature Selection,FS)和组合分类器可以有效改善信贷客户个人信用评估系统的性能问题。在这一领域,现需要研究的主要问题是如何通过协同参数调优,使得特征选择算法和组合分类器的混合模型性能最优。本文基于三个实验阶段提出了一种混合数据挖掘模型,实现特征选择算法和组合分类器的最优组合。第一阶段是信用数据采集和数据的预处理。第二阶段,实验将在信用数据集上进行四种特征选择算法建模,包括遗传算法(Genetic Algorithm,GA)、主成分分析(Principal Component Analysis,PCA),信息增益率以及Relief属性估计函数算法。在本文中,支持向量机(Support Vector Machine,SVM)分类算法的准确率将作为特征选择算法参数设置的基准。在对特征选择算法参数调优后,将其输出的特征子集分别作为常用分类算法和组合分类算法的输入进行建模。在该建模阶段,通过组合对比实验选出性能最优的特征选择算法和特征子集。在最后的实验阶段中,分别在最优特征子集上使用常用分类算法和组合分类算法进行建模。实验结果显示,第二阶段中PCA算法明显优于其他特征选择算法,在第三阶段中,分类结果显示人工神经网络(Artificial Neural Network,ANN)和AdaBoost(Adaptive Boosting)的组合方法有着更高的分类准确率。最后,本文基于前述三个阶段提出并验证了一个基于PCA和ANN-AdaBoost的混合数据挖掘模型,该模型在个人信用评估应用上具有有效性和鲁棒性。
其他文献
人类目前正处于能源危机的情况,开发新能源已经是迫在眉睫了,氢能以其卓越的优势逐渐引起了人们的关注,研究价格相对便宜的非贵金属催化剂是氢能可以大量使用的关键。以钼和
干旱,盐碱,高低温等非生物胁迫一直是限制旱区农作物产量及品质提高的重要因素,如何提高农作物对这些非生物胁迫的抗性,一直是研究的焦点。近年来,越来越多的研究人员期望通
由于阴离子识别在生命和环境领域的重要性,使得新型阴离子受体的设计合成及其在主客体化学中的研究一直是活跃的研究领域。近年来,本研究组在合成系列含酚羟基及酰胺基的大环
随着刑事侦查工作面临的任务日益复杂,以及其它案侦科学技术手段的快速发展,警犬技术服务刑事侦查工作应该如何深化应用,已迫在眉睫。本文详尽地分析了当前警犬技术服务刑侦
会议
交叉违约是指将债务人在其他合同关系下发生的违约行为作为债务人违反本债务的前提,当发生约定事项从而触发本债务的违约时,债权人有权要求债务人按照约定采取救济措施,如提前到期和提供增信措施等。交叉违约条款早些年多应用于国际贷款协议中,近几年开始出现在我国债券市场领域。交叉违约条款的加速到期功能使得债券持有人得以在债券合同到期之前提前主张自己的权利,从而在实现债权时避免自己落入比其他债权人更不利的地位,条
聚丙烯(PP)纤维作为五大合成纤维之一,具有质轻高强、弹性好、耐磨、耐腐蚀,具有电绝缘性和保暖性等优异性能。PP纤维的工业化之路在我国虽然起步较晚,但是近些年来飞速发展,
近年来Ti-Al系金属间化合物由于具有低密度、高比强度以及良好的高温性能等优点,是潜在的航天材料,拥有可观的发展前景。但由于TiAl本身的室温脆性,对于Ti-Al系金属间化合物
广聚萤叶甲(Ophraella communa)是入侵杂草豚草(Ambrosia artemisiifolia)的专食性天敌,对豚草的防治效果十分显著。模拟了夏季常规的昼夜气温变化模式(32±4℃)、白天均温升
导电聚合物因其具有良好的力学性能、导电性、稳定性和电化学成膜性等特点,在太阳能电池、热电能量转换、CP执行器、可充电电池等方面表现出许多优异的性能。聚噻吩易于被修饰,具有聚合度可控、特殊情况下制备的纳米纤维强度大于铝等特性,因此在导电聚合物的研究中占有重要地位。聚噻吩作为一种新型高分子材料成为有机半导体、电极材料和传感器等器件的主要材料,但是聚噻吩材料的机械故障可能导致整个器件的故障甚至失效。然而
目的探讨脯氨酸羟化酶抑制剂——二甲基乙二酰基甘氨酸(DMOG)对MSCs的动员作用、可能机制以及动员骨髓来源MSCs的生物学特性。方法(1)DMOG对间充质干细胞的动员作用:ICR小鼠