自适应多目标优化集成分类方法及其在信用评分的应用

来源 :华南理工大学 | 被引量 : 0次 | 上传用户:dx3386136
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着人工智能技术的发展,学术界越来越重视和机器学习相关的各方面研究,各个行业也开始使用机器学习技术为业务赋能。传统的机器学习方法通常是基于数据分布平衡的假设,而在实际应用场景中数据分布不平衡的问题经常出现,导致传统机器学习方法性能受到一定影响。针对该问题,不平衡学习这一课题被提出并且在不平衡数据集上取得了令人满意的性能。信用评分业务是不平衡学习重要应用场景之一,在信用评分中,机器学习模型被用来预测客户的信用资质好坏,其优点在于能快速对客户信用做出预测来辅助业务决策,在构建客户画像,风险控制,营销业务中起到了很大作用,但是受到信用评分业务的复杂性和异构数据的存在等因素影响,信用评分场景下的数据不平衡问题成为比较具有挑战性的研究课题。近些年来,信用评分场景下的不平衡机器学习方法主要包括采样方法,代价敏感方法,不平衡集成分类方法等,这些方法在信用评分场景中已经取得了比较好的表现,但是仍然存在着相应局限性,主要表现在:1.采样方法通常缺乏对样本分布的优化,其中基于稀疏采样的方法通常会丢失部分有用信息;2.部分不平衡算法比如代价敏感方法对于噪音样本和离群点十分敏感,性能不是很稳定;3.不平衡集成分类方法通常缺乏自适应优化机制,而且较少考虑到样本和特征空间的组合优化等。根据上述方法存在的局限性,本文提出了一种适用于信用评分场景下的自适应多目标优化集成分类方法。该方法的创新点在于:1.在过采样方法中引入了粒子群优化算法进一步优化采样后的样本分布,使得过采样后的样本分布更加接近原始数据分布;2.将样本维度优化和特征维度优化同时引入到集成学习框架,在对样本进行优化后,引入多目标优化算法结合信用评分场景的常用评价指标对随机特征子空间进行优化,然后训练子分类器并对分类结果进行集成以提高模型性能;3.设计一种自适应优化策略来优化分类器集合,借鉴强化学习反馈机制来更新对应特征子空间内分类器被采样的概率,最终得到更优的分类器集合。实验部分对算法的关键技术做了详细的对比试验,并且通过数据可视化直观展示其优化效果。在真实世界信用评分数据集上的实验结果显示本文提出的算法整体性能要优于当前主流不平衡分类算法。
其他文献
结构可控性和时效网络都已被证明是研究复杂系统的有用工具。在对复杂网络的研究中,其可控性是最基本的问题之一。本文致力于建立这两者的联系,主要研究基于具有时变拓扑的时
当前中国正在经历世界上最大规模的城镇化进程。推进城镇化的进程是中国经济和社会发展必然要经历的一个过程。在快速发展的城镇化进程中,如何能够有效地转变城镇的发展形式
为应对资源受限设备中的数据安全与隐私保护问题,2013年美国国家安全局提出一种轻量级分组密码算法—SIMON算法。在公布算法时,设计者并未公开其安全性评估报告。为探讨SIMON
目的:本研究旨在通过年龄-时期-队列分析来分别评估中国新疆南疆四个地区乙肝发病率趋势,中国江苏省不同人口结构和结核病发病数较高的六个城市的结核病发病率趋势和中国重庆市与深圳市艾滋病发病率趋势,并分别估计年龄、时期和出生队列的独立影响。最后从不同的角度分别预测不同年龄组发病率的未来趋势,并尝试通过模型拟合和预测确定疾病筛查的目标人群。方法:(1)首先,在新疆维吾尔自治区疾病预防控制中心,江苏省疾病预
学位
刑事诉讼中的“异地管辖”打破了我国《刑事诉讼法》对刑事案件管辖的一般性规定,以消除在法定管辖地进行侦查、起诉、审判中可能产生的不良影响,为实现刑事诉讼实体和程序两方面公正而将案件改由法定地域管辖权的专门机关实施管。在我国的刑事诉讼领域,首次明确规定“异地管辖”的时间是在2012年。刑诉法在第42条第二款规定中表明,如果辩护人也有可能涉及犯罪案件时,不可以将案件侦查交由其所承办案件的侦查机关负责,而应当由其他侦查机关负责办理。在我国刑事诉讼领域,适用“异地管辖”这一办案模式
学位
跨视域行人跟踪是指在不同摄像机视域下对给定目标行人进行检索、匹配和跟踪,在智能安防领域具有广阔的应用前景。但是,由于受到遮挡、光照变化、行人外观差异大等因素的干扰,跨视域行人跟踪方法仍然存在特征提取效果差、跟踪准确度低等问题,难以满足落地应用的要求。因此,对跨视域行人跟踪的研究仍具有重要意义。本文围绕跨视域行人跟踪方法,从行人跟踪和行人再识别两方面展开研究。具体工作内容如下:针对行人跟踪网络模型图像信息利用不充分的问题,提出一种基于改进DIMP的行人跟踪方法。首先,改变残
学位
济源市克井盆地地下水按含水介质不同可分为松散岩类孔隙水、碎屑岩类裂隙水和裂隙岩溶水,其中碎屑岩类裂隙水富水性差,开采价值低;松散岩类孔隙水易受污染,主要用于农田灌溉
如今,越来越多的企业通过组建跨职能、知识和文化背景的团队来解决组织面临的复杂问题,然而团队成员也会因彼此特征的差异而引起团队内部分化成多个子团队。如何减少团队内部
音乐音响具有非语义性和非具象性,这个性质决定了学生获得得音乐审美体验的基本途径只有通过聆听、演唱、演奏和音乐编创等多种实践形式才能实施。但是在实际教学过程中,笔者发现初中的音乐课堂存在教学方法不够丰富、对学生节奏、音调、曲式结构等音乐要素和音乐技能的训练较少等问题。面对音乐课堂过分强调审美体验而忽视音乐实践教学的问题,美国音乐教育家和音乐心理学家戈登在他的音乐教学理论中针对学校音乐课堂教学提出了一
学位
土地是人们生存生活的基础,在社会经济的发展中,土地资源的稀缺性与有限性,同人类对于日益增长的土地需求之间的矛盾日渐凸显,土地利用规划不仅有效合理安排社会经济中的各项