基于多目标进化优化的混合过滤式和包装式特征选择算法研究

来源 :安徽大学 | 被引量 : 0次 | 上传用户:madiawang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着科学技术的进步,出现了许多包含大量特征的问题。大量的冗余特征会显著降低模型的学习精度和速度。为了消除冗余特征,特征选择在各个领域被广泛应用。现有的特征选择算法主要分为两类,第一类为过滤式方法,该方法根据数据的特性定义一些评价指标,通常速度较快。第二类是包装式方法,包装式方法通常是一种迭代型算法,能够得到较高的分类精度。为了能够同时提高算法的分类精度和缩短算法的时间,一种基于混合(结合过滤式和包装式)的特征选择算法被提出。由于现有的很多特征选择算法容易陷入局部最优,而进化算法有很好的跳出局部最优的能力,所以本文提出了两种基于多目标进化优化的混合特征选择算法。为了充分融合两种方法的优点,本文提出了一个基于交互的混合多目标特征选择算法。为了能够进一步的提高算法的分类效率,本文又提出了一个基于可变样本的混合多目标特征选择算法。本文的主要工作包括以下两个部分:(1)基于交互的混合多目标特征选择算法。具体来说,在该算法中包括两个种群,包装式种群和过滤式种群。为了充分利用这两种种群的优点,本文提出了一个基于交互的混合多目标进化算法,其中,指导策略和修补策略被用来选择高质量的特征子集。指导策略是利用包装式种群中较好的解来指导过滤式种群向更好的方向进化。在修补策略中,利用过滤式种群中的有用信息对包装式种群中的一些可能陷入局部最优的特征进行修补,减少包装式种群遇到局部最优问题。为了进一步提高算法的性能,该算法中提出了两种有效的初始化策略。与几种最新的算法相比,所提出的算法表现出较好的性能。(2)基于可变样本的混合多目标特征选择算法。在数据集中选择特征时会对特征子集进行评价以保证特征选择的分类精度,通常评价的过程是非常耗时的。在数据集中不仅仅有冗余的特征,也存在着冗余的样本,所以为了保证分类精度的同时减少特征选择的时间,本文提出了一个可变样本的特征选择算法。该算法将样本分类正确频率的结果作为选择样本子集的标准,在迭代的过程中不断地动态调整样本集,使得特征选择的结果和时间都能有一个很好的保证。为了能够更好的帮助算法跳出局部最优,该算法提出了一种最近最远相似性的修补策略。实验表明,在多个数据集中该算法都能同时保证分类性能和执行速度。
其他文献
粮食是人类赖以生存的物质,是国家的重要战略物资,农业的发展要放在一切经济发展的首要位置。当前国际上各个国家粮食危机频发,我国粮食能在自给自足的情况下保有一定的粮食库存,粮食安全对人民幸福、国家昌盛有着重要影响,直接关乎社会稳定。近年来,我国粮食产量逐年增加,国家对粮食的储存提出了更高的要求,并提出“藏粮于地,藏粮于技”战略。在智能仓储管理系统中,仍然存在测控设备管理不善、监测系统功能不全等问题。为
Z.Pawlak于1982年提出来的粗糙集理论是一种描述不完整性和不确定性知识的数学理论工具,该理论已被应用于智能计算技术领域研究中,不仅如此,还被广泛的应用到KDD中的数据挖掘中、文本分类中等各种领域。许多应用领域的数据不仅种类复杂,而且由于各种原因的影响导致数据信息是不完备的,这对于粗糙集的进一步研究也带来了新的挑战。比如,决策粗糙集模型作为一种扩展模型,可以被用来处理多种类型的数据,但是,目
生产调度问题是运筹学的重要研究方向之一,在金属加工、物流货运以及食品制造业等都有着丰富的应用。随着工业的发展,传统的工作模式难以满足日益复杂的调度环境,而批调度生产模式能够批量处理材料因此得到广泛关注。制订高效的批调度方案可以实现有限资源的合理配置,压缩工业成本的同时提高生产效率,是企业保持长久发展的重要途径。本文以半导体芯片制造业以及智慧物流等工业的生产过程为背景,面向基于成组分批加工的运行模式
粮食安全一直是国家军事战略安全和农民基本生活保障的重要支撑点,对维护社会秩序、市场合理化、国家安全起着非凡影响。当前我国粮情测控问题主要包括温湿度采集硬件成本高和粮仓环境变化不能精确测量和控制,从而造成粮食的损坏和浪费,并且严重影响粮食存储安全,损害国家利益。因此针对现有粮情测控问题,将无线传感器技术、低功耗和远距离无线电传输技术(Long Range,LoRa)和神经网络知识应用于粮情测控领域很
如何在不耗费过多资源的前提下拥有较高的作业效率一直是学术界研究的重点和难点,传统优化策略对该问题的寻优效果往往并不理想,而群智能优化算法的出现使学者们的寻优思路不再过于局限。该类算法可以通过不断的迭代和搜索以获取最终结果,在求解过程中不仅可表现出极高的智能性还能够极大减小人力资源成本。蝙蝠算法(Bat Algorithm,BA)主要是对自然界中蝙蝠超声波的回声特征进行模仿,作为一种具有代表性的群智
小麦籽粒在感染赤霉病(Fusarium head blight,FHB)的过程中所累积毒素会对人和动物的健康造成巨大的危害,同时也会影响小麦的产量。传统的赤霉病识别主要依靠专家的经验以及一些设备仪器,该方法存在耗时耗力和低效等缺点。因此,开发出一种高效的小麦籽粒赤霉病识别方法至关重要,对于我国智慧农业的发展具有重要意义。现有研究表明,光谱学技术具有快速无损的特点,可以应用于农作物病害的检测。目前,
近年来,民用汽车保有量的持续增长,导致交通供需不平衡问题日益严重。交通流数据能够直观反映出实时的交通状况,若能提前了解可靠的交通信息,将有助于交通管理者制定和实施交通规划策略,有效地降低公共安全风险。同时,还可以帮助旅行者更好地规划出行路线,减少时间成本和经济损失。因此对道路的管理者和使用者都具有十分重要的意义。然而,由于道路之间的时空相关性复杂多变,交通流数据的非线性和随机性特征,交通流预测变得
现实世界中的复杂系统与人们的生活密切相关,这些复杂系统都可以表示为复杂网络,其中社团结构作为复杂网络的重要特性之一,对于分析复杂网络的结构属性和潜在功能具有重要作用。复杂网络中的社团结构主要分为两类:一类是非重叠社团,即网络中节点只能属于一个社团;另一类是重叠社团,即网络中节点可以属于多个社团。由于现实世界中大部分复杂网络都具有重叠社团结构,所以本文关注重叠社团检测问题。为了解决这个问题,基于多目
随着大数据以及云服务时代的来临,互联网上Web服务呈指数增长,具有类似功能的Web服务也急剧增多。如何在功能相同的海量服务中为用户推荐满足其需求的服务成为服务推荐领域的研究热点。服务的QoS作为衡量服务非功能属性的指标一直广泛应用于服务推荐领域中。然而,在当前网络环境下,由于种种条件限制,用户不可能亲自调用每一个服务来获取QoS值,因此,QoS预测成为为用户在短时间内推荐服务的有效途径。传统的协同
随着城市中汽车数量与日俱增,交通流量日益扩大,给我国智能交通系统带来一定挑战,因此车牌定位与识别技术的研究不能停滞不前,尤其是车牌定位技术更是整个研究领域中最为关键的一环,同时随着汽车周围环境的变化和不确定因素的干扰,传统固定场景下的车牌定位方法逐渐难以满足越来越复杂的实际场景需求。本文基于经典的特征设计工程以及深度学习在目标检测领域获得巨大成功的前提下,针对复杂场景下的车牌定位难的问题提供了两种