基于微粒群优化的异质数据特征选择

来源 :中国矿业大学 | 被引量 : 0次 | 上传用户：ivy1128

【摘要】

：

特征选择是数据挖掘和模式分类领域的重要数据处理方法，广泛用于故障预测、疾病诊断、网络入侵检测和生物情感识别等众多领域。考虑外部环境和测量设备精度等因素的影响，很多实

【作者】

：

胡滢

【机构】

：

中国矿业大学

【出处】

：

中国矿业大学

【发表日期】

：

2014年期

【关键词】

：

特征选择微粒群优化异质数据高斯采样概率占优

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

特征选择是数据挖掘和模式分类领域的重要数据处理方法，广泛用于故障预测、疾病诊断、网络入侵检测和生物情感识别等众多领域。考虑外部环境和测量设备精度等因素的影响，很多实际问题中不同特征所对应的采样数据的质量往往相差很大,这类问题称为异质数据特征选择问题。由于该类问题不但具有维数众多的特征，而且不同特征所对应采样数据的质量各不相同，因此，面向无差别数据的传统特征选择方法难以使用。鉴于此，本文研究面向异质数据特征选择问题的微粒群优化理论和方法。首先，考虑数据质量完全可信的特征选择问题，提出一种知识引导微粒群优化特征选择方法。采用二进制方式对微粒编码，给出微粒适应值的计算方法；依据微粒适应值的大小，将整个微粒群分为优势微粒群和劣势微粒群，并根据特征被选择概率，给出特征的优劣分类策略；根据特征所属类型，改进Sigmod函数，进而确定特征被更新的概率。采用UCI数据库的10个典型测试数据集验证所提方法的性能，并与3种已有方法进行对比，实验结果验证了所提方法的优越性；同时，将其应用于国内某家医院的肝炎病临床诊断数据，结果显示，所提方法能够获得令人满意的分类结果。然后，考虑数据质量不完全可信，但其可信程度可以精确表示的情况，提出一种基于多目标微粒群优化的特征选择方法。该方法采用[0,1]之间的精确数表示数据集中每个特征的可信程度（可靠性），由被选特征的平均可信度，评价相应特征子集的整体可靠性，将问题描述为同时包含分类精度和可靠性的2目标优化问题。采用多目标微粒群优化方法求解该问题，为了提高算法的搜索性能及Pareto解集的分布性，结合网格划分和高斯采样，给出一种微粒全局引导者产生方法；为了提高微粒群的全局搜索性能，提出一种帮助微粒跳出局部最优的扰动策略。将所提方法应用于UCI数据库中6个典型测试数据集，并与已有4种方法对比，实验结果验证了所提方法的优越性。最后，考虑数据质量不完全可信，且其可信程度为模糊数的情况，提出一种数据质量模糊表示下多目标微粒群优化特征选择方法。该方法采用三角模糊数表示数据集中每个特征的可信程度（可靠性），相应地，特征子集的可靠性指标变为模糊数。处理上述包含模糊性能指标的2目标特征选择问题，首先，定义一种Pareto概率占优关系，用来比较微粒的优劣；然后，根据解的概率占优关系和定义的决策者容忍系数，给出一种有效的外部储备集更新策略。利用UCI数据库的4个典型测试数据集验证所提方法的性能，并与已有2种方法进行对比，实验结果验证了所提方法的优越性。

其他文献

上海巴士公交信息化中的关键技术

论文提出了现代化的公交运营管理与调度系统的基本框架，指出了公交调度计划系统和基于地理信息系统的公交车辆现场监控系统在现代公交运营管理中的地位和角色。并结合上海巴士

学位

公交调度计划系统遗传算法车载终端公交车辆监控系统公交电子地图

OPC报警与事件服务器的开发研究及实现

OPC(OLEforProcessControl)是世界上领先的自动化公司和软硬件供应商在微软合作下开发的一套工业标准，用于规范软件和硬件的接口，提高系统的开放性。OPC技术提供了标准化访问接

学位

COMOPC报警CAN总线OPC事件服务器标准化访问接口

动态不确定非线性系统的鲁棒控制及其应用

本文研究了存在未建模动态的不确定非线性系统的鲁棒控制，及其在励磁发电机模型上的应用。首先，介绍了递归设计方法-Backstepping方法，以及分别针对存在有界扰动和线性

学位

非线性系统鲁棒控制励磁发电机有界扰动

舰船C4I集成的若干实时元素特性研究

本文以海军舰船C4I系统集成应用中的元素特性分析为背景，针对其中若干实时元素特性展开一系列的模型与算法的研究，这些实时元素包括：实时Agent模型、具有切换时间的多机调度以及

学位

多Agent实时系统集成实时控制多机调度协同设计

通信智能化的综合电力参数变送器的研究与设计

随着电子技术、计算机技术和通信技术的发展，电力参数传送技术与现场总线技术也得到了迅猛的发展，将两者结合成为一个必然的趋势。另一方面，随着Internet网络的普及，一些电参数传

学位

电力参数变送器现场总线以太网通信智能化电力系统远程检测

基于Linux数控系统的软PLC研究

随着科技的发展，传统的数控系统越来越显示出其缺点，它的封闭式结构、专用的功能使得用户很难在其上进行扩展，因此迫切地要求采用模块化、层次化的结构，并通过各种形式向外提供统

学位

数控系统可编程控制器Linux操作系统PLC控制

单交叉口交通信号配时的模糊控制策略及其遗传算法优化

本文针对固定相序的单交叉口多相位交通信号进行控制，提出基于车流量预测的动态调整相位最大绿灯时间的模糊控制系统结构。该控制策略通过模拟交通指挥者实际进行交通控制的特

学位

交通管理单交叉口信号配时模糊控制

组态软件中基于LNS的OPC服务器与客户端的开发

本文主要讨论了组态软件在数据采集方面的发展方向，即OPC技术。LonWorks总线作为一种工业总线在工业控制和楼宇控制中具有广泛的应用，LNS(LonWorksNetworkService)作为其操作系

学位

自动控制组态软件软件设计

城市经济空间主体区位选择的建模与仿真——以西安市为例

随着城市化进程的加快和经济全球化的趋势,对城市经济空间结构的动态演化、内部结构机制的动态行为进行描述、预测等显得尤为重要。以往对城市经济空间结构的研究大都建立在

学位

城市经济空间主体区位选择复杂适应系统理论经济主体

改进二阶SPSA-MFA算法及其应用

为了解决对受控系统数学模型结构的依赖和未建模动态的问题，自适应控制界提出了MFA(无模型自适应)控制的概念，即不需要建立系统的模型或者在对系统模型知之甚少的情况下根据系

学位

自适应控制随机逼近同时扰动组态软件算法理论

基于微粒群优化的异质数据特征选择

其他学术论文