论文部分内容阅读
在以K-最近邻(KNN)和案例推理(CBR)为代表的类比学习方法中,涉及到特征属性重要性的评估,即权重的分配问题。由于特征属性权重的分布情况直接影响相似度的计算结果,不同的权重分布会得到不同的相似度,问题求解的结果也可能发生大的变化。因而,权重分配方法的研究在基于类比学习的问题求解领域具有重要的应用价值。此外,目前的主观分配法及客观优化法还不能确保权重分布的合理性,在通用性上很难区分这些方法孰优孰劣。因此,有必要探索和研究新的权重分配方法。本文针对类比学习方法中属性权重的优化分配问题,从膜计算(MC)原理与权重优化分配的结合机理出发,对优化权重的膜结构、算法及分类应用中的对比实验进行了系统研究,取得如下结果:(1)为了发挥MC的迭代寻优能力对特征属性权重进行优化搜索,设计了一种细胞型的膜结构。其中涉及到表层膜、次表层膜和若干平行的内层膜的构建、膜规则的制定以及膜间区域子算法的设置等问题。为实现权重优化分配的功能打下了方法基础;(2)利用MC的并行计算优势,对若干平行的内层膜设计了选择、交叉、变异的进化规则,保证每次迭代进化时权重对象的多样性,既能收敛于最优解,又能扩大搜索范围;同时,采用一种双向交流规则去保留进化过程中出现的具有最大适应度的权重对象参与循环迭代,保证输出至次表层膜的权重对象具备良好的性能;(3)为了避免权重的寻优陷入局部极小,将模拟退火(SA)算法与MC结合起来得到一种膜间区域子算法。通过摄动函数对次表层膜的权重对象进行退火操作,并根据适应度的变化情况对其进一步寻优,最后将寻优结果输出至表层膜,以促进MC寻优性能的提高;(4)结合基于数据的模式分类例子,开发了基于MATLAB-GUI的实验平台。研究了MC中参数设置及有无区域子算法SA两种情况下的性能对比。此外,对典型的不平衡数据、缺失数据、医学数据以及TE过程故障诊断等分类问题,将本文方法与目前的权重分配方法进行了对比实验,结果表明本文方法的有效性。本文提出的MC权重分配方法不仅提高了类比学习方法的性能,而且比其它方法更具有应用优势。实验结果证明膜结构的设计、膜规则的制定以及区域子算法SA的设置具有合理性,提高了MC在权重分配中的寻优能力。