论文部分内容阅读
基因表达式程序设计是一种新兴的搜索算法,它在个体的表示、处理和结果的形式上等方面与传统遗传算法及遗传规划有着显著的区别。遗传规划是在遗传算法的基础上发展起来的,在性能上优于遗传算法,而基因表达式程序设计(GEP)与遗传规划相比,在符号和表达式的处理上更有优势。本文在分析、研究遗传算法与遗传规划基本理论的基础上,对遗传规划与GEP对数据挖掘中的应用进行了较深入的研究。主要内容包括以下几个方面:1)阐述函数挖掘的基本概念,分析了符号回归的特点和难点,主要是分析符号积分、带任意常数的符号回归以及计算机图像压缩等问题。2)论述了遗传算法、遗传规划的基本原理和解决问题的步骤,指出了传算法和遗传规划的缺陷。3)提出了基因表达式程序设计(Gene Expression Programming,GEP)。用基于模拟退火算法的混合GEP(SAGEP)求解带任意常数的符号回归问题,有效的加大了结果的精确度。在符号积分问题上,采用由算法本身创建随机常数的方法,使得回归过程复杂性更低、节约内存资源。对于计算机图像压缩问题,利用GEP将图像转化成一种符号表达式,为图像压缩存储提供了一种可行的方法。4)通过大量的实验,结果证明,GEP比GP方法的适用性更广、数据拟合与预测的精度更高、能够在较短的时间内找到多个较优的函数模型等优点。