论文部分内容阅读
IB理论通过将数据对象压缩到一个事先定义好的“瓶颈”变量的过程中极大地保持其与另一数据对象的关联性,解决了传统的模式分析方法不能有效解决的问题。随着IB理论在各领域应用的深入,IB算法在求解空间增大和变化的情况下所存在的问题也逐渐暴露出来,其中之一是:IB算法的压缩变量参数的确定问题。本文针对sIB算法的压缩变量参数的有效性确定问题,采用最小描述长度原理,构建一种自动确定参数的AsIB算法。算法使用一种有效的编码方案对数据分析模型和相应的数据进行描述,将最小描述长度的模型作为选择标准,从而有效发现了数据蕴含的特征模式数目。实验表明:AsIB算法所采用的编码方案有效,在不设定模式数目的情况下,能够正确发现数据集所蕴含的模式。该算法解决了现sIB算法对先验知识的依赖问题,将能拓展其在多维数据的自动降维分析和模式提取等方而的府用。