用最小最大熵吉布斯模型学习结构化吉布斯点过程以及随机向量分布的研究

来源 :浙江大学 | 被引量 : 0次 | 上传用户:david6357
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
吉布斯模型是一种非常通用的统计分布模型,在图像处理、计算机视觉和统计学习等邻域得到了广泛的研究和应用。本论文深入研究了基于最大熵原理的吉布斯模型在学习结构化点过程和随机向量分布方面的一些原理和应用,做出了一些有意义的发现。 本论文的基本出发点是基于下面三篇关于吉布斯学习的重要文献,即[Zhu 97]中创造的用最小最大熵准则(Minimax Entropy Principle)学习纹理图像分布的一套统计框架,[Guo 01]中提到的用吉布斯模型学习纹理基元分布的方法,以及[Liu 01]中介绍的关于非均匀吉布斯模型(Inhomogeneous Gibbs Model,简称IGM)的学习机制。这三篇文献从不同的应用场合和建模方法介绍了基于最小最大熵准则的吉布斯模型是如何成功设计和应用的。具体来说,在涉及到规则矩形网格上纹理图像的统计学习时,[Zhu 97]利用最小最大熵准则推出了具有吉布斯分布形式的统计模型,并给出了一套完整的模型学习和模型采样的方法,在合成纹理图像的应用中取得了很好的效果。另一方面,作为一种新的尝试,[Guo 01]利用类似的吉布斯模型研究纹理图像上纹理基元的分布现象(一种结构化的随机点过程)。纹理图中基元的个数、位置和属性都是需要建模描述的对象,如何学习这三者之间的关系是[Guo 01]所要解决的问题。上面这两类模型研究的范畴属于空间统计邻域,而IGM是一种用来学习随机向量分布的模型。IGM比主成份分析模型(Principle Component Analysis,简称PCA)更具有表达能力,同时比混合高斯模型(Gaussian Mixture Model,简称GMM)更容易学习和训练,因此在学习独立同分布数据的统计分布上显示出广泛的应用前景。 本论文的研究工作主要有以下两个方面的贡献:贡献一,我们发现构造随机场和点过程模型上最关键的一环就是要定义合适的clique空间,作为比较任意两个随机场或点过程之间相似性的媒介。根据这个思想,我们提出了一种较[Guo 01]更鲁棒和直观的模型来学习纹理基元的分布现象。新方法利用Delaunay[Delaunay]三角化算法构造基元图案的clique集合,并要求模型自动生成的纹理基元图案和观测的基元图案在clique空间上具有一致的统计特性。同时,我们采取了一种自动学习特征的机制,能够不断向模型中加入有效的特征直到模型符合要求。实验表明我们可以在较少的特征下学到纹理基元的分布规律。贡献二,我们发现IGM在两个方面都存在不足,一是在进行特征选取时,缺少一个可计算且能够被合理解释的准则;二是模型的学习(训练)过程非常耗时。我们在本文中给出了一个基于信息增量的可计算准则来选取特征,要求模型优先接受那些能带来更大信息量的特征。同时对于给定的特征能解析的计算出较优的模型参数作为初始值。由于初始模型的分布函数己经比较接近最优分布,应用Importance采样技术就可以极大的加快模型的学习过程。实验表明该方法对于一般的学习任务能够获得几十倍的速度提升。
其他文献
本实验通过不同离子通道抑制剂对胀果甘草钠离子吸收的影响分析,探讨了其钠离子吸收的共质体途径,为其耐盐分子机制的研究提供基础。结果表明:在低盐浓度(50 mmol/L NaCl)和高
境外企业的财务管理是企业管理的核心内容,良好的财务管理工作能够改善企业经营水平,提高企业的经济效益。海外企业蓬勃发展,但是在发展过程中受各方面的因素的影响,在财务管
我国水泥的需求从长期来看,还是处于上升时期,随着落后产能的淘汰,水泥价格也将同步上涨。近日,记者对几个价格上涨幅度较大的省进行了了解。
<正>膜技术应用于饮用水处理始于20世纪80年代末。近20年来,在美、日、欧等世界先进国家和地区,膜技术发展和应用十分迅速,膜技术已成为成熟的饮用水处理工艺,适用于各种水源
急性胰腺炎(acute pancreatitis,AP)是一种由多种病因引起的极为凶险的急腹症,患病率居于急腹症的第3~5位。AP的病情轻重不一,其中多数为轻型,病死率不超过2%,