基于编辑距离图嵌入的图匹配算法研究

来源 :西安建筑科技大学 | 被引量 : 0次 | 上传用户:qq462283910
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
图作为一种结构化的信息表示形式,在模式识别领域中日益得到广泛重视。图嵌入方法结合统计学习理论中向量空间的优势,将图嵌入至一定维数的向量空间,通过向量空间的相似性度量方法搭建了从结构模式识别问题到统计模式识别问题的桥梁。图的编辑距离是一种任意结构和任意标记图之间的非相似性度量,而传统的树搜索算法计算图编辑距离需要指数级的算法复杂度。随着训练样本集规模的增加,直接导致图嵌入时的特征向量的维数大幅上升,产生“维度灾难”,且特征向量中包含了大量冗余和噪声,因此,在确保模式识别的精度前提下,快速的编辑距离计算算法和降低图嵌入维度的原型选择方法设计,是当前图匹配研究领域的研究热点与难点问题之一。本文针对上述两方面的问题进行展开,主要研究工作如下:(1)通过研究与比较现有的基于原型选择的图嵌入方法,设计出一种以编辑距离度量为基础,采用训练样本每一类内聚合和与其他类相远离的策略,构造出较好区分各类的原型图,并通过实验证实了该方法的效能。(2)针对上述策略选取的原型未能考察类内选取的原型对类之间的相互影响,设计出一种改进的采用训练样本每一类的类内和其他类的进行均衡化处理的原型选择方法,实验表明,该方法选出了对分类效果明显的原型集。(3)通过分析传统的树搜索编辑距离算法,它的效率随着图的规模呈指数级增加,采用了一种快速的编辑距离计算算法,设计出一种利用图之间的属性计算定义代价函数。实验结果表明,本文设计的原型选择方法和编辑距离算法可以有效地降低特征向量的维度,并有效改善图嵌入下的模式识别精度。
其他文献
频频发生的反倾销案件使得中国服装产品出口受到重创,当务之急,作为全球最大的纺织品出口和遭受反倾销调查最严重的国家,中国应迅速建立针对出口服装商品的反倾销预警机制。  
随着互联网应用的普及,对网络通信进行分析和监控确保企业和国家的网络信息安全已经成为一个非常重要的课题。当前的协议解析研究工作多是在协议已知的前提下进行的。协议未知
当前,P2P流媒体直播软件已经大规模商业应用,而P2P点播软件在技术上也逐步走上成熟。虽然不同网络运营商对于P2P软件的蓬勃发展采取了截然不同的态度,但P2P软件所代表的个体
在过去的一个世纪中,通信网络的发展主要取决于技术的更新。自上世纪末开始,业务驱动网络发展的趋势已经明朗,业务提供已经成为下一代网络(NGN)的关键技术之一,快速高效地生成和
本研究针对因特网上的文本数据进行语言识别,包括网页和电子邮件内容等,以构建实时、高效的语言识别模块为目标,设计了一种复合方法来实现多语种文本的语言识别。文章首先介绍了
在网络信息时代中,信息量庞大,且信息模式多样。XML作为兼具可扩展性及灵活性的通用数据传输格式,越来越多地被人们用来表示异构数据,以克服多数据源的不一致性,从而达到信息
随着多媒体技术和计算机网络的迅速发展,越来越多的数字信息产品通过网络广泛传播。在给人们带来便利的同时,由此而引发的非法拷贝和恶意篡改等侵权行为也引起了人们的关注。
通常认为,中间节点所进行的数据处理对数据传输过程本身并不会带来任何好处:然而,2000年,Ahlswede等人在IEEE信息论会刊上发表了题为《NetworkInformationFlow》的论文,彻底推翻了
在实时控制系统中,软件是控制反馈环的重要部分。该类软件中增加了严格的时间要求,同时低级的实时技术须与高级的程序设计、网络通信、仿真和控制相结合。作为控制大型复杂不确
随着信息技术的高速发展,数据库应用的规模、范围和深度不断扩大,产生了“数据丰富而信息贫乏”现象。为了解决这一问题,人们提出了数据挖掘技术。经过十几年的发展,数据挖掘