树编辑距离相关论文
经过长期的信息化建设,使企业和组织内部产生了大量遗留系统,这些系统在实施过程中缺乏系统性、一致性考虑,因而产生了大量异构信......
数据库技术是当今信息处理的基本手段,数据库课程是国内高校计算机专业学生必修的专业基础课程,数据库课程建设的好坏直接影响到培......
近年来,随着在线考试系统的推广和流行,针对计算机自动评分技术的应用研究已迅速地发展并成熟起来。但是,目前大多数的在线考试系......
随着国际互联网的迅猛发展,网络已经成为人们发布和获取信息的一个重要平台。目前,大部分网页都是通过服务器根据请求从后台数据库......
随着互联网的高速发展,Internet在我们日常的生活中扮演越来越重要的角色,成为我们生活和工作中必不可少的一部分。网络的高速发展......
探讨把相似网页转化成标签树,引入树编辑距离的概念,利用树匹配算法来量化网页结构相似度。把该算法应用于Web信息抽取,采用树的相似......
为了识别犯罪嫌疑人伪造和篡改的虚假身份,利用树编辑距离计算个体属性相似性,证明了树编辑距离的相关数学性质,对属性应用层次编......
本文提出了一种利用树编辑距离和AESA算法进行手写体数字识别的方法,该方法的识别效果接近基于神经网络和支持向量机的手写体数字......
针对Web中数据密集型的动态页面,文本数据少,网页结构化程度高的特点,介绍了一种基于HTML结构的web信息提取方法。该方法先将去噪......
提出一种改进的树匹配算法,通过考量HTML特性,对树编辑距离方法进行改进,根据不同HTML树结点在浏览器中所显示的相关数据的不同权重赋......
针对数据库机器学习过程中的存储过程评估问题,提出基于AST的存储过程自动评估模型。从静态评估的角度,给出了模型的整体框架;以构......
XML类型的数据成为当前主流的数据形式,本文提出一种检测XML数据相似性的方法,即将XML文档转换成树结构的基础上,对树结构的节点加权,......
针对SQL语言编程能力评估的多因素影响、界限模糊特性造成的难度和偏差问题,本文提出了基于结构相似度匹配的评估模型(SQL-APAM)。结......
Web信息抽取中需要对目标网站的网页进行聚类分析,以检测并生成信息抽取所需的模板。传统的基于DOM树编辑距离的网页聚类算法不适......
在工作流的发现和聚类等应用中,需要对两个工作流模型的距离进行度量。因此,提出一种计算两个不同结构化工作流的距离定量度量方法......
以SQL预编译的构建为目的,提出一种基于ANTLR(Another Tool for Language Recognition)的SQL预编译设计模型。模型从编译原理的角......
Div+CSS流行于Web页面的布局,在这种布局下,网页中很多数据记录以重复结构的形式聚集在一个层级。为了更好地从网页中挖掘数据,提......
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们......
介绍基于网站和网页结构的信息采集算法,提出一种基于约束树编辑距离的导航树算法。该算法通过提取网页的HTML的重要标记生成网页结......
本文研究了如何从列表页面中抽取数据记录.系统分为两个阶段:第一步采用三种启发式方法相结合的方法.识别主数据区域的根节点;第二步将......
树形结构的文本配置在分布式的测控数据处理软件中使用广泛,它的正确性对数据处理而言至关重要。为了实现树形结构的文本配置自动......
动态网页是Internet上重要的网页类型,它们通常是由网站的后台数据库通过某种通用的模板构成。提出了一种新的基于树模型算法的动......
近年来Internet迅猛发展,Web已随之发展为世界上规模最大最复杂的知识库,越来越多的人从Web中获取其所需信息,因此,Web信息抽取方法应......
处于电力系统末端的配电网,履行着电能分配的职责,直接影响用户供电可靠性和供电质量,是灵活互动智能用电的实现地,具有拓扑结构多......
已有的拓扑相似性度量方法主要通过目标之间拓扑关系统计均值的差值,衡量目标之间的拓扑相似程度,在拓扑变化复杂区域由于拓扑关系......
有向标记根树之间的编辑距离(TED)被广泛应用在文档的结构化相似度计算上.文中提出有向标记根树之间的语义编辑距离(TSED)的概念,......