从复杂XML文档中抽取目标关系片段的方法

来源 :郑州大学学报:理学版 | 被引量 : 0次 | 上传用户:leosky_001
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对以往关系信息挖掘中存在的复杂XML文档相似度计算精度不高的问题,提出通过发现包含目标关系信息的最小公共祖先节点SCATR,以SCATR节点为根对复杂文档进行片段划分,并按片段的相似度进行聚类,目的在于改善已有模型对复杂XML文档的识别效果.实验结果表明,通过抽取包含目标关系的文档片段,去除文档片段中无关分枝,能够有效地帮助已有模型从复杂XML文档中识别和抽取出目标关系信息.
其他文献
车辆行驶信息感知是汽车防碰撞系统的关键技术之一,只用单一传感器对目标车辆进行测量容易产生虚警.在对联合卡尔曼滤波分析的基础上,给出了基于联合卡尔曼滤波的汽车防碰撞
传统的X-R(均值-极差)控制图虽然能反映整个过程的变化趋势,但只对较大的偏差反应灵敏,对持续的、较小的偏差反应迟钝.一种基于预测模型的改进算法能较好地反映较小偏差的变化,并以
在研究图像融合基本方法的基础上,提出了一种基于小波变换的双匹配度并结合方向与区域能量的图像融合算法.对低频分量采用双匹配度的融合策略,对高频分量采用结合区域能量的带有方向性的加权算法.实验表明,图像融合算法使得低频部分的内容更详尽,而高频部分保留了有效的细节和边缘信息,最终使图像的清晰度更高.
两个代理的重新排序问题是指,每一个代理有一个非中断加工的工件集,两个代理共用一个机器进行加工,每一个代理分别考察依赖于各自工件完工时间的目标函数.针对单机上有限错位
通过选择合适的计算参数,利用QCD求和规则对基态4+K介子的质量进行了分析和计算.当s0=6.0~6.5GeV2,1.0GeV2≤M2≤2.3GeV2时,计算得到的4+K介子质量的数值结果为(1.831±0.176)GeV,与实验
为使智能主体能够有效处理情感,提出一种基于情感强度的情感主体更新体系结构,以及基于LOBA逻辑的情感主体更新模型.该模型为构建支持情感推理的情感规则库提供了理论依据.
网页分类需要使用标记网页对分类算法进行训练,然而,对网页进行标记的过程既费时又费力.随着Web的快速发展,获得未标记网页已经变得相对容易.为了有效地利用未标记网页来提高
本体作为语义网的重要工具,是对共享概念模型的形式化规范说明.领域本体更是说明了一个领域特定的概念定义和概念之间的关系,提供该领域中发生的活动以及该领域的主要理论和基本