一种从XML数据中发现关系信息的方法

来源 :软件学报 | 被引量 : 0次 | 上传用户:shijingthink
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
提出了一种发现蕴藏在不同XML文档嵌套结构中的关系信息及其出现模式的新方法.可根据用户兴趣,发现描述不同实体之间联系的关系信息,抽取关系实例及其在文档中的出现模式.具体解决方案是:首先识别和收集包含用户感兴趣的实体的XML文档片段;然后根据文档片段标签的语义和文档片段的结构计算文档片段的相似度,并采用自适应阈值方法按相似度聚类文档片段,使得包含同一种关系的文档片段聚集在同一个片段簇;最后从XML文档片段簇中抽取关系实例及其出现模式.实验结果表明,对于包含有意义标签的各种XML文档,该方法能够准确地识别和抽
其他文献
在世界范围内,丙纶长丝用于服装业的尝试从70年代就开始了,然而20年来却一直未得到广泛的应用.其主要原因之一是单丝纤度太粗,使丙纶织物手感硬,蜡感强,穿着不舒适,且易起毛
对en—route transcoding缓存中的缓存路由和协同放置及替换问题进行了研究.提出了CCRA(cost-aware cache routing algorithm)缓存路由算法,能以可控的探测开销来发现潜在的、具
股指期货是一种重要的金融衍生品,虽然股指期货能够规避系统性风险,帮助市场投资者进行套期保值,具有价格发现等特殊功能,对市场有效运行发挥重要作用,但对于出台股指期货降