基于使用信息的数据库模式匹配方法研究

来源 :哈尔滨工程大学 | 被引量 : 0次 | 上传用户:kongduiyue2008
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网技术的进步和人们对信息需求的日益增长,数据库已成为信息存储和共享的重要资源,大量的数据经过采集、整理存储在各类数据库中。不同企业和部门间对数据的共享和集成已非常迫切,由于这种不同的环境背景所造成的数据源(关系数据库、面向对象数据库、XML等)异构问题已经成为数据集成的主要障碍。实现各数据源集成首要问题是定义数据库模式之间的语义映射关系,即所谓的数据库模式匹配。因此,数据库模式匹配成为数据集成的关键环节。通过对现有的模式匹配方法的深入分析,针对Usage-Based方法中模式匹配方法中只考虑使用信息中的部分信息的问题,为了进一步提高匹配的查全率和查准率,本文对Usage-Based方法中的模式匹配方法进行了改进,提出了一种基于使用信息的数据库模式匹配方法。在该方法中首先从数据库的日志中提取属性特征向量,然后对数据进行预处理,最后使用遗传算法计算属性间的相似性来进行匹配。此外,针对已有的模式匹配方法中大多忽略了属性的使用信息的问题,本文提出一种基于多种信息的属性匹配方法。在该算法中,扩展了原数据指标,在新数据指标中结合属性使用信息、数据实例和模式信息,并给出了本方法的BP神经元网络结构。最后,通过实验验证了基于使用信息的匹配算法和基于多种信息的匹配算法的可行性,实验结果表明这两种方法在一定程度上提高了匹配的查全率和查准率。
其他文献
在信息化高速发展的今天,各行各业用到的文件大多由现在的电子文件取代传统的纸质文件。传统以保护纸质文件为核心,这种安全管理的理念很难适用于电子文件的安全管理。随之就
无线传感器网络通常由部署在特定区域的数量庞大的微型传感器组成,这些传感器节点之间互相协作对需要监测的区域进行实时的监测和收集有用的信息,传感器节点监测得到的有用信
容错技术是保障系统运行的关键技术,其中检查点技术被广泛应用。但是,传统的基于磁盘的检查点会给系统带来巨大的性能损失。基于内存的检查点技术通过共享工作内存和检查点数
在过去十几年中,生物识别技术已经相当成熟了,它是一门利用统计学方法和人体生理活动数据来验证个人身份的技术。心电信号ECG(Electrocardiograph)本身因人而异的,并且在每个
云服务软件需要对外提供不间断的在线服务,但是由于功能的复杂和代码规模的庞大使得软件中难以避免存在bug,如果这些bug引发了性能异常问题,开发者将很难对这些性能异常进行
当前社会对互联网移动性的要求不断提高,而目前的互联网体系结构是针对固定网络而设计的,因此不能很好的支持网络移动性,针对这一问题提出的MIPv6(Mobile IPv6)、HMIPv6(Hier
随着科学技术和人们物质文化生活的不断提高,机器人应用范围也越来越广,对机器人的控制要求也越来越高。目前,具有视觉功能的机器人和多机器人协调是机器人领域的研究热点。
运动估计是高级视频编码标准H.264的核心部分之一,通过高效的帧间预测方法大幅提升了视频压缩比,但高计算复杂度问题却给实时视频编码带来巨大挑战。近年来随着图形处理器GPU
进入21世纪,计算机科学技术的发展日新月异,并渗透到各个领域,促进了各行各业的发展。虚拟手术技术作为虚拟现实技术与现代医学等学科结合的产物,已经成为计算机领域研究的热
联合补充问题就是对来自同一个供应商或同一供应地的多种物品,进行联合补充订购,目的是减少年总订购次数,获得数量折扣,节约库存控制费用,降低物品成本的一种库存问题。当一组物品都是由同一个供应商(或供应地)供应,或当一组物品同时采用一种运输工具(汽车、轮船或飞机)运输,这时便面临着这些品种之间如何协调、合理安排订购,使费用极小化的问题。在以往的联合补充问题的模型研究中,研究者大都假设模型中所涉及的需求率