【摘 要】
:
随着网络和计算机上各种结构化数据的迅速发展,需要访问关系数据库查询信息的用户数量急剧上涨。然而传统的查询方法需要用户知道SQL查询语句和数据库模式;人们希望能够在关系
论文部分内容阅读
随着网络和计算机上各种结构化数据的迅速发展,需要访问关系数据库查询信息的用户数量急剧上涨。然而传统的查询方法需要用户知道SQL查询语句和数据库模式;人们希望能够在关系数据库上实现自由形态的关键词查询,这样用户就可以避免书写SQL查询语句,只需向查询接口提交所要查询的关键词就能获得所需要的查询结果。本文提出基于知识库的新方法,实现关系数据库上自由形态的关键词查询。首先,对索引表存储结构进行改进和融合,压缩索引表中存储的冗余信息确保时空开销较小,并采用较细化的存储粒度为数据库中关系建立知识库,存储相应元组词所在元组的词频,元组中单词长度及属性列包含元组数等各种知识来确保关键词查询的准确性;其次,充分考虑关系数据库的结构和因素,改进经典的IR排序策略,根据关系与查询的匹配度为关系的各个属性赋予不同的权值来满足用户的查询需要。接着,为了提高关键词查询效率,系统按属性权重的大小顺序对其所在的元组集网络进行SQL转化使得相似度高的结果较早出现,并且基于用户对返回结果的兴趣程度不同的考虑,只为用户返回前top-N个答案,然后根据用户的进一步需要,把排列靠后的答案逐屏显示。最后,实际数据集上的实验结果显示此方法在查询时间和准确性上是有效的。
其他文献
互联网是复杂巨系统,是现代信息社会的基础设施,互联网行为影响我们每个人的工作和生活,同时互联网的行为在不停地变化并且是不可预测的。随着网络技术的发展,许多新型的网络
程序调试是软件开发过程中最关键的环节之一,调试的开销将直接影响到软件的成本和软件公司的收益。对于程序员来说,调试也是一个非常单调乏味的工作。因此,程序的自动化调试方法
本文是针对计算机辅助几何设计与制造(CAGD/CAM)中的曲线曲面造型问题,运用融合的思想研究了广义圆弧曲线曲面造型研究及其应用。其内容包括:基于融合的样条曲线造型方法概述
随着“互联网+”时代的来临,互联网规模日益壮大,相应底层网络结构也日趋复杂。用户网络的安全性以及稳定性成为当今社会关注的热门话题,而如何解决互联网的持续可靠运行业已
随着计算机无线网络技术的迅速发展,无线局域网(WLAN)不断提高的传输能力和高效的移动能力已成为通信领域的一个重要发展产业之一,被人们越来越关注,并广泛应用于各个领域。
P2P (Peer-to-Peer)对等网络已经成为Internet中最重要的应用系统之一。然而,P2P具有的开放、匿名以及松耦合等特性,使得网络系统的安全面临着巨大的挑战,由此导致不可靠的服
无线局域网(WLAN)因其移动性、灵活性和经济性的特点,目前已得到广泛的发展。随着无线局域网的用户越来越广泛,其安全性的不足也渐渐凸显出来,成为制约其发展的一大要素。目前的
计算机断层扫描成像技术是医学成像领域的常用方法,心脏断层图像可视化是医学图像分析中的热点研究问题,旨在提供更加直观的人体心脏的三维信息。论文针对左心室形态和断层数
进化算法是一类通过模拟自然界中物种进化过程与机制来求解优化与搜索问题的一类自适应、自组织、自学习的人工智能技术。该算法基于这样的基本认识:“从简单到复杂、从低级到
近年来Web Services作为一种新技术广受关注。Web Services中的接口定义语言WSDL和内容传输格式SOAP已经成为W3C的草案和建议标准。然而,在实际应用中,单个Web服务通常无法满