面向领域的关系数据库全文检索系统的优化设计

来源 :浙江大学计算机学院 浙江大学 | 被引量 : 0次 | 上传用户:fiona_01
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在互联网飞速发展的背景下,数据库应用体现出了不同以往的新特点,新的需求应运而生。海量数据及数据孤岛的产生,严重阻碍了科学数据的有效共享。从这一背景出发,DartGrid在传统的数据集成解决方案基础上引入了语义技术和网格技术,提出了基于语义的数据库网格的概念,作为异质异构数据库集成的一种解决方案。作为DartGrid内核的一个主要应用平台,DartSearch全文搜索系统已经伴随着DartGrid发展到了第三个版本,本文主要介绍了DartSearchV3系统的设计和实现。首先,本文简要的介绍了DartGrid平台和搜索引擎技术的发展现状,然后介绍Lucene的实现机制。并通过分析DartSearchV2版本所存在的问题,提出了DartSearchV3所要解决的问题和系统的架构设计。本文的重点是对DartSearchV3系统中中文分词方法、索引机制、rank机制这三个核心模块所采用的技术、架构、算法思想、核心模块、优化结果等多个方面进行了分析。此外,本文还介绍了DartSearchV3系统所开发的vml语义图工具包和相关图文聚合工具包。总之,探讨的重点始终围绕DartSearchV3面向数据库的全文搜索系统的功能性、实用性、易用性进行。最后,本文还扼要的分析了DartSearchV3系统将来可能面临的问题,提出了DartSearch系统的发展方向。
其他文献
随着网格技术的发展,网格正在被越来越多的普通用户所使用,网格应用正在朝着大众化方向发展,这对于网格技术的推广具有非常重要的意义。但是受制于网格平台及网格技术的复杂
虚拟现实技术在电子商务中的应用是一项正在蓬勃发展的前沿技术,必将成为未来电子商务发展的必然趋势。 本课题主要解决商品展示效果与网站速度的最优化配置问题,同时,兼顾网
大规模场景可视化在计算机辅助设计、模拟训练、沉浸式场景漫游等领域是一个关键性问题。如何利用集群将大规模场景实时绘制从单机扩展到多机,使用并行绘制进行高分辨率、大
为了寻求解决物理样机试验费时费力的缺陷,人们把目光投向了基于计算机的数字样机技术的研究上来,即通过仿真来模拟产品功能和行为达到验证、评价新产品的目的。各种仿真中,
本课题围绕在医院信息化过程中占重要地位的PACS(Picture Archive and Communication System,即图像存档及通信系统)这一领域,为了实现PACS发展趋势之一“DICOM图像转换成通
随着计算机技术的发展,金融领域业务处理已向电子化全面展开,网络通信中的数据安全问题尤为重要。目前金融行业实现了集中式综合业务处理系统,其基本架构是将银行数据主机、
随着信息技术的迅猛发展,企业信息化的需求不断增加,但是在竞争激烈的市场中,企业只有把有限的资源用于核心业务,而把非核心业务外包,才能有效地建立自己的竞争优势。ASP模式是网
信息化的不断推进,通信技术的飞速发展,电信市场的逐步开放以及人们对多媒体通信的迫切要求,促使移动通信从2G向3G演进。在核心网络方面,为提供多媒体通信,3GPP在R5版中提出
纹理度量了物体表面光强度的变化,定量表现了物体表面的光滑、粗糙和规则程度。它常被用于在图像分析和计算机视觉中进行区域描述,是展现真实世界的重要手段。二维表面纹理的