论文部分内容阅读
Web服务是一种自包含、自描述、模块化且具有良好互操作能力的新应用,它可以通过Web来发布、定位和调用。UDDI是目前注册和发现Web服务的行业标准,它为Web服务注册提供了基础平台环境,服务请求者可以方便地从中选择合适的Web服务集成到其自身的应用程序中。虽然这种Web服务注册机制在市场上被广泛使用,但是它在Web服务发现方面存在着一些困难。一方面,一些Web服务提供者虽然开发并部署了某个Web服务,但是其并没有在UDDI注册中心注册该Web服务。另一方面,基于简单的关键词匹配方式匹配服务代理中注册的Web服务与用户提交的查询请求,由于不能提供语义信息,因此可能会导致返回给服务请求者一些无关的Web服务,甚至可能会遗漏许多相关的Web服务,影响了服务的查全率。本文提出了一种基于搜索引擎技术进行Web服务发现系统——Web服务搜索与执行系统(WSSES,Web Service Search and ExecutionSystem),该系统以互联网上抓取的网页作为原始数据,通过解析、抽取,索引、搜索一系列操作实现Web服务发现的功能,此系统同时提供一种执行机制,用户搜索到某个具体的可执行组件,选定后在网页中输入执行此操作所需的输入数据,远程的可执行组件能将返回结果提交给系统,最后呈现给用户。本文基于WordNet设计了一种语义查询扩展策略,在用户搜索Web服务阶段,使用该方法对用户的查询范围进行扩大,同时更能准确反映用户需求。在建立索引的过程中,提出快速分词算法,对WSDL文档进行分词处理。实验证明,与基于UDDI注册中心相比,大大提高了Web服务发现的效率。