论文部分内容阅读
跨语言信息检索是近年来较有应用价值的一个信息检索方向,其实现方法涉及到自然语言处理(NLP)、信息检索、搜索引擎、机器翻译等多个学科领域。 本文首先介绍了跨语言信息检索、医学信息检索相关领域的研究背景和现状,阐述了本文的研究目标和意义。然后综述了跨语言信息检索的基本理论方法,介绍了互联网作为语料库的思想,并简单介绍了搜索引擎相关内容,重点介绍搜索API技术及其应用方法。随后提出了一种汉英跨语言医学信息检索检索系统的设计,这也是本课题的主要研究内容。该系统主要包含关键词提取和查询翻译两个功能模块。 在关键词提取模块,介绍了跨语言医学信息关键词提取系统CMKES的设计思想和工作流程,用该系统实现了跨语言医学信息检索中的关键词提取,以用于搜索引擎检索构建查询式,并通过实验得到了预期的结果。 在查询翻译模块,采用了互联网作为语料库的思想,针对所提取的关键词,应用搜索引擎API获取搜索结果文档集,引入了一种基于互联网语料的查询翻译方法,并对其进行改进以用于本工作涉及的汉-英跨语言检索中的关键词查询翻译。 该系统主要可以应用与跨语言信息检索和知识发现,在因特网辅助翻译(IAT)、英文写作、文献查询等方面也具有一定应用价值。