基于自由文本的问答系统研究与应用

来源 :海南大学 | 被引量 : 0次 | 上传用户:Bryson
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的快速发展,网上信息越来越多,如何在这些海量信息中快速准确地找到所需要的信息也越来越困难。虽然传统的搜索引擎(如Google等)已经取得了很大的成功,但这类搜索引擎只能获取与用户查询请求相关的文档,用户必须自己从这些文档中查找相关信息;其查询是一系列关键词而非自然语言问句,事实上,用户可能更习惯于用自然语言来描述一个问题;多数情况下,用户所需要的只是问题的确切答案,而不是与该问题相关的一系列网页。问答系统集知识表示、信息检索、自然语言处理于一体,能更好的满足用户的检索需求,正成为国际上研究的一个新热点。本文主要工作是基于自由文本的问答系统的相关技术研究,主要工作及创新包含以下几个方面内容: (1)本文对近千个汉语问句的句型进行统计研究,提出“问题标准型”方法,即先“缩检”(将提问化为标准形式)再“扩展”(针对标准形式给出多种可能回答形式)的处理方式,使句法分析能够更有效的处理自然语言问句,较准确的识别用户意图。 (2)通过实验对比了问答系统框架下多种布尔检索策略的性能,为构建问答系统选择适当的检索策略提供了实验数据和重要依据;在闭域问答系统环境下,提出特征词集的方法,并通过实验验证该方法对系统性能有很好的改善和提高。 (3) 以问题和答案中关键词的词频统计特性为基础,进一步考虑问题和侯选答案句子中关键词位置分布信息,提出一种结合向量空间模型(VSM)和关键词最小匹配距离的问题和句子相似度的计算方法,答案提取的MRR值达到了 0.48。
其他文献
随着家电数字化的发展,各种家电设备互联构成了智能家庭网络,为人们提供了更加丰富和多样化的体验。智能家庭网络通过家庭网关实现了家庭内部设备联网及其与外部网络的信息交
合成孔径雷达干涉(Interferometric SyntheticAperture Radar,InSAR)测量技术,是指根据两幅相干SAR复图像的干涉相位差信息来重建三维地形,在军事和民事应用中发挥了重要作用,因
雷达图像采集处理卡是船载航行数据记录仪(VDR)专用的雷达接口,用于记录船舶雷达主显示器上出现的全部信息。在雷达图像采集卡的图像处理过程中,图像的获取、图像的传输、图
无线信道的时变衰落特性以及应用层业务对QoS的大范围动态要求已成为未来移动通信面临的巨大挑战。传统的无线网络分层设计由于采用固定的网络协议结构和参数设置,将会导致低
正交频分复用(Orthogonal frequency-division multiplexing,OFDM)技术由于具有高频谱利用率、抗多径干扰、可实现无线数据高速传输等优点。多输入多输出(Multiple-input mult