基于中文带权关键词树的受限领域问答系统研究

来源 :山东财经大学 | 被引量 : 0次 | 上传用户:zzjokok
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
现今,网络的快速发展为人们提供了大量的信息资源,人们希望在大量的信息中能够快速准确地找到自己需要的信息,在这样的背景下自动问答系统应运而生。自动问答技术(Question Answering,QA)是综合运用自然语言处理、信息检索、语义分析、人工智能等技术的一种新型信息服务技术。与传统的搜索引擎不同,自动问答系统通过自然语言句子提问,系统对问题进行分析并理解用户的问题,最终返回用户需要的答案。自动问答系统在国内外有着广泛的研究,已经出现了比较成熟的自动问答系统。但是由于中文语言的复杂性和处理技术的局限性,让计算机理解中文非常困难,中文问答系统已成为极具挑战力的研究领域,目前,中文自动问答系统的研究与应用仍以限定领域为主,并且还没有较成熟的系统出现,针对现有研究状况,本文提出并实现了基于中文带权关键词树算法的受限领域问答系统,研究的主要内容有:关键词抽取与加权得分;关键词树的构建与推理等。本文主要创新点如下:(1)本文对关键词的属性进行了详细的分析,将关键词属性分为词本体属性与词句中属性两类。抽取其中七种主要属性进行统计分析并作为评测关键词重要程度的加权依据。然后通过主成分分析来为各种指标的权重系数进行重组,计算权重指标系数并得出关键词的最终得分,此得分即为评价关键词重要性的依据。(2)本文通过创建自己的语义树,即关键词树,对领域知识进行管理。本文将类与树的概念相结合,提出了关键词树的知识存储概念,并结合领域知识的特性,对关键词树的构建、存储、更新等一系列操作进行了详细描述。(3)本文以关键词树为中心设计知识库并进行问句相似度计算,通过计算关键词权重与等级来设计问句相似度算法,缩小知识搜索范围,并对候选问题进行排序。总之,本文结合语义分析与统计分析的理论方法,在限定领域内,提出了一套基于关键词树的自动问答系统。通过实验证明,本文方法有效地提高了问答系统的检索效率和准确性。研究结果在信息咨询、电子政务以及科普文化传播等领域具有较高的理论意义和实用价值。
其他文献
随着网络技术的迅猛发展,电子商务作为一种全新的企业经营手段迅速发展并逐渐成熟。在电子商务环境下,交易双方往往会为了争夺有限的资源,而不可避免的产生争议与冲突。在电
随着科学技术的不断进步,随着计算机技术和人工智能技术的不断发展,人工智能技术的应用领域得到不断的拓展,使得一些领域的非常枯燥的人工劳动,逐渐被具有相同功能的设备所代
随着经济的迅速发展,汽车使用量迅速增加,虽然道路也随之不断扩展,道路交通负荷还是比较严重,交通事故发生频繁。由于道路交通事故中,行人在遭遇危险时避开车辆的能力较差,因
随着信息化时代数据信息的爆炸式增长,海量冷数据的归档存储成为数据中心依赖的重要基础技术之一。随着蓝光光盘技术的飞速发展,能提供低成本、低能耗、高容量、高可靠性服务
随着企业信息化建设的深入,企业逐步开展业务系统建设,由于系统的建设时期、开发技术、业务特征等诸多因素影响,这些系统之间并不能有效地实现信息共享和交互,将不可避免地导
XML以其扩展性、结构性、平台独立性和自描述性等特性成为数据表示和交换的事实标准,越来越多的应用使用XML来存储、交换和发布信息。但是目前关系数据库并不能很好的支持XML
纠删码具有低存储开销高容错特点,可以将(k+r,k)纠删码用于归档访问频率低的数据副本,既可以保证数据的可用性,又可以提高存储空间的利用率。根据待归档数据块的存放规则,数
专家系统是人工智能研究方向的一个重要分支,是一种对特定领域的问题求解并给出解释的一种智能软件系统。它模拟的是现实中某一领域专家解决问题的方法和推理。现实中的专家
图像融合是通过一种特定算法将两幅或多幅图像合成为一幅新图像的过程。通过融合能得到比单一信息源更丰富、精确和可靠的有用信息,最大限度的获取对目标或场景的完整信息描
近几年,关于无线传感器网络的研究取得了一定的成果。但是,适合无线传感器网络的数据聚合协议仍存在着广泛的研究空间。由于无线传感器网络受节点能量的限制,而传感器节点的