【摘 要】
:
近年来,随着互联网的发展,知识量的扩大,互联网上大量的信息却只有一小部分是对人们有用的。搜索引擎在处理此问题也存在很多不足,如噪声过多、有效内容过少和问题定位不准等,导致了用户无法高效的从互联网中获取有效信息,为了解决这一问题,问答系统应运而生,人们越来越关注问答系统,因为问答系统能从海量信息中选出有效信息反馈给人们。随着知识图谱的发展,传统问答系统的模式也逐渐改变。对输入问句的识别和根据问句中实
论文部分内容阅读
近年来,随着互联网的发展,知识量的扩大,互联网上大量的信息却只有一小部分是对人们有用的。搜索引擎在处理此问题也存在很多不足,如噪声过多、有效内容过少和问题定位不准等,导致了用户无法高效的从互联网中获取有效信息,为了解决这一问题,问答系统应运而生,人们越来越关注问答系统,因为问答系统能从海量信息中选出有效信息反馈给人们。随着知识图谱的发展,传统问答系统的模式也逐渐改变。对输入问句的识别和根据问句中实体进行实体搜索的精准度是衡量问答系统好坏的重点。本文运用问句相似度计算以及改进的TransE模型完成了一个基于知识图谱的问答系统。传统的知识表示学习模型能有效处理一对一的实体关系,但对于一对多或者多对一的实体关系处理起来准确性不佳。本文对问句匹配、候选实体获取以及知识表示模型技术的深入研究,采用中文知识图谱为知识来源,对用户的问句实体识别算法和传统的知识表示算法做了改进,给出了本文的创新算法与模型,并在真实数据中进行了测试,构建出了基于知识图谱的问答系统。本文的主要工作如下:(1)当前基于知识图谱的问答系统中问句理解的准确率还有不足之处,本文在问句实体识别前增加了问句匹配步骤,首先采用词嵌入技术(word embedding)来对问答系统中输入的问句进行词嵌入,将向量化的问句与构建的候选问句集进行比较,选出最优问句,再识别选出的最优候选问句的实体,从而提高问句实体识别的准确率。(2)传统知识图谱问答系统中,在实体搜索后返回的是无序的实体链接序列,为了提高目标实体获取的准确率,本文将实体的热度、语义相似度、上下文相似度和字符相似度四个方面对实体进行多维度打分机制来减少冗余,提出了改进的Rank M算法对候选实体进行排序。(3)针对传统知识图谱表示模型TransE对部分实体的表示具有高度相似性,无法表示一对多、多对一实体对的问题,我们在TransE的基础上引入了实体的描述信息部分,将实体的信息特征加入TransE模型中,提出改进的TransEM模型,从而区分了高度相似实体的表示,并通过数据集进行测试,实验结果证明本文的方法相比于传统的方法有所提高。本文根据上述算法并结合DBpedia部分数据集,实现了一个基于中文知识图谱的问答系统,并在真实的环境中进行系统测试,测试结果答案准确率比传统问答系统有所提高。
其他文献
在我国经济结构转型期,企业资产有形性逐渐降低,此时通过区域金融发展缓解企业融资约束是加快新兴产业发展的重要前提。本文基于沪深两市上市公司样本数据,首先对上市公司资产有形性与现金持有量的关系进行研究。然后,对区域金融发展因素进行主成分分析,拓展研究区域金融发展对现金持有量与资产有形性的关系的调节作用。最后,通过稳健性检验和异质性分析探究本文研究结论的可靠性和差异性。研究发现,我国上市公司资产有形性有
实体链接(Entity Linking)是知识图谱领域一项关键的基础技术,其任务是要将非结构化文本中提及的实体和知识库中存储的实体进行一一映射,以帮助计算机更精准地理解输入的自然语言。实体链接在知识库扩展、信息检索、智能问答、内容推荐等场景下有着广泛的应用,是知识图谱领域的热点研究问题之一。本文通过对国内外基于图结构和实体嵌入的实体链接相关研究进行调研,针对实体链接研究中生成的候选实体集噪声过大,
我们的工作使用涵盖19852017年期间的历史数据来测试科特迪瓦经济增长与减贫之间的关系。STATA 14用于Johansen协整和单位根检验,以确定平稳性和变量之间的长期关系。VAR研究了人均GDP,失业增长率和公共支出对贫困后果的影响。我们的研究结果表明,公共支出与人类发展指数之间存在正相关关系,这是贫困发生率的间接指标。人均国内生产总值的比率与先验的预期相对应,并描述了贫困发生率的负相关性,
复杂网络是对复杂系统的抽象表示。系统中的实体被抽象地表示为网络节点,实体之间的交互关系被抽象地表示为网络连接。普适性使得复杂网络被广泛应用于社会学、生物学以及计算机科学等多个学科,相关理论和方法的研究具有深远的科学意义。面向不具先验知识的真实网络,如何高效地探索其拓扑结构是复杂网络分析的一项重要任务。作为一种生成模型,以贝叶斯理论为基础的随机块模型能够很好的处理该问题。相较于单一结构发现,随机块模
针对传统网络异常检测算法中异常阈值需要通过人工定义的问题,以及单分类支持向量机(One-Class Support Vector Machine,OCSVM)异常检测算法无法在高维海量数据中扩展的缺陷,提出了一种结合变分自编码器(Variable Auto-Encoder,VAE)和OCSVM的深度学习异常检测算法(VAE-OCSVM),以实现工业控制网络中异常值的检测和识别任务。在异常检测过程中
随着科学技术的发展,在生物学、经济学、人口学、自动控制理论及计算机网络等领域提出了许多需要应用差分方程解决问题的具体数学模型,可以说差分方程是描述状态变量随离散时
P2P网络借贷,是由借款人在线申请贷款,贷款人经过类似拍卖的程序,经过投标对借款人提供资助的民间金融形式。这一服务缓解了信贷市场的供需失衡,也因其便捷性、高收益性而迅速发展。目前,我国P2P发展猛烈并伴随有诸多问题。行业运行已经引发了一系列法律问题、增加了风险隐患,已与信息中介的最初形态背道而驰,不仅仅体现了行业违规操作、法律制度供给很不充足、法律监管缺失等风险。需要采取积极有效有针对性的措施,对
压电材料可实现机械能和电能之间的相互转换,在传感器、致动器、超声换能器等领域有着广泛应用。随着科技的发展,对压电材料的性能要求越来越高,因此亟需具有强压电性的材料
在目前信息化时代的今天,大量数据信息都存储在互联网中,针对问题进行复杂网络的建模,可以有效的解决各种节点分类、节点聚类、链接预测、影响力分析、可视化分析等问题。而针对复杂网络社区的发现可以有效的观察社区的整体结构,分析社区演化过程,找出中心性节点,针对真实网络问题的分析具有重要的意义。随着研究学者对社区发现算法研究的深入,基于图嵌入技术的社区发现算法、基于密度聚类的社区发现算法、基于标签传播的社区
磷光过渡金属配合物由于金属中心的重原子效应,使得旋轨耦合作用增强,能够同时利用单重态激子和三重态激子,大大增加了磷光量子效率,成为有机光电子领域的研究热点。此外,磷