基于组合语义的基础教育资源深层知识表示方法研究

来源 :武汉理工大学 | 被引量 : 1次 | 上传用户:xuelin_1985
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
以“地理”为代表的基础教育资源蕴含了丰富的知识,在高考试题解答中的知识也常常是一种复杂的结构化的信息集合且关联性强。因而,对试题研究采用何种高效的深层知识表示方法以及该知识表示与大型本体知识库之间的关系,如何对问题进行深度语义信息抽取,最终实现对问题的理解,对进一步开发类人智能产品具有重要的意义。论文依托863项目“面向基础教育的类人智能知识理解与推理关键技术”,对问题语义分析的核心任务深层知识表示方法进行了研究,主要工作如下:1)设计了基于组合语义的DAG(Directed Acyclic Graph)深层知识表示方法。针对地理高考试题特点,设计了基于模板的试题预处理算法,定义了试题模板触发词,将试题中结构复杂的长句转化为结构相对简单的短句,并利用词向量模型训练并扩展了触发词列表。在此基础上,将试题模板转化为有向无环图结构。根据组合语义,利用组合范畴语法将预处理后的试题短句转化为有向无环图,最后与模板的图结构相结合,形成最终的有向无环图DAG深层知识表示。2)设计了基于剪枝算法与启发式搜索的组合范畴语法分析优化方法,有效地提高了组合范畴语法的分析效率以及DAG深层知识表示的分析速度和准确性。在剪枝算法中论文使用的词汇序列标注模型为最大熵模型,减小了词汇范畴搜索范围,实现了对CCG句法分析的加速。接着使用了启发式搜索代替原有的CKY算法,提高了搜索效率。剪枝算法与启发式搜索是彼此相互独立、互不影响的,它们共同提高了组合范畴语法的分析效率以及准确性。3)设计了基于DAG深层知识表示的问题语义分析方法。将本体知识库视为一个具有复杂网络结构的图,同时根据DAG深层知识表示方法,将知识拆解为节点及边,插入到现有的基于图的本体知识库中,利用词向量进行谓词模糊匹配。同时,在输入的问题是由不完全、或模糊的语句组成时,设计了问题近似子图提取算法从多个DAG子图中提取问题子图,然后根据提取的DAG与问题的对比获得具有匹配度排序的DAG集,从而实现对问题语义的理解。论文提出的基于组合语义的DAG深层知识表示方法在试题结构复杂且问题表示模糊的情况下取得了较好的效果,对试题的解答提供了巨大的帮助。
其他文献
随着计算机图像在日常生活与生产中的广泛运用,人们对图像分析、检索和分类管理的需求与日俱增。由于图像信息内含的非结构化特点,给相应信息分析处理带来极大困难,因此,图像
全球变暖和能源短缺是人类社会可持续发展面临的两个严峻挑战。以再生能源制备的氢气为还原剂,通过热/光催化过程,将温室气体二氧化碳转化为燃料或化学原料,实现热能/光能向
目前,类人智能发展迅速,已有相应产品应用于教育、医疗等行业,如针对初等教育考试问题的日本Todai Robot项目和致力于智力问答并拓展到医疗领域的美国IBM的Waston项目。完备
这是一篇英译汉翻译项目研究报告。选译章节出自传记《我的父亲》。此书由英国作家兼编辑马丁·汤森所著,描述了一种特别的父子之情,以及作者对父亲余生所患狂躁抑郁症的感触
随着云计算,云存储技术的发展,在用户和企业发展的过程中产生了大量的数据以后,更倾向于将数据存储于第三方云端服务器中,以节约本地的存储资源。但是,出于对自身数据安全性
随着认知无线电的推广和应用,通信侦察系统必须具备快速有效地检测信号的能力。与奈奎斯特采样相比,欠采样能够解决宽频带稀疏分布信号超高速采样的难题,逐渐成为宽带信号采
权益资本成本是股权融资的机会成本,也是投资者购买股票时所要求的最低报酬率,其大小取决于企业的风险。企业的信息披露作为投资者了解企业经营状况的有效渠道,是投资者投资
随着互联网的快速发展,PC互联网正日趋饱和,移动互联网在近几年以惊人的速度发展着。随着智能手机、平板电脑等移动智能设备的大量使用,现在已经进入移动互联网时代,越来越多
随着互联网技术的不断发展,产生的数据量也越来越大,传统关系型数据库系统已经越来越不能满足这些海量数据的存储需求以及快速检索的需求,为了解决这一问题人们提出了各种分
本文通过翻译英文小说《过境》中的《星》和《夜》两个章节,并对译者在翻译过程中所采用的翻译策略进行分析,旨在讨论如何实现翻译中的文化对等。《过境》是著名的亚裔美国作