论文部分内容阅读
近几年来,随着人工智能的发展,生活上的方方面面都变得更加智能化。而在教育领域,如何让人工智能的力量更好的服务于人类的教育是一个十分有意义的课题。要让计算机能够个性化辅导和自动解题,首先要解决的就是让计算机理解人类所使用的数学语言,才能实现计算机自动推理和自动解题。本文主要研究了初等数学领域中题意理解的关键方法,包括初等数学语言的特点及其知识表示方法,初等数学的词的表示方法,数学短文本的特征提取及特征构造方法,基于分类思想的题意理解过程和数学文本的预处理方法等内容。由于初等数学语言有别于普通自然语言的特殊性,要研究初等数学题意中的数学语言,就不能直接使用处理普通自然语言的已有的方法。相对于普通自然语言,数学语言中包含了大量的符号、公式、专有名词等普通自然语言没有的内容,所以要做好初等数学的题意理解就必须针对这些特性对普通的自然语言处理方法做出改进。本文主要研究工作如下:1、首先详细分析了初等数学语言的特点,并根据其特点和设计了一种简单,高效的初等数学知识表示方法。1)在词的表示层面,本文深入研究在自然语言领域已经取得较好效果的开源工具word2vec中的模型和算法,继而在此基础上针对数学语言的特点对其提出了对数学领域中的关键词加权等一些列的改进,使其更适合表示数学语言中的词。2)在句子的表示层面,通过将语义层面的特征和数学实体层面的两种特征结合起来的方法表示数学短文本。两种特征的协同表达,使其对数学短句子的特征表达更充分,更有利于后续工作。2、在题意理解的方法上,本文另辟蹊径的将数学题意理解问题转化为了数学短文的分类问题,使得问题简单化,可以根据已有的方法很好的解决未知的问题。在数学短文本分类方面,根据语义和数学实体的协同特征向量的特点,本文将两种已有的分类算法结合并加以改进,提出了一种适合数学文本分类的分类算法。3、在题意理解的具体流程上,首先设计针对初等数学领域的文本预处理方法,继而通过词向量和数学实体构造特征向量,接着进行数学短文本的分类,最后生成对应的知识表示。并将实现的系统用在初等数学题目自动求解的系统中。基于以上方法,本文设计与实现了一个初等数学题意理解系统。并通过对比实验证明此系统在初等数学题意理解方面取得了较好的效果。