论文部分内容阅读
自上世纪五十年代以来人工智能领域经历近七十年的发展,已然有颇丰的成果,机器解答数学习题正是建立在前人的累累硕果之上的前沿研究。机器解答数学应用题需要经过题目读入、题目理解、机器解答和类人输出这一系列的步骤。本论文中的题目理解是指对输入的应用题在文本分类和信息抽取方法的途径上建立题目的数量关系组。这样的题目理解方法首先需要识别出给定题目的题目类型,再根据识别出的类型,抽取和添加相应的数量关系,其中包含直陈述关系和隐含关系。题目类型识别,还可用于将分类好的题目交由与之对应的特定解题框架进行求解。本论文所做的工作为应用题的分类识别,具体而言,是采用基于支持向量机SVM分类的方法,识别一个给定的应用题是否为相对运动应用题。为了实现这一目标,本文构建了数学题目类型识别器,识别器基于SVM算法,通过对数学应用题题目样本进行训练建构预测模型,从而对未知数学应用题题目样本集进行分类预测,实现了识别给定的习题是否是相对运动应用题的功能。本文的主要研究工作如下:第一,本文研究了数学应用题中隐含关系提取的一个具体问题,在机器解答数学应用题过程中需不需要添加相对运动的公式,即判断应用题是否为相对运动应用题。通过对输入的训练题目文本集进行分词,用词袋法对抽取的特征进行特征向量表示,训练好学习模型后读入测试样本,用同样的方法对测试样本进行向量化。最终利用SVM分类算法对题目文本是否为相对运动问题进行判断与识别。第二,本文将从初级中学权威教辅材料中收集的数学应用题组成测试集,进行实证研究,通过实验验证了该分类模型的性能。最后的实验效果显示该题目文本分类器模型能以100%的正确率识别给定初等数学中应用题是否是相对运动应用题。