基于SVM的初等数学问题自动分类的研究与应用

来源 :电子科技大学 | 被引量 : 6次 | 上传用户:chinagood111
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
众所周知,随着计算机信息技术的迅速发展,信息技术已经在我们生活的方方面面有所应用。在教育领域,人们的目光也逐渐从线下老师辅导以及手工批阅试卷,解题转向了基于人工智能的互联网智能教育。这种新型的数学教育理念实现的一个重要前提就是对文本自然语言进行转换,通俗的讲就是把人类理解的数学语句转化为事先定义好的计算机存储知识,来供计算机进行下一步的处理。这些处理主要有解题,以及全流程判卷等等。这一前提也可以称为自然语言处理过程。而分类问题又是自然语言处理的过程中的主要问题。本文主要分为两个部分,第一部分是对初等数学问题文本进行分词,以及词性标注和命名实体识别。第二部分是基于SVM对初等数学问题文本进行题型分类,进而根据不同的类别转换成计算机推理所需的表现形式。在英文表达中,每个单词之间都是有空格的,但是中文则不同,所有的字符都是连接在一起的,所以需要对中文的文本进行分词。但是数学表述中包含了较多的有特定含义的符号,所以通用的分词方法行不通。因此需要针对数学表述构造专门的分词器。同样,数学语言表达中的实体和普通语言表达的实体不同,普通语言的实体更多是时间,地点,姓名等。而在数学表达中,包含重要信息的实体往往是数学名词,比如三角形,以及各方程等等。因此需要针对初等数学方向定义专门的命名实体,然后进行提取。本论文采用条件随机场来进行命名实体标注。初等数学问题中涉及的类型有很多,想要对初等数学问题进行自动求解,首先要做的是把问题进行分类,然后根据不同的类别调用相应的求解方法。对经过命名实体模型标注的初等数学问题文本进行文本预处理,包括去停用词,建立词袋模型。在本论文中,通过卡方统计量来实现文本特征向量的选择。这样使用特征向量通过选择降维技术能很好的减少计算量,还能维持分类的精度。最后,根据本文提出的方法,使用支持向量机实现了一套对初等数学问题进行命名实体提取并且对题目进行分类的系统。该系统可以准确标注命名实体,为后面解题等处理提供知识表示,同时有效的题目分类可以为后面解题或者判卷做推理剪枝。
其他文献
卢卡奇的辩证法强调主体与客体之间的相互作用、理论与实践的统一,因而是一种革命的辩证法。但在论述中存在显性和隐性两种话语:显性话语是以揭示"社会现实"为目的,辩证法作
本文将中华人民共和国建立以后60多年的变迁总结为四个社会试验。首先是打碎原有阶级结构的试验:从建国到文化大革命结束,在农村和城市都实施了比较彻底的阶级改造,重塑了社
■2010年是“十一五”的最后一年,这一年,全国教育工作会议的召开和《国家中长期教育改革和发展规划纲要(2010 —2020年)》的颁布,使全国教育事业发展在“十一五”末形成了明显的
会议
<正>约翰·菲力德利赫·赫尔巴特(Johann FriedrichHerbart,1776-1841)是近代德国著名的哲学家、心理学家和教育家,科学教育学的奠基人,传统教育学派的代表人物。《普通教育
本文首先以1-氯丁烷和N-甲基咪唑为原料,对氯化1-丁基-3-甲基咪唑([Bmim][Cl])勺合成进行了研究,采用单因素和正交试验法对其合成的反应工艺条件进行了优化,得到的较佳反应条
从高速公路沥青混凝土路面常见病害出发,总结了常见沥青混凝土路面破坏方式有车辙破坏、路面结构破化与沉降均匀破坏方式,同时在分析常见的破坏形式同时对常见的沥青混凝土路
法医鉴定体制作为我国司法鉴定制度的重要组成部分,在现代司法诉讼中发挥着重要的作用。近年来,随着司法体制改革的不断加深,我国法医鉴定体制中的问题逐渐凸显出来,主要表现
本文试从八个方面进行阐述雍正对清朝奏折制度的改革,以就教于方家。
为方便输电线路的巡视与状态监测,研发了输电线路危险点远程图像监控系统,实现了对输电线路危险点和周围气象条件的监测。在简述了系统构成和技术特点后给出了监控装置硬件结
本文通过考察卢卡奇与布洛赫的思想发展历程,指出来自宗教方面的思想资源在他们走向马克思主义的道路上起到了重要的作用。正是借助于宗教方面的思想资源,他们才能重新走上人