基于深度强化学习的数学应用题自动求解器

来源 :电子科技大学 | 被引量 : 0次 | 上传用户：lkajdofaief

【摘要】

：

【作者】

：

王磊

【出处】

：

电子科技大学

【发表日期】

：

2020年01期

【关键词】

：

自动求解数学题自然语言理解自然语言推理深度学习强化学习

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

作为机器智能的重要标准测试之一,自动求解数学应用题(MWP)的研究历史可追溯到20世纪60年代,并且在最近几年中吸引了大量研究者们的关注。对于数学应用题的自动求解,求解器需要将人类可读懂的句子映射成机器可理解的逻辑形式,随后推理得到其求解表示式,最后计算得到其答案。该任务不仅仅涉及到对文本的深入理解,还需要求解器具有很强的逻辑推理能力,这也是自然语言理解和推理研究中的难点和重点。近几年,大量的数学应用题求解器被提出,研究者们也声称在各自的小规模数据集上取得了优异的效果。作为早期的尝试,基于动词分类的求解器,受限于只能支持加减法两种运算;基于标签的方法,需要过多的人工干预,难以扩展;基于模板的解决方案,随着数据集增大,模板集的基数和复杂性增加,性能急剧下降;基于表达式树的方法,随着数字个数的增加,搜索空间呈指数增长。综上所述,这些方法表现的还不够鲁棒,推理难度随着数据量和数据复杂度的增加呈指数增长,其在特征设计和提取上花费的人工成本代价巨大,且不能够在可接受的运算时间内得到足够好的效果。因此,为了更客观,更全面,更多样化的测评数学应用求解器,近两年来相关研究者们发布了较大规模的数学应用题数据集,对以往的方法进行了探究验证,给往后的方法提供了一个更具挑战的测试平台。本文主要聚焦于用深度学习和强化学习相关的技术来构建数学应用题自动求解器。本文首先回顾总结了算术和方程组这两大类数学应用题(MWP)近年以来的发展。随后介绍了本文提出的三种基于深度学习或强化学习的求解方案:1)提出了一种基于深度Q网络(DQN)的数学应用题自动求解器,降低了构建数学求解表达式树所需的指数级的搜索空间,能够更高效更准确的对数学应用题进行求解;2)提出了一种基于序列到序列(SEQ2SEQ)集成模型的数学应用题自动求解器和一种等式归一化方法,减少了在特征设计和提取上花费的人工成本,降低了等式的搜索空间;3)提出了一种基于递归神经网络的数学应用题两步求解系统:首先利用序列到序列(SEQ2SEQ)模型预测一个操作符待填充的树形结构的求解表达式模板;然后利用得到的树形结构模板,通过递归神经网络,自底向上预测内节点对应的操作符。该方法更进一步减少了模板的搜索空间,提高了数学应用题的求解准确率。本文最后,基于当前的研究现状,讨论了对于数学应用题自动求解领域,值得进一步探索和研究的方向。

其他文献

巴门尼德Being的时间向度

对于早期希腊哲学中Being的理解有许多争论,集中表现在对巴门尼德残篇的翻译和解读上。本文通过回归希腊语境,对残篇8:14重新解读,指出以往对Being的解读和翻译集中在语言和

期刊

Being时间空间动态静态

我教《琵琶行》

<正> 《琵琶行》是一首古代长篇叙事诗,在一般情况下,讲授这篇课文,需要安排四个课时,但是我只用了三个课时,其中教师的讲授不足两课时,其余一个多课时为学生讨论。这说明长

期刊

《琵琶行》参考资料白居易

欧珀莱彩妆:一吻开启炫酷交互

<正>"女为悦己者容"——这是女人爱美丽的原因吗?第一次听到这句话时,觉得很正确,现在看来这句话有值得商榷之处。很多时候感觉更应该是"女为己悦而容",女人的美丽是需要自我

期刊

DSP欧珀莱智能手机

分析安全运行特种设备的管理

<正>随着人民群众生活品质的提升,企业的发展,国民经济的建设特种设备是必不可少的基础设备设施。根据多年来对特种设备安全使用管理的实践和实际经验教训,各单位、企业只重

期刊

特种设备预案演练安全法特种设备安全管理应急预案

生态文明视阈下建设美丽沈阳的实践与反思

建设美丽沈阳营造良好生态环境已成为人们普遍共识,沈阳作为东北老工业基地核心城市在解决历史遗留环境问题、城市绿化、污染排放控制、循环经济发展等方面已取得显著效果。

期刊

生态文明美丽沈阳实现途径

炮制王不留行的操作经验

<正>王不留行系石竹科植物的干燥成熟种子.呈细小球形,质坚硬,外表黑色,内面白色.由于质坚硬,不经炮制,某些有效成分难以发挥,所以必须经过炮制.炮制此药较其它药品难度较大,

期刊

王不留行操作经验

建筑施工的影响因素及管理策略探究

在建筑行业随经济发展而快速发展的过程中,建筑工程管理工作对提高建筑工程项目质量,保障工程施工安全和控制项目施工成本等方面起着重要的作用。建筑企业只有认识到工程管理

期刊

建筑工程管理建筑行业建筑施工管理策略探究

从社会共同体视角浅析我国网络道德问题及对策

随着新时代的到来,网络在社会共同体发展中的地位日益凸显。网络浪潮带来便捷的同时也带来了泥沙,我国现阶段的网络环境表现为多元化思维弱化了社会的主流思想、色情垃圾信息

期刊

社会共同体网络道德现状对策

抑制背景谐波放大的阻性有源滤波器实现研究

分布式系统中存在很多电力电子装置和非线性用电设备，这些装置和设备在使用过程会向系统注入大量谐波。当系统传输线参数满足一定条件时，谐波在传输过程中会发生振荡，威胁系统中

学位

背景谐波谐波抑制阻性APFRAPF输出阻抗比例谐振控制器

用尼龙袋测定饲料中粗纤维的试验研究

测定饲料中粗纤维含量的经典方法,是19世纪由Weede试验站建立的酸碱处理法,我国国家标准"GB6434-86饲料粗纤维测定法"就是以此为基础的[1].但此法操作步骤繁琐,费时费力,酸碱

期刊

尼龙袋粗纤维常规法尼龙袋法

基于深度强化学习的数学应用题自动求解器

其他学术论文