基于胶囊网络的意图识别方法研究

来源 :内蒙古师范大学 | 被引量 : 0次 | 上传用户:hehan1127
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着人工智能技术的不断发展,人机对话系统受到广泛的关注。口语理解是人机对话系统中的一部分,而且至关重要,目的是让机器理解用户的具体需求从而给出合理的答复。为了明确用户表达的意图需求,意图识别是口语理解中的关键子任务,同时意图识别的准确性直接关系到语义槽填充的性能并且有助于后续对话系统的研究。考虑到人与机器的频繁交互以及用户表达的多样性,用户话语中有时不仅仅包含一种意图,而是含有多种意图,所以意图识别任务可以分为单意图识别和多意图识别两个任务。本文通过分析传统的机器学习方法和深度学习方法在单意图识别任务和多意图识别任务上的研究,进一步思考如何将深度学习模型合理地运用到意图识别任务中。胶囊网络中的胶囊含有丰富的特征信息,动态路由可以动态学习神经网络层之间的关系,不仅可以保留出现概率较小的语义特征,而且具有很好地拟合特征的能力,适用于小型数据集。因此,本文主要采用胶囊网络分别在单意图识别任务和多意图识别任务上进行研究,具体工作如下:(1)针对卷积神经网络中的池化操作不能完全利用句子中的所有特征信息这一问题,本文采用胶囊网络解决这一问题并将其应用于单意图文本中,通过使用动态路由算法合理地将意图文本中的所有特征信息动态分配到意图胶囊中,从而完成单意图识别任务。并将其与传统的机器学习方法和各种深度学习方法在单意图识别任务上进行性能结果对比,进一步证明了胶囊网络的优势。(2)考虑到用户多意图表达数据稀缺的问题,本文分别收集了基于单意图标签的中文和英文多意图测试集,并且构造基于单意图标记的多意图分类器进行多意图识别,同时将胶囊网络用于多意图识别任务。一方面,为了保证意图文本的特征质量,本文提出在胶囊网络中增加卷积胶囊层提取意图文本的深层次语义信息,并且利用胶囊网络中的动态路由算法将高层特征胶囊动态分配到意图胶囊类别中,通过设置阈值大小判别多种意图存在的概率,从而提升多意图识别的准确性;另一方面,在增加卷积胶囊层的基础上,本文提出使用三种不同的卷积核提取句子中不同词组搭配的语义信息,探究不同卷积核对多意图识别性能结果的影响程度,实验证明ngram值为3时可以得到更好的多意图分类性能。多意图识别性能的提升有助于口语理解的研究和对话系统的构建。
其他文献
北京水资源严重不足,是北京建设世界城市的关键制约因素。污水资源化利用是适合北京的最有效的开源方式,也是提高水资源使用效率的重要途径,既减轻水资源供应负荷,又削减水污染负
在现代叙事理念中,经验作者被隐含作者所取代,作家在叙事中隐去真身,幻化出另一幅精神生命和人格面具,成为"隐身说话的人"。这一带有鲜明形式主义批评和文本中心主义色彩的叙事
在充气欠平衡钻井过程中,地层存在诸多不确定因素及不可预知情况。尤其是煤层气的开发,如果各种突发状况或者影响安全钻进的其他工况未能被及时监测与控制.则会发生井塌、井眼不
构建和谐湖北具有各种各样的路径,不同路径的采用取决于湖北社会中存在着的各种不同的妨碍社会和谐的因素。其中,如何有效地处理效率与公平(即如何尽可能多地创造社会财富与合乎
<正>全面介绍了"中国民航适航指令网络化管理系统"的功能及特点,并就该系统的开发背景和发展方向做了相应的阐述。我国的适航指令简称CAD,是由
乡土小说是指作者凭借回忆所构建的具有乡土特色地方气息的小说作品,这一类型的小说在整个二十世纪的中前期大放异彩,成为我国文学创作的一个重要流派。四川自古交通相对不便,地理位置特殊,在半封闭的环境之中形成了自己独特的地域文化特色。二十世纪上半叶中,一大批乡土作家以四川为背景,创作了一系列经典的乡土小说,其中所蕴含的对于四川地方性知识的丰富描写,不仅在四川本地引起了当地读者的强烈共鸣,也为其他地区的读者
在全面分析我国西部地区水利现状的基础上,提出了西部地区水利建设总体规划思路,包括水利规划总体部署及近期水利建设的重点等.