基于深度学习的人机交互话术文本分类

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:cyg858644
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机技术和人工智能技术的突飞猛进,越来越多的智能产品走入人们的生活,人类俨然进入人机交互时代。如何从人机交互话术文本中获取有用的信息,让机器能够快速、准确的做出反应,已经成为学者和商业公司关注的焦点。本文主要研究在TCL智能电视场景下人机交互话术文本分类的相关技术,打破先前采用单一模型进行分类的局限性,提出了一种智能电视场景下的分类决策系统,重点研究分类决策系统中的层级分类模块。本文的主要工作有:1.首先,介绍文本分类的基本概念,文本语言模型,Word2vec词向量训练工具的基本原理以及深度学习中常用的分类模型。其次,采用k-means算法对收集到的人机交互话术文本进行聚类,初步确定文本数据类别。然后,分析人机交互话术文本的数据特点并结合智能电视的业务场景,对人机交互话术文本进行边界确定,划分出数据模块。最后,根据数据模块所具有的特点,提出具有针对性的决策分类系统。实验证明,决策分类系统对TCL智能电视场景下的人机交互话术文本分类的准确率达到了99.98%,相比于textCNN模型和textRNN模型,分类的准确率提高了19.99%-27.33%。2.设计结合字向量和词向量的双通道卷积神经网络分类模型用以实现对层级模块中的一级分类。首先,结合字向量和词向量的双通道卷积神经网络分类模型,解决了卷积神经网络视角单一,无法提取局部特征的问题。其次,在卷积层中,设置不同尺寸的卷积核,用以提取更多的语义特征,克服传统机器学习忽略词与词在语义上的联系。然后,通过连续的卷积层和池化层对特征进行提取和压缩,使提取的特征被压缩在低维的特征图谱中。最后,使用全连接层对特征进行降维,使用SoftMax分类函数,将神经网络的输出结果转换为概率分布形式,利用交叉熵损失函数对模型进行评价,采用Adam算法对模型进行反向调节,找出最优参数,实现对文本的准确分类。实验结果表明,卷积神经网络分类模型的在一级分类上的准确率为99.91%。3.研究残差神经网络在文本分类上的应用,提出隐藏层具有单个神经元的残差全连接神经网络。首先,通过在残差模块中设置隐藏层具有单个神经元的全连接层来改进残差网络的结构,改进的残差网络在增加模型深度的同时避免网络退化,并且模型的复杂度得到有效的降低,训练速度也得到了很大的提升。其次,在模型中设置TCE损失函数,提高分类器在有噪声情况下的训练特性。实验结果表明,隐藏层具有单个神经元的残差全连接神经网络在二级分类上的准确率达到了99.99%。
其他文献
文化幽默是指幽默文本中负载了文化信息。文化是民族的,有其自身的特异性,文化幽默的理解必须是建立在相同的文化背景之上的。文化幽默的翻译是跨语言跨文化的交际活动,源文本功
智慧旅游带动了旅游行业的优化升级,推动了经济的发展,但是也为人才的培养提出了更高的要求。基于此,文章首先概述了智慧旅游的内涵,其次探讨了智慧旅游趋背景下,对旅游人才提出的
目的:研究比较髓芯减压植骨术与缝匠肌肌骨瓣移植术治疗成人FicatⅢ期股骨头缺血性坏死的远期临床疗效。方法回顾性分析2003年1月至2008年12月,采用髓芯减压植骨术和缝匠肌肌骨
<正>师生问好之后,我一如既往地没有急着上课,而是先反馈了早上批改回家作业后的感受:"今天批回家作业时我发现一个小问题——‘丢三落四’的现象严重起来了。昨晚有一道解决
本文分析了企业文化营销观念对于企业的生存、发展和创新的战略意义,论述了企业文化营销观念的建立、涵义、理论根据与市场营销关系及其适用性,提出了企业文化营销观念是企业
选用4种不同分子量的液体硅橡胶(107硅橡胶)作为生胶制备出了室温下固化的硅橡胶泡沫材料。探讨了生胶胶料黏度对固化速度的影响,以及分子量大小对硅泡沫的泡孔形貌、物理力
考虑机器人与目标点的相对位置以及相对速度因素构建引力势场和引力函数,考虑机器人与障碍物之间的相对位置、相对速度以及相对加速度因素构建斥力势场和斥力函数;基于位置的“
宁夏氟病区农村居民饮水的水质标准宁夏南部山区属清水河、苦水河、葫芦河、泾河、祖厉河流域及盐池东部闭流区,面积3.95万km2,占宁夏面积的76.26%。本区微咸水、咸水和苦水主要分布在第三系