论文部分内容阅读
随着计算机技术和人工智能技术的突飞猛进,越来越多的智能产品走入人们的生活,人类俨然进入人机交互时代。如何从人机交互话术文本中获取有用的信息,让机器能够快速、准确的做出反应,已经成为学者和商业公司关注的焦点。本文主要研究在TCL智能电视场景下人机交互话术文本分类的相关技术,打破先前采用单一模型进行分类的局限性,提出了一种智能电视场景下的分类决策系统,重点研究分类决策系统中的层级分类模块。本文的主要工作有:1.首先,介绍文本分类的基本概念,文本语言模型,Word2vec词向量训练工具的基本原理以及深度学习中常用的分类模型。其次,采用k-means算法对收集到的人机交互话术文本进行聚类,初步确定文本数据类别。然后,分析人机交互话术文本的数据特点并结合智能电视的业务场景,对人机交互话术文本进行边界确定,划分出数据模块。最后,根据数据模块所具有的特点,提出具有针对性的决策分类系统。实验证明,决策分类系统对TCL智能电视场景下的人机交互话术文本分类的准确率达到了99.98%,相比于textCNN模型和textRNN模型,分类的准确率提高了19.99%-27.33%。2.设计结合字向量和词向量的双通道卷积神经网络分类模型用以实现对层级模块中的一级分类。首先,结合字向量和词向量的双通道卷积神经网络分类模型,解决了卷积神经网络视角单一,无法提取局部特征的问题。其次,在卷积层中,设置不同尺寸的卷积核,用以提取更多的语义特征,克服传统机器学习忽略词与词在语义上的联系。然后,通过连续的卷积层和池化层对特征进行提取和压缩,使提取的特征被压缩在低维的特征图谱中。最后,使用全连接层对特征进行降维,使用SoftMax分类函数,将神经网络的输出结果转换为概率分布形式,利用交叉熵损失函数对模型进行评价,采用Adam算法对模型进行反向调节,找出最优参数,实现对文本的准确分类。实验结果表明,卷积神经网络分类模型的在一级分类上的准确率为99.91%。3.研究残差神经网络在文本分类上的应用,提出隐藏层具有单个神经元的残差全连接神经网络。首先,通过在残差模块中设置隐藏层具有单个神经元的全连接层来改进残差网络的结构,改进的残差网络在增加模型深度的同时避免网络退化,并且模型的复杂度得到有效的降低,训练速度也得到了很大的提升。其次,在模型中设置TCE损失函数,提高分类器在有噪声情况下的训练特性。实验结果表明,隐藏层具有单个神经元的残差全连接神经网络在二级分类上的准确率达到了99.99%。