基于动态语义编码双向LSTM的中文语义相似度计算

来源 :计算机应用与软件 | 被引量 : 1次 | 上传用户:jinxiangjinshu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
中文句子结构有较高的复杂性,导致计算语义相似度非常困难,准确率不高。针对这种情况,改进一种动态语义编码双向LSTM中文语义相似度计算模型。采用双向LSTM编码器解码器结构,提取由标准句子和自然句子组成的句子对的双向语义特征。在解码器结构中加入动态语义编码规则,调整输入到解码器的语义编码信息,并把编码信息存储到LSTM神经元节点中,从而得到句子对更准确的相似度值。模型在汉字数据集、混合数据集和原始数据集三种中文句子对数据集中进行实验。实验结果表明,该模型在三种数据集中语义相似度的计算优于其他循环神经网
其他文献
目的探讨脑血管疾病患者医院感染的危险因素和护理.方法对2000年1月~2003年12月住院脑血管病患者发生医院感染29例,35例次的临床资料进行回顾性调查、分析.结果感染率为4.74%.
采用美国Morse跌倒风险评估表对185例年龄大于70岁老年住院患者进行全面评估,分析老年人住院期间跌倒的相关危险因素,并采取针对性预防措施,以减少住院老年人跌倒的发生率,保
因特网已经成为当代大学生重要的思想交流、获取信息不可缺少的重要领域,网络文化也已成为影响当代大学生思想品德、价值导向的重要因素.认真研究因特网与大学生思想政治上作
电信客户投诉记录中包含大量非结构化文本信息和客户通信行为信息。为了进行客户投诉的自动分析和精准分类,针对这些具有高维混合特征的数据,提出一种基于Filter模型和随机森林的客户投诉分类方法。采用Filter模型进行特征选择,以信息增益比来衡量特征的重要性,从而删除无关冗余的特征,降低维数;构建基于随机森林的客户投诉分类模型。采用某电信运营商3个月的投诉数据进行实验,结果表明:该方法相比其他集成学习
当前,推进人力资源开发,对于经济社会发展具有重要意义。从系统观点看,从我国经济社会发展的实际出发。需要着眼于人力资源开发的全过程,关注人力资源开发的全方面,增强人力资源开
近年来,分布式光伏电源逐渐接入配网系统,提高了配网系统的运行水平,同时也对配网运维检修安全生产带来了一定的挑战,使得配网运维检修面临着更高的技术要求。现分析光伏电源
纺织品配额取消以后,我国纺织服装出口反而遇到前所未有的挑战。纺织服装的低成本优势正在逐步丧失。为了化解出口压力,作为纺织服装出口大国,我国应该借助中国东盟自由贸易区(CA