融合隐式评价内容的意见挖掘技术研究与实现

来源 :河北科技大学 | 被引量 : 0次 | 上传用户:wuyuwei1210
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在电商网站不断增加的时代,用户的评论信息也在不断的增多。用户通过浏览某个产品的网络评论得到数据支持服务,借此深入了解产品,并在用户决策时提供参考;商家通过挖掘用户的反馈意见,指导后续改进产品和服务的质量。关于网络评论的意见挖掘技术得到广泛的研究。意见挖掘中评价对象的抽取是很多研究者关注的问题,其中明确表达评论属性的显式评价对象获得了较多研究。包含隐式评价内容的用户意见挖掘为用户和商家提供了更加丰富的评论意见。因此,本文结合隐式评价内容对用户意见挖掘技术进行了研究与应用,主要工作如下:1)提出了显式评价对象与评价词抽取方法。根据评价对象抽取任务的粒度不同,可将其整理为语料级别和语句级别的抽取。针对语料级别的抽取任务,本文提出一种融合语义依存关系和BTM的Biterm*Topic Model语料级别评价对象抽取模型;针对语句级别的抽取任务,本文提出了基于BiLSTM-CRF与不同权值的词嵌入向量和词性嵌入向量相结合的Weight~N-BiLSTM-CRF语句级别评价对象抽取模型。使用不同的抽取模型抽取出不同级别的文本中的评价对象与评价词。2)针对意见挖掘中的隐式评价对象的预测和情感极性判别,提出了基于多输入卷积的长短期记忆神经网络的分类算法。该算法将词语及其对应的词性标注信息进行向量化,并将向量化结果作为卷积神经网络的输入;利用卷积神经网络对输入信息进行特征提取,并生成特征矩阵;利用长短期记忆神经网络对特征矩阵进行特征学习。设计实现了将该算法应用于隐式评价对象的预测和情感极性判别。实验表明,采用Weight~N-BiLSTM-CRF模型能够提高显式评价对象和评价词抽取任务的F值;基于多输入卷积的长短期记忆神经网络的分类模型比单输入卷积的长短期记忆神经网络的分类模型在隐式评价对象的预测以及情感极性的判别在准确率与F值上都有所提高。
其他文献
目的:探讨多原发大肠癌的发病特点、临床特点、诊断、治疗、预后和随访,为临床医师掌握该病的诊治提供参考。方法:回顾性分析大连医科大学附属第一医院普外科2012年1月1日-20
对元代以来汉语教科书《老乞大》及《老乞大集览》的若干词语作了考释,以为研究之助。
作为中华民族文化之瑰宝的中原武术文化内涵丰富,历史悠久,其外宣材料的英译工作也日益得到关注。本文着力从功能目的论的角度来探讨中原武术文化的外宣翻译,认为好的翻译应
目的研究异染色质蛋白1α(HP1α)在胆管癌发展中的作用和分子机制,为胆管癌靶向治疗提供新的策略。方法该研究利用免疫组化,Western blot和PCR检测了HP1α在胆管癌组织和细胞
目的:应用二维分层应变成像技术测量左心室心内膜下心肌、中层心肌和心外膜下心肌收缩期整体及各节段纵向应变,探讨该技术评估蒽环类药物化疗后乳腺癌患者早期左心室收缩功能
随着互联网技术的日新月异,传统互联网PC端日渐式微,加之智能手机端高效便捷,使得我国移动互联网使用群体不断扩大。据工信部数据,截至2016年年底,国内移动互联网用户的总数
在浩瀚的中国古文化长河中,有两样东西令世界难忘:它们是丝绸和瓷器.分别以丝绸和瓷器命名的"丝绸之路"与"陶瓷之路",不仅仅是简单意义上的交通要道,更是中外政治、经济、文
<正>2019年全国三套高考语文试卷中论述类文本阅读无论是阅读材料还是选项设计,均聚焦语文学科核心素养,呈现出鲜明的个性特征。此类试题在考查考生阅读核心能力方面所呈现出
目的:检测CD137(又称4-1BB)、CD137L(又称4-1BBL)在胰腺癌组中与癌旁正常胰腺组织中的表达差异,并通过CD137L表达水平与胰腺癌病理分期和预后的关系,探究CD137和CD137L对胰腺