基于深度学习的评论文本方面级观点挖掘研究

来源 :北京工商大学 | 被引量 : 1次 | 上传用户:heliuer
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着网络技术的飞速发展和计算机的普及,互联网已经成为生活中不可缺少的一部分,人们也越来越倾向于通过互联网来表达自己对网络商品、社会问题及热点事件的观点。网络评论中通常包含评论对象的多个方面,而这些细粒度信息也愈发受到浏览者的关注,值得我们进一步进行挖掘和分析。然而面对互联网上日益剧增的海量数据,用户要想找到自己所关注的信息往往需要耗费大量时间及精力,因此我们十分需要一种能够对大量互联网评论进行面向方面的观点挖掘与分析的方法。传统的方面级观点挖掘方法效果欠佳且缺少高效的观点总结方法。本文的工作包含以下四个方面:第一,本文对方面级观点挖掘相关研究进行了综述,对领域已有的工作分别从观点方面提取方法、观点内容提取方法、观点挖掘评价指标及常用数据资源等角度进行了归纳总结与分析。第二,本文在前人的启发下提出了一个带有注意力机制的深度神经网络来进行方面级观点挖掘任务,模型的输入特征除了包含语义信息外更考虑了输入文本的句法结构特征,最终通过在双语言数据集上进行实验证明了模型相比于其他参照模型在各个指标上均有不同程度的提升。第三,本文基于传统DBSCAN方法提出算法时间复杂度上的优化策略,利用改进后的快速聚类算法对方面级观点挖掘结果进行观点总结,并通过在多数据集的观点挖掘结果上的聚类性能与聚类效果实验对改进后的模型进行验证。第四,本文将方面级观点挖掘模型应用于中文影评数据集,实现演员推荐系统。本文对大量的原始影评进行观点挖掘与观点总结,得到的观点结果作为演员的素质评分计算依据,利用演员推荐算法与新角色进行各项素质的匹配与排序,最后实现演员推荐的目的。本文提出了基于深度学习的方面级观点挖掘方法及基于DBSCAN算法改进的快速聚类算法,最后将算法整合为观点挖掘系统,并在此基础上实现了基于观点挖掘的演员推荐系统,能够帮助使用者面对新电影新剧本做出更好的选角决策。
其他文献
目的探讨急性ST段抬高型心肌梗死(STEMI)合并应激性高血糖(SHG)患者围手术期应用胰高血糖素样肽-1(GLP-1)对心肌灌注和心功能的影响。方法选择STEMI合并SHG患者114例,随机分为观察
实务中,子公司向母公司支付的服务费是否属于“服务”性质,该费用能否税前扣除,一直是税务机关关注的重点,不少大企业集团因此被纳税调整。那么,子公司支付给母公司的服务费,难道真
报纸
采用访谈法、文献资料调研和问逻辑分析等方法,对黑龙江省中小学排球运动开展的现状和影响因素进行了调查和分析,并针对存在的问题,提出了相应的建议。
文章在单整和协整检验的基础上,运用计量经济分析方法的双变量格兰杰因果关系检验遴选先行指标,然后基于脉冲响应函数检验各先行指标的先行期数,最后建立起贵州省经济运行的
1.场地建造人工驯养野兔时必须遵循其生活习性,给野兔创造最适宜生长的"仿野生环境"进行人工饲养,逐渐减少野兔的野性。
现如今,专网行业的应用场景越来越丰富,除了窄带语音外,涉及的宽带多媒体业务也越来越广泛。宽带是发展方向,窄带是基础保障,两者的融合成为关键因素。针对不同的融合方案,文
由机械工业部北京起重运输机械研究所主持召开的中小型水利启闭机行业组成立大会于1986年7月6~9日在湖北省咸宁地区召开。到会代表有地方机械厅、水利厅属各中、小型生产厂28
提出一种结合单类学习器和集成学习优点的Ensembleone-class半监督学习算法.该算法首先为少量有标识数据中的两类数据分别建立两个单类分类器.然后用建立好的两个单类分类器
分析建筑业投入产出的效率差异,促进建筑业又好又快发展,运用DEA方法,对各地区建筑业发展数据进行统计分析,研究结果显示我国有接近一半的省份存在着非DEA有效。根据综合效率
VTK(Visualization Toolkit)作为一种通用的可视化类库,在科学和工程界有着广泛的应用,其中一种重要而又常见的应用就是在医学领域,本文介绍了可视化工具包的概念、总体框架,并研究