论文部分内容阅读
随着网络技术的飞速发展和计算机的普及,互联网已经成为生活中不可缺少的一部分,人们也越来越倾向于通过互联网来表达自己对网络商品、社会问题及热点事件的观点。网络评论中通常包含评论对象的多个方面,而这些细粒度信息也愈发受到浏览者的关注,值得我们进一步进行挖掘和分析。然而面对互联网上日益剧增的海量数据,用户要想找到自己所关注的信息往往需要耗费大量时间及精力,因此我们十分需要一种能够对大量互联网评论进行面向方面的观点挖掘与分析的方法。传统的方面级观点挖掘方法效果欠佳且缺少高效的观点总结方法。本文的工作包含以下四个方面:第一,本文对方面级观点挖掘相关研究进行了综述,对领域已有的工作分别从观点方面提取方法、观点内容提取方法、观点挖掘评价指标及常用数据资源等角度进行了归纳总结与分析。第二,本文在前人的启发下提出了一个带有注意力机制的深度神经网络来进行方面级观点挖掘任务,模型的输入特征除了包含语义信息外更考虑了输入文本的句法结构特征,最终通过在双语言数据集上进行实验证明了模型相比于其他参照模型在各个指标上均有不同程度的提升。第三,本文基于传统DBSCAN方法提出算法时间复杂度上的优化策略,利用改进后的快速聚类算法对方面级观点挖掘结果进行观点总结,并通过在多数据集的观点挖掘结果上的聚类性能与聚类效果实验对改进后的模型进行验证。第四,本文将方面级观点挖掘模型应用于中文影评数据集,实现演员推荐系统。本文对大量的原始影评进行观点挖掘与观点总结,得到的观点结果作为演员的素质评分计算依据,利用演员推荐算法与新角色进行各项素质的匹配与排序,最后实现演员推荐的目的。本文提出了基于深度学习的方面级观点挖掘方法及基于DBSCAN算法改进的快速聚类算法,最后将算法整合为观点挖掘系统,并在此基础上实现了基于观点挖掘的演员推荐系统,能够帮助使用者面对新电影新剧本做出更好的选角决策。