论文部分内容阅读
随着互联网产业应用发展的不断深入,人们生产生活各个方面都深受影响,随之产生的各种文本数据呈爆炸式增长,这些文本的数量变得异常庞大并且蕴含着很多重要的信息。因此,从这些文本数据中准确快速地提取到有用信息的方法研究具有重要的应用价值。文本主题提取和情感分析是提取文本信息的常用方法,而推荐系统模型是文本信息应用的重要领域方向。但由于网络文本结构多样,风格迥异,中文语言复杂性等因素使中文文本信息的处理具有一定的挑战性,因此,在当前的推荐系统模型中,对文本信息的利用也非常有限。 针对以上问题,本论文基于餐馆用户评论文本致力于将主题提取和情感分析结果应用于个性化推荐模型。传统的个性化推荐系统大多基于用户与商品的历史互动行为数据建立用户的偏好模型,进而针对用户的兴趣偏好进行信息推荐。随着互联网产业的完善,庞大的网上文本评论数据能够直观反映用户的行为偏好,这些信息的利用对个性化推荐模型的建立具有很重要的参考价值。网络文本主题提取可以了解用户关注的产品特性,而情感分析可以反映用户对产品各个特征的喜恶程度,与从历史行为进行用户偏好分析相比,从用户评论得到用户的偏好更直观更准确。 本课题做了三方面的研究工作:首先对原始评论文本进行处理,构建聚类半监督主题扩展方法,从而得到用户关注的主题;接着综合现有的通用情感词典和评论文本构建专用情感词典,利用专用情感词典对用户关注的主题进行情感分析,综合得到用户的偏好;最后根据从用户评论文本中获得的用户偏好对用户进行个性化推荐。 论文使用大众点评网站用户餐馆评论文本数据对算法进行验证,结果表明,本课题提出的聚类半监督主题扩展方法对特定领域(本文选取美食评论领域)的主题提取具有良好的效果;领域情感词典的构建提升了情感分析的准确性;由用户评论文本数据获取用户偏好从而进行个性化推荐的方法在个性化推荐领域具有很重要的实践应用价值。