论文部分内容阅读
随着互联网与信息技术的飞速发展,社会媒体逐渐成为人们信息传播及观念阐述的重要渠道,为研究人员了解社会趋势、群体诉求等提供内容丰富的开放式平台,如汽车相关的话题评论社区。由于汽车网络口碑的出现,企业能够从中发现用户的整体需求并识别汽车的隐式风险,为其准确把握用户心理、构建风险预警体系及持续稳定发展提供保障。但对于一种全新的用户反馈渠道,如何快速、准确的于海量数据间采集有效信息并识别其情感倾向则是企业利用网络口碑的主要制约因素。因此本文针对国内汽车企业普遍存在的信息化程度不高、网络口碑利用率较低等问题,提出了一种基于社交媒体的汽车品牌评论情感分类系统框架,并采用深度网络分类模型对评论进行情感自动化识别,期望提高汽车企业对网络评论的利用程度。本文主要完成了以下工作:(1)提出一种以字符和词组作为联合输入的卷积神经网络模型。针对长度小于140字的汽车文本评论特征共现信息不足的问题,该模型引入拼音序列来表征评论字符特征输入,并采用Word Embedding技术对汽车评论进行文本表示,进而通过卷积和k-max采样操作抽取评论文本的特征,最后采用Softmax分类算法实现对汽车短评论的情感识别。(2)采用长短时记忆网络模型对长评论文本序列进行双向建模。针对长度大于140字的汽车文本评论长度差异化明显的问题,该模型能够有效利用文本序列数据中的长距离依赖信息,通过抽取评论文本中的关键词组和上下文信息来实现汽车长评论的情感识别。(3)在分析现有主要汽车媒介平台的基础上,提出了适用于多数据源的汽车行业情感分类系统平台框架。该系统主要包含数据采集、数据处理以及情感分类三大模块,针对模块中的关键问题,着重介绍了多数据源评论抽取聚合方案和深度学习模型训练部署方案的实现细节。