细粒度中文网络消费评论情感极性分类方法研究

来源 :大连海事大学 | 被引量 : 4次 | 上传用户:truebug
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着电子商务和各种类型互联网互动社区的同步快速发展,网络消费评论信息,形成了具有重要商业价值的大数据集。网络商品评论的情感分析技术能够从主观性文本中识别、抽取相关的倾向性信息,通过特定算法以量化形式描述出文本所表达的主观意见,借此推测出评论者对所购买商品或服务的喜好程度,能够影响消费者的决策行为,对于改进商品特性、精准推送商品信息也具有重要的指导意义。为使情感分析的效用更加精准的作用于某一属性之上,以最大发挥消费评论的商业价值,本文开展网络消费评论分析中情感词与属性词的自动提取算法,以及基于情感词与属性词分析的细粒度网络消费评论情感极性分类方法研究。本文首先利用网络爬虫技术抓取了网络餐饮消费评论作为语料库,借助机器学习、自然语言处理等领域的理论知识,结合中文网络评价语言表达方式的特点,提出一种基于语料的领域情感词库自动构建方法;结合了餐饮评论中情感词与属性词之间的特征分析,提出基于名词+LDA(Latent Dirichlet Allocation)和基于字词间距+LDA+情感词库两种属性词搜寻策略,并对方法和策略的有效性进行了实验验证和实验结果分析;构建情感评价单元,根据情感评价单元进行情感计算,依据计算得分实现细粒度的文本情感分析,将细粒度情感分析结果以图形化层次结构进行了输入显不。通过本文的研究能够进一步提高用户评论情感分析的精确性,并使其在产品或服务改进、消费决策过程中发挥更大的指导作用。
其他文献
文章分析了目前我国城市水价存在的主要问题为 :总体水价偏低 ,水价计价和构成不合理。合理的水价应包括资源水价、工程水价和环境水价三个部分 ,本文讨论了水价三个构成部分
在发达国家管理会计得到了广泛的应用,但就我国现状而言,管理会计的应用状况并不理想。本文旨在对管理会计在制造业企业应用中存在的问题进行剖析,并提出相应措施以推动管理
目的探讨预测脑卒中康复结局的重要因素和可靠的预测模型。方法采用回顾性研究的方法 ,对北京博爱医院1999年 1月— 2 0 0 1年 7月收治的 2 2 5例首次脑卒中患者的临床资料进
目前许多观点挖掘方法挖掘粒度过大,导致反馈信息不足。为解决该问题,对标准LDA模型进行改进,提出主题情感联合最大熵LDA模型进行细粒度观点挖掘。首先,考虑到词的位置和语义
目的:分析儿童反复呼吸道感染(RRTI)的相关因素,为防治儿童RRTI提供科学依据。方法:选择儿童RRTI144例与健康儿童对照,自拟易感因素调查表,设置22个可能与RRTI有关的因素进行
个体化诊疗即突出个性化特征的临床诊断及其与之相应的个性化治疗。中医药学的辨证论治就是一种典型的“个体化诊疗”方法。中医在诊治过程中将其重点放在对个性特征的辨析上
封堵技术是油田“控水稳油”的主导技术之一,在油田开发中应用普遍。然而,近年国内新投入开发的油田中有相当数量的埋藏深、高温、高压、高矿化度、低渗透难开发的油藏,常规
我国区域经济发展不平衡严重影响了货币政策的传导机制,使得货币政策在传导效率、传导渠道和传导效果方面都形成了显著的区域性差异。本文首先对货币政策的信用传导机制进行
1.引言近年来,尽管北极涛动没有明显的正、负位相变化(Lindsay and Zhang,2005),同时,20世纪90年代末之后冬季全球变暖停滞(IPCC,2013),但是北极海冰面积(ASIC)仍持续减少。
在庆祝温州医学院建院四十周年之际,回顾我科的发展历程,深感党的改革开放政策是我们事业成功的保证。1982年,温州医学院附属第二医院创立,由原白求恩门诊部和附属第一医院骨科合并组