基于电子商务的评论文本情感极性等级分析

被引量 : 0次 | 上传用户:eric_nj
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
文本情感分析指研究分析人们对产品、服务、组织机构、事件和话题等进行评价时表达的意见、情感、评价、态度和情绪的特殊自然语言处理研究领域。涉及到多项具有挑战性研究任务,根据研究任务的不同,文本情感分析可以分为情感分类、情感信息抽取、情感信息检索和归纳。研究的过程包括预处理、情感信息抽取、分类器选择、结果归纳展示。随着web2.0的发展,人们可以通过互联网随时随地发表自己的观点,如博客、论坛、门户网站、电子商务平台等,这些文本能直接或间接反映人的行为和思想,所以研究分析这些文本的情感有许多的用处。关注分析电子商务领域的评论文本情感,无论对消费者还是商家都有重要的意义。目前文本情感分析虽然取得了较大发展,但对情感极性等级分析研究还不足。文本情感存在固有模糊特性,由此可以利用模糊理论的隶属度函数,进行情感极性等级计算。情感分析主要判断评论文本的情感极性和极性等级,即属于褒义、贬义的强度。根据电子商务领域评论文本的特点,在已有传统情感分析的基础上,开展对评论句子的情感极性等级分析。首先,通过STEP算法标注WordNet词典中的形容词情感,再用NOS隶属度函数计算词语情感极性等级,构建NOS情感词典。其次,利用整数线性规划(ILP)改造NOS情感词典,得到领域情感词典,使词典最大化适应电子商务领域文本分析。然后,改进传统的加权统计算法,即预先使用投票选举法判断句子极性,再计算情感极性等级,通过与未选举法的极性等级求平均值,作为最终的句子极性值。最后,使用领域情感词典抽取文本中的情感信息,包括情感词典、否定词、程度副词,实现了一个面向电子商务领域的情感分类系统。实验语料库为12000条评论句子,分别来自家电、酒店、图书类电商网站,通过手工标注语料的褒贬极性作为检验实验结果的金标准。实验结果显示:领域情感词典比NOS词典平均准确率提高了2.7%~6.1%;改进算法比加权统计算法提高了5.7%~9.1%,这说明对情感分析进行的初步尝试有较好效果。
其他文献
为了确定母光栅刻划设备运动平台各项机械误差与设备最终刻划精度之间的数学关系,为设备的设计和制造提供相关理论依据。首先,采用多体系统动力学方法,确立了母光栅刻划设备
在知识经济时代日益临近的今天,国民素质的高低,掌握知识的程度,特别是知识创新和技术创新能力,将成为决定一个国家,一个民族在国际竞争和世界格局中地位的关键。这其中教育
以Google Earth为平台,结合SketchUp的建筑物真实感三维建模功能,以西南交通大学校园为例建立校园真实感三维模型,并对其应用进行分析。该方法实现地形数据与建筑物三维模型
期刊
通过对大、中、小学 ,五个年龄段男女学生的立定跳远成绩和技术进行分析 ,针对立定跳远起跳时 ,大小腿的夹角对成绩的影响进行研究 ,发现起跳时站位低的 (接近 90°)好于起跳
伴随着我国经济的发展,我国人民的生活水平越来越高,我国儿童园艺工具市场容量也随之增加。相当数量的国外企业在我国“入世”以后进一步加强了对我国市场的开发。而我国儿童园
目的新生血管和炎性病变在颈动脉粥样硬化斑块的发展及破裂中起着非常重要的作用,并且新生血管与炎性病变密切相关,本研究使用DCE-MRI(dynamiccontrast-enhanced magnetic reson
气相色谱具有快速、灵敏、简便和分离能力高的特点,目前有70%农药残留量的测定是使用气相色谱法进行的。高效液相色谱法适应范围广,分析速度快,干扰物影响小,使得它在农药残留分析
超分子化学已成为构建具有特殊光电性能的纳米有序组装体的最有效手段。本文将巴比妥酸与蜜胺及其衍生物接枝到具有光电特性的TTF骨架上,通过氢键的诱导构建出纳米有序超分子