【摘 要】
:
产品评论挖掘就是从用户发表的评论中挖掘出产品特征、用户观点,并判断观点极性,为生产、营销商家和潜在的用户提供参考。通过对提取出的产品特征进行分析,发现用户对产品特征粒
论文部分内容阅读
产品评论挖掘就是从用户发表的评论中挖掘出产品特征、用户观点,并判断观点极性,为生产、营销商家和潜在的用户提供参考。通过对提取出的产品特征进行分析,发现用户对产品特征粒度的关注是不同的,本文针对这一问题进行了研究,主要工作如下:利用基于索引的标签路径的方法找到数据区路径,抽取产品说明书和原始评论。定义标注细则,完成原始评论的人工标注,为后续研究准备基础数据。给出了基于特征粒度树获得产品特征粒度关系的方法。由于单个说明文档中的特征分类效果不好,本文利用改进的相似度公式判断来自不同说明文档特征记录的相似性,相似度公式的改进使得特征记录相似性判断的准确性有了较大提高;基于相似特征记录将特征组进行重组,根据新的特征组集合建立特征粒度树;由于特征记录来源于同一型号的产品,其特征覆盖不完全,本文抽取了多种类型产品的说明文档,用于完善粒度树,增加特征粒度树的广泛适用性;根据相似度计算和《同义词词林》判断从产品评论中抽取的特征与特征粒度树中结点的相似性,将产品特征在特征粒度树中进行定位,从而获得产品特征之间的粒度关系。实验结果表明本文改进的相似度公式提高了相似判断的准确性,也验证了基于特征粒度树获得产品特征粒度关系方法的有效性和本文建立的特征粒度树的实用性。
其他文献
2000年,R. Ahlswede等人提出了网络编码的概念,它完全颠覆了传统的路由方式。网络编码技术允许网络节点对接收到的数据信息进行编码处理,然后将编码数据包发送出去;接收端根
识别蛋白质相互作用网络中的模块结构,是理解细胞功能的组织结构以及动态性的第一步。因而,如何在蛋白质相互作用网络中寻找模块结构便成为一项十分重要而且极具挑战的任务。目
随着信息技术的迅速发展和现代教育需求的增长,E-learning(Electronic learning)逐渐成为人们生活中重要的学习方式。E-learning具有良好的交互性和较小的时空约束性,它能够不受
目标跟踪是计算机视觉和模式识别领域当前的研究热点问题之一,并且在诸如智能导航、自动监控、军事防御、人机交互等方面有着广泛的实际应用。虽然目标跟踪经过几十年的发展
第三代合作伙伴计划(3rd Generation Partnership Project,3GPP)考虑到互联网和传统运营商的融合,引入了IP多媒体子系统(IP Multimedia Subsystem,IMS)作为核心网的发展方向
由于技术的发展以及成本的降低,基因组测序在孟德尔遗传疾病,复杂疾病,以及癌症基因检测中得到了运用,并产生了海量的测序数据。这些数据对研究疾病的致病机制、疾病的临床诊
基于位置的服务(Location Based Service, LBS)是根据用户的位置信息提供服务的一种移动通信应用服务。在给用户带来便利的同时,现有LBS的工作机制也使得用户面临个人信息,甚
在当今信息化世界中,中文信息处理技术已经在各个领域中得到了广泛的应用。本文主要对中文分词算法中的基于分词词典机制的最大匹配算法进行研究讨论。由于中文语法语义复杂导
在飞速发展的交流调速系统中,交流变频电机作为主要的拖动方式已逐渐占据主导地位,在生产实践中的应用越来越广泛。而在采用了绝缘栅双极型晶体管(IGBT)器件的脉冲宽度调制(PWM)型变频器后,变频电机却出现了寿命问题,其中变频电机用漆包线耐电晕性能是制约其寿命的一个重要方面,这时就需要特定的测试仪器能够有效检测漆包线耐电晕的性能。在深入研究漆包线耐电晕测试相关技术的基础上,本文采用了IGBT的H桥技术