基于非参数贝叶斯方法的情感主题模型构建

来源 :西南科技大学 | 被引量 : 0次 | 上传用户:farzision
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着近几年微博、博客、电子商务网站的兴起,用户的参与度和活跃度越来越高,针对热销商品、热门新闻事件等产生了海量的评论信息。通过对这些文本进行数据挖掘研究,可以得到用户对于产品的评价、对社会事件的观点,对于商家的产品研发、用户的购买决策和政府的舆情监控以及政策制定有着重要的价值和意义。因此,分析处理这些文本信息变得迫在眉睫,文本情感分析就是其中主要工作。本文对细粒度的情感分析进行了研究,结合非参数贝叶斯方法,提出了一种面向产品属性的用户情感模型。主要的研究内容包括以下几个方面:首先,研究传统情感模型在分析商品评论中的用户情感时,发现面临两个主要问题:缺乏针对产品属性的细粒度情感分析和自动提取的产品属性其数量须提前确定。接着,提出了一种细粒度的面向产品属性的用户情感模型,首先利用分层狄利克雷过程将名词实体聚类形成产品属性并自动获取其数量,然后结合产品属性中名词实体的权重和评价短语以及情感词典作为先验,利用潜在狄利克雷分布对产品属性进行情感分类。最后,通过采集淘宝和京东关于手机的评论数据,选取苹果手机评论作为实验数据集。实验结果表明该模型具有较高的情感分类准确率,情感分类平均准确率达87%。该模型与传统的情感模型相比在抽取产品属性和评价短语的情感分类上具有较高的准确率。
其他文献
通过对比实验方法研究了机器人铅酸电池Pb-Sb合金的胞/枝晶转变和电化学行为。采用EIS、极化曲线和等效电路分析研究了定向水冷凝固系统制备Pb-2.2%(质量分数)Sb合金试样在室温
取犬血浆500μL,加入20.0μg·L-1氯霉素内标甲醇溶液50μL,用甲基叔丁基醚(MTBE)先后萃取2次,使样品中雌三醇(E3)溶入MTBE中,MTBE的加入量均为1.00mL,充分摇匀2.0min后,
文章从教育学的"外围"环境入手,以四套文献分类体系共16种分类标准作为研究对象,分别考察其对教育学学科属性的界定或分类,以判断教育学在文献中表现出来的认可程度,并通过赋权
为了深入揭示国际瑜伽研究发展状况,以美国Web of science(WOS)TM核心合集数据库为数据源,通过关键词检索,获取1985-2014年相关数据。运用Cite Space软件对数据进行计量分析,
供应链金融(Supply Chain Finance),是指商业银行在其信贷业务的专业领域中,以核心企业作为支撑点,为其提供融资和其他结算服务的同时,把信贷资金投入核心企业上下游的中小企
目的:探讨保温措施对腹腔镜肾切除术患者手术过程中低体温的预防效果。方法:选择60例手术患者,随机分组,对照组患者进行常规护理,观察组患者采取保温护理措施,比较两组疗效。
极其微小的机器人将引起制造业的革命。原则上 ,一个分子大小的组装器可以建造几乎所有的东西 ,包括复制它自己
本文在分析我国滩涂开发存在的政策、科学与技术等问题的基础上 ,探讨了我国滩涂持续利用的基本思路 ,提出了滩涂生物遗传多样性的保护与利用、适于滩涂成陆土地种植的植物筛
<正>计算机会计信息系统实现网络处理后,由于系统的入口增多,操作人员和信息使用者干预系统的机会增大,系统面临的安全隐患也必然增多。尤其随着Internet的应用,外部日益扩大
<正> 据《自然》周刊报道,德国研究协会(DFG)最近发表的一篇报告指出,德国政府对科学的过份控制已损害了德国研究工作的效率。并有可能威胁到德国的科学竞争力。 DFG任命的一
期刊