基于语义技术的中文信息情感分析方法研究

被引量 : 0次 | 上传用户:ttjjgogogo
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
面对网络上日益丰富的情感信息资源,如何能快速有效的获取并使用其中的有效信息成为人们关注的问题。本论文以影评信息领域的客户情感挖掘为例,通过使用一种以语义倾向分析为基础的信息挖掘技术来挖掘影评中用户透露的情感信息,藉此探讨语义倾向分析方法在面向互联网中文信息的客户情感分析中的作用。本文首先系统地介绍了文本分类的相关知识。通过对文本分类的基本概念、原理及相关技术的介绍,总结了文本分类领域的研究现状,为下一步方法的提出奠定基础。随后论文对语义分析的来源及原理作了简要地总结,从中英文语言差异的角度出发,针对语义倾向方法在英文应用中暴露的问题,提出了改进,进而提出应用于中文的改进算法。最后的实验阶段论文运用影评测试文档对改进后的文档进行实测以验证改进后算法的正确性。为了验证改进后算法每个步骤的必要性,论文针对不同的步骤组合也进行了相关的实验。同时更加清晰地展现改进后算法的性能,验证改进的正确性,本文运用近年来广泛使用支持向量机技术进行性能的比较,并采用手机测试文档进一步测试比较两者的性能。本文在改进算法的同时,收集整理了相关的影评数据集和手机数据集,形成了一个可以共享的语料库。同时根据改进后的算法,设计编写了一个情感信息分类系统,解决了中文情感信息的自动分类问题。语义倾向方法与训练型的文本分类算法相比,由于具有不需要大量样本训练、领域知识依赖弱的特点,相信在未来必能得到广泛的发展。
其他文献
根据2004-2006年监测数据,运用综合水质标识指数对山美水库水质进行评价.结果表明,山美水库主要污染因子的污染程度大小排列次序:总氮(TN)>总磷(TP)>粪大肠菌群>高锰酸盐指数
马克思毕生将经济学研究和哲学研究相结合,既重视经济学的研究,也重视哲学的研究,独创了历史唯物主义和剩余价值学说,而这两者的内在统一是他经济哲学思想的实质和特色。科学
目的:探讨IgA肾病血清IgA1与系膜细胞共培养上清对足细胞分泌TNF-α的影响及机制。方法:Jacalin亲和层析柱和Sephacryl S-200分子筛用来纯化蛋白,单体IgA1(mIgA1)热聚合为聚
巴渝地区具有深厚的传统道德积淀,集中体现在"为公"、"重义"、"尚勇"、"祟仁"、"包涵"五个方面.
本文首先对OECD成员国税收优惠政策做简单回顾,然后着重分析我国研发费加计扣除政策体系构成和发展阶段,并且较全面总结我国R&D费用财务核算范围与加计扣除范围的不同,指出如
本文结合榆林煤炭工业发展的现状,基于人工神经网络构建出煤炭工业可持续发展的预警模型,并运用该模型,对榆林煤炭工业的可持续发展状况进行了研究,这有利于提高煤炭工业发展预警
城市是电力系统的主要负荷中心,城市电网规划的好坏决定着城市电网的使用的安全性和经济性。本文对城市电网规划的意义、主要内容和方法就做了简要的介绍。由于城市发展中的
在古今中外艺术发展过程中,民间信仰对于民间美术的影响十分广泛。民间信仰影响着民间美术造型的产生和发展,在历史的长河中它们相互影响并生共存。本文以河南淮阳地区的“泥
顾宁教授认为阵发性房颤发病基础为气阴两虚,心神失养;病机总属本虚标实,本虚为气阴两虚,标实有血瘀、痰饮、气滞之异;治疗上以益气养阴治本为基础,兼以祛邪治标,配合宁心安
伴随着高速数字采集以及处理芯片的发展,电网继电保护已逐步受到国家电网公司的关注。针对平均无故障时间、失效率与寿命的关系进行了剖析,并对目前继电保护装置寿命研究中的