论文部分内容阅读
随着互联网的普及,信息时代的到来,网络在我们日常生活中扮演着越来越重要的作用,电子商务的兴起更是使得人们足不出户就能买到价美物廉的物品。通常消费者会根据自己购买商品的满意程度来进行购买后的评价,而这些评价又表达了消费者的情感倾向性。消费者的情感倾向性信息对于商家、消费者和相关政府部门等都具有很大的帮助。对于商家,可以帮助他们认识到商品质量和管理方面的不足;对于消费者,在进行购买时提供是否值得购买的事实依据;对于相关政府部门,可以作为指导他们进行监管工作的参考信息。所以网购评语中蕴含了丰富的情感倾向,这些数据就是一个天然的数据库,利用这个数据库挖掘出有用的信息是我们需要研究的问题。本文正是以真实的网购评语为对象,进行网购评语情感挖掘研究,特别是在情感倾向和情感倾向性强度方面。本文首先介绍了情感挖掘理论知识基础,包括了文本分词模型、文本特征抽取及文本情感倾向性分析的方法。在这些基础理论之上介绍了现有中英文环境下的文本情感倾向性分析模型。由于中文文本的特殊性和复杂性,使得原有中文环境下情感倾向性分析存在很大的误差。接着本文阐述了原有模型的不足及需要改进的方面,针对这些不足提出了改进模型及改进的方法,并增加了情感倾向性强度这一量化指标,这也是本文的创新所在。为了加强说服力,本文利用网络爬虫的知识获取到真实的网络评语信息,并对原有模型和改进后的模型分别进行情感倾向挖掘,并用相应的指标进行测量,验证了新模型的提高。本文最后为了说明网购评语情感挖掘所具有的实用性,在应用方面进行了基于情感挖掘的预测分析,将情感挖掘和灰色预测模型相结合,将本文的研究进一步推向现实生活,为商家、消费者和相关政府部门提供了借鉴分析的方法。