【摘 要】
:
随着互联网的快速发展,网络情感文本的日益增多,其所包含的有价值情感信息也越来越重要,让人不可忽视。而情感分类作为一种能够自动判别文本情感方向的技术,已经被广泛的应用
论文部分内容阅读
随着互联网的快速发展,网络情感文本的日益增多,其所包含的有价值情感信息也越来越重要,让人不可忽视。而情感分类作为一种能够自动判别文本情感方向的技术,已经被广泛的应用于观点挖掘、市场分析、舆论监督等领域中。然而,经典的基于机器学习的情感分类方法具有以下两方面的假设,1)需要有足够的标签数据用来训练分类器;2)训练数据和预测数据应该具有相同的数据分布。然而,这在实际应用中往往难以得到满足。为此,跨领域情感分类得到普遍关注,它能够有效的利用与目标领域具有不同数据分布的标签数据,减少人工标注标签数据的工作量。本文针对已有的跨领域情感分类方法展开研究,主要工作如下:(1)首先概述了跨领域情感分类的相关研究,包括研究背景,意义,以及当前的研究现状。(2)针对已有的特征选择方法无法直接应用在跨领域情感分类中的问题,提出一种面向跨领域情感分类的特征选择方法,并基于该方法,通过构建目标领域情感词典,实现快速的跨领域情感分类CSFS。实验结果表明该方法能够在不降低分类精度的情况下,大大提高跨领域情感分类的时间效率。(3)为解决同一特征在不同领域具有不同情感极性的问题,提出了一种通用子空间的构建方法(CSC),该方法利用领域独立特征构建通用子空间,并通过将领域依赖特征映射到该子空间来消减领域差异性,从而实现跨领域情感分类。实验结果表明该方法在分类性能上具有较大优势。
其他文献
VOIP(Voice over Internet Protocol)概念提出至今已10余年了,先前由于通话质量等各方面存在缺陷,因此端对端的VOIP电话并没有真正大范围发展起来。但近两年来,随着全球宽带
二十一世纪是信息爆炸的时代,信息处理技术成为人们关注的焦点,面对海量的信息,如果对其不加区分,而采用相同处理,时间及空间复杂度则无法估计。研究发现,在海量信息中,人们
群体队形控制是人群仿真技术和计算机动画的重要分支,对于编队控制、队形设计等具有重要意义,已应用在游戏、动画、群机器人系统等诸多领域。本文结合几何约束机制,研究Power
随着现代社会的快速发展,人们对信息的要求越来越高了,作为重要信息资源之一的档案正面临着全球信息化浪潮的巨大冲击,原有的手工管理档案的方式已经不能满足人们对档案高效
随着网格技术的迅猛发展,网格安全成为影响网格技术的关键问题。特别当网格技术引入到校园网建设中后,不仅可以使得校园内的教学和计算资源得到充分的利用,还能够消除资源孤岛和
电子商务的迅速发展将传统旅游业推进了一个新的发展空间,上海旅游集散中心联合其他各家旅游集散中、汽车公司、酒店共同构建旅游电子商务联盟,以求通过开展电子商务来谋求企业
随着计算机和信息技术的迅速发展,网络已经成为我们日常生活、学习和工作的基础设施。各种基于网络的分布式办公系统层出不穷,电子政务系统就是其中之一。电子政务系统利用网络
随着嵌入式产品的功能和复杂度的不断提高,如何高效地进行开发已成为一个严峻的挑战。嵌入式软件开发已呈现出一些显著的特点:其一是行业内技术人员流动频繁,缺少复用经验的技术
时间序列是指按时间顺序排列的、随时间变化且相互关联的数据序列,在各个领域都广泛存在。异常检测在不同的研究领域和应用领域一直都是一个重要问题。所以随着互联网的发展
借鉴生物免疫系统的免疫原理解决网络安全问题已引起计算机安全研究人员的高度重视,尤其是基于人工免疫的异常检测方面已成为一个热门的研究方向。本文在研究人工免疫基本理