面向社交网络文本的情感分析方法的研究

来源 :大连理工大学 | 被引量 : 0次 | 上传用户:slim_ning
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着在线社交网络平台的爆炸式增长,比如国内的微博、微信,国外的Twitter、 Facebook等社交网络平台,人们越来越倾向于在社交网络平台上发表自己的观点,表达情感态度。与此同时,社交网络平台产生了海量的蕴含了用户的情感倾向、观点态度的文本数据。挖掘这些信息分析其情感倾向性,对优化个性化推荐,更好地进行舆情监控等都有很重要的价值和意义。然而,社交网络文本以其口语化、时效性强以及网络化等特点,给传统的情感分析等任务带来了巨大的挑战。众所周知,除了文本,转发等行为关系数据也是社交网络文本的一大特点。针对此特点,本文结合图排序模型,利用用户的行为关系数据来分析微博的情感。然而,在对社交网络文本进行情感分析时,也会存在一些其他的问题,其中一个最显著的问题就是语料分布的不平衡。针对此问题,本文做了进一步研究,提出了一种基于情感关键句抽取的跨领域情感分析方法。一方面,本文针对社交网络文本自身的特点,提出了一种基于图排序模型的微博情感分析方法。该方法首先利用微博中含有的丰富的表情符号,基于表情符号进行无监督的语料标注,在一定程度上弥补了语料分布不平衡的问题;然后,鉴于微博等社交网络文本的特征的稀疏性,利用受限波尔兹曼机进行新特征抽取;最后,利用微博的转发关系以及同一用户发表的不同微博之间的关系,构建了微博邻接关系图,并结合图排序模型对微博进行情感分析。该方法充分利用社交网络文本的文本数据的同时结合行为关系数据,较好地实现了微博的情感分析。另一方面,针对社交网络文本在情感分析过程中,易出现语料分布不平衡的问题,提出了一种基于情感关键句抽取的跨领域情感分析方法。该方法首先基于文档中不同句子具有不同的情感贡献度的思想提出了情感关键句的概念,构造抽取情感关键句的启发式规则,并与机器学习算法相结合来抽取网络评论的情感关键句;然后基于抽取的情感关键句,将数据划分为key和detail两个视图;最后利用视图集成策略将两视图有效融合,实现了跨领域的情感分析,进而在一定程度上解决了随着社交网络的飞速发展,文本数据分布变化带来的语料分布不平衡的问题。
其他文献
软件可信性问题已经成为国际上一个普遍关注的问题,最近的软件故障和失效所带来的影响越来越大,例如,北京奥运会期间的售票系统瘫痪和最近的波兰总统飞机坠毁事件,都在说明系
随着科学技术的不断发展,图像作为一种新的数据信息已经被广泛应用于各个领域。越来越多的图像需要被处理。图像匹配指的是将不同情况下获取的不同图像中的相同内容匹配起来
随着信息技术的发展,信息系统在国家的政治、军事和经济领域的广泛应用,整个社会对信息系统的依赖性越来越大,信息系统的安全问题已成为关系经济稳定发展和国家安全的社会问题。
无线传感网络(Wireless Sensor Network, WSN)目前已经被广泛地使用在各种军事或民用应用中,如军事航空、空间探索、环境监控和健康医疗。然而,在实际应用中,能量问题严重阻
在企业的日常运作过程中,会经常遇到各种各样复杂的调度问题,而车间生产调度问题解决的好坏直接影响着企业的运作效率和客户满意程度,最终影响企业对市场的反应力和竞争力。
随着信息科技在教学过程中的广泛应用,一种基于移动技术的答疑学习系统改变了传统的学习方式和教育方法。这种采用自主的、探究式的、灵活多样的移动答疑学习方式让学习者从
随着监控系统的发展,市场需求的产品种类越来越多,而可以统一管理这些设备的系统就变的非常重要。本文借鉴海康威视的SDK设计开发出针对多种设备的统一管理软件,其中包括:混
随着计算机技术,特别是数据库技术的发展,高校的信息化发展有了很大的进步,校园网内各类管理信息系统以及因特网上权威检索数据库中存储的数据已初具规模。如何发现隐含在这些数
在现实生活中,许多应用涉及到多个目标同时求优的问题,这些问题被称为多目标优化问题。进化算法凭借着其较好的收敛性和多样性被广泛应用在多目标优化问题中,这些多目标优化
随着我国水电事业的迅猛发展,大批的规模较大的梯级水电站群已经投产使用。水电站群的特点包括电站级数多、装机容量大、输送范围广等,其优化问题具有非常明显的高维性,非线