【摘 要】
:
近些年来互联网技术的普及程度加深,在网络平台上发表自己对于热点事件的看法和观点成为人们表达自己见解的一个重要的渠道。为了更好地了解广大民众的想法,将社交网络中的海量文本资源作为分析对象对舆情进行监控和分析逐渐成为了研究者们的一个关注重心。目前针对短文本的情绪分析的研究很多依然停留在情感极性的层面,细粒度的情绪分析依然没有统一的标准,单标签分类结果往往无法全面的反应用户的真实情绪。因此,多标签下的社
论文部分内容阅读
近些年来互联网技术的普及程度加深,在网络平台上发表自己对于热点事件的看法和观点成为人们表达自己见解的一个重要的渠道。为了更好地了解广大民众的想法,将社交网络中的海量文本资源作为分析对象对舆情进行监控和分析逐渐成为了研究者们的一个关注重心。目前针对短文本的情绪分析的研究很多依然停留在情感极性的层面,细粒度的情绪分析依然没有统一的标准,单标签分类结果往往无法全面的反应用户的真实情绪。因此,多标签下的社交网络短文本情绪分析是具有很重要的社会意义和价值的一项研究。本论文主要是基于推特的内容进行分析,研究从文字中识别用户的情绪并进行分析的方法。本文的主要工作内容及贡献如下:(1)目前多标签的互联网短文本情绪标注语料库比较匮乏,为更好的对多标签情绪分类算法进行研究,本文设计了一种面向推特文本的情绪标注规则,根据标注规则完成了推特语料库的标注工作。标注完成的语料包含6500条推特,11338条句子,其中推特层级为多标签标注。(2)针对人工标注语料库时间成本和人工成本过高的问题,提出了一种自动化短文本情绪标注的方法,通过机器完成对文本情感极性和情绪倾向的标注,并在其基础上通过人工方式进行修正,大大降低了语料库情绪标注的人工成本。(3)考虑到主流的针对文本的情绪分析方法大多是单纯的多分类问题,本文进行了多标签情绪分析,在情绪分析环节,针对单独利用词语的句内特征进行文本情绪分析无法准确的分析互联网短文本情绪倾向的问题,本文对MLkNN分类器进行了改进,将句子的相邻句以及整体的推特情绪进行结合,对推特整体的情绪分析结果进行迭代修正。并在此基础上将标签相关性作为情绪分类的条件之一,对分析结果进行修正。改进后的算法在互联网短文本情绪分析的应用中取得了较好的效果。
其他文献
射频指纹识别技术是一种通过对通讯设备的硬件差异识别不同的无线设备的方法,旨在辅助解决无线网络的安全接入问题。本文通过对通信发射机稳态信号的细微指纹进行提取,并利用
我时常向自己提这样一个问题:我的学生中有多少是出于对学科的兴趣、出于求知的热情而学习的?这首先是对自己的教育教学的警醒。因为在我看来,我们的学生一直处在一种“被学习”的状态。我们的教育经过了一系列改革,虽然有了较大发展,但我们仍很少把学生看成主动发展的生命,忽视了个体成长过程中生命自觉的唤醒。 教室里虽有读书声,但听不出学生那种对文字的热爱。数学虽然能得满分,但冰冷的分数中看不到学生对于数学的喜
本次研究围绕将项目式学习应用在高中化学教学中的相关问题进行了初步的探讨,同时应用文献法,实验法、调查法等研究方法开展了相关研究。随着基础教育改革的进行,核心素养的
目的:本研究对种植钉辅助上颌快速扩弓的临床效果及其稳定性进行分析,并与传统螺旋扩弓器快速扩弓的临床效果及稳定性进行对比,为临床医师治疗计划的设计提供参考和帮助。方
文章分析了海洋经济和陆域经济的关联关系,从海陆经济发展中的竞合行为出发,运用复制者动态方程对海洋经济和陆域经济的竞合协同关系进行表征,获得系统的动态均衡点,并结合相
流量是互联网行业最重要的资产,互联网内容社区需要将用户流量通过某些手段实现现金收益。在促进流量变现的方式上,很多品牌都选择品牌延伸策略。例如小红书从海淘内容社区发
于2013年5月对高栏港湾内11个采样站位表层沉积物中Cu、Zn、Cd、Pb、Cr与As等重金属元素进行测定,探讨了表层沉积物重金属平均含量及其分布特征。并对由11个采样站位分组而成
基于实际应用的需要,引入区域控制的概念,对一类时间分数阶扩散方程的区域边界可观性进行研究,并对如下问题做出了回答:用多少观测器,如何配置可实现时间分数阶扩散方程的区域