新闻评论中的隐式情感分析技术研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:bujifangzong
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的不断发展,网民的数量逐渐增多,网络信息也呈爆炸式增长。这些信息基于用户的真实体验,蕴含着巨大的价值。目前可以使用情感分析技术挖掘其中的情感与观点,然而由于许多时候人们不直接通过情感词,而是选择“隐晦”地表达其真正想说的意思。隐式情感分析可以较好地处理这类问题。由于这类问题有一定的占比、不容忽视,且目前受到的关注较少,因此本文聚焦于隐式情感分析技术,对其中的各种任务做出研究。本文的主要研究工作如下:1.构建隐式情感分析数据集,来源为新闻评论。由于目前隐式情感分析领域的公开数据集与本文的研究内容不符,最终选择自行标注数据集。详细介绍了构建过程与标注规则,并且分析了其主题与类别分布。2.新闻评论显隐式情感分类。事先判断出句子中包含的是显式情感还是隐式情感有助于采用不同的方法对其作出更好的研究,故该任务是后续任务的基础。本文针对该任务提出了BCRNN模型,同时对比了传统机器学习模型、集成学习模型以及深度学习模型的表现。3.隐式情感极性分类。情感极性可以极大地帮助我们理解用户的态度,可以说是最重要的任务。本文针对该任务提出了ECRNN模型,并且结合各种机制以便更好地识别情感极性。4.隐式情感表达方式分类。由于自然语言表达的丰富性以及类别分布不均的特性,该任务较为困难。本文针对该任务提出了AXCRNN模型,同时对比了不同的训练集规模、以及不同的利用无标注数据的方法的表现。5.搭建了新闻评论隐式情感分析原型系统。系统可以方便结果的展示与使用。完成的系统界面简洁,使用方便,实用价值高。
其他文献
现阶段基于云端的视频监控技术日渐成熟,然而将监控设备采集到的图像或视频数据传输至云端或数据处理中心进行数据分析将会对监控网络的服务器与带宽造成较大负担,因此,面向变电站监控场景及智能化监控识别需求,结合人工智能图像分析与处理的方法,开展边缘智能计算技术研究至关重要。首先,分析并总结国内外有关目标检测技术与边缘计算技术的研究方案以及技术路线,同时基于现有边缘计算设备讨论模型搭建与边缘部署的可能性,分
文本作为沟通和协作的重要工具,在社会中扮演着重要的角色。同时在现代化社会中,由于图片和视频等数字化内容的快速发展,对其中的文本进行检测和识别往往可以提供给人们很重要的信息,利用这些信息能够辅助使用该信息的主体更好的完成任务。因此对于图片和视频中的场景文本进行检测和识别具有重要的意义。而在场景文本的检测和识别过程,对场景中的文本进行定位(即场景文本检测)是首要任务,因此场景文本检测具有重要的研究意义
近年来我国心脑血管疾病为代表的各类疾病发病率屡达新高,已经成为当前医学界重点研究课题之一。有研究数据表明,急性期丙烯率逐渐从最初的5%递增到15%,大部分死亡患者均因自身脑部病变及其他并发症所致。能幸存下来的患者当中有70%左右的患者都遗留有后遗症,必须长期服用药物来抑制病情,同时还需进行不定期复查,确保随时掌握病情。患有脑梗死的城乡居民不但痛苦还给家庭带来了严重的经济负担,在后期的康复中还需要长
作文智能批改的需求与日俱增,然而目前针对不规范书写的中文手写作文识别任务尚未有一套完善的解决方案。篇幅级识别任务大多是针对于英文数据集,还没有已经开源的中文作文数据集。因此研究复杂场景下的中文手写作文图像识别方法具有重要意义。首先为了快速收集大量数据,本文开发了一个半自动化的人机协作作文标注系统。利用百度开源的sdk,为用户提供了两种人机协作的标注模式,能自动帮助用户切分行、生成标签;系统支持多层
对于居家的糖尿病患者来说,将CGM屏幕显示的血糖曲线拍照发送给远程管理血糖的医生是目前常用远程医疗方式。考虑到医生需要较为准确的数据进行诊断,因此需要考虑CGM血糖图像通过视觉检测进行数据提取。本文针对CGM血糖仪屏幕图像设计了数据提取的视觉检测算法,同时开发了CGM血糖仪图像数据检测系统。本文的主要研究内容如下:由于需要针对不同型号CGM血糖仪设计不同的视觉检测算法,同时获得大量CGM血糖仪屏幕
如今软件产品有着非常广泛的应用,软件错误的发生可能带来很严重的后果,软件错误的定位显得更为重要。人工定位错误耗时又费力,自动化错误定位可以节约开发人员时间,降低调试难度。基于变异的错误定位不涉及程序依赖关系分析,是一种轻量级的错误定位方法,计算复杂度低,同时又定位在语句级别,定位精度较高。但是因为其会有大量变异体生成并执行,所以花费成本较高。由于现有的变异算子是为模拟程序错误而设计的,若变异算子可
学位
近年来,随着互联网和云计算技术的发展,我们逐渐从信息化时代向智能化时代迈进,互联网成为了最多源的信息采集平台。知识图谱打破了传统数据存储介质的局限性,并通过结构化的方式将实体和关系集成来自互联网上的多源异构数据,形成了统一化的语义网络结构。在数据收集、传输、探索和分析的基本技能中,最需要的一项是发现多源、多变量和流数据中的隐含的关系。无规范化的领域知识阻挡了本体和知识库的共享,由于本体的主观性和知
甲状腺结节是临床常见病和多发病。在临床中,普遍采用超声成像技术对甲状腺结节成像,生成的超声图像是医生对甲状腺结节进行诊断和治疗的重要依据。在临床中,超声图像通常由训练有素的专家阅读,他们通过撰写文字报告来描述患者的异常和疾病。超声图像的阅读和超声报告的撰写花费了放射科医生大量的工作时间,而且由于医生的时间和精力有限,会出现漏诊和误诊的情况。因此,医学超声图像报告的自动生成技术,即为一张超声图像自动
[研究目的]平台企业数据共享是维护市场安定、保护国家经济安全中的重要一环,数据所具有的竞争法品性,使得平台企业数据共享需要被纳入反垄断法进行规制。[研究方法]在反垄断背景下分析平台企业滥用数据优势的行为及危害,进而阐述平台企业数据共享的理论根源和实践现状。从平台市场竞争失序的理论根源研究出发,据此提出平台企业数据共享的理论支撑。对平台企业数据共享现状进行研究,发现平台企业数据共享运作机制存在着市场