【摘 要】
:
随着互联网的不断兴起以及各大社交媒体的不断普及,拥有智能终端的用户可以随时随地的浏览时事热点报道。他们可以使用推特,微博,知乎等社交媒体平台及时的发表意见,交流观点。而在谣言监测和舆情分析等应用场景下,文本中所表达的用户立场倾向至关重要。但传统的人工抽样调查的方法存在成本过高,效率过低的问题。因此需要一系列自动化手段帮助我们从海量的社交媒体文本中识别出用户对于相关事件的立场。传统的情感分析技术仅对
论文部分内容阅读
随着互联网的不断兴起以及各大社交媒体的不断普及,拥有智能终端的用户可以随时随地的浏览时事热点报道。他们可以使用推特,微博,知乎等社交媒体平台及时的发表意见,交流观点。而在谣言监测和舆情分析等应用场景下,文本中所表达的用户立场倾向至关重要。但传统的人工抽样调查的方法存在成本过高,效率过低的问题。因此需要一系列自动化手段帮助我们从海量的社交媒体文本中识别出用户对于相关事件的立场。传统的情感分析技术仅对文本进行极性分析,不能对具体事件目标的立场进行分类。所以针对现有立场挖掘需求,设计新的立场挖掘方法及模型,提升现有算法的效率与准确率是本课题的研究重点,主要分为以下三点:1、基于深层长短期记忆网络和注意力机制的立场分类算法:首先,通过社交媒体语料库预训练词嵌入模型,提取词汇语义特征。然后,通过多层双向长短期记忆神经网络学习单词语义表示,结合注意力机制吸收话题特征,在不同数据集上进行对比实验验证算法效果。2、基于递归图卷积网络的立场分类算法:传统文本分类算法将文档视为单词序列,基于递归图卷积网络的文本分类方法将单词作为节点,将文档作为词汇图。本文针对立场挖掘任务特性,将用户的社交文本构建为独立的文档图,采用图卷积网络对节点特征进行更新,使用话题注意力得到文档表示向量,提升立场分类实验效果。3、文本立场挖掘系统的设计与实现:为了降低用户使用门槛,本文基于本课题所提出的算法构建了文本立场挖掘系统。本文对相关组件进行了详细设计,通过网页前端与用户直接进行交互,并对数据爬取模块与立场分类模块进行了功能测试,实现了一个简洁方便的文本立场挖掘系统。
其他文献
在现实生活中,许多现象都可以归纳为非线性发展方程的数学模型问题,人们开始对非线性发展方程的求解有了广泛的兴趣。非线性发展方程有着丰富的背景,其应用范围十分广泛,被广泛应用到生物学、数学和物理等众多领域。到目前为止,求非线性发展方程的精确解还没有形成统一的方法,因此,我们需要寻找有效的求解方法。越来越多的科学家开始研究非线性发展方程的特点,创造出了李对称分析方法,该方法在理论和应用方面都取得了很大进
近年来,无线通信领域对物理层安全通信有了更高的要求,而传统的通信技术往往具有高复杂性算法、能耗和硬件成本支出过大的问题。因此最近智能反射面(Intelligent Reflecting Surface,即 IRS)被提出并应用于无线通信系统中。IRS是无源被动的二维反射表面,可以通过软件控制IRS上反射单元的反射相位主动修改无线信道。通过设计IRS的反射相位可以在合法用户处的接收信号相干叠加同时在
随着互联网信息技术的发展,网络媒体、社交帐户每天都会产生大量文本数据,这些文本数据蕴含着巨大的价值。信息抽取技术(Information Extraction,IE)能够从这些文本中挖掘有用信息。本文主要研究信息抽取技术的子任务实体关系抽取(Relation Extraction,RE)技术。该任务旨在从非结构化文本数据中抽取蕴含的实体语义关系,从而将大量非结构化数据转化成易存储、易分析的结构化数
凭借着高品质因子、低模式体积,回音壁模式的光学微腔日益成为科学家研究的重点并且被投入到各种应用之中。多层复合材料微腔能够观察到单一材料无法实现的独特现象,然而目前对于微腔内热振荡现象的研究都仅限于双层及以下的微腔之中。本文以提出的两种不同模型的三层复合回音壁微球腔为重点,第一种是由二氧化硅、聚二甲基硅烷、二氧化硅组成的三层微腔,他们各自通过热光效应对微腔谐振波长的影响是正、负、正;第二种是由二氧化
增强现实(AR)在教育、医疗和营销推广等领域发挥的作用越来越明显。目前,AR主要基于专用设备或APP来实现,少部分基于Web。然而,专用设备式AR和APP式AR的体验和开发成本高,不具备轻量化特性,Web AR发展不成熟且性能提升仍有较大空间。为此,本文提出了一种实现轻量化AR的方法,在满足功能和性能要求的同时,降低体验和开发成本。主要创新内容和工作如下:(1)针对目前AR应用体验与开发成本高的问
呼吸运动是哺乳动物用来维持生命的一项必要的生理活动,其中包含着丰富的节律性行为。研究表明,哺乳动物延髓腹外侧区的pre-B(?)tzinger复合体(pre-B(?)tC)是产生和调节呼吸节律的关键部位。其中存在着一类特殊的神经元,这些神经元可以通过突触耦合形成神经网络,并自发地产生节律性放电,这些节律性放电与呼吸节律的产生密切相关。在生物实验中,研究者发现了一类特殊的簇放电类型——混合放电(MB
极化是电磁波很重要的特性之一。对于各种极化态的操控,需要借助极化转换器来完成。极化转换器在卫星通信、电磁隐身、天线设计、成像和波束控制等方面,发挥着重要的作用。传统的极化转换器主要利用自然界现有的材料,依靠材料本身所具有的双折射效应和圆二色性等特性对极化态进行控制。然而,这往往需要厚重的体积,以实现在传播方向上足够的相位积累。超材料的出现则为极化转换器的发展提供了新的方向。本文基于超材料的设计思想
随着互联网行业的高速发展,互联网产品的功能逐渐复杂化,行业内的竞争也越来越激烈,在互联网项目及企业中引入科学先进的风险管理方案显得尤为重要。本研究以D移动办公平台项目为例,对互联网项目的风险管理进行深入的研究,旨在研究出科学合理且适用于互联网项目的风险管理方案,从而提高互联网企业的竞争力。本研究首先通过专家访谈法、组织全员头脑风暴会等方法对D移动办公平台产品3.0迭代项目在各个阶段的风险因素进行识
随着现代通信的不断发展,作为信息物理载体的光纤正在扮演愈加重要的角色。光缆故障属偶发事件,但光缆数量的激增导致光缆故障愈加频繁的出现。光缆安全监测技术是光缆运维不可或缺的关键技术,有效的光缆安全监测技术能大幅降低运维成本,提高运维效率。光纤传感技术因其体积轻便、安装便捷、无源、抗干扰等优势,已在各个领域中作为一种重要的监测手段而被广泛使用。光缆安全监测已有成熟的解决方案,但主流方案具有硬件成本与改
随着大数据、人工智能技术的进步,计算机视觉领域受到人们的广泛关注,它的主要目的是创建可以像人类一样处理、分析和理解视觉数据的数字系统。本文主要研究了计算机视觉领域中的人体姿态估计和预测问题。前者是指从包含人的图像或视频中获取关节点的位置信息。后者是指在人体姿态估计的基础上,利用历史姿态位置信息预测未来一段时间内的姿态变化情况。目前,这两项技术已经被广泛应用于视频监控、医疗健康、自动驾驶等领域。本文