基于词对齐模型的网络文本评价关系抽取

来源 :福州大学 | 被引量 : 0次 | 上传用户:wxxsdc
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
评价关系抽取是情感分析的基础任务,它旨在抽取网络评论文本句中的评价对象以及评价词。目前国内外已开展了许多相关研究,并取得了一定的研究成果。但是现有方法还存在评价对象与评价词之间关系度量不准确,忽略评价对象,评价词自身关联关系等问题,影响了最终抽取的精度。因此,本文针对这一问题,进行了以下三方面的工作:(1)针对现有研究工作在抽取评价对象与评价词关系时应用人工模板和规则的方式,对评价对象与评价词关系权重的度量不准确这一问题,提出了基于词对齐模型的评价对象与评价词抽取。该模型利用词对齐模型自动抽取评价对象与评价词搭配,并结合词间距离等特征来估计两者关系的强度,建立一张二分图,结合领域相关性度量,利用随机游走算法迭代计算候选评价对象与评价词的置信度。在COAE2011任务3的语料上进行实验验证,结果表明,该方法在电子产品,影视娱乐及金融证券三个领域的抽取结果较基准方法在F1值上都有一定程度上的提升。(2)针对基于词对齐模型的评价对象与评价词抽取仅利用评价对象与评价词的距离因素来计算关系权重,而忽略了评价对象与评价词以及自身之间的多层关系这一问题,提出了一种基于多层关系的评价对象与评价词抽取模型。同样,它首先利用词对齐模型自动抽取评价对象与评价词搭配,然后同时考虑评价对象与评价词的依存句法关系,评价对象,评价词自身的共现关系,建立情感关系图,利用随机游走方法计算候选评价对象与评价词的置信度。在数据集上的实验结果表明,该方法与基于词对齐模型方法(WAM_I)相比在评价对象抽取上F1值平均提高3%。(3)针对在依存句法分析时往往只适合于句子成分完整的文本,而对于一些口语化的句子或者包含语法错误的网络评论文本可能产生错误的问题,提出了一种结合CRF评论句子压缩的评价对象与评价词抽取模型。首先利用条件随机场CRF模型对评论句子进行压缩,保留句子的主要情感成分,然后将其融入基于多层关系的评价对象与评价词抽取模型用于实验。实验结果表明,该方法较现有方法在准确率,召回率和F1值上都有不同程度的提高。
其他文献
不同说话人发音时声道形态差异很大,不利于生理发音数据的统计对比和生理发音模型的建立。减小说话人的声道形态差异不仅有助于发音特性的分析而且能够提高语音识别系统的鲁
近年来,随着社会经济的不断发展以及大众安全意识的不断提高,大到商场、火车站,小到个人家庭都安装了大量的视频监控设备。目前人们对于视频监控设备的需求已经不仅仅满足于
随着软件系统的规模与复杂程度的日益增长,对其源代码的分析也显得更加重要。对于像Linux内核等大型软件而言,由于开发人员众多,缺少统一的开发文档,在进行新的内核开发或升
钢铁公司在当今世界趋向数字化、全球化、绿色低碳的国际背景下,承受着巨大的转型升级压力。面对后工业化时代的到来,单位GDP消耗钢材数量持续走弱,加之全球经济增长的放缓、
大自然中有很多让人叹为观止的生物群体活动现象,比如鱼类的群游、鸟类的蜂拥、蚂蚁的搬家。自然界这些复杂的行为无法通过个体指挥来完成,因为单个个体的能力是有限的,但是
供应链契约协调是供应链协调的一种有效的协调方式。考虑决策主体的过度自信后,对供应链契约协调进行研究更有现实意义。为探索决策主体过度自信时,收益共享契约的参数变化以
高效的多址接入是提高网络吞吐量,降低信道随机接入碰撞的有效方法,现有的载波侦听等传统方法,仍然存在效率较低,网络吞吐量不高等缺陷。本文研究了基于压缩感知的多址接入方
随着移动互联网的快速发展、移动智能终端的普及化,移动智能终端产品在给用户带来便利的同时也获取大量的用户原始数据。这些原始数据蕴含着移动用户的兴趣偏好、运动轨迹和
2013年全球著名公司谷歌推出了新一代视频编解码标准VP9。VP9视频编解码一经推出,就受到产业界的广泛关注。越来越多的厂商开始支持VP9,国外互联网视频中采用VP9编码技术的数
An omnidirectional vision has the ability to obtain larger field of view and richer information of environment than normal view vision,and has wide applications