多特征融合的解释性意见要素识别方法研究与实现

来源 :黑龙江大学 | 被引量 : 0次 | 上传用户:annhongmay
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
越来越多的人在互联网平台发布一些产品的评论信息,我们称为用户生成内容(User-Generated Content,UGC)。如何高效地帮助人们识别有用的信息是目前学术界和工业界越来越关注的研究之一。汉语解释性意见要素识别就是研究如何精确的识别出用户生成内容中要素成分的问题。汉语解释性意见要素识别任务是指利用自然语言处理技术准确的识别评论语句中的意见属性、意见评论、意见解释信息。本文根据中文产品领域评论的语言特点,在构建汉语解释性意见要素识别的语料库基础上,研究汉语解释性意见要素识别问题。本文将从以下三个方面进行研究:(1)基于LSTM的解释性意见要素识别:基于LSTM的方法可以识别出属性、评论和意见解释片段,但是没有利用标签的相互作用,而CRF框架可以加强当前标签对相邻下一个标签的识别效果。为了提高意见要素识别预测的准确率,本文运用LSTM和CRF框架的结合。实验表明,可以有效识别要素成分。(2)基于预训练模型的解释性意见要素识别:CRF只利用预测标签之间的信息,而在中文的评论语句,字的上下文信息、字在句中的语义信息都可以作为特征。预训练在很多研究中已经得到验证,可以获取意见要素成分中与字相关的特征,并能有效提高预测的准确率。本文运用word2vec、ELMo两种预训练的方法,分别提取了要素成分中字的上下文信息、要素成分中的字在整段评论句的语义信息。实验表明,分别增加这些特征可以对要素识别的效果起到一定作用。(3)融合多特征的解释性意见要素识别:分别使用上下文特征、语义特征可以取得一定效果,为了进一步提高要素识别的效果,采用融合要素成分与字有联系的特征和字的特征。与字有联系的特征通过预训练模型提取;字的特征包括字作为单纯的特征和字的笔画特征,字的笔画特征可以有利于识别数据稀疏未出现的要素成分。融合多特征是将这些特征结合作为LSTM和CRF的框架的输入,实验表明,融合多特征的方法有一定的效果。
其他文献
大量研究显示限制性饮食者对食物信息存在注意偏向,其中失败的限制性饮食者对食物信息的注意维持与回避偏向,已有研究采用改编的点探测任务,引导个体对食物信息的注意偏向,证
美国运输学院用数字说明了琼斯法案作保护美国国内航运市场政策的重要性。这一究对我们有很好借鉴作用,也为评价运输政提供研究思路。
通过司法控制死刑依赖于社会的价值观、伦理观、道德情感等共识性基础。对于作为剥夺生命的"极刑"来说,只有对"恶性"极大的人适用死刑才能具有道德上的合理性。酌定情节的裁
阿里巴巴开放平台成立于2006年,成立的初衷是为了增加淘宝网上商家销售工具的多样性,因此阿里巴巴开放平台将自身的一些服务端接口对外开放,并引进了一批第三方工具类开发者,
当前,国际环境变幻莫测,国内外贸易形势错综复杂,影响国家安全的因素日益增长,中国海关作为进出境监管部门,一直承担着严峻的进出境风险防控任务。如何建立起符合中国国情的海关风险管理模式,探索高效的风控措施,实现高效监管目标,一直是海关部门的重要研究课题。石家庄海关作为直属海关,虽然已经初步建立了以风险防控分局为中心的海关风险管理体系,但是在实际操作中还存在许多问题,风险管理体系始终处于低效率运行状态,
铁路台阶式加筋土挡墙的设计方法尚不成熟,不能满足铁路边坡工程实践的需求。潜在破裂面的确定是加筋土挡墙设计的关键,但现行规范仅对10m以下单级加筋土挡墙的潜在破裂面有
我国铝电解产业已形成全球最大的生产和消费规模。目前,我国电解铝产能过剩,企业亏损,作为高能耗工业,降低电力资源的成本是市场竞争的关键。东北大学直流负载半实物仿真及负