基于深度学习的在线健康文献食材命名实体识别

来源 :华南理工大学 | 被引量 : 0次 | 上传用户:ltcool
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
深度学习是近年来受关注较多的机器学习方法,它利用了人脑的层次化思考方式,通过多层网络学习的方式来对数据进行抽象和学习,并通过一系列的改进和研究使得多层的神经网络能够有效得到训练,其中的卷积神经网络、循环神经网络等在许多领域如文本生成、语音合成、人脸识别、行为识别等各类任务中取得了很好的效果。伴随着居民生活水平的提高,人们开始提高了对自身健康和相关疾病的关注,同时互联网在国内的快速和兴起,关于健康方面的资讯和文献资料开始在互联网上涌现,为人们提供了更多的信息来源和渠道。然而这些在线健康文献以自由文本的方式存在,对其进行命名实体识别是一项有效挖掘后续信息的方法。本文针对其中的与人们日常生活关系最为紧密的食材名进行命名实体识别。本文的主要工作包括:1.整理并分析了中英文领域实体识别的相关工作,指出了中文实体识别的相关困难;2.分析并对比了传统识别方法与深度学习方法的异同,指出了传统方法面临的困难与不足及深度学习方法能够带来的改进;3.针对当前没有相关语料库的情况,利用网络爬虫等手段构建了相关的实体识别语料库及标注数据;4.通过实验对比了不同循环神经网络的性能水平;5.利用当前性能水平较好的卷积神经网络、循环神经网络等,在前人的基础上改进了相关的深度模型,并取得了更好的效果。
其他文献
近年来,随着建设智慧城市、平安城市等目标的提出,监控视频网络在各个行业得到了广泛的应用。作为智能监控中核心技术之一的无重叠视域多摄像机下的行人再识别问题也受到越来
视觉目标跟踪是当前计算机视觉领域的主要研究内容与技术之一,在智能视频监控系统、人机交互系统、视频检索系统、视频压缩技术以及军事应用领域都有着重要的作用。然而,在实
蛇形机器人是一种用途广泛的仿生机器人,具有广阔的发展前景和重大的研究价值,但是其高冗余度、结构复杂的特点使得研究工作有一定难度。本文旨在通过旋量理论对于蛇形机器人
古特提斯金沙江缝合带是研究大洋扩张、洋-陆俯冲、陆-陆碰撞、以及陆-陆碰撞晚期作用机制的重要区域。沿金沙江缝合带发育有多条岩浆弧,其中江达-维西岩浆弧是研究陆-陆碰撞
将普通用户的智能移动设备(手机,平板电脑等)作为基本的感知单元,通过移动互联网进行有意识或者无意识的协作,实现感知任务的分发和感知数据的收集和存储,完成大规模的、复杂
无线传感器网络(WSN)将传感器节点散落在一定区域,观察发生事件。但是在大多数的情况下,只有包含了传感器节点位置信息的数据才具有真正的用途。因此,已知监测区域内各传感器
自动生物实体关系抽取技术对于构建生物领域知识库,知识图谱,提高搜索引擎检索效率具有重要意义。通过总结现有工作,本文从三个方面进行自动实体关系抽取。基于规则的关系抽
改革开放以来,中国经济持续高速发展,人民对电力的需求与日俱增,高压和特高压输电线路的电压水平不断增加。输电塔线体系是一个大跨度、高耸的结构体系,在跨越地势相差较大的山谷地貌时,相邻塔之间会产生大高差档距,在风载荷作用下,输电线路易形成强烈的风致响应,严重的还会导致倒塔事故,致使整个线路停运。因此,研究输电塔线体系在复杂风载荷作用下的响应具有重要意义。本文以某500kV大高差输电塔线体系为原型,运用
随着当代遥感技术日新月异的发展,航天遥感卫星成像具有高分辨率、高精度、高时效性,与此同时数据量也相应的呈几何量级迅猛增长。而星地数据传输信道带宽与星载数据量之间形
随着婴幼儿游泳行业不断发展扩大,越来越多的家长将孩子送至婴儿游泳场馆游泳,虽然有游泳圈保护,但安全监控防护措施没有及时更新,婴幼儿溺水事件频频发生,家长或是工作人员的一时疏忽,就会导致惨剧的发生。随着互联网的不断发展,计算机已经能够使人类生产和生活更加安全可靠。对于婴幼儿泳池安全问题,计算机也可以提供溺水监控的帮助,不管是否有人在看管婴幼儿游泳池的孩子,都会有安全的保障,实时监测并能在危险发生的瞬