中文电子病历中时间表达式和医疗事件识别技术研究

来源 :西北师范大学 | 被引量 : 0次 | 上传用户:lpt207
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
互联网的快速发展加快了医院信息系统建设的步伐。电子病历作为医疗信息化系统建设的一部分,其数量与日俱增。电子病历包含了大量与患者健康状况息息相关的医疗信息,是对患者在医疗机构就诊时的医疗事件陈述。如何通过技术手段挖掘电子病历文本中包含的一些关键信息,应用于临床决策支持、辅助诊疗等方面具有重要的研究价值。随着信息技术的发展,基于自然语言处理的医疗信息结构化成为学术界的研究热点。时间表达式和医疗事件作为了解患者疾病发生发展的重要依据,对医生和研究者认识动态的医学现象具有重要意义。由于目前已有研究主要面向于英文电子病历,中文电子病历的语料库较少,鉴于此,本文进行了以下几项研究:(1)设计了中文电子病历时间表达式和医疗事件标注规则。本文参考英文I2B2评测中关于英文电子病历中所给出的定义和相关标注规则,结合中文电子病历自身的特点,通过对中文电子病历的分析和研究,设计了中文电子病历时间表达式和医疗事件标注规则,并构建了1500份中文电子病历时间表达式标注语料库和2000份中文电子病历医疗事件标注语料库。(2)中文电子病历中时间表达式识别研究。提出了一种融合卷积神经网络(Convolutional Neural Networks,CNN)和双向长短时记忆神经网络(Bi-directional Long Short-term Memory Networks,BiLSTM)的中文电子病历时间表达式自动识别方法。通过几种方法对比发现,融合CNN和BiLSTM的方法识别中文电子病历时间表达式的性能最高,整体识别的F1值达到了95.38%,同时在每个子类别的识别上也有较好的表现。(3)中文电子病历中医疗事件识别研究。本文提出了一种基于卷积注意力和多图神经网络的方法来对中文电子病历中的医疗事件进行识别。通过几种方法对比,得出我们提出的医疗事件识别模型有较好的性能,对医疗事件综合识别的F1值为92.21%,并且在医疗事件每个子类别的识别与现有的方法相比均有一定幅度的提升。
其他文献
虞美人是我国北方冷凉地区广为栽培的一种草本花卉,在湖南益阳地区栽培较少,尤其是春播更少。文章对虞美人的植物学特征和生物学特性以及在湖南益阳地区的露地春播栽培技术进
[目的]探究粮食作物种植结构时空分布特征,有利于进一步优化生产布局,对保障粮食的安全可持续生产具有重要意义。[方法]文章通过对1991—2016年陕西省主要粮食作物种植结构相
伴随社会和经济的快速发展产生的水体磷污染日益受到关注,磷污染主要来自含无机磷的生活污水和含有机磷的工业废水。排入水体的无机磷和有机磷种类多、结构复杂,会对人体健康
研究背景耳聋肌张力障碍视神经病(Deafness Dystonia Optic Neuropathy,DDON)综合征,也被称为Mohr-Tranebjaerg综合征(MTS;MIM 304700),是一种罕见的进行性X连锁隐性遗传疾病,全