基于EHR电子健康记录的临床医学文献检索研究

来源 :华中师范大学 | 被引量 : 0次 | 上传用户:wudongzy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着医疗信息系统的普及,存在大量相对松散且难以定量分析的EHR电子健康记录,真实地描述了患者的临床表现情况。本文使用EHR作为查询输入,检索与查询相关的医学文献进行输出,帮助医生更快更准确地进行医疗决策。这项任务同时得到了信息检索界和生物医学信息界的高度关注,并连续在近几年的TREC测评比赛中设立此项任务。医学检索一直是信息检索领域的研究热点。给定的临床真实数据具有以下特点:a.用作查询的EHR包含Summary,Description以及Note三种类型并且长短不一;b.特定词汇重复出现;c.医学数据集和查询主题中包含大量专有名词和缩略语,格式和内容普遍存在不规范和不完整问题。然而,在传统文档长度归一化方法中,模型本身具有一定的偏好性,如果参数设置一个很小的值,它对于短查询效果较好;反之,则对长查询更有利。现有伪相关反馈模型则不能同时考虑到候选词在反馈文档中的重要程度和候选词与查询词之间的邻近位置共现关系。鉴于此,本文进行了相应的研究与改进,具体贡献体现在以下两个方面:第一,在概率模型基础上,设置一个动态函数,代替取值固定的普通参数调节,动态函数需满足(1)查询词只有一个时,必须包含该词的文章才能被检索出来。(2)函数值是递减的,随查询长度增加而减少。(3)该函数是有界的。同时采用一个新的平均特定组频的概念,得到一个新的模型来进行词区别。第二,为了更好地解决与查询术语具有较高位置关联度的词更可能与查询主题相关这一问题,本文使用超空间模拟语言(HAL)模型,设置固定窗口大小,分别计算该窗口内每个候选扩展词与初始用户查询词的邻近词权重,将词邻近共现权重融合到Rocchio扩展权重中,提出了 HRoc模型。最终使用归一化方法计算候选查询词得分,选取前N个候选查询词作为扩展查询词来完善用户的查询意图。本文所提出的改进模型都在TREC临床决策支持追踪数据集上进行了实验,结果表明在大部分评价标准上,本文所提出的方法具有可行性和有效性。
其他文献
近日,安福县纪委和检察院分别就该县审计机关移送的县物资资产运营公司原经理蔡某等人涉嫌违法违纪案件线索情况,向该县审计局作出回复,该县检察院立案侦查终结后查明,蔡某犯贪污
新课程倡导的学习方式之一是探究性学习,而发现和提出问题正是探究性学习的开端。结合课改实践,本文就培养学生问题意识的意义及策略等方面微探,分析认为通过构建民主的课堂
<正>1塑料性能测试通用标准统计标准内容的划分包括基础标准(通用技术语言、技术通则、基础规范)、产品标准(树脂、塑料、板材、管材、薄膜、软管、电缆)和方法标准(工艺要求
为了提高红外激光图像的定位识别能力,提出基于机器学习的红外激光图像特征定位技术,采用红外遥感采集设备进行原始红外激光图像采集,采用多层Gabor小波降噪技术对采集的红外
<正> 自从Mosman提出Th1/Th2理论后,人们对无序的细胞因子网络有了初步认识,有关Th1/Th2分化的外在影响因素和内在调控机制的研究,使人们对Th1/Th2理论重要性的认识更加深刻,
会议
文章以两宋之交的山水画家江参作为研究对象。主要通过掌握的文献史料和知识,对其现存重要山水作品中的具体问题进行探究,在解决问题的过程中得出认识。旨在通过对江参其人和
公益众筹作为一种创新型公益筹资模式,通过"互联网+金融+公益"的桥梁,打破了旧式的公益方式,必将伴随着移动互联网技术的发展而逐渐引起重视。本文通过分析我国公益众筹的发
会议
广州市立中山图书馆是岭南著名建筑师林克明先生于20世纪30年代设计的一项重要公共建筑,同时也是他留学归国后的第一个作品,它的设计思路和“中国固有式”思潮相符合,也带有西洋
丝绸之路最早开始于何时,已难确知,但根据史料可以判断的是,中国官府举办的丝绸之路始于西汉,海路从岭南的徐闻、合浦出发,陆路则从长安出发。从现存文献看,西汉明确以官府名
羽衣甘蓝(Brassica oleracea L.var.acephala DC.)是十字花科芸薹属甘蓝种的一个变种,是一种2年生观赏或菜用草本植物,丰富多彩的叶色和叶形变异构成了其主要的观赏性状。羽衣