基于医学挂号系统和问答匹配模型研究与实现

来源 :上海师范大学 | 被引量 : 0次 | 上传用户:hlg1205
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的发展,网络数据井喷式增长,出现了很多医疗社区,越来越多人开始使在医疗问答社区进行信息获取和问诊。医疗社区利用在线医生提供就诊服务的同时,也会利用积累的数据提供信息检索服务,但主要都是基于搜索引擎的关键词匹配返还一堆相关问题和答案文档,不能深入理解用户问句的语义信息。问答系统因为能返回一个确定的答案而不是一堆仍需用户筛选的文档,成为了当下研究热点。基于深度学习的问答系统是将答案确认过程看成一个问句和候选答案语义匹配的过程,目前研究主要有两个研究方向:利用多种网络组合来增强网络特征提取能力;用注意力机制识别问题意图,突出问题和答案的交互信息。但是利用多种组合的深度神经网络来提取问答句深层特征时,往往利用网络最后一层的特征作为句子特征表示,而没有有效利用中间各层提取的特征;在利用注意力机制捕获问题答案相关信息时,也是用最终的问句特征对答案特征加权筛选,而没有考虑中间每一相同层间问题、答案的交互信息。考虑到去医院就诊挂号确定科室时,病人受限于自己掌握的医疗知识有时并不清楚自己需要挂的科室;同样,用户通过医疗社区进行咨询就诊时,也需要按科室类别(如内科,五官科,妇产科)选择医生,但有的用户并不能确定自己的病属于哪一科,据我所知,到目前为止还没有相关方面的研究。针对以上问题,本文主要研究工作如下:(1)本文首次将深度学习和自然语言处理技术应用于解决医疗挂号问题,将病人看病挂号选择科室的问题建模成问句分类问题。基于医疗社区积累的数据,本文利用Bi-LSTM结合注意力机制训练了一个分类器对病人问题分类。此外还用LSI文本相似度技术找到带标签数据集中最相似的问题,根据最相似问题的标签对分类器的结果进行校验。该挂号系统能方便用户线下就诊时确认挂号科室以及在网上医疗社区按科室找到自己需要的医生。(2)本文提出了一种多层融合的层间交互的问答匹配模型,利用多层特征融合的深度神经网络和多层层间注意力机制来解决问答匹配问题。多层的Bi-LSTM+CNN+CNN每层提取的特征进行拼接融合作为最终的问题、答案语义特征用于进行问答匹配和答案打分;在每层对问题、答案特征提取时都加入注意力机制,来突出答案和问题相关的特征。相比起用深度神经网络最后一层特征,本模型综合利用每一层的特征,最终的表示特征语义信息更充分;在每一相同层间利用注意力机制有利用及时的捕获问答交互信息。(3)针对中文利用词向量时需要进行分词、去停用词等复杂的处理,另外虽然现在中文分词工具比较成熟,但受限于医疗特定领域专业名词的存在,有些专业词汇分词识别不准会直接影响下游模型性能,而构建专业领域字典虽然能解决这一问题,但任务量大,并且移植性差,利用字向量不需要分词可避免上述问题。因此,本文在进行问答语义匹配时,除了用词向量进行模型训练的同时,也用字向量进行实验,研究字向量的有效性和可行性。(4)利用医疗社区的数据,和上述挂号模型以及问答匹配模型,设计了一个医疗问答系统,来解决用户挂号问题,以及问答需求。其问答模块,相对于医疗社区信息检索服务是基于关键词匹配返回和用户问题相关的一堆问题和相应答案文档,本文设计的问答系统,是利用多层融合特征交互的问答匹配模型对问题和候选答案进行深度语义匹配后打分,返回一个确定答案。
其他文献
多孔SiO2凝胶材料具有大的比表面积和孔容,在吸附、催化、分离等领域具有很好的应用前景。实验利用溶胶-凝胶法制备复合多孔SiO2凝胶材料,并以其粉末为原料采用压制成型工艺
从20世纪90年代开始,我国国有企业开始进行混合所有制改革,近年来我国国有企业逐步进入全面深化改革阶段,国有企业混合所有制改革的深度更进一步,改革步伐越来越大,改革方式也越来越多样全面。作为国有企业混合所有制改革的主要方式之一,员工持股计划经历了从试点实验到暂停使用再到重新使用的曲折过程。与此同时,国家也有逐步完善相应的政策支持。中国证监会2014年出台了《关于上市公司实施员工持股计划试点的指导意
脱粒是荞麦收获和加工过程中的关键一环,脱粒装置的性能决定了荞麦的脱粒率和破碎率。由于荞麦籽粒成熟度不一样,收获时茎秆含水率比较高,普通的脱粒方法会打烂茎秆造成分离筛堵塞等问题,而且荞麦作为一种小杂粮,目前国内还没有成型的荞麦专用脱粒装置。因此,进行荞麦脱粒装置的研究,对荞麦的发展和收获技术的进步具有重要的现实意义。本文结合荞麦的生物学特性,在分析现有的其他谷物脱粒机的脱粒原理和结构技术的基础上,运
领导干部自然资源资产离任审计作为一项新兴的审计领域,虽然已在全国各地全面铺开,但是理论上仍存在很多尚未解决的问题,实务工作也缺乏完整全面的工作体系,总体上还处在初期探索阶段。本文的研究目的,是通过对自然资源资产离任审计的研究,分析现行自然资源资产离任审计存在的问题,分析解决方案。本文通过文献研究、实地调研、案例分析等方法,整理归纳现有文献,结合已开展项目,重点关注基层领导干部自然资源资产审计试点工
当前,伴随我国人口老龄化形式的日益严峻,失能老人的数量也在与日俱增。同时,基于中国家庭结构向小型化、核心化、空巢化趋势转变,传统的家庭模式已难以担当起失能老人长期照护的重任,而社区、机构等社会化照护服务方式也尚未形成稳定的供给格局。在此现实背景下,失能老人的长期照护服务供需矛盾尖锐,亟需得到社会各界的关注和寻求合理的解决方式。鉴此,本文试图研究失能老人长期照护模式选择意愿及其影响因素,分析失能老人
写作教学作为英语教学中的一环,对于培养学生综合运用英语的能力起着重要作用,但是如何提升学生的英语写作能力一直是英语教学中的一个难题,许多教师、研究者为解决这一问题做出了巨大的努力但是效果甚微。从20世纪70年代开始,研究者们的研究重心逐步从以结果为中心的写作方法转变为以过程为中心的写作方法,同伴互评作为过程写作法的一部分,在国内外研究中得到了高度重视。很多学者通过大量的理论和实证研究论证了同伴互评
随着社会发展,合同瑕疵履行的救济方式日渐完善,补正履行作为救济途径之一,是指债务人的给付不完全符合债之本旨,就其瑕疵给付所做出的补救,是对原给付之修正。对于补正履行,在我国理论界对其性质存在争议,立法上对其规定并不完善,也因此导致在司法实践中出现同案不同判的现象。本文第一章从补正履行的概念出发,论述了补正履行与继续履行二者均是原履行请求权的修正和延伸,但这两个概念相互独立,互不隶属,接下来论述了补
改革开放以来,我国经济飞速发展,但是在粗放型的经济发展模式下,我国生态环境领域的问题日渐突出,随着党的十九大顺利召开,环境保护成为国家战略之一。与此同时,生态环境建设相关产品和服务的需求也在日益增加,但是伴随着这些需求的增加,加上这些环境保护项目的投资在建设初期需要大量的资金支持,且难以短时间内获得回报等特点,仅仅依靠政府来投资建设这些项目往往是不够的。PPP模式作为一种新型的商业模式,由政府和社
文化是一个国家安身立命的重要精神支柱,在新时代实现中华民族伟大复兴的中国梦,我们要高举中国特色社会主义伟大旗帜,必须要坚定道路自信、理论自信、制度自信、文化自信。中华优秀传统文化是中华民族的精神命脉,是涵养社会主义核心价值观的重要源泉,也是我们在世界文化激荡中站稳脚跟的坚实根基。在世界文化多样性的今天,我们必须要重视中华优秀传统文化的传承与发展,让中华优秀传统文化在世界舞台依然焕发光彩,而高中思想