论文部分内容阅读
目前,恶性肿瘤是严重威胁人类生命和健康的重大疾病之一,中医药在肿瘤防治、术后调理等方面优势日益凸显。肺癌是我国发病率和死亡率高居前位的癌症之一,大量实践和研究表明中医药及中西医结合治疗肺癌已经取得显著成效。国医大师周仲瑛教授临床上治疗肿瘤经验丰富、见解独到,在诊治肺癌患者过程中积累大量临床医案,值得中医学者借鉴和学习。但是由于中医医案是临床诊疗的记录和经验积累,非结构化的形式、零散的分布和个性化的表述,使得中医知识难以统一描述,从医案中快速获取有效信息面临一定困难和挑战。并且传统统计方法很难完全揭示名老中医医案中蕴含的知识,学习者也无法高效获取并应用,故需要对医案信息进行提炼、总结和学习。在知识爆炸性增长的今天,如何应用现代技术将名老中医的学术思想和经验更好地传承和发扬对于中医领域的发展意义重大,值得我们给予高度关注。知识图谱作为知识管理和知识服务的新兴技术,为传承和发扬名老中医学术思想和临证经验提供了新方法。研究目的本文基于国医大师周仲瑛教授辨治肺癌的临床医案,研究构建周仲瑛教授辨治肺癌的知识图谱,以可视化方式系统展示周仲瑛教授辨治肺癌的知识体系和临床路径,实现名医经验知识的结构化展示与语义检索等功能,为分析和总结名医临证思维和诊疗特点提供新的工具,为中医工作者学习和传承周仲瑛教授辨治肺癌的学术思想和经验提供思路和借鉴方法,拓宽临床肺癌诊疗思路,促进名老中医学术经验传承与发展,为中医药知识图谱智能应用奠定坚实基础。研究方法(1)采用文献调研法系统梳理国内外知识图谱研究应用情况及中医药领域知识图谱研究进展,掌握知识图谱概念、构建流程、相关技术等理论知识,借鉴已有的研究思路,分析总结中医药领域知识图谱构建相关研究中值得借鉴学习之处和需要进一步完善的方向,为本文提供理论基础和思路。(2)收集整理1986年7月至2015年2月间周仲瑛教授治疗肺癌的门诊医案,按照纳入、排除标准筛选出446例医案(576诊次)作为研究对象,医案内容包括患者信息、临床症状、舌象、脉象、病机、治则治法、用药等,对所纳入医案进行标准化和规范化预处理,建立周仲瑛教授辨治肺癌的中医医案数据库。(3)利用Protégé5.5.0本体工具,参照中医药学主题词表、中医药类专著教材、行业标准等,参考七步法设计并构建国医大师周仲瑛教授辨治肺癌的知识本体框架,较为全面展示周仲瑛教授辨治肺癌的病机(概括)、症状体征、中药等相关概念及概念间关系,形成知识图谱模式层,为从概念层次上掌握周仲瑛教授辨治肺癌知识体系提供支撑,为知识图谱的构建奠定基础。并在获得周仲瑛教授及其传承工作室的认可后以本体框架为基础进行周仲瑛教授辨治肺癌的知识图谱构建探索。(4)采用Bert-BiLSTM-CRF模型对周仲瑛教授肺癌医案中症状、舌象、脉象等实体进行命名实体识别,结合人工审定,将结构化并规范标注的肺癌实体数据与模式层的本体框架相匹配,形成知识图谱的数据层。(5)使用Neo4j图数据库对知识图谱进行存储,实现知识图谱可视化展示、语义查询等功能,并采用专家咨询的方式对所构建知识图谱进行评估,检验知识图谱的科学性与有效性。(6)基于前文对肺癌医案数据实体抽取的基础上,采用频数统计、关联规则、聚类分析等数据挖掘方法对周仲瑛教授辨治肺癌医案中的常见病机、病理因素与药物及病机与症状之间的关系进行分析总结,实现隐性知识显性化,对知识图谱进行修正完善。研究结果(1)设计构建国医大师周仲瑛教授辨治肺癌的知识本体框架本文基于周仲瑛教授辨治肺癌的医案及其学术思想设计并构建知识本体框架,该本体是对国医大师周仲瑛辨治肺癌知识体系模式层的构建,对实体属性及各实体之间的语义关系和语义类型进行定义,共定义病机、症状体征、病性、病位、病理因素、治则治法、中药、辅助检查8个顶层概念。肺癌中医药本体共有类34个,实例277个,对象属性7个,数据属性5个,经检验该本体具备内在逻辑一致性,并由国医大师周仲瑛传承工作室专家参与修正后,最终确定周仲瑛教授辨治肺癌知识本体框架。该本体框架作为知识图谱模式层,也为后续知识库或知识图谱构建等进一步研究奠定基础。(2)基于深度学习的肺癌医案症状体征命名实体识别研究结合周仲瑛教授肺癌医案的特点,针对症状体征等非结构化文本数据采用Bert-BiLSTM-CRF 模型对周仲瑛教授肺癌医案中症状、舌象、脉象等实体进行命名实体识别,整体评价指标准确率为81.58%、召回率为86.52%、F1值为83.98%,均在80%以上表明能够对医案进行较为准确地识别,并结合人工审定和实体对齐,将结构化并规范标注的肺癌实体数据与模式层的本体框架相匹配,形成知识图谱的数据层。(3)基于Neo4j图数据库的知识图谱存储与应用采用Neo4j图数据库进行国医大师周仲瑛教授辨治肺癌知识图谱构建,将实体及关系数据借助Python导入Neo4j中并进行存储,共包含1281个实体和7554条关系。最终构建完成的知识图谱实现可视化展示和语义查询功能。并采用专家评估的方法对所构建的知识图谱进行评价,结果表明本文构建的知识图谱数据真实可靠,模式层合理,能够较为系统地对周仲瑛教授辨治肺癌医案进行展示,具有一定的科学性和可行性。(4)国医大师周仲瑛教授辨治肺癌知识图谱完善利用频数统计、关联规则、聚类分析等多种方法对周仲瑛教授辨治肺癌医案中的症状、病机、方药之间关系进行分析挖掘,总结周仲瑛教授辨治肺癌的常见病机、病理因素与中药之间关联及常见病机与症状之间关联,如与病机饮停胸胁相关联的中药包括桑白皮、葶苈子、生黄芪、法半夏、紫苏子、冬瓜皮、防己等;饮停胸胁常表现出呼吸困难、胸痛、胁痛、胸闷、咳嗽、气喘等症状。在与国医大师周仲瑛教授名医经验传承工作室进行确认后,对知识图谱进行修正,完善现有知识图谱。研究结论知识图谱是一种新兴的知识管理与服务模式,能够捕捉和呈现领域概念及概念之间的关系,通过可视化图形的方式对名老中医临床诊疗数据之间的相关关系进行展示,为中医知识服务奠定基础,为传承名老中医学术思想与临床经验提供新的途径。本文基于国医大师周仲瑛教授治疗肺癌的临床医案,设计并构建周仲瑛教授辨治肺癌的知识本体框架,并以此框架为基础进行周仲瑛教授辨治肺癌的知识图谱构建探索,对所构建的知识图谱进行质量评估和完善。通过知识图谱的构建,实现名老中医经验知识的可视化展示与语义检索等功能,有助于年轻中医工作者学习周仲瑛教授辨治肺癌的思想和经验,为名老中医思想和经验的传承和发扬提供方法学参考。