论文部分内容阅读
目的:目前,对临床医疗数据的数据挖掘研究所得到的分析模型往往不能满足临床实际需求,距离解决现实问题还有不小的差距。究其原因,多数研究是立足于可获得的数据而不是临床实际需求开展的,因此,如何面向临床实践需求开展数据挖掘是临床医疗数据挖掘研究需要解决的当务之急。面对这种当务之急,我们需要考虑的问题包括:临床医疗数据挖掘分析有哪些实际需求?基于这样的需求,开展临床数据挖掘研究的人员应该具有什么样的知识和技能?为解决上述问题,本研究采用文本挖掘和德尔菲法等方法,对临床医疗数据挖掘的需求和人才胜任力要素展开调查,希望为未来的临床医疗数据开发策略研究和人才培养提供理论依据,并从客观意义上推动临床医学的发展。研究方法:(1)临床医疗数据挖掘的需求分析文本挖掘:从PubMed数据库中检索临床医疗数据挖掘相关论文,抽取论文中有关临床医疗数据挖掘应用、目的和意图的主题词,根据主题词共现矩阵,运用双聚类算法自动聚类分析,得到通过文献形式表达出来的临床医疗数据挖掘现实需求,为后续临床医疗数据挖掘问题和需求的问卷调查编制提供依据。德尔菲法:根据文本挖掘提供的线索,在知识非常态理论框架下,结合数据挖掘过程模型,设计和构建临床医疗数据挖掘需求问卷,采用德尔菲法,将临床医疗数据挖掘需求问卷发放给临床医学、计算机、医学信息学和流行病学等领域中从事临床数据挖掘研究和管理工作的16名专家,经过2轮的问卷发放,专家的意见逐渐趋同,最终整理出临床医疗数据挖掘面临的问题、知识现状和需求。(2)临床医疗数据挖掘人才胜任力模型构建借鉴人才胜任力模型理念,以期通过提高临床医疗数据挖掘人员的个人能力及时发现临床医疗数据挖掘中的临床诊疗需求和临床管理需求,解决数据挖掘过程中由于知识和能力不匹配而导致的较多问题。根据冰山模型,将临床医疗数据挖掘人才胜任力分为冰山以下的内在素质部分和冰山以上的基本知识和技能部分,构建临床医疗数据挖掘人才胜任力一级指标和二级指标。将临床医疗数据挖掘人才胜任力问卷发放给16名临床医学、计算机、医学信息学和流行病学等领域方面的专家,经过2轮的问卷发放,根据均值、变异系数筛选优化各级指标,初步确立临床医疗数据挖掘人才胜任力评价模型。(3)模型实证研究以来自某医科大学附属一院和附属二院的46名从事临床医疗数据挖掘的研究人员为主要调查对象进行问卷调查,进行信度和效度检验,保证评价模型的可靠性和有效性。同时发现当前从事数据挖掘研究人员胜任力上的实际情况和影响因素。结果:(1)双聚类算法和德尔菲法发现临床医疗数据挖掘的需求运用双聚类算法提取和锚定了通过文献形式表达出来的一部分临床医疗数据挖掘现实需求,主要涵盖了临床诊疗相关需求,如在精准医学、疾病风险因素分析、药物不良事件监测、疾病预后、疾病诊断、疾病治疗和诊断影像学等方面的需求。德尔菲调查结果对临床医疗数据挖掘的现实需求进行了补充。德尔菲调查结果显示,临床医疗数据挖掘除了在临床诊疗方面表现出需求外,在临床管理方面也存在一定的需求,如再住院预测不良事件监测、临床路径优化、药物处方序列、医院感染预测、住院时间预测等。在知识非常态理论框架下,结合两轮德尔菲法专家调查结果,发现临床数据挖掘实践人员知识与其数据挖掘目的和意图之间存在着“鸿沟”,这种“鸿沟”具体表现为:由于数据挖掘知识和数据分析知识与目的意图的不匹配而导致的数据理解问题,尤其是数据具体价值认识不足问题;由于数据分析知识与目的意图的不匹配而导致的数据准备问题,尤其是数据预处理难和数据一致性检查难问题;由于跨学科知识和数据分析知识与目的意图的不匹配而导致的模型评价问题;临床医疗数据挖掘客观条件与目的意图的不匹配导致的数据获取问题,尤其是数据标准化程度低问题和因为隐私与安全要求导致数据获取难问题。“鸿沟”的存在反映了临床医疗数据挖掘的潜在需求,即临床数据挖掘应具备的知识和能力的需求和临床医疗数据挖掘客观条件的需求。(2)临床医疗数据挖掘人才胜任力模型本研究基于需求分析结果和冰山模型初步构建的临床医疗数据挖掘人才胜任力评价模型包括动机、个性和特质和知识技术能力三个维度,17个二级指标,在内容上既包括了综合知识、数据挖掘技能等显性要素,也包括了成就动机、个人品质等隐性要素。根据专家意见设立的各个指标的权重情况为动机权重0.122,个性和特质权重0.481,知识技术能力权重0.397,最终总结临床医疗数据挖掘人才胜任力模型为:胜任力=0.122*动机+0.481*个性和特质+0.397*知识技术能力。(3)临床医疗数据挖掘人才胜任力现状应用本研究构建的模型进行46名临床医疗数据挖掘人员评价,结果发现,被调查人员总体岗位胜任力得分为4.094±0.762,按量表等级(1-5分)水平,说明被调查对象的总体胜任力处于较高水平,在动机(4.488±0.763)、个性和特质(4.138±0.930)和知识技术能力(3.914±1.047)三个维度中,知识技术能力分数较低,值得研究者关注。评价指标中,兴趣、持续学习能力、数据素养在各维度中分数较高,其中兴趣和数据素养分数较高说明被调查的临床医疗数据挖掘人员在对自身的数据挖掘兴趣和数据素养方面较为自信,而在洞察临床问题能力上仍需加强。临床医疗数据挖掘人才胜任力会受到个人社会学特征的影响,单因素分析和多元线性回归分析结果表明,性别、年龄因素对临床医疗数据挖掘人才胜任力总分会产生显著的影响关系(p<0.05)。性别、年龄、工作年限、职称、学历等因素对临床医疗数据挖掘人才的动机方面影响不存在统计学意义(p>0.05);而性别、年龄因素对临床医疗数据挖掘人才的个性和特质得分产生显著的影响关系(p<0.05);性别因素对临床医疗数据挖掘人才在知识技术能力得分会产生显著的影响关系(p<0.05)。结论:(1)本研究将临床医疗数据挖掘研究的需求总结为3大类:(1)临床诊疗和临床管理的现实需求;(2)临床医疗数据挖掘应具备的知识和能力的需求;(3)临床医疗数据挖掘客观条件的需求。(2)本研究构建了包含3个核心维度,17个二级指标的临床医疗数据挖掘人才胜任力评价模型,信度效度较好,能够客观反映临床医疗数据挖掘人员胜任力要求。(3)实证研究发现,被调查临床医疗数据挖掘人员总体胜任力处于较高水平,在动机、个性和特质以及知识技术能力三个维度中,知识技术能力分数较低,因此,提升临床医疗数据挖掘人员胜任力的关键在于知识技术能力培训。此外,年龄和性别对临床医疗数据挖掘人才胜任力影响较大,可能会决定临床医疗数据挖掘人员的职业规划,即男性临床医疗数据挖掘人员可能更愿意长期从事临床数据挖掘研究工作,以期获取更高的胜任力和社会声誉。