论文部分内容阅读
近年来,全球变化加剧了自然灾害发生的强度和频率。随着数据获取能力的不断提升,数据在减灾研究中的作用更加凸显。针对灾害事件开展的科学研究逐渐从单学科向多学科转变,多学科数据资源成为有效支撑。自然灾害事件的数据依赖性是指多学科多领域数据对于特定灾害类型或者灾害事件的贡献程度。自然灾害的数据依赖性研究有助于更加科学地构建特定灾害类型或事件的研究方案。本文针对自然灾害减灾科学研究中支撑数据的充分性和科学性等难题,采用基于文献的知识发现方法和模型,探索自然灾害事件和其支撑数据的相关性关系,开展重大自然灾害事件中多学科支撑数据的精确分析和定量化关联研究。本文选择三次地震事件(唐山、汶川和海地)以及洪涝事件作为自然灾害事件的典型案例,从多学科角度和对地观测角度对自然灾害的数据依赖性开展研究并对依赖性进行了量化,针对科研用户的具体需求进行个性化数据推荐建模,并构建了自然灾害事件的概念本体。主要的研究内容和创新点包括:1)对于自然灾害事件的数据依赖性,开展了自然灾害致灾原理、自然灾害分类、自然灾害数据分类与管理的调研,总结并提出自然灾害的生命周期理论、数据管理流及数据依赖性等相关背景知识。2)将文献知识发现方法应用到本文的研究中,并提出了针对典型灾害事件的数据依赖性研究思路和普适性的技术路线。以三次地震事件(唐山、汶川和海地)和洪涝事件研究为例,分析了典型灾害事件的多学科数据依赖性特征。并以对地观测数据为例,对洪涝灾害研究主题与数据依赖性的关系进行分析。结果表明:洪涝研究中使用率最高的数据为气象和水文数据,其次是对地观测数据。唐山地震研究中大部分文献使用了地球物理与地质数据,汶川地震研究中绝大部分文献使用地面测量数据和对地观测数据。海地地震研究中大量使用了社会经济数据、临床数据和观测数据。自然灾害事件研究对数据的依赖性,呈现出明显的时空差异。3)结合自然灾害的数据依赖性统计结果,分析自然灾害事件的数据依赖性的影响因素。从时空角度和用户角度对数据依赖性进行了量化建模并给出了时效性指数、用户指数、地域指数及综合量化指标的计算方法。案例部分以1990-2015年的洪涝灾害研究文献和三次地震事件的文献数据源作为研究对象开展分析,给出了时空特征和用户社区对数据依赖性的影响度量化值。4)根据协同过滤推荐算法提出面向科研用户的个性化数据推荐模型。基于科研文献的研究内容,权威性、普遍性、时效性、地域性及学科属性字段构建科研文献向量,并依据用户的兴趣度构建相应的用户内容向量和属性向量。综合推荐模型和多准则决策方法提出个性化的数据推荐策略。并以洪涝研究为例开展了实例验证。5)综合自然灾害分类标准以及基于文献的自然灾害事件的概念抽取结果构建面向科研的自然灾害事件的概念本体。采用层次化本体构建方法和类元信息描述策略来解决语义异构和查询检索难题。根据调研,目前基于文献的知识发现方法在生物医学和化学领域应用广泛,但尚无研究将此方法推广到自然灾害研究领域。另外,针对自然灾害的数据依赖性的研究多是从研究者的学科背景从单学科角度进行分析,尚没有针对自然灾害多学科数据依赖性开展的研究分析。因此本文的研究目标以及所采用的方法都是开创性的。研究提出的技术方法和模型可以扩展用于其他的自然灾害事件研究,丰富了自然灾害学研究的知识范畴,对综合减灾研究具有重大意义。