论文部分内容阅读
“空、天、地、底”立体监测网的建立,为海洋资源开发与经济发展奠定了较好的海洋数据基础,但受海洋数据管理、数据分析以及数据应用等软/硬平台的限制,海洋领域“大数据,小知识”的现象日益凸显,因此,如何从海量海洋数据中快速获取信息为智能决策提供服务是当前研究热点之一。抽样调查能够快速地从海量数据中获取有效关键数据,适用于大规模大范围数据,其周期短,费用低,是解决大数据快速应用的主要途径。而目前抽样方法仍较多地依赖于传统概率抽样理论来建立,在面向多应用需求的驱动下,如何抽取有效可靠的数据使之快速生成有效信息,是现有抽样方法面临的挑战。海洋环境监测数据主要指通过浮标、调查船以及人工监测等手段,获取的海洋环境态势监测数据,其数据特性及抽样问题可归纳为:(1)海量性,海洋环境监测数据正以空前的速度增加和加快,动态更新频繁,多源,数据在空间尺度和时间尺度上都显现出存在冗余问题;(2)空间相关性,数据具有空间属性特征,距离近的数据相似度高,容易造成空间关联失效或样本重叠,抽样精度下降;(3)空间异质性,数据涵盖信息复杂,空间分布不均匀,给数据复用及后期处理带来困难。因此,考虑海洋环境监测数据的特征,设计优化空间抽样方法来帮助有效使用数据是值得研究的问题。在设计抽样和估计时,过度降低抽样成本会产生估计精度出现偏差、抽样结果失真等问题,而过高的样本量会增大数据冗余,从而提高成本,因此,如何能够平衡抽样精度与成本是设计优化空间抽样方法的主旨。本文主要研究内容如下:(1)分析海洋环境监测数据特征,总结其呈现出的多模态、高维度、多属性等特性给抽样方法带来的挑战,综述现有抽样方法的研究现状,分析这些方法运用于海洋环境监测数据时产生的问题。(2)提出一种系统空间抽样优化方法,考虑数据空间相关性,将半变异函数引入空间抽样方法设计,兼顾样本点在研究海域内分布均匀的同时,又保证在其抽样精度的前提下减少信息的冗余。(3)面向该批海洋环境监测数据的应用需求,考虑抽样对象的多属性联系,通过计算各属性权重对方法做进一步扩展,设计能够满足海洋环境监测数据多属性综合评估需求的空间抽样方法,用于更全面,更经济的抽样估计。(4)以某海域空间数据为实验对象,通过方差、抽样比率和趋势面分析,对本文设计的复杂类型海洋环境监测数据的空间抽样方法与传统抽样方法进行比较,结果表明,通过使用本方法计算得到的步长进行抽样能够有效减少数据量,同时保证一定的抽样精度,比较好的反应总体特征趋势。