论文部分内容阅读
随着物联网技术的逐步成熟,油田物联网系统将逐步实现通过传感器技术、射频技术等对生产对象及生产制造全过程的泛在感知与全面监测,实现生产及设备状态数据的集中化管理与集成处理。由于油田企业是一个多学科、多领域、多技术的高度技术密集型行业,长期的纵向管理导致各系统部门获取数据的手段不同、感知设备接口标准不同等使得采集的原始数据的结构、格式、表达形式及内容各不相同,这些异构性使得实时数据难以统一描述和集成。同时,前端感知设备持续不断的采集形成了高速数据流,这些数据流本身具有不能够预知的、高速且持续到达的,并且对实时性要求高等特点,如果不能及时处理,将会在造成数据堆积、丢失等问题,失去数据的时效价值。针对上述问题,本研究提出了适合原始数据实时集成的框架,为油田企业实时数据集成系统的开发提供了理论支撑。一方面,从集成的实时性角度出发,对数据流的传输提出了基于MOM缓存的方式,确保了数据在传输中的可靠性;对缩短集成任务的执行时间方面提出了基于实时性需求的调度策略,保障实时数据能够尽快发挥价值;针对加载对数据库性能影响提出了基于实时数据库缓存的方法,确保了实时性要求高的数据率先得到集成的同时降低了实时数据的持久化对数据库性能的影响。另一方面,从集成的准确性角度出发,将语义技术引入实时数据集成中,提出基于领域本体的模式匹配方法,利用油田领域全局本体对数据源以及数据库中的数据项添加统一的规范化语义描述,不仅解决了数据源到数据项集成过程中的异构问题,而且在匹配过程中缩小了工作量,提高了匹配效率。在模式匹配的相似度计算过程中,提出改进的综合相似度算法,解决了现有匹配方法中匹配不准确的问题,实现了数据源到数据项的准确集成。综上所述,本研究为油田实时采集的数据添加统一、规范化的语义描述进而为其集成到数据库中提供新技术与新方法,解决了油田领域实时数据集成过程中实时性不高、集成不准确的问题,并对所研究的关键技术进行效果对比实验。经验证,本文所提出的基于语义的实时数据集成技术,从准确性和实时性两个方面均有所改进。