论文部分内容阅读
随着大数据技术的发展,数据驱动分析法广泛地被应用于油气勘探开发行业中。数据驱动分析为许多传统方法难以处理的问题提供了新的解决方案,例如水平井的产量预测问题。不同开发区的水平井产量主控因素差异较大,使得基于机理模型的传统产量预测方法泛化能力较弱,在复杂的地质及工程条件下预测效果通常不理想。而数据驱动方法将产量预测的研究重点从分析油气开发过程中的物理机理上转移到挖掘产量的数据特征上,从而获得更具普适性的预测模型,解决传统机理预测方法对模型及数据条件过度依赖的问题。在数据驱动方法中,机器学习作为一种重要的数据回归和分类手段已在很多领域得到了应用,也逐渐成为水平井产量预测中的常规方法。目前很多研究使用了机器学习方法进行产量预测,但存在一些欠缺。首先是研究普适性不足。例如一些研究致力于选择最优学习器及模型参数调优,然而由于不同开发区条件差异较大,在某一数据集上进行学习器优选及调参的结果并不一定适用于其它数据集,因此获得的模型难以推广使用,无法体现数据驱动预测的优势。其次是应用场景不足。水平井产量预测的一个重要的场景是使用井的地质工程参数及已知生产曲线预测未来的生产曲线,该场景在机器学习中应被描述为一个延时时间序列的编码-解码问题,但目前产量预测仅有同步时间序列预测场景的研究。最后是对模型的应用拓展不足。产量预测模型不仅可以用来进行经济评价和风险评估,还可以用来进行产量主控因素分析及生产参数优化。如何使用产量预测模型提高产量、降低成本,是目前常常被忽略的一个重要问题。为了解决以上问题,本研究完成了以下改进研究:1、基于机器学习的产量预测框架设计与数据预处理研究。本研究分析了常规大数据和油气大数据的不同,对比了产量预测数据驱动模型与传统物理机理模型的优点和不足,讨论了机器学习在产量预测中的适用性。基于该认知对产量预测建模的一般流程进行了总结,并完成了多个产量预测问题在机器学习中的描述。此外以实际开发区数据集中的层位数据的特征工程为例,结合实际应用效果说明了如何结合油气开发领域知识编码油气数据,使更多非结构化特征中的信息能够被机器学习模型利用。本研究的产量预测框架和数据预处理模式具有一般性,对其它问题和数据集的研究也适用。2、产量预测机器学习建模研究。对于不同的产量预测问题分别建立了静态或动态产量预测机器学习模型,并结合预测结果分析了不同机器学习模型在具有不同数据条件的数据集上的适用条件。设计了使用井的静态参数及已知生产曲线预测未来生产曲线的BPNN-RNN和BPNN-RNN-RNN时间序列模型,然后集成非时间序列预测模型来改进其预测效果。3、产量预测机器学习模型应用拓展研究。使用训练好的机器学习模型及实际数据进行了单变量、多变量的产量影响因素分析,寻找了井地质及工程参数中的主成分及产量主控因素,对比了机器学习方法与传统方法在分析结论和适用条件上的差异;提出了使用机器学习预测模型进行新井工程参数优化及老井生产措施优化的方法,达成了降低生产成本、提升产量的目标。