开源技术 * IBM 微讲堂:Kubeflow 系列(观看回放 | 下载讲义) 了解详情

油藏模拟

概述

油藏模拟数据集 (ORSD) 集合包含由油藏储层基于物理学的模拟器生成的数万个序列。每个模拟都包括一个输入action 序列和一个输出 prediction 序列。发布此数据集的目的是协助开发某些机器学习模型,这些模型可以在给定输入序列的情况下准确地预测输出序列,从而为评估序列到序列模型提供了庞大的数据库。

ORSD 集合由两个单独的数据库组成,每个数据库针对的场景略有不同(一个带有“漂移”,另一个没有“漂移”),并且都包含大约 30,000 个模拟。

ORSD 迎合了各个领域研究人员的需求,尤其适合更广泛的机器学习 (ML) 社区,即研究人员和数据科学家,他们希望使用数据来验证新的(顺序)算法,同时也适合希望检查模拟并在此基础上开展工作的较窄领域的油藏专家。

该数据集随附的手册中提供了详细的介绍和完整的数据描述。

数据集元数据

格式 许可 领域 记录数 大小 最初发布日期
JSON
HDF5
CDLA – 宽松 [序列建模,时间序列分析] 30000 次模拟 4.7GB 2020-04-10

本文翻译自:Oil Reservoir Simulations(2020-04-10)