开源技术 * IBM 微讲堂:Kubeflow 系列(观看回放 | 下载讲义) 了解详情

显示 1 - 25 项/共 35 项搜索结果

Dataset

塔拉纳基盆地测井曲线整理

这个数据集包含了根据 2016 年新西兰石油勘探公共数据包整理的测井曲线。

更新: 2020-10-27 | 发布: 2020-06-08

Dataset

论坛分类

在线讨论的对话行为分类

更新: 2020-10-26 | 发布: 2020-04-30

Dataset

SimpleQuestions 关系检测

从 SimpleQuestions 数据集派生的一组提取实体关系注解。

更新: 2020-10-16 | 发布: 2020-06-08

Dataset

WebQSP 关系检测

从 WebQuestionsSP 数据集派生的一组提取实体关系注解。

更新: 2020-10-15 | 发布: 2020-06-08

Dataset

WikiText-103

从维基百科文章中提取的令牌集合”

更新: 2020-09-29 | 发布: 2020-04-30

Dataset

PubTabNet

PubTabNet 是一个用于基于图像的表格识别的大型数据集,包含超过 51.6 万个表格数据图像,并以表的对应 HTML 表达式进行了注解。

更新: 2020-07-21 | 发布: 2020-04-30

Dataset

视频-文本合规

Video-Text Compliance (VTC) 数据集包含原子活动的视频,以及文本说明和合规标签。

更新: 2020-06-29 | 发布: 2020-04-30

Dataset

IBM Debater® 辩论录音 #1

由专业辩手录制的 60 条辩论语音,讨论了各种有争议的主题,采用了音频和文本格式。

更新: 2020-06-29 | 发布: 2020-04-30

Dataset

MedNLI

临床领域中自然语言推理任务的数据集。

发布: 2020-04-30

Dataset

PubLayNet

PubLayNet 是来自 PubMed Central 开放存取子集的文档图像的大型数据集。每个文档的布局都用边界框和多边形分割进行了注解。

发布: 2020-04-30

Dataset

油藏模拟

用于模拟油藏产量的序列到序列数据集。

发布: 2020-04-30

Dataset

IBM Debater® 标记演讲中强调的词

创建重点词数据集,目的在于对用于接收书面辩论性语音并预测“文本转语音”组件应强调哪些词的系统进行训练和评估。

发布: 2020-04-30

Dataset

IBM Debater® 提到检测基准

“提及检测”的目标是将文本中提及的实体、概念映射到知识库中的正确概念。数据集包含3000个句子,这些句子都有注释。

发布: 2020-04-30