新しい IBM Developer JP サイトへようこそ!サイトのデザインが一新され、旧 developerWorks のコンテンツも統合されました。 詳細はこちら

IBM Debater® Wikipedia Category Stance

概要

このデータセットの内容は次のとおりです。

  1. 132 のコンセプト
  2. コンセプトに対する態度 (肯定/否定) でアノテーションを付けた、4,603 の Wikipedia のカテゴリーとリスト

リリースされているデータ・ファイルには次の 4 つの列があります。

  • 列 A: ラベル
  • 列 B: コンセプト
  • 列 C: Wikipedia でのカテゴリーまたはリストのページ・タイトル
  • 列 D: カテゴリー/リストのページの URL

各カテゴリーのラベルは次のいずれかになります。

  1. “-” – 人のグループは関連しないカテゴリーであることを意味
  2. “P” – 肯定的な態度 (コンセプトを支持)
  3. “C” – 否定的な態度 (コンセプトに反対)
  4. “?” – カテゴリー名を基に態度を判断できないか、関連性のないカテゴリーであることを意味
  5. “X” – 3 人のアノテーターが判断したラベルがそれぞれ異なる未解決のケース

データセットのメタデータ

形式 ライセンス ドメイン レコード数 サイズ 公開日
CSV
CC-BY-SA 3.0 自然言語処理 4,603
525KB 2016 年 8 月 30 日

サンプル・レコード

P,Abortion,Category:American_pro-choice_activists,https://en.wikipedia.org/wiki/Category:American_pro-choice_activists
C,Abortion,Category:American_pro-life_activists,https://en.wikipedia.org/wiki/Category:American_pro-life_activists

抜粋

@inproceedings{toledo-ronen-etal-2016-expert,
title = "Expert Stance Graphs for Computational Argumentation",
author = "Toledo-Ronen, Orith  and
Bar-Haim, Roy and
Slonim, Noam",
booktitle = "Proceedings of the Third Workshop on Argument Mining ({A}rg{M}ining2016)",
month = aug,
year = "2016",
address = "Berlin, Germany",
publisher = "Association for Computational Linguistics",
url = "https://www.aclweb.org/anthology/W16-2814",
doi = "10.18653/v1/W16-2814",
pages = "119--123",
}

関連リンク

  • Project Debater は、複雑なトピックについて人間とディベートできる初の AI システムです。このプロジェクトの目標は、人々が説得力のある討論を行った上で、十分な情報に基づく意思決定を行えるよう支援することです。Project Debater でのモデルのトレーニングには、このデータセットが活用されました。