新しい IBM Developer JP サイトへようこそ!サイトのデザインが一新され、旧 developerWorks のコンテンツも統合されました。 詳細はこちら

フォーラム分類

概要

このデータセットは、クローリングによって Ubuntu Forums のディスカッションから収集された 100 個のディスカッション・スレッドからなります。個々のスレッドに含まれるメッセージごとに、8 つのクラスの対話ラベルのうちの 1 つが割り当てられています。対話ラベルの 8 つのクラスは、質問、質問の繰り返し、明確化、詳細、解決策、ポジティブなフィードバック、ネガティブなフィードバック、ジャンクです。

データセットのメタデータ

形式 ライセンス ドメイン レコード数 サイズ
XML
CC BY-SA 4.0 自然言語処理 529 個のメッセージ
104 MB (圧縮時)

引用

@article{ahu61This,
author="Sumit Bhatia
and Prakhar Biyani
and Prasenjit Mitra",
title="Identifying the Role of Individual User Messages in an Online Discussion and its Applications in Thread Retrieval",
journal="Journal of the Association for Information Science and Technology",
volume="67",
year="2015",
pages="276-288",
}