新しい IBM Developer JP サイトへようこそ!サイトのデザインが一新され、旧 developerWorks のコンテンツも統合されました。 詳細はこちら

Video-Text Compliance

概要

VTC には 7,920 個のサンプルが含まれ、各サンプルは動画とテキストの説明のペアと、コンプライアンス/非コンプライアンスのラベルからなります。このデータセットには 120 万を超えるフレームが含まれています。データ収集の際は独特の手法を採用して、コアとなる一連の動画から自動的にデータセットを増量できるようにしています。データ・プライバシーに関する懸念の高まりを受けて、VTC データセットの生成においてはプライバシーを確保するための対策に慎重に従いました。

データセットのメタデータ

形式 ライセンス ドメイン レコード数 サイズ
MP4
CSV
CDLA-Sharing 動画分類 7,920 (動画サンプル)
1,200,000 (フレーム)
2GB

サンプル・レコード

carry_bag_P1000344_iter006.mp4 0 open_predetermined_suitcase_calmly
carry_bag_P1000344_iter007.mp4 0 precisely_place_the_appropriate_box
carry_bag_P1000344_iter005.mp4 0 push_accessible_cart
carry_bag_P1000344_iter004.mp4 0 open_the_applicable_bag_at_once
carry_bag_P1000344_iter000.mp4 0 carry_the_specified_box

抜粋

@InProceedings{Jaiswal_2019_ICCV_Workshops,
    author    = {Jaiswal, Mayoore and Liu, Frank and Jagannathan, Anupama and Gattiker, Anne and Hwang, Inseok and Lee, Jinho and Tong, Matthew and Dureja, Sahil and Shah, Soham and Hofstee, Peter and Chen, Valerie and Paul, Suvadip and Feris, Rogerio},
    title     = {Video-Text Compliance: Activity Verification Based on Natural Language Instructions},
    booktitle = {The IEEE International Conference on Computer Vision (ICCV) Workshops},
    month     = {Oct},
    year      = {2019}
  }

関連リンク

  • Video-Text Compliance: Activity Verification Based on Natural Language Instructions (論文): Video-Text Compliance (VTC) データセットには最小単位でのアクティビティーの動画が、テキストによる説明とコンプライアンス・ラベル付きで含まれています。VTC データセットは自動増補手法を採用して作成されています。プライバシーを確保した上で、120 万を超えるフレームが含まれています。