新しい IBM Developer JP サイトへようこそ!サイトのデザインが一新され、旧 developerWorks のコンテンツも統合されました。 詳細はこちら

VizWiz

概要

VizWiz データセットには、20,000 点のトレーニング画像が含まれています。画像ごとに、その画像に関する質問とその質問に関連する 10 個の回答が用意されています。

データセットのメタデータ

形式 ライセンス ドメイン レコード数 サイズ
JSON
CC BY 4.0 視覚的質疑応答 20,000 個の画像と質問のペア
15.3 GB

引用

@inproceedings{vizwiz,
author="Danna Gurari and Qing Li and Chi Lin and Yinan Zhao and Anhong Guo and Abigale J. Stangl and Jeffrey P. Bigham",
title="{VizWiz-Priv}: {A} Dataset for Recognizing the Presence and Purpose of Private Visual Information in Images Taken by Blind People",
year=2019,
booktitle={IEEE Conference on Computer Vision and Pattern Recognition (CVPR)}
}

関連リンク