VizWiz – Visual Question Answering

概要

VizWiz データセットには、20,000 点のトレーニング画像が含まれています。画像ごとに、その画像に関する質問とその質問に関連する 10 個の回答が用意されています。

データセットのメタデータ

形式 ライセンス ドメイン レコード数 サイズ
JSON
CC BY 4.0 視覚的質疑応答 20,000 個の画像と質問のペア
17.5 GB

引用

@inproceedings{vizwiz,
author="Danna Gurari and Qing Li and Chi Lin and Yinan Zhao and Anhong Guo and Abigale J. Stangl and Jeffrey P. Bigham",
title="{VizWiz-Priv}: {A} Dataset for Recognizing the Presence and Purpose of Private Visual Information in Images Taken by Blind People",
year=2019,
booktitle={IEEE Conference on Computer Vision and Pattern Recognition (CVPR)}
}

関連リンク