オブジェクト検出機能によってアイテムの位置を特定し、アイテムの数をカウントする  

アプリが画像内のアイテムを検出して位置を特定し、その数をカウントできるようにするためのモデルと REST エンドポイントを作成する

Last updated | By Mark Sturdevant

Description

オブジェクト検出には、画像分類とは違った用途と可能性があります。このコード・パターンでは、PowerAI Vision のオブジェクト検出機能を使用して、画像内のオブジェクト (この例では、コカ・コーラ製品) をカスタマイズしたトレーニングに基づいて検出し、ラベルを付ける方法をデモします。この方法を理解すれば、コードを一切作成しなくても、独自のデータセットを使用してこの初期サンプル・データセットを簡単にカスタマイズできるようになります。

Overview

例えば、あなたがある商品 (例えば、ソフトドリンク) のサプライヤーで、ある店舗で売られている商品の本数を知りたいとします。その場合、PowerAI Vision を利用すれば、その目的を果たすためのアプリを作成できます。PowerAI Vision では深層学習を使用して、アップロードされた画像と、ラベルに基づいて、トレーニングされたモデルを作成します。新しいオブジェクト検出モデルをトレーニング、デプロイ、テストするためにコードを作成する必要は一切ありません。画像をアップロードして、マウスを使って画像内のオブジェクトにラベルを付けるだけで、後は PowerAI Vision が学習してくれます。

このパターンでは、深層学習トレーニングを使用してオブジェクト検出モデルを作成します。数回クリックするだけで、モデルをトレーニングしてデプロイできます。モデルをトレーニングしてデプロイした後は、REST エンドポイントを使って画像内のアイテムの位置を特定し、カウントできるようになります。このコード・パターンに付属のサンプル・データセットは、コカ・コーラのボトルのディテクターを作成するためのものですが、独自のサンプルを使用して別のオブジェクトを検出することもできます。

PowerAI Vision は、推測処理に対応する REST API を備えています。カスタム・モデルを作成する際は、オブジェクト検出にどの REST クライアントを使用するのでも構いません。REST クライアントは、PowerAI Vision UI を使用してテストできます。このサンプルに含まれる Node.js アプリケーションでは、画像をアップロードする方法、検出された画像内のオブジェクトにラベルと枠線を描画する方法をデモします。

このコード・パターンをひと通り完了すると、以下の方法がわかるようになります。

  • PowerAI Vision を使用してオブジェクトを検出する対象のデータセットを作成する
  • データセットに基づいてモデルをトレーニングし、デプロイする
  • REST 呼び出しを使用してモデルをテストする

Flow

  1. 画像をアップロードして PowerAI Vision データセットを作成します。
  2. トレーニングを実行する前に、画像データセット内のオブジェクトにラベルを付けます。
  3. PowerAI Vision 内でモデルをトレーニング、デプロイ、テストします。
  4. REST クライアントを使用して、画像内のオブジェクトを検出します。

Instructions

このパターンの詳細な手順については、README を参照してください。手順の概要は以下のとおりです。

  1. GitHub リポジトリー powerai-vision-object-detection を複製します。
  2. PowerAI Vision にログインします。
  3. オブジェクト検出トレーニングに使用する新規データセットを作成します。
  4. オブジェクトのトレーニングに使用するタグを作成し、それらのタグでオブジェクトにラベルを付けます。
  5. 深層学習 (DL) タスクを作成します。
  6. モデルをデプロイしてテストします。
  7. アプリを実行します。

Related Blogs

Call for Code 2019 応募に向けて個別オンライン相談会の予約受付開始

皆さん、こんにちは。IBM デベロッパーアドボケイト戸倉彩です。 グローバルハッカソンは目標をもって仲間と一緒 […]

続けて読む Call for Code 2019 応募に向けて個別オンライン相談会の予約受付開始

Related Links

Architecture center

Learn how this code pattern fits into the Cognitive discovery Reference Architecture

From the developers

IBM PowerAI Vision speeds transfer learning with greater accuracy — a real world example