オブジェクト検出機能によってアイテムの位置を特定し、アイテムの数をカウントする

概要

オブジェクト検出には、画像分類とは違った用途と可能性があります。このコード・パターンでは、IBM Maximo Visual Inspection のオブジェクト検出機能を使用して、画像内のオブジェクト (この例では、コカ・コーラ製品) をカスタマイズしたトレーニングに基づいて検出し、ラベルを付ける方法をデモします。この方法を理解すれば、コードを一切作成しなくても、独自のデータセットを使用してこの初期サンプル・データセットを簡単にカスタマイズできるようになります。

説明

例えば、あなたがある商品 (例えば、ソフトドリンク) のサプライヤーで、ある店舗で売られている商品の本数を知りたいとします。その場合、IBM Maximo Visual Inspection を利用すれば、その目的を果たすためのアプリを作成できます。IBM Maximo Visual Inspection では深層学習を使用して、アップロードされた画像と、ラベルに基づいて、トレーニングされたモデルを作成します。新しいオブジェクト検出モデルをトレーニング、デプロイ、テストするためにコードを作成する必要は一切ありません。画像をアップロードして、マウスを使って画像内のオブジェクトにラベルを付けるだけで、後は IBM Maximo Visual Inspection が学習してくれます。

このパターンでは、深層学習トレーニングを使用してオブジェクト検出モデルを作成します。数回クリックするだけで、モデルをトレーニングしてデプロイできます。モデルをトレーニングしてデプロイした後は、REST エンドポイントを使って画像内のアイテムの位置を特定し、カウントできるようになります。このコード・パターンに付属のサンプル・データセットは、コカ・コーラのボトルのディテクターを作成するためのものですが、独自のサンプルを使用して別のオブジェクトを検出することもできます。

IBM Maximo Visual Inspection は、推測処理に対応する REST API を備えています。カスタム・モデルを作成する際は、オブジェクト検出にどの REST クライアントを使用するのでも構いません。REST クライアントは、IBM Maximo Visual Inspection UI を使用してテストできます。このサンプルに含まれる Node.js アプリケーションでは、画像をアップロードする方法、検出された画像内のオブジェクトにラベルと枠線を描画する方法をデモします。

このコード・パターンをひと通り完了すると、以下の方法がわかるようになります。

  • IBM Maximo Visual Inspection を使用してオブジェクトを検出する対象のデータセットを作成する
  • データセットに基づいてモデルをトレーニングし、デプロイする
  • REST 呼び出しを使用してモデルをテストする

フロー

フロー

  1. 画像をアップロードして IBM Maximo Visual Inspection データセットを作成します。
  2. トレーニングを実行する前に、画像データセット内のオブジェクトにラベルを付けます。
  3. IBM Maximo Visual Inspection 内でモデルをトレーニング、デプロイ、テストします。
  4. REST クライアントを使用して、画像内のオブジェクトを検出します。

手順

このパターンの詳細な手順については、README を参照してください。手順の概要は以下のとおりです。

  1. GitHub リポジトリー powerai-vision-object-detection を複製します。
  2. IBM Maximo Visual Inspection にログインします。
  3. オブジェクト検出トレーニングに使用する新規データセットを作成します。
  4. オブジェクトのトレーニングに使用するタグを作成し、それらのタグでオブジェクトにラベルを付けます。
  5. 深層学習 (DL) タスクを作成します。
  6. モデルをデプロイしてテストします。
  7. アプリを実行します。