視覚認識による分類を最適化する

概要

視覚認識による分類プロセスで使用するデータ・セットのサイズはかなり大きいため、開発者は画像を分類する作業に追われて、AI テクノロジーや機械学習テクノロジーに取り組むまでの段階になかなか辿り着けないことがよくあります。Watson IoT Platform に Watson Visual Recognition サービスを統合すれば、Visual Recognition のトレーニング済みモデルを使用して、オブジェクトを識別する際の処理時間を短縮することができます。このコード・パターンではまず、Java ベースのトレーニング・アプリを作成する方法を説明します。このアプリは IoT 対応デバイスから画像をキャプチャーした後、カスタム分類子を作成します。そしてJava API を呼び出して画像のセットを渡し、そのカスタム分類子をトレーニングします。続いて、Watson IoT Platform、Node-RED、Watson Visual Recognition サービスを利用して、トレーニング済みモデルに基づいて新しい画像セットを分類する予測アプリを作成する方法を説明します。

説明

インテリジェントな画像認識には、以下の 2 つのプロセスが必要になります。

  1. トレーニング・モデルを作成する
  2. 画像を分類し、トレーニング・モデルに基づいてオブジェクトを識別する

このパターンは、トレーニング・アプリと予測アプリの 2 つのアプリで構成されています。予測アプリは、分類プロセスを最適化する革新的ソリューションになるはずです。このアプリでは、画像がキャプチャーされて Watson IoT Platform にパブリッシュされると、Node-RED 内の IoT サブスクライバー・ノードがこのパブリッシュされたペイロードを取り、Watson Visual Recognition サービスを呼び出してそのペイロードを渡します。画像の分類結果は Cloudant DB 内に保管されます。

このパターンを使用すれば、Visual Recognition サービス・インスタンスを利用してカスタム分類子を作成し、トレーニングすることができます。Visual Recognition サービスは画像内にあるオブジェクトを識別するために、事前にトレーニングされた分類子を使用します。したがって、Visual Recognition サービスを利用して特定の画像に含まれている特定のオブジェクトを検出するには、独自のカスタム分類子を作成する必要があります。

識別結果を表示するには、予測アプリを実行する必要があります。IBM Watson IoT Platform には柔軟性があり、開発者がアナリティクス、ストレージなどの他のサービスやタスクを統合して実行することができます。このパターンでは予測アプリ内で Watson IoT Platform を使用して、Visual Recognition サービスを呼び出し、画像内のオブジェクトを検出します。この実装には、オブジェクト検出の全体的な実行時間を短縮できるという利点があります。

フロー

フロー

  1. ユーザーがトレーニング・アプリ内で、分類子の名前を入力します。
  2. ユーザーがトレーニング・アプリ内で、ネガティブ画像が含まれる zip ファイルのパスを入力します。
  3. トレーニング・アプリ内でカメラ・ウィンドウが起動され、指定された数のポジティブ画像をキャプチャーします。
  4. トレーニング・アプリ内で、ポジティブ画像が zip ファイルに圧縮されて、ネガティブ画像の zip ファイルと一緒に Java API に渡されます。Visual Recognition サービス・インスタンス内でカスタム分類子が作成されます。
  5. トレーニング・アプリ内でトレーニングが完了すると、トレーニング完了を通知するメッセージが Watson Text to Speech サービスに送信されます。
  6. 予測アプリ内で、カメラ・デバイスを使って画像がキャプチャーされ、処理キューに入れられます。
  7. 予測アプリ内で、キューから画像が取り出され、Base-64 でエンコードされたペイロードに変換されます。
  8. 予測アプリ内で、エンコードされたペイロードが Watson IoT Platform 上のトピックにパブリッシュされます。
  9. Node-RED 内で、IoT-IN ノードがトピックにパブリッシュされたペイロードを受け取ります。
  10. Node-RED 内で、Base-64 でエンコードされたペイロードが VR サービス・ノードに渡され、VR 内部で 3 つのフィーチャー (classifyImg、faceDetection、textDetection) がチェックされます。
  11. Node-RED 内で、結果が CloudantDB ノードに送信されてデータベース内に保管されます。
  12. Node-RED 内で、デバイス・コマンドが IoT-OUT ノードを介してデバイスに送信されます。これにより、デバイスが次に処理する画像をキューに送信し、GUI を更新して最新の結果を表示します。

手順

詳細な手順については、README ファイルを参照してください。このコード・パターンを使用するために実施する必要がある主なステップは、以下のとおりです。

  1. IBM Cloud 内で Internet of Things Platform Starter ボイラープレートを使用して IoT アプリを作成します。
  2. Watson IoT Platform ダッシュボードを使用して、IoT デバイスを登録します。
  3. IoT デバイスからイベントを受信して IoT デバイスに通知を返す Node-RED シミュレーターを作成します。
  4. トレーニング・アプリと予測アプリをビルドして実行します。