機械学習モデルでストリーミング・データに採点を付ける

このコード・パターンは「ラーニング・パス: IBM Streams 入門 」の一部となっています。

レベル トピック タイプ
100 Introduction to IBM Streams 記事
101 Create your first IBM Streams app without writing code チュートリアル
201 Ingest data from Apache Kafka コード・パターン
301 Build a streaming app using a Python API コード・パターン
401 機械学習モデルでストリーミング・データに採点を付ける コード・パターン

概要

この開発者コード・パターンでは、オンライン・ショッピング・データをストリーミングし、そのデータを使用して、各買い物客がショッピング・カートに追加した商品を追跡します。さらに、scikit-learn を使用して、ショッピング・カートの中身に応じて買い物客をグループ化する、k 平均クラスタリング・モデルを作成します。買い物客をクラスターに割り当てれば、追加でお勧めする商品を予測できます。

説明

このアプリケーションを構築するために使用するのは、IBM Cloud Pak® for Data 上の IBM Streams です。IBM Streams には Streams Flows という IDE が組み込まれていて、この IDE を使用すると視覚的にストリーミング・アプリを作成できます。IBM Cloud Pak for Data プラットフォームにはさらに、複数データ・ソースの統合、組み込みアナリティクス、Jupyter Notebook、機械学習などのサポートも用意されています。

一方、機械学習モデルを作成してデプロイするために使用するのは、IBM Watson® Studio 内の Jupyter Notebook と Watson Machine Learning サービス・インスタンスです。この例では、どちらも IBM Cloud Pak for Data プラットフォーム上で実行されます。

Streams Flows エディターを使用して、次のオペレーターからなるストリーミング・アプリを作成します。

  • ソース・オペレーター: サンプルのクリックストリーム・データを生成します。
  • フィルター・オペレーター: イベントを「カートへ追加」イベントに絞り込みます。
  • コード・オペレーター: この例では、Python コードを使用してショッピング・カート内のアイテムを採点に使用する入力配列に整理します。
  • WML デプロイメント・オペレーター: 買い物客をクラスターに割り当てます。
  • デバッグ・オペレーター: 結果をデモするために使用します。

フロー

フロー

  1. ユーザーが機械学習モデルを作成してデプロイします。
  2. ユーザーが IBM Streams アプリケーションを作成して実行します。
  3. Streams Flow UI にストリーミング、フィルタリング、採点の動作が示されます。

手順

このコード・パターンに取り組む準備はできましたか?README では、次の手順を説明しています。

  1. Cloud Pak for Data 上の IBM Streams インスタンスにアクセスできることを確認します。
  2. Cloud Pak for Data 内で新しいプロジェクトを作成します。
  3. モデルを作成して保管します。
  4. デプロイメント空間をプロジェクトに関連付けます。
  5. モデルをデプロイします。
  6. Streams Flow アプリケーションを作成して実行します。

お疲れさまでした!このコード・パターンは、「IBM Streams 入門」シリーズの最終回です。このシリーズでは、IBM Streams の概要に加えて、次の方法を説明しました。

  • コードを 1 行も作成せずに、初の IBM Streams アプリを作成する
  • Apache Kafka ストリーミング・アプリを構築する
  • Python API を使用してストリーミング・アプリを構築する
  • 機械学習モデルでストリーミング・データに採点を付ける

このシリーズを通して、IBM Streams の基本といくつかの機能について理解できたはずです。さらに詳しく学ぶには、「Introduction to streaming analytics with IBM Streams」動画シリーズをご覧ください。