フィーチャー・エンジニアリングとモデルの採点を行う  

IBM Watson Studio Local を利用して、ワインを分類する機械学習モデルの作成とトレーニングを自動化する

By Vinodh Mohan, Rich Hagarty, Ying Chen

Description

このコード・パターンでは、IBM Watson Studio Local を利用して、ワインを分類する機械学習モデルの作成とトレーニングを自動化する方法を説明します。ここではフィーチャーを抽出するために、ワイン関連のデータセットに主成分分析 (PCA) アルゴリズムを適用します。抽出した成分に基づいて、ワインのカテゴリーを予測する分類モデルを作成します。

Overview

このコード・パターンでは IBM Watson Studio Local ツール・スイートを利用する例として、ワインをその化学的プロパティーに基づいて 3 つのカテゴリーに分類するためのデータ・サイエンス・ワークフローを紹介します。

ワインを分類するために必要なプロパティーの数は、フィーチャー・エンジニアリングを使用して制限します。主成分分析 (PCA) アルゴリズムを使用してワイン関連のデータセットから 2 つの主成分を抽出し、分類モデルを作成します。

この分類モデルでは、抽出された成分にロジスティック回帰を適用してワインのカテゴリーを予測します。

このコード・パターンを完了すると、以下の方法がわかるようになります。

  • Watson Studio Local を使用して、PCA やその他の手法によってフィーチャーを抽出する
  • Watson Studio Local を使用して、抽出されたフィーチャーを基にモデルを作成、トレーニング、保存する
  • Watson Machine Learning の機能を使用してモデルをデプロイし、バッチおよび API モードでモデルにアクセスする
  • サービスとしてデプロイされたスクリプトを使用して、バッチおよび API モードでフィーチャー抽出とモデル採点を自動化する

Flow

  1. Spark DataFrame の処理によってデータセットをクリーンアップし、Spark MLlib を使用して PCA 分類モデルをトレーニングします。
  2. トレーニングしたモデルを IBM Watson Studio Local に保存します。
  3. ユーザーは Watson Studio Local 内で提供されているノートブックを実行できます。
  4. IBM Watson Machine Learning の機能を使用してモデルをデプロイし、モデルを使用してワインを分類します。

Instructions

詳細な手順については、README ファイルを参照してください。手順の概要は以下のとおりです。

  1. github リポジトリーをローカル・システムに複製します。
  2. Watson Studio Local 内でプロジェクトを作成します。
  3. 必要なすべてのプロジェクト・アセットをアップロードおよび作成します。
  4. Jupyter Notebook を実行して分類モデルを作成します。
  5. Watson Studio Local マスター・リポジトリーに変更をコミットします。
  6. Watson Machine Learning 内でデプロイ可能なリリース・プロジェクトを作成します。
  7. モデルを Web サービスとしてデプロイします。
  8. ヘルパー・スクリプトをジョブとしてデプロイします。
  9. すべてのデプロイメントをオンライン状態にします。
  10. API エンドポイントを収集して、スクリプトから呼び出せるようにします。
  11. デプロイされたエンドポイントを呼び出すようにスクリプトを変更します。
  12. スクリプトをローカルで実行してテストします。
  13. Watson Machine Learning を使用してモデルを管理します。

Related Blogs

Call for Code 2019 応募に向けて個別オンライン相談会の予約受付開始

皆さん、こんにちは。IBM デベロッパーアドボケイト戸倉彩です。 グローバルハッカソンは目標をもって仲間と一緒 […]

続けて読む Call for Code 2019 応募に向けて個別オンライン相談会の予約受付開始

Related Links