新しい IBM Developer JP サイトへようこそ!サイトのデザインが一新され、旧 developerWorks のコンテンツも統合されました。 詳細はこちら

Watson Machine Learning と Jupyter Notebook を利用してデータ分析、モデルの作成、デプロイを行う

このコード・パターンはラーニング・パス「IBM Cloud Pak for Data 入門」を構成するコンテンツになっています


概要

このコード・パターンでは IBM Cloud Pak® for Data を使用して、Telco Customer Churn データセットに基づいてビジネス問題を解決し、カスタマー・チャーンを予測するデータ・サイエンス・パイプライン全体を見ていきます。IBM Cloud Pak for Data はクラウド・ベースのインタラクティブなコラボレーション環境です。データ・サイエンティストと開発者、そしてデータ・サイエンスに関心を持つ人々がツールを使用して共同で作業し、データから引き出した洞察を共通、収集するために利用できるだけでなく、機械学習モデルと深層学習モデルを作成してデプロイすることもできます。

説明

カスタマー・チャーン (顧客が企業との取引関係を終わらせること) は、ビジネスの収益を左右する最も基本的な要因の 1 つです。この問題を解決するためには、どの顧客が忠実で、どの顧客にチャーンのリスクがあるかを把握し、チャーンの決定に影響する要因を顧客の観点から理解しなければなりません。そこで、このコード・パターンでは機械学習モデルを作成し、そのモデルを使用してチャーンのリスクがある顧客を予測する方法を説明します。ここで取り上げるのは完全なデータ・サイエンス・プロジェクトであり、このプロジェクトで作成したモデルによる調査結果は、規範的分析やターゲットを絞ったマーケティングに使用できます。

このコード・パターンを完了すると、以下の方法がわかるようになります。

  • Jupyter Notebook を使用してデータをロード、視覚化、分析する
  • Jupyter Notebook を IBM Cloud Pak for Data 内で実行する
  • IBM Cloud Pak for Data 上で Spark MLib を使用して機械学習モデルを作成、テスト、デプロイする
  • IBM Cloud Pak for Data を使用して、選択した機械学習モデルを本番環境にデプロイする
  • クライアントとインターフェースをとるフロントエンド・アプリケーションを作成し、デプロイしたモデルの使用を開始する

フロー

フロー

  1. ユーザーが Jupyter Notebook を IBM Cloud Pak for Data platform にロードします。
  2. Telco Customer Churn データセットを GitHub から直接 Jupyter Notebook にロードします。または、ラーニング・パス「IBM Cloud Pak for Data 入門」データ仮想化チュートリアルの手順に従った後、仮想化されたデータとしてロードすることもできます。
  3. データを前処理し、機械学習モデルを作成して IBM Cloud Pak for Data 上の Watson® Machine Learning に保存します。
  4. 選択した機械学習モデルを IBM Cloud Pak for Data プラットフォーム上の本番環境にデプロイし、採点エンドポイントを取得します。
  5. フロントエンド・アプリケーションを使用して、モデルを基に信用度を予測します。

手順

このコード・パターンに取り組む準備はできましたか?このアプリケーションを起動して使用する方法について詳しくは、README ファイルを参照してください。

まとめ

このコード・パターンでは IBM Cloud Pak for Data を使用して、Telco Customer Churn データセットに基づいてビジネス問題を解決し、カスタマー・チャーンを予測するデータ・サイエンス・パイプライン全体を詳しく調べる方法を説明しました。このコード・パターンはラーニング・パス「IBM Cloud Pak for Data 入門」の一部です。 このシリーズで引き続き IBM Cloud Pak for Data の詳細を学ぶには、次のコード・パターン Watson OpenScale でモデルをモニタリングする をご覧ください。