IBM Open Data Analytics for z/OS で Python と Jupyter Notebook を使用して、カスタマー・チャーン・データを分析する  

カスタマー・リテンション・データの重要な傾向を明らかにするデータ視覚化を作成する

By David Rice, Andrew Hicks

Description

例えば、銀行で顧客維持の問題を抱えているとします。具体的には、取引銀行を変える顧客が増えている (チャーン率が上昇している) という問題です。その場合、IBM Open Data Analytics for z/OS (IzODA) で、各種の Python ライブラリーが組み込まれた Jupyter Notebook を使ってクレジット・カード取引データを調べ、IzODA が提供する最適化されたデータ層を使用して堅牢なデータ視覚化を作成することで、顧客が取引銀行を変える理由を明らかにする重要なフィーチャーを見つけることができます。

Overview

このコード・パターンでデモする探索的 Jupyter Notebook は、メインフレーム上で顧客の個人データとクレジット・カード取引データを分析し、取引銀行を変えるという顧客の決定に影響している可能性のある要因を明らかにします。

この架空の使用ケースでは、あなたはカスタマー・リテンションの問題 (データ・サイエンティストの間では「カスタマー・チャーン」と呼ばれる問題) を抱えている銀行に勤めています。あなたが監督するデータ・サイエンス・チームは、データを分析して、潜在的チャーンを明らかにする指標となるフィーチャーを調べる必要に迫られています。

Python で作成されているこのデモには、Pandas や Matplotlib などの優れた Python ライブラリーの多くが組み込まれています。さらに、Scikit-Learn を使用した機械学習も組み込まれています。デモで使用するデータ・セットは、6,001 件のレコードが含まれる顧客情報テーブル、約 150 万件のレコードが含まれるクレジット・カード取引テーブルの 2 つです。このコード・パターンで、最新のプログラミング言語を使って z/OS データを操作し、この 2 つのデータ・セットから主要な予測フィーチャーを分析する方法を説明します。

このコード・パターンを完了すると、以下の方法がわかるようになります。

  • Jupyter Notebook を使用してデータをロード、視覚化、分析する
  • IBM Open Data Analytics 内で Notebook を実行する
  • scikit-learn を使用して予測モデルを作成する

Flow

  1. データ・サイエンティストが Web UI を操作します。
  2. Web UI は、Jupyter Notebook 用のブラウザー・ベースのユーザー・インターフェースです。
  3. Jupyter Notebook は IzODA に組み込まれて、z/OS 上で稼働しています。
  4. VSAM データ・セットには、Optimized Data Layer (ODL) 内に定義された仮想テーブルを介してアクセスします。
  5. DSDBC が ODL に対して VSAM データをクエリーします。

Instructions

このコード・パターンの詳細な手順については、README を参照してください。

Related Blogs

Call for Code 2019 応募に向けて個別オンライン相談会の予約受付開始

皆さん、こんにちは。IBM デベロッパーアドボケイト戸倉彩です。 グローバルハッカソンは目標をもって仲間と一緒 […]

続けて読む Call for Code 2019 応募に向けて個別オンライン相談会の予約受付開始

Related Links

Jupyter Notebook

このオープンソース Web アプリケーションを使用することで、ライブ・コード、方程式、視覚化、テキストを含むドキュメントを作成し、共有できます。

IBM Open Data Analytics for z/OS

Apache Spark、Anaconda、Python などのオープンソース・テクノロジーのランタイムを最適化し、元のデータ・ソースを活用してデータから洞察を引き出します。

scikit-learn

このコード・パターンのデモで使用している、skikit-learn Python 機械学習ライブラリーです。

matplotlib

この Python 2D グラフ描画ライブラリーを使用して、出版品質のグラフを各種のハードコピー形式で、しかもプラットフォームをまたがったインタラクティブな環境で生成できます。

seaborn

matplotlib ベースの Python データ視覚化ライブラリー、seaborn は、魅力的で有益な統計グラフを描画できる高レベルのインターフェースを提供します。