新しい IBM Developer JP サイトへようこそ!サイトのデザインが一新され、旧 developerWorks のコンテンツも統合されました。 詳細はこちら

Kubeflow 開発環境を構築する

このチュートリアルはラーニング・パス「Kubeflow 入門」を構成するコンテンツです。

概要

Kubeflow をインストールした後は、Kubeflow パイプライン・アプリケーションをコンパイルしてテストするための開発環境を構築する必要があります。このチュートリアルでは、以下の方法を学びます。

  • コンパイル用の Kubeflow 開発環境を構築する
  • Kubeflow Dashboard を使用して Kubeflow パイプライン・アプリケーションをテストする

前提条件

このチュートリアルに取り組むには、最小要件として 8 基のコア、16 GB の RAM、250 GB のストレージを搭載した Ubuntu 18 マシンが必要です。また、チュートリアルの手順は root 権限で実行する必要があります。Kubeflow は、クラウド内またはオンプレミス環境内にインストールします。Kubeflow をまだインストールしていない場合は、以下のいずれかのチュートリアルに従ってインストールしてください。

所要時間

このチュートリアルの所要時間は約 15 分です。

サンプル・パイプライン・アプリケーションをコンパイルする

このチュートリアルでは、サンプル・パイプライン・アプリケーションをコンパイルするために必要な手順を説明します。詳細な開発環境の構築手順については、Kubeflow の公式サイトを参照してください。

  1. Python 環境を構築します。構築には Python 3.5 以降を使用する必要があります。

     apt-get update; apt-get install -y wget bzip2
     wget https://repo.continuum.io/miniconda/Miniconda3-latest-Linux-x86_64.sh
     bash Miniconda3-latest-Linux-x86_64.sh
     Create a Python 3.7 environment name of mlpipeline(or any name you preferred):
     conda create --name mlpipeline python=3.7
     conda init
    
  2. 現在のシェルをもう一度開きます。

     conda activate mlpipeline
    
  3. Kubeflow SDK をインストールします。

     pip install https://storage.googleapis.com/ml-pipeline/release/latest/kfp.tar.gz --upgrade
    
  4. サンプル Kubeflow を複製するかダウンロードして、コンパイルします。

     mkdir /root/kubeflow/src
     cd /root/kubeflow/src
    
     git clone https://github.com/kubeflow/pipelines.git
     dsl-compile --py /root/kubeflow/src/pipelines/samples/core/sequential/sequential.py --output /tmp/mysequential.tar.gz
    

    コンパイルの出力は /tmp/mysequential.tar.gz 内に保管されます。

コンパイル済みパイプラインを Kubeflow Dashboard にアップロードする

以下の手順に従って、コンパイル済みパイプラインを Kubeflow Dashboard にアップロードします。

  1. メイン・ページ内の「Quick shortcuts (クイック・ショートカット)」で、「Upload a pipeline (パイプラインをアップロード)」をクリックします。

    パイプラインをアップロードするメニュー項目を示す画面のスクリーンショット

  2. 「Pipelines (パイプライン)」ウィンドウ内の GUI で、「Upload pipeline (パイプラインをアップロード)」をクリックします。

    パイプラインをアップロードするメニュー項目を示す画面のスクリーンショット

  3. Upload and name your pipeline (パイプラインをアップロードして名前を付けます)」ウィンドウで、「Upload a file (ファイルをアップロード)」を選択し、コンパイルしたファイルを選択します。「Upload (アップロード)」をクリックします。

    パイプラインをアップロードして名前を付ける画面のスクリーンショット

Kubeflow Dashboard 内でコンパイル済みパイプラインを実行する

  1. 「Pipelines (パイプライン)」ウィンドウで、「mysequential」(前のステップでアップロードしたファイル) をクリックします。

    mysequential パイプラインを示す画面のスクリーンショット

  2. mysequential パイプライン内で、このパイプラインのグラフとソースを確認できます。以下の画像に示されているように、2 つのコンテナーを表す矩形が 2 つ表示されます。「Create experiment (エクスペリメントを作成)」をクリックします。

    Mysequential パイプライン・ウィンドウのスクリーンショット

  3. 「Experiment details (エクスペリメントの詳細)」ウィンドウで、エクスペリメント名を入力してから「Next (次へ)」をクリックします。

    エクスペリメントの詳細を示す画面のスクリーンショット

  4. 「Run details (実行の詳細)」ウィンドウで、実行名を入力し、「Run Type (実行タイプ)」で「One-off (1 回限り)」を選択してから「Start (開始)」をクリックします。

    実行の詳細ウィンドウのスクリーンショット

「Experiments (エクスペリメント)」ウィンドウが再表示されます。このウィンドウで、実行のステータスやその他の情報を確認できます。

エクスペリメント・ウィンドウのスクリーンショット

「Runs (実行)」セクションで「mySeqRun1」をクリックして詳細を表示します。

myseqrun1 の詳細を示す画面のスクリーンショット

「Graph (グラフ)」タブで、個々のコンテナーをクリックすると、その入力と出力、およびその他の詳細が表示されます。

まとめ

このチュートリアルでは、パイプライン・アプリケーションをコンパイルするための開発環境を構築する方法と、Kubeflow Dashboard を使用してパイプライン・アプリケーションをテストする方法を説明しました。

このチュートリアルはラーニング・パス「Kubeflow 入門」を構成するコンテンツです。引き続きこのラーニング・パスに従うには、シリーズの次のチュートリアル「Db2 for z/OS 内のエンタープライズ・データを対象に Kubeflow を使用する」に取り組んでください。