概要
このコード・パターンでは、対象分野の専門家やデータ・サイエンティストを対象に、IBM Watson Studio と Watson Machine Learning を利用してデータ・マイニングや時系列予測子のトレーニングを自動化するための方法を説明します。このコード・パターンは、過去のデータに基づいて傾向を予測できる数学モデルを作成するための自己回帰和分移動平均 (ARIMA) アルゴリズムや他の先進的な手法にも適用されます。
説明
このコード・パターンで紹介する IBM Watson Studio と Watson Machine Learning を使用したデータ・サイエンスのワークフローの例は、予測履歴データに基づいて S&P 500 株価指数の終値を予測するというものです。このパターンに含まれるデータ・マイニング・プロセスでは Quandl API を使用して、金融、経済などの市場データを、最近のアナリストが使用する最新の形式で取得します。
このコード・パターンを完了すると、以下の方法がわかるようになります。
- Watson Studio 内で Jupyter Notebook からパブリック API を使用して金融データをマイニングする
- Data Refinery などの特化された Watson Studio ツールを使用して、モデルのトレーニングに使用するデータを準備する
- オープンソースの Python ライブラリーまたは Watson Studio に組み込まれたグラフィック指向の Modeler Flow を使って、抽出されたデータを基に時系列モデルを作成、トレーニングして保存する
- IBM Cloud Object Storage を操作して、マイニングされてモデル化されたデータを保管し、そのデータにアクセスする
- Modeler Flow で作成したモデルを保管し、Python API を使用して Watson Machine Learning サービスとやりとりする
- Pandas と Bokeh を使用して、時系列データをグラフィカルに表す視覚化を生成する
フロー
- Watson Studio プロジェクトを作成します。
- プロジェクトに Cloud Object Storage を割り当てます。
- Jupyter Notebook を Watson Studio にロードします。
- Quandl API から取得したサンプル・データを Notebook でインポートします。
- インポートされたデータを Data Refinery でクレンジングしてから Cloud Object Storage に保存します。
- SPSS Modeler フローを使用して予測を作成します。
- SPSS Modeler フローからエクスポートされた Watson Machine Learning モデルを Watson Machine Learning にインポートします。
- API を介して Watson Machine Learning モデルを公開します。
- アプリケーションで Watson Machine Learning API を使用して株価の予測を生成します。
手順
このパターンの詳しい手順については、readme ファイルを参照してください。手順の概要は以下のとおりです。
- Watson Studio 内で新しいプロジェクトを作成します。
- Python Notebook を使用してデータをマイニングし、予測を行います。
- Quandl API キーを構成します。
- Notebook 内で IBM Cloud Object Storage 資格情報を構成します。
- マイニングされたデータをアセットとして Watson Studio プロジェクトにインポートします。
- Data Refinery を使用してデータをクレンジングします。
- SPSS Modeler フローを使用して予測を行います。
- Python Notebook を使用して Modeler フローの結果を視覚化します。
- Modeler フローのモデルを Watson Machine Learning 内にデプロイします。