概要
このコード・パターンでは、EPA で提供している大気質に関する大規模なデータ・セットを分析します。この「スマート・シティー」と見なすことのできる使用ケースにより、Watson Studio と Python データ・サイエンス・パッケージを使用して大規模なデータ・セットを分析する方法を説明します。Jupyter ノートブックに用意された数種類の例で、オープンソースのソフトウェア・パッケージを利用してデータ・セットを分析する方法を学んでください。
説明
このパターンには構造化データ・セットが必要です。構造化データ・セットを生成するには、さまざまな方法があります。その 1 つは、このパターンに関連する「LoRaWAN ネットワークを使用した長距離対応 IoT システムのハードウェア・プラットフォームをセットアップする」というタイトルのパターンに従って、長距離対応のネットワークをデプロイし、そのネットワークを介してセンサー・データを収集することです。
ここでは代わりの方法として、EPA によって生成されたデータ・セットを使用します。EPA では米国の各地で汚染物質レベルを測定しています。測定は年間を通して 1 時間ごとに行われるので、このデータ・セットでは時系列分析を利用できます。
このコード・パターンを完了すると、以下の方法がわかるようになります。
- IBM Watson Studio 内で Juypter ノートブックを作成する
- 重要ではないデータを削除してデータ・セットをクリーンアップする
- pandas (Python Data Analysis Library) を使用してデータ・セット内からパターンを検出する
- 全体的なデータの傾向を視覚化する「matplotlib」ライブラリーを使用してグラフを作成する
フロー
- エンド・ノード・デバイスが現地のセンサー・データを収集します。
- 収集されたデータがワイヤレス・プロトコルを介してゲートウェイに送信されます。
- ゲートウェイから Watson IoT Platform にセンサー・データが転送されます。
- Watson IoT Platform が受信したデータ・パケットを Cloudant 内に保管します。
- Watson Studio が保管されたデータを Juypter ノートブックにインポートし、このノートブックを使用してデータを処理します。
手順
このパターンに取り組む準備はできましたか?Jupyter ノートブックによって行われる分析をはじめ、詳細な手順については README を参照してください。