Watson Natural Language Understanding を利用して非構造化データを視覚化する  

強力なアナリティクス・エンジンによってデータにコグニティブ・エンリッチを適用し、洞察を引き出す

By Pavan Tummala, Rich Hagarty

Description

このコード・パターンでは、Watson™ Natural Understanding、Apache Tika、D3.js を使用して非構造化データを視覚化する Web アプリを作成します。ユーザーが任意のローカル・ファイルをアップロードすると、このアプリは Apache Tika を使用して非構造化データ・ファイルからテキストを抽出します。抽出されたテキストは Watson Natural Language Understanding に渡され、このサービスによってエンティティーと概念が抽出されます。最後に、アプリは D3.js を視覚化ツールとして使用して、結果をユーザーに表示します。

Overview

Watson Natural Understanding サービスを利用する最大の利点は、コグニティブ・エンリッチを適用してデータから洞察を引き出す、その強力なアナリティクス・エンジンにあります。抽出される主なエンリッチには、次のものがあります。

  • エンティティー – 人、企業、組織、都市など
  • キーワード – データのインデックス付けや検索で通常使用される重要なトピック
  • 概念 – 必ずしもデータ内で参照されているとは限らない、識別された一般概念
  • 感情 – 各ドキュメントの全体的な感情 (肯定的または否定的)

これらのエンリッチを表示するために使用するのは、D3.js という強力な視覚化手法を提供する JavaScript ライブラリーです。このアプリでは、データを活性化するのに役立つ D3.js を使用してエンリッチのそれぞれを対話式バブル・クラウドで表示し、各要素のサイズと位置によって、その相対的重要性を示します。

このコード・パターンを完了すると、以下の方法がわかるようになります。

  • Watson Natural Language Understanding のインスタンスを作成して使用する
  • Apache Tika を使用して非構造化ファイルからテキストを抽出する
  • D3.js を使用して視覚化を表示する

Flow

  1. ユーザーが Watson Natural Language Understanding サービスの資格情報を構成して、アプリを起動します。
  2. ユーザーが処理対象のデータ・ファイルを選択してロードします。
  3. アプリが Apache Tika を使用してデータ・ファイルからテキストを抽出します。
  4. 抽出されたテキストが Watson NLU に渡されて、エンリッチが適用されます。
  5. アプリが D3.js ライブラリーを使用して、エンリッチされたデータを UI 内で表示します。

Instructions

このパターンに取り組む準備はできましたか?詳細な手順については、README を参照してください。

Related Blogs

Call for Code 2019 応募に向けて個別オンライン相談会の予約受付開始

皆さん、こんにちは。IBM デベロッパーアドボケイト戸倉彩です。 グローバルハッカソンは目標をもって仲間と一緒 […]

続けて読む Call for Code 2019 応募に向けて個別オンライン相談会の予約受付開始

IBM Developer Dojo – 6月イベントスケジュール

皆さん、こんにちは。IBMデベロッパーアドボケイト戸倉です。 5月にスタートした毎週水曜日にIBM渋谷オフィス […]

続けて読む IBM Developer Dojo – 6月イベントスケジュール