テキスト要約機能

概要

このモデルは、テキストからの抜粋をいくつかカプセル化した JSON 入力を取り、入力テキストに含まれる主な情報やメッセージを表すテキスト要約を返します。このモデルのトレーニングには CNN / Daily Mail データセットが使用されています。モデルが対応する語彙の単語数は約 200,000 です。このモデルのベースとなっているのは ACL の記事「Get To The Point: Summarization with Pointer-Generator Networks」(2017 年) です。

モデルのメタデータ

ドメイン アプリケーション 業種 フレームワーク トレーニング・データ 入力データの形式
NLP テキスト要約 一般 TensorFlow CNN / Daily Mail テキスト

参考資料

ライセンス

コンポーネント ライセンス リンク
モデルの GitHub リポジトリー Apache 2.0 LICENSE
サード・パーティーのコード Apache 2.0 LICENSE
事前トレーニングされたモデルの重み Apache 2.0 LICENSE
トレーニング・データ MIT LICENSE CNN / Daily Mail

このモデルのデプロイ方法

このモデルは、以下のメカニズムを使用してデプロイできます。

  • Docker Hub からデプロイする場合:

    docker run -it -p 5000:5000 codait/max-text-summarizer
    
  • Red Hat OpenShift からデプロイする場合:

    Follow the instructions for the OpenShift web console or the OpenShift Container Platform CLI in this tutorial and specify codait/max-text-summarizer as the image name.

  • Kubernetes 上にデプロイする場合:

    kubectl apply -f https://raw.githubusercontent.com/IBM/MAX-Text-Summarizer/master/max-text-summarizer.yaml
    
  • ローカルにデプロイする場合: GitHub 上のモデルの README に記載されている手順に従います。

使用例

このモデルは cURL を使用してテストまたは使用できます。

cURL を使用してモデルをテストする

モデルをデプロイしたら、コマンド・ラインからモデルをテストできます。以下に例を示します。

$ curl -d @samples/sample1.json -H "Content-Type: application/json" -XPOST http://localhost:5000/model/predict

以下のような JSON レスポンスが表示されるはずです。

{
  "status": "ok",
  "summary_text": [
      ["nick gordon 's father -lrb- left and right -rrb- gave an interview about the 25-year-old fiance of bobbi kristina brown . it has been reported that gordon , 25 , has threatened suicide and has been taking xanax since . whitney houston 's daughter was found unconscious in a bathtub in january . on wednesday , access hollywood spoke exclusively to gordon 's stepfather about his son 's state of mind . "]
  ]
}