概要
このモデルは、テキストからの抜粋をいくつかカプセル化した JSON 入力を取り、入力テキストに含まれる主な情報やメッセージを表すテキスト要約を返します。このモデルのトレーニングには CNN / Daily Mail データセットが使用されています。モデルが対応する語彙の単語数は約 200,000 です。このモデルのベースとなっているのは ACL の記事「Get To The Point: Summarization with Pointer-Generator Networks」(2017 年) です。
モデルのメタデータ
ドメイン | アプリケーション | 業種 | フレームワーク | トレーニング・データ | 入力データの形式 |
---|---|---|---|---|---|
NLP | テキスト要約 | 一般 | TensorFlow | CNN / Daily Mail | テキスト |
参考資料
A.See、P. J. Liu、C. D. Manning 共著「Get To The Point: Summarization with Pointer-Generator Networks」(ACL、2017 年)
ライセンス
コンポーネント | ライセンス | リンク | |
---|---|---|---|
モデルの GitHub リポジトリー | Apache 2.0 | LICENSE | |
サード・パーティーのコード | Apache 2.0 | LICENSE | |
事前トレーニングされたモデルの重み | Apache 2.0 | LICENSE | |
トレーニング・データ | MIT | LICENSE | CNN / Daily Mail |
このモデルのデプロイ方法
このモデルは、以下のメカニズムを使用してデプロイできます。
Docker Hub からデプロイする場合:
docker run -it -p 5000:5000 codait/max-text-summarizer
Red Hat OpenShift からデプロイする場合:
Follow the instructions for the OpenShift web console or the OpenShift Container Platform CLI in this tutorial and specify
codait/max-text-summarizer
as the image name.Kubernetes 上にデプロイする場合:
kubectl apply -f https://raw.githubusercontent.com/IBM/MAX-Text-Summarizer/master/max-text-summarizer.yaml
ローカルにデプロイする場合: GitHub 上のモデルの README に記載されている手順に従います。
使用例
このモデルは cURL を使用してテストまたは使用できます。
cURL を使用してモデルをテストする
モデルをデプロイしたら、コマンド・ラインからモデルをテストできます。以下に例を示します。
$ curl -d @samples/sample1.json -H "Content-Type: application/json" -XPOST http://localhost:5000/model/predict
以下のような JSON レスポンスが表示されるはずです。
{
"status": "ok",
"summary_text": [
["nick gordon 's father -lrb- left and right -rrb- gave an interview about the 25-year-old fiance of bobbi kristina brown . it has been reported that gordon , 25 , has threatened suicide and has been taking xanax since . whitney houston 's daughter was found unconscious in a bathtub in january . on wednesday , access hollywood spoke exclusively to gordon 's stepfather about his son 's state of mind . "]
]
}