开源技术 * IBM 微讲堂:Kubeflow 系列(观看回放 | 下载讲义) 了解详情

新闻文本生成器

概述

新闻文本生成器(News Text Generator)可以生成类似于十亿单词基准数据集中文本的英文文本。该模型的输入是简单文本文件,输出则是字符串,其中包含预计将跟在输入文本之后的单词。该模型的词汇量约为 800,000 个单词。

模型元数据

领域 应用 行业 框架 训练数据 输入数据格式
文本 语言建模 通用 TensorFlow 十亿单词基准数据集 文本

参考资料

许可

组件 许可 链接
模型 GitHub 代码库 Apache 2.0 许可
模型权重 Apache 2.0 TensorFlow 模型仓库许可
模型代码(第三方) Apache 2.0 TensorFlow 模型仓库许可

可用于部署此模型的选项

  • 从 Dockerhub 部署:

    docker run -it -p 5000:5000 codait/max-news-text-generator
    
  • 在 Red Hat OpenShift 上部署:

    遵照本教程中有关 OpenShift Web 控制台或 OpenShift Container Platform CLI 的操作说明,并将 codait/max-news-text-generator 指定为图像名称。

  • 在 Kuberneters 上部署:

    kubectl apply -f https://raw.githubusercontent.com/IBM/MAX-News-Text-Generator/master/max-news-text-generator.yaml
    

    有关如何将此 MAX 模型部署到 IBM Cloud 上的生产环境中的更详细教程,可以在此处找到。

  • 本地部署:遵照 GitHub 上的模型 README 中的说明进行操作

用法示例

部署之后,您可以通过命令行测试该模型。例如:

curl -F "text=@data/sample1.txt" -XPOST http://localhost:5000/model/predict

您应该会看到类似如下的 JSON 响应:

{"status": "ok", "pred_txt": [{"pred_txt": "This is a test case .. but this is at least an investigation into the types of accidents they are involved  .</S> "}]}

资源和贡献

如果您有兴趣为 Model Asset Exchange 项目做贡献或有任何疑问,按照此处的说明进行操作。

本文翻译自:News Text Generator(2018-09-21)