开源技术 * IBM 微讲堂:Kubeflow 系列(观看回放 | 下载讲义) 了解详情

概述

文本情感分类器(Text Sentiment Classifier )可以检测出文本片段是倾向于正面还是负面情绪。底层的神经网络基于预训练的 BERT-Base English Uncased 模型,并根据 IBM Claim Stance Dataset 进行了调优。

此模型的最佳输入示例是语法正确的短字符串(最好是单个句子),但这不是必要条件。

模型元数据

领域 应用 行业 框架 训练数据 输入数据
自然语言处理 (NLP) 情绪分析 通用 TensorFlow IBM Claim Stance Dataset 文本

基准

下表中列出了此模型在测试集(包含三个不同数据集)上的预测准确性。

第一行展示了此模型根据 IBM Claims Dataset 进行调优后的泛化能力。 Sentiment140(推文)和 IMDB Reviews 数据集仅用于评估此模型的迁移学习能力。此代码库中的实现 尚未 根据 Sentiment140 或 IMDB Reviews 数据集进行训练或调优。

第二行描述了 BERT-Base (English – Uncased) 模型在根据特定任务进行调优后的性能。这仅供参考之用,因此无法提供权重。

当输入数据与用于调优的数据(例如,根据 IBM Claims Dataset 进行调优时的 Sentiment140(推文))相似时,泛化效果(第一行)将非常好。但是,当提供其他样式的文本作为输入,并且中位数较长(例如,多句 IMDB Reviews)时,泛化效果将不那么理想。

模型类型 IBM Claims Sentiment140 IMDB Reviews
此模型
(根据 IBM Claims 进行调优)
94% 83.84% 81%
根据特定数据集进行调优的模型 94% 84% 90%

参考资料

许可

组件 许可 链接
模型 GitHub 代码库 Apache 2.0 许可
调优模型权重 Apache 2.0 许可
预训练模型权重 Apache 2.0 许可
模型代码(第三方) Apache 2.0 许可
用于调优的 IBM Claims Stance Dataset CC-BY-SA 许可 1
许可 2

此模型的可用部署选项

可以使用以下方式来部署此模型:

  • 通过 Dockerhub 进行部署:

    docker run -it -p 5000:5000 codait/max-text-sentiment-classifier
    
  • 在 Red Hat OpenShift 上部署:

    遵循本教程中有关 OpenShift Web 控制台或 OpenShift Container Platform CLI 的操作说明,并指定 codait/max-text-sentiment-classifier 作为镜像名称。

  • 在 Kubernetes 上部署:

    kubectl apply -f https://raw.githubusercontent.com/IBM/MAX-Text-Sentiment-Classifier/master/max-text-sentiment-classifier.yaml
    

    可以在此处找到有关如何将此 MAX 模型部署到 IBM Cloud 上的生产环境的更详细的教程。

  • 本地部署:遵循 GitHub 上的模型 README 文件中的操作说明

用法示例

您可以测试或使用此模型

使用 cURL 测试模型

在部署模型后,可以在命令行中测试该模型。例如:

curl -d "{ \"text\": [ \"The Model Asset Exchange is a crucial element of a developer's toolkit.\"]}" -X POST "http://localhost:5000/model/predict" -H "Content-Type: application/json"

您应该会看到与下面类似的 JSON 响应:

{
  "status": "ok",
  "predictions": [
    [
      {
        "positive": 0.9977352619171143,
        "negative": 0.0022646968718618155
      }
    ]
  ]
}

在无服务器应用程序中测试模型

通过遵循在 IBM Cloud Functions 中利用深度学习教程中的操作说明,可以在无服务器应用程序中使用此模型。

此模型的可用训练选项

可以使用以下机制来训练此模型:

资源与贡献

如果您有兴趣为 Model Asset Exchange 项目做出贡献或有任何疑问,遵循此处的操作说明。

本文翻译自:Text Sentiment Classifier(2019-03-29)