开源技术 * IBM 微讲堂:Kubeflow 系列(观看回放 | 下载讲义) 了解详情

概述

光学字符识别(Optical Character Recognition)代码库包含用于实例化和部署光学字符识别模型的代码。此模型接受含文本的图像作为输入,并返回预测文本。该模型已根据来自 8 种不同字体和 4 种属性(常规、粗体、斜体、粗体+斜体)的 94 个字符的 20 个样本(总共 60,160 个训练样本)进行了训练。请参阅论文 An Overview of the Tesseract OCR Engine,获取有关如何训练此模型的更多详细信息。

模型元数据

领域 应用 行业 框架 训练数据 输入数据格式
图像和视频 光学字符识别 通用 n/a Tesseract 数据文件 图像 (PNG/JPG)

参考资料

许可

组件 许可 链接
此代码库 Apache 2.0 许可
模型代码(第三方) Apache 2.0 Tesseract OCR 代码库
测试样本 Apache 2.0 样本 README 文件

此模型的可用部署选项

  • 通过 Dockerhub 进行部署:

    docker run -it -p 5000:5000 codait/max-ocr
    
  • 在 Red Hat OpenShift 上部署:

    遵循本教程中有关 OpenShift Web 控制台或 OpenShift Container Platform CLI 的操作说明,并指定 codait/max-ocr 作为镜像名称。

  • 在 Kubernetes 上部署:

    kubectl apply -f https://raw.githubusercontent.com/IBM/MAX-OCR/master/max-ocr.yaml
    

    可以在此处找到有关如何将此 MAX 模型部署到 IBM Cloud 上的生产环境的更详细的教程。

  • 本地部署:遵循 GitHub 上的模型 README 文件中的操作说明

使用 cURL 测试模型

在部署模型后,可以在命令行中测试该模型。例如,如果在本地运行:

$ curl -F "image=@samples/quick_start_watson_studio.jpg" -XPOST http://localhost:5000/model/predict
{
  "status": "ok",
  "text": [
    [
      "Quick Start with Watson Studio"
    ],
    [
      "Watson Studio is IBM’s hosted notebook service, and you can create",
      "a free account at https://www.ibm.com/cloud/watson-studio.Other",
      "hosted notebook services can be used to run the noteooks as well,",
      "but Watson Studio offers all of the frameworks and languages that",
      "are used for this book’s examples.Once you have created an account",
      "and logged in, you can begin by creating a project and notebook."
    ]
  ]
}

资源与贡献

如果您有兴趣为 Model Asset Exchange 项目做出贡献或有任何疑问,遵循此处的操作说明。

本文翻译自:Optical Character Recognition(2019-11-04)