开源技术 * IBM 微讲堂:Kubeflow 系列(观看回放 | 下载讲义) 了解详情

构建对象检测模型以从汽车图像中识别车牌

此 Code Pattern 已纳入 IBM Maximo Visual Inspection 入门学习路径

摘要

在此 Code Pattern 中,学习如何使用光学字符识别 (OCR) 和 IBM Maximo Visual Inspection 对象识别服务来识别和读取车牌。

概览

通过使用 IBM Maximo Visual Inspection 和自定义推理脚本,您可以构建对象检测模型以从汽车图像中识别车牌。IBM Maximo Visual Inspection 对象识别服务中的模型可以识别表示车牌的图像部分。然后,自定义后的推理脚本可以裁剪该区域,并使用开源代码对文本执行 OCR 以返回车牌。该用例是工作场所、公寓大楼或购物中心停车场等区域自动门禁系统的理想选择。

完成本 Code Pattern 后,您将掌握如何:

  • 构建对象检测模型
  • 在检测到特定对象时触发后处理脚本
  • 使用 Python Opencv 库来准备要执行 OCR 操作的图像
  • 调整 Tesseract OCR 以检测特定字体

流程

OCR 车牌流程图

  1. 用户通过 UI 或 API REST 调用将汽车图像上载到 IBM Maximo Visual Inspection。
  2. PowerAI 模型识别图像中的对象,并指出牌照在图像中的位置。
  3. IBM Maximo Visual Inspection 后处理脚本将裁剪后的车牌图像发送到自定义 OCR 服务器。
  4. Python 脚本通过 opencv 将车牌图像作为 NumPy 数组加载,并使用多种处理算法去除背景噪音和提取车牌数字。
  5. 对处理后的图像使用 Tesseract OCR。
  6. 用户通过终端日志接收带有车牌文本的 JSON 对象。

操作说明

readme 文件中可找到本 Pattern 的详细步骤。这些步骤将展示如何:

  1. 部署 Kubernetes 集群。
  2. 将训练图像上载到 IBM Maximo Visual Inspection。
  3. 在 IBM Maximo Visual Inspection 中训练和部署模型。
  4. 克隆代码存储库。
  5. 部署 OCR 服务器。

结束语

此 Code Pattern 介绍了如何使用 OCR 和 IBM Maximo Visual Inspection 对象识别服务来识别和读取车牌。此 Code Pattern 是 IBM Maximo Visual Inspection 入门学习路径的最后一部分。恭喜!现在,您应该已经基本了解了 IBM Maximo Visual Inspection 及其部分高级功能。若想要了解更多信息,可查阅 IBM Maximo Visual Inspection 页面。

本文翻译自:Build an object detection model to identify license plates from images of cars(2020-06-16)