此 Code Pattern 已纳入 IBM Maximo Visual Inspection 入门学习路径。
级别 | 主题 | 类型 |
---|---|---|
100 | 计算机视觉简介 | 文章 |
101 | IBM Maximo Visual Inspection 简介 | 文章 |
201 | 构建并部署 IBM Maximo Visual Inspection 模型并在 iOS 应用中使用 | 教程 |
202 | 通过对象检测定位并统计物体 | Code Pattern |
203 | 使用 OpenCV 和深度学习对视频中的对象进行跟踪 | Code Pattern |
301 | 验证计算机视觉深度学习模型 | Code Pattern |
302 | 使用 IBM Maximo Visual Inspection 针对 AI 项目开发分析仪表板 | Code Pattern |
303 | 自动化视觉识别模型训练 | Code Pattern |
304 | 在仪表板中加载 IBM Maximo Visual Inspection 推断结果 | Code Pattern |
305 | 构建对象检测模型以从汽车图像中识别车牌 | Code Pattern |
306 | 自动化视频分析 | Code Pattern |
307 | 通过 AI 对实时摄像头流和视频收集洞察 | Code Pattern |
摘要
在此 Code Pattern 中,学习如何使用光学字符识别 (OCR) 和 IBM Maximo Visual Inspection 对象识别服务来识别和读取车牌。
概览
通过使用 IBM Maximo Visual Inspection 和自定义推理脚本,您可以构建对象检测模型以从汽车图像中识别车牌。IBM Maximo Visual Inspection 对象识别服务中的模型可以识别表示车牌的图像部分。然后,自定义后的推理脚本可以裁剪该区域,并使用开源代码对文本执行 OCR 以返回车牌。该用例是工作场所、公寓大楼或购物中心停车场等区域自动门禁系统的理想选择。
完成本 Code Pattern 后,您将掌握如何:
- 构建对象检测模型
- 在检测到特定对象时触发后处理脚本
- 使用 Python
Opencv
库来准备要执行 OCR 操作的图像 - 调整 Tesseract OCR 以检测特定字体
流程
- 用户通过 UI 或 API REST 调用将汽车图像上载到 IBM Maximo Visual Inspection。
- PowerAI 模型识别图像中的对象,并指出牌照在图像中的位置。
- IBM Maximo Visual Inspection 后处理脚本将裁剪后的车牌图像发送到自定义 OCR 服务器。
- Python 脚本通过
opencv
将车牌图像作为 NumPy 数组加载,并使用多种处理算法去除背景噪音和提取车牌数字。 - 对处理后的图像使用 Tesseract OCR。
- 用户通过终端日志接收带有车牌文本的 JSON 对象。
操作说明
在 readme 文件中可找到本 Pattern 的详细步骤。这些步骤将展示如何:
- 部署 Kubernetes 集群。
- 将训练图像上载到 IBM Maximo Visual Inspection。
- 在 IBM Maximo Visual Inspection 中训练和部署模型。
- 克隆代码存储库。
- 部署 OCR 服务器。
结束语
此 Code Pattern 介绍了如何使用 OCR 和 IBM Maximo Visual Inspection 对象识别服务来识别和读取车牌。此 Code Pattern 是 IBM Maximo Visual Inspection 入门学习路径的最后一部分。恭喜!现在,您应该已经基本了解了 IBM Maximo Visual Inspection 及其部分高级功能。若想要了解更多信息,可查阅 IBM Maximo Visual Inspection 页面。
本文翻译自:Build an object detection model to identify license plates from images of cars(2020-06-16)