开源技术 * IBM 微讲堂:Kubeflow 系列(11 月 5 日,8:00PM) 了解详情

构建图像分类模型

摘要

本 Code Pattern 演示了如何使用 PyTorch 和深度学习网络对美国手语 (ASL) 字母表进行分类。它使用 PyTorch 模型 zoo 中的预训练模型,并重新训练了网络的最后一部分。

概览

本 Code Pattern 使用 PyTorch 构建和训练深度学习模型,将图像分类为 29 个类别,这些类别包括 26 个 ASL 字母、空格 (space)、Del 和无 (nothing) ,后面可使用这些类来帮助听力不佳的人与他人以及电脑进行沟通。本 Pattern 使用预训练的移动网络,定义分类器,并将其连接到该网络。然后会针对数据集训练此分类器以及网络中的最后一些模块。本 Pattern 使用 IBM® Watson™ Studio 中的 Python 和 GPU 环境进行更快速的训练,您可以下载、探索、构建和训练自己的模型。进一步了解可用的 Watson Studio 环境

学完本 Pattern 之后,您将掌握如何:

  • 从 Kaggle 获取数据集
  • 探索数据并定义用于在训练之前对图像进行预处理的转换器
  • 定义分类器以具备包含 29 个输出的输出层
  • 训练网络的最后一些模块以及定义的分类器
  • 测试训练后的模型

流程

flow

  1. 登录至 Watson Studio。
  2. 获取 Kaggle API 凭证。
  3. 在 Watson Studio 中运行 Jupyter Notebook。

操作说明

可在 readme 文件中获取详细的步骤。这些步骤将展示如何:

  1. 注册 Watson Studio。
  2. 创建一个新项目。
  3. 创建 Notebook。
  4. 运行该 Notebook。
  5. 测试模型。

本文翻译自:Build an image classification model(2020-08-05)