Localize e conte itens com detecção de objeto

Apresentação

A detecção de objeto tem usos e oportunidades diferentes dos da classificação de imagem. Este padrão de código demonstra como usar o IBM Maximo Visual Inspection Object Detection para detectar e rotular objetos dentro de uma imagem (neste caso, produtos da Coca-Cola) com base em treinamento customizado. É possível customizar facilmente este exemplo de conjunto de dados inicial com seus conjuntos de dados sem gravar qualquer código.

Descrição

Imagine que você é fornecedor de um item (por exemplo, um refrigerante) e quer saber quantas garrafas existem na prateleira da loja. É possível desenvolver um aplicativo para ajudá-lo a fazer exatamente isso. O IBM Maximo Visual Inspection utiliza deep learning para criar modelos treinados com base em imagens transferidas por upload e rotulá-los. Não é preciso gravar nenhum código para treinar, implementar e testar um novo modelo de detecção de objeto. Basta você fazer upload das imagens, usar o mouse para rotular os objetos nas imagens e, depois, deixar o IBM Maximo Visual Inspection fazer o aprendizado.

Com esse padrão, você usará o treinamento deep learning para criar um modelo para detecção de objeto. Com apenas alguns cliques, é possível treinar e implementar o modelo. Após isso, um terminal REST lhe permite localizar e contar itens em uma imagem. O padrão de código inclui um conjunto de dados de exemplo para ajudá-lo a desenvolver um detector de garrafas de Coca-Cola, mas é possível usar seus próprios exemplos e detectar outros objetos.

O IBM Maximo Visual Inspection apresenta APIs de REST para operações de inferência. É possível usar qualquer cliente REST para detecção de objeto com seu modelo customizado e usar a UI do IBM Maximo Visual Inspection para testá-lo. Este exemplo inclui um aplicativo Node.js de exemplo que demonstra como fazer upload de uma imagem e depois desenhar a imagem com rótulos e caixas delimitadoras em torno dos objetos detectados.

Após concluir esse padrão de código, você deverá saber:

  • Crie um conjunto de dados para detecção de objeto com o IBM Maximo Visual Inspection.
  • Treine e implemente um modelo com base no conjunto de dados.
  • Teste o modelo usando chamadas REST.

Fluxo

Fluxograma das etapas para criação do app

  1. Faça upload das imagens para criar um conjunto de dados do IBM Maximo Visual Inspection.
  2. Rotule os objetos no conjunto de dados da imagem antes do treinamento.
  3. Treine, implante e teste o modelo no IBM Maximo Visual Inspection.
  4. Use um cliente REST para detectar objetos nas imagens.

Instruções

Encontre as etapas detalhadas deste padrão no arquivo README. Essas etapas mostrarão como:

  1. Clonar o repositório powerai-vision-object-detection GitHub.
  2. Efetuar login no IBM Maximo Visual Inspection.
  3. Criar um novo conjunto de dados para o treinamento de detecção de objeto.
  4. Criar tags para objetos de treinamento e rotular os objetos.
  5. Criar uma tarefa DL.
  6. Implementar e testar o modelo.
  7. Executar o aplicativo.

Aviso

O conteúdo aqui presente foi traduzido da página IBM Developer US. Caso haja qualquer divergência de texto e/ou versões, consulte o conteúdo original.

Legend