Classifique os dados de streaming com um modelo de aprendizado de máquina

Isto faz parte do Caminho de aprendizado: Introdução ao IBM Streams.

Nível Tópico Tipo
100 Introdução ao IBM Streams Artigo
101 Crie seu primeiro aplicativo IBM Streams sem escrever código Tutorial
201 Incorpore dados do Apache Kafka Padrão de código
301 Desenvolva um aplicativo de streaming usando uma API Python Padrão de código
401 Classifique os dados de streaming com um modelo de aprendizado de máquina Padrão de código

Resumo

Neste Padrão de código para desenvolvedores, vamos transmitir dados de compras online e usar os dados para rastrear os produtos que cada cliente adicionou ao carrinho. Criaremos um modelo de clustering k-means com scikit-learn para agrupar os clientes de acordo com o conteúdo de seus carrinhos de compras. A atribuição de cluster pode ser usada para prever produtos adicionais para recomendar.

Descrição

Nosso aplicativo será desenvolvido usando o IBM Streams no IBM Cloud Pak® for Data. O IBM Streams fornece um IDE integrado, denominado Streams Flows, que permite a criação visual de um aplicativo de streaming. A plataforma IBM Cloud Pak for Data fornece suporte adicional, como integração com várias origens de dados, análise integrada, notebooks Jupyter e aprendizado de máquina.

Para desenvolver e implementar nosso modelo de aprendizado de máquina, usaremos um notebook Jupyter no IBM Watson® Studio e uma instância do Watson Machine Learning. Em nossos exemplos, ambos são executados no IBM Cloud Pak for Data.

Usando o editor do Streams Flows, criaremos um aplicativo de streaming com estes operadores:

  • Um operador Source que gera uma amostra de dados de sequência de cliques
  • Um operador Filter que mantém apenas os eventos “adicionar ao carrinho”
  • Um operador Code em que usamos código Python para organizar os itens do carrinho de compras em um array de entrada para classificação
  • Um operador WML Deployment para atribuir o cliente a um cluster
  • Um operador Debug para demonstrar os resultados

Fluxo

fluxo

  1. O usuário desenvolve e implementa um modelo de aprendizado de máquina.
  2. O usuário cria e executa um aplicativo IBM Streams.
  3. A interface do usuário do Streams Flow mostra o streaming, a filtragem e a classificação em ação.

Instruções

Pronto para começar? O README explica as etapas para:

  1. Verificar o acesso à sua instância do IBM Streams no Cloud Pak for Data.
  2. Criar um novo projeto no Cloud Pak for Data.
  3. Desenvolver e armazenar um modelo.
  4. Associar o espaço de implementação ao projeto.
  5. Implementar o modelo.
  6. Criar e executar um aplicativo Streams Flow.

Parabéns! Este Padrão de código concluiu a série Introdução ao IBM Streams. Além de explicar o IBM Streams, mostramos como:

  • Criar seu primeiro aplicativo IBM Streams sem escrever código
  • Desenvolver um aplicativo de streaming Apache Kafka
  • Desenvolver um aplicativo de streaming usando uma API Python
  • Classificar os dados de streaming com um modelo de aprendizado de máquina

Agora, você deve ter uma compreensão básica do IBM Streams e de alguns dos recursos dele. Para saber mais, dê uma olhada na série de vídeos Introdução à análise de streaming com o IBM Streams.