Não perca o Workshop “Observabilidade Empresarial: Importância e Benefícios do Insight Imediato” Inscreva-se já!

Desenvolva um modelo preditivo de aprendizado de máquina de forma rápida e fácil com o IBM SPSS Modeler

Neste tutorial, usaremos o IBM Cloud Pak for Data para desenvolver um modelo preditivo de aprendizado de máquina com o IBM SPSS Modeler e decidir se um cliente bancário irá inadimplir um empréstimo. O IBM Cloud Pak for Data é um ambiente interativo, colaborativo e baseado em nuvem que permite que desenvolvedores e cientistas de dados trabalhem colaborativamente, obtenham insights a partir de dados e desenvolvam modelos de aprendizado de máquina.

Objetivos de aprendizagem

Após concluir este tutorial, você aprenderá como:

  • Fazer upload de dados ao IBM Cloud Pak for Data.
  • Criar um fluxo do SPSS Modeler.
  • Utilizar a ferramenta SPSS para inspecionar dados e obter insights.
  • Modificar e preparar dados para criação de modelo de IA usando o SPSS.
  • Treinar um modelo de aprendizado de máquina com o SPSS e avaliar os resultados.

Pré-requisitos

Tempo estimado

A conclusão deste tutorial deve levar cerca de 30 minutos

Etapas

  1. Crie um projeto e faça upload dos dados.
  2. Crie um fluxo do SPSS Modeler.
  3. Importe os dados.
  4. Inspecione os dados.
  5. Preparação de dados.
  6. Treine o modelo de ML.
  7. Evaluate the results

Etapa 1. Crie um projeto e faça upload dos dados.

Se você ainda não tiver criado um projeto para esta linha de aprendizagem, siga as instruções abaixo para criar um. Caso contrário, você pode pular para Criar um fluxo do SPSS Modeler.

Crie um projeto do IBM Cloud Pak for Data

No Cloud Pak for Data, usamos o conceito de um projeto para coletar/organizar os recursos utilizados que atingem um determinado objetivo (recursos que constroem uma solução para um problema). Os recursos do seu projeto podem incluir dados, colaboradores e ativos analíticos, tais como blocos de notas e modelos, etc.

  • Acesse o menu de navegação (☰) e sob a seção Projects clique em Todos os projetos..

    Botão Novo projeto no canto superior direito.

  • Botão de novo projeto na parte superior direita.

    Comece um novo projeto

  • Selecione o botão de opções Projeto de análise de dados e clique no botão Próximo .

    Comece um novo projeto

  • Selecione Criar um projeto vazio..

    Criar um projeto vazio

  • Forneça um nome e descrição opcional para o projeto e clique em Criar.

    Escolha um nome

Faça download do conjunto de dados para este experimento e carregue-o no seu projeto.

  • Faça download do conjunto de dados german_credit_data.csv dataset.

  • Faça upload do conjunto de dados, para o projeto de análise de dados, clicando em Procurar e selecionando o arquivo transferido por download.

Etapa 2. Crie um fluxo do SPSS Modeler

    1. A partir da página inicial do Projeto, clique em Incluir ao Projeto e escolha fluxo do Modeler.

      Adicionar fluxo do moderador

  1. Dê ao fluxo um nome relevante, tal como Fluxo de Risco de Crédito, e, em seguida, clique em Criar.

    Criar fluxo

Etapa 3. Importe os dados

  1. Na área de janela à esquerda, expanda Importar e, em seguida, arraste e solte o nó Ativo de Dados na tela. Dê um clique duplo no nó que foi solto na tela e clique em Mudar ativo de dados.

    Ativo de dados

  2. Na página Ativos, abra a guia Ativos de dados escolha o arquivo german_credit_data.csv que você anteriormente transferiu por upload e clique em Selecionar.

    Importar dados

  3. Quando os dados estiverem importados, clique em Salvar.

    Guardar dados

Etapa 4. Inspecione os dados

  1. Para obter insight sobre seus dados, abra a guia Saída e arraste e solte o nó auditoria de dados na tela. Passe o mouse sobre o nó Ativo de Dados que foi anteriormente arrastado e solto na tela. Ele deve ter um ícone circular azul na lateral. Clique no ícone e arraste sobre o nó Auditoria de Dados. Isso conectará os dois nós.

    Auditoria de dados

  2. Passe o mouse sobre o nó Auditoria de Dados e clique nos três pontos verticais para abrir o menu para o nó. Alternativamente, clique com o botão direito do mouse no nó Auditoria de Dados e clique em Executar.

    Inspeção de dados

  3. Assim que estiver pronta, a saída pode ser visualizada ao abrir o menu Saídas à direita. Clique no ícone “olho” para abrir a Auditoria de Dados (Auditoria de Dados de [21 campos]) e visualizar estatísticas sobre os dados.

Abrir inspeção de dados

statísticas de inspeção de dados

4.Clique no X no canto superior direito para fechar a janela.

Estatísticas de inspeção de dados

Etapa 5. Preparação de dados

  1. Expanda o guia Operações de Campo e arraste e solte o nó Tipo na tela. Conecte o nó Ativo de Dados ao nó Tipo e, em seguida, dê um clique duplo no nó Tipo para efetuar as configurações necessárias.

    Modelo

  2. Clique em Ler Valoress. Assim que a operação de leitura concluir, verifique se a medida e a função para cada campo está correta. Altere a função de Risco de Entrada para Destino, e, em seguida, clique em Salvar para fechar a guia.

    Preparação de dados

Etapa 6. Treine o modelo de ML

  1. Expanda a guia Modelagem e, em seguida, arraste e solte o nó Floresta Aleatória na tela. Conecte o nó Tipo ao nó Floresta Aleatória. O nó Floresta Aleatória será automaticamente renomeado para Risco.

    Floresta aleatória

  2. Clique com o botão direito do mouse no nó Floresta Aleatória e clique em Executar. Quando a execução estiver concluída, você verá um novo nó Risco similar a uma pepita dourada incluído à tela.

    Comece a treinar

  3. Clique com o botão direito do mouse no novo nó Risco de pepita dourada e escolha Visualizar para inspecionar os resultados de saída.

    Pré-visualizar o resultado da floresta aleatória

Etapa 7. Avalie os resultados

  1. Expanda o guia Saída e, em seguida, arraste e solte um nó Análise na tela. Conecte o nó Risco de pepita dourada ao nó Análise. Clique com o botão direito do mouse no nó Análise e clique em Executar.

    Análise

  2. A partir da guia Saídas à direita, clique no ícone “olho”, próximo à análise de [Risco], para obter insight sobre a precisão dos resultados.

    Saída de análise

    Saída de análise

  3. Clique em Retornar para o fluxo para voltar.

  4. Expanda a guia Gráficos e, em seguida, arraste e solte o nó Avaliação na tela. Conecte o nó Risco de pepita dourada ao nó Avaliação. O nó Avaliação será automaticamente renomeado para $R-Risk. Clique com o botão direito do mouse no nó e clique em Executar.

Avaliação

  1. Dê um clique duplo no ícone “olho”, próximo à saída $R-Risk (avaliação de [$R-Risk]: Ganhos), para visualizar o gráfico para os Ganhos. Isso proporcionará a Taxa Positiva prevista (ou suporte do classificador) vs. a Taxa Positiva Verdadeira (ou sensibilidade do classificador).

    Gráfico de avaliação

Resumo

Este tutorial demonstrou um pequeno exemplo da criação de um modelo preditivo de aprendizado de máquina no IBM SPSS Modeler no IBM Cloud Pak for Data. Ele abordou a importação de dados ao projeto e ao fluxo do modelador, assim como a preparação dos dados para modelagem e, em seguida, as etapas de escolha de um algoritmo adequado para os dados e o treinamento de um modelo de previsão. O última etapa explicou como visualizar e avaliar os resultados do modelo treinado.