Resolva um problema de negócios e preveja a inadimplência de empréstimos usando um conjunto de dados de risco de crédito alemão

Resumo

Neste padrão de código do desenvolvedor, usaremos IBM Cloud Pak for Data para percorrer todo o pipeline de ciência de dados para resolver um problema de negócios e prever a inadimplência de empréstimos usando um conjunto de dados de risco de crédito alemão. IBM Cloud Pak for Data é um ambiente interativo, colaborativo e baseado em nuvem. Ele pode ajudar cientistas de dados, desenvolvedores e outros interessados em ciência de dados a utilizar ferramentas para colaborar, compartilhar e reunir insights a partir de seus dados, assim como construir e implementar modelos de aprendizado de máquina e de deep learning.

Descrição

Prever inadimplência de empréstimos é essencial para muitos negócios financeiros e outros relacionados. Para esse caso de uso, o modelo de aprendizado de máquina que estamos desenvolvendo é um modelo de classificação que retornará uma previsão de ‘Risco’ (as características do requerente do empréstimo preveem haver uma boa chance de inadimplência no empréstimo) ou ‘Sem Risco’ (as informações do requerente preveem que o empréstimo será pago). A abordagem que usaremos neste laboratório é usar algumas bibliotecas /estruturas bastante populares para construir o modelo em Python usando um notebook Jupyter.

Após concluir este padrão de código, você entenderá como:

  • Usar o Jupyter Notebooks para carregar, visualizar e analisar dados.
  • Executar o Notebooks em IBM Cloud Pak for Data.
  • Construir, testar e implementar um modelo de aprendizado de máquina usando Spark MLib em IBM Cloud Pak for Data.
  • Implementar um modelo de aprendizado de máquina selecionado para produção usando IBM Cloud Pak for Data.
  • Criar uma aplicação de front-end para interagir com o cliente e começar a consumir seu modelo implementado.

Fluxo

Fluxo do processo

  1. O usuário carrega o Jupyter Notebook na plataforma IBM Cloud Pak for Data.
  2. Os dados de crédito alemães são carregados no Jupyter Notebook, diretamente do repositório do GitHub ou como dados virtualizados após seguir o tutorial anterior.
  3. Pré-processe os dados, construa modelos de aprendizado de máquina e salve em IBM Watson Machine Learning no IBM Cloud Pak for Data.
  4. Implemente um modelo de aprendizado de máquina selecionado em produção na plataforma IBM Cloud Pak for Data e obtenha um terminal de pontuação.
  5. Use o modelo para previsão de crédito usando uma aplicação de front-end.

Instruções

Pronto para colocar esse padrão de código em uso? Detalhes completos sobre como começar a executar e usar esta aplicação estão no README, incluindo como:

  1. Criar um novo projeto.
  2. Criar um espaço para implementações de aprendizado de máquina.
  3. Fazer upload do conjunto de dados se você não estiver na linha de aprendizagem IBM Cloud Pak for Data.
  4. Importar o Jupyter Notebook para IBM Cloud Pak for Data.
  5. Executar o bloco de notas.
  6. Implementar o modelo usando a IU IBM Cloud Pak for Data.
  7. Testar o modelo.
  8. Criar um app Python Flask que usa o modelo.

Conclusão

Este padrão de código mostrou como usar IBM Cloud Pak for Data e percorrer todo o pipeline de ciência de dados para resolver um problema de negócios e prever a inadimplência de empréstimos usando um conjunto de dados de risco de crédito alemão.