¡Participa de la Maratón Behind the Code, la competencia de programación más desafiante! Inscríbete aqui

Cómo resolver un problema de negocio y pronosticar la rotación de clientes utilizando un conjunto de datos de pérdida de clientes

Módulos de esta ruta de aprendizaje

# Tipo Titulo Descripción
1 Artículos Introducción a IBM Cloud Pak for Data Conoce los conceptos básicos de IBM Cloud Pak for Data
2 Artículos Introducción a IBM Cloud Pak for Data (Parte 2) Comprende sus funciones y adquiere conocimientos prácticos de los diferentes pasos y tareas
3 Tutoriales Virtualización de datos en IBM Cloud Pak for Data Utiliza la virtualización de datos en IBM Cloud Pak for Data para realizar consultas en varios orígenes de datos
4 Tutoriales Visualización de datos con Data Refinery Utilice IBM Cloud Pak for Data para filtrar, limpiar y visualizar datos
5 Tutoriales Buscar, preparar y comprender datos con Watson Knowledge Catalog Resuelve los problemas de gobernanza de datos empresariales utilizando Watson Knowledge Catalog en la plataforma IBM Cloud Pak for Data
6 Tutoriales Automatizar la creación de modelos con AutoAI Aprende cómo se pueden manejar los problemas de regresión y clasificación sin necesidad de código
7 Tutoriales Crea un modelo predictivo de machine learning de manera rápida y sencilla con IBM SPSS Modeler Aprovecha los activos de datos y las aplicaciones modernas con algoritmos y modelos listos para usar
8 Code Pattern Cómo resolver un problema de negocio y pronosticar la rotación de clientes utilizando un conjunto de datos de pérdida de clientes Utiliza Watson Machine Learning y Jupyter Notebooks en IBM Cloud Pak for Data para pronosticar la pérdida de clientes
9 Code Pattern Monitoreo del modelo con Watson OpenScale Entrena, crea y despliega un modelo de machine learning con IBM Watson Machine Learning en IBM Cloud Pak for Data

Resumen

En este code pattern para desarrolladores, utilizaremos IBM Cloud Pak® for Data con el fin de revisar todo el proceso de data science para resolver un problema empresarial y pronosticar la rotación de clientes mediante un conjunto de datos de pérdida de clientes de empresas de telecomunicaciones. IBM Cloud Pak for Data es un entorno interactivo, de colaboración y basado en la nube. Permite ayudar a los científicos de datos, desarrolladores y otras personas interesadas en data science a utilizar herramientas para colaborar, compartir y recopilar insights a partir de sus datos, así como a crear y desplegar modelos de machine learning y deep learning.

Descripción

La pérdida de clientes (es decir, cuando un cliente termina su relación con una empresa) es uno de los factores más básicos a la hora de determinar los ingresos de una empresa. Es necesario saber qué clientes son fieles y cuáles están en riesgo de perderse, y conocer los factores que afectan a estas decisiones desde la perspectiva del cliente. Este code pattern explica cómo crear un modelo de machine learning y usarlo para pronosticar si un cliente está en riesgo de terminar su relación con la empresa. Se trata de un proyecto completo de data science y es posible utilizar los hallazgos del modelo para realizar un análisis prescriptivo posterior o utilizarlos para acciones de marketing dirigido.

Al completar este code pattern, comprenderás cómo:

  • Utilizar Jupyter Notebooks para cargar, visualizar y analizar datos.
  • Ejecutar Notebooks en IBM Cloud Pak for Data.
  • Crear, probar y desplegar un modelo de machine learning mediante Spark MLib en IBM Cloud Pak for Data.
  • Desplegar en producción un modelo de machine learning seleccionado utilizando IBM Cloud Pak for Data.
  • Crear una aplicación frontend para interactuar con el cliente y empezar a utilizar tu modelo desplegado.

Flujo

Diagrama de flujo del programa finalizado en IBM Cloud Pak for Data

  1. El usuario carga Jupyter Notebook en la plataforma IBM Cloud Pak for Data.
  2. El conjunto de datos de pérdida de clientes de empresas de telecomunicaciones se carga en Jupyter Notebook, ya sea directamente desde el repositorio de GitHub o como datos virtualizados siguiendo el tutorial anterior.
  3. Los datos se procesan previamente, se crean modelos de machine learning y se guardan en IBM Watson® Machine Learning en IBM Cloud Pak for Data.
  4. El modelo de machine learning seleccionado se despliega en producción en la plataforma IBM Cloud Pak for Data y se obtiene un punto final de puntuación.
  5. Se utiliza el modelo para la predicción de crédito mediante una aplicación frontend.

Instrucciones

¿Listo para poner en práctica este code pattern? Los detalles completos sobre cómo empezar a ejecutar y utilizar esta aplicación se encuentran en el archivo README, que incluye información sobre cómo:

  1. Crear un nuevo proyecto.
  2. Crear un espacio para despliegues de machine learning.
  3. Cargar el conjunto de datos si no se encuentra en la ruta de aprendizaje de IBM Cloud Pak for Data.
  4. Importar Jupyter Notebook a IBM Cloud Pak for Data.
  5. Ejecutar el notebook.
  6. Desplegar el modelo mediante la interfaz de usuario de IBM Cloud Pak for Data.
  7. Probar el modelo.
  8. Crear una aplicación Python Flask que utilice el modelo.

Conclusión

En este code pattern, se mostró cómo utilizar IBM Cloud Pak for Data y se revisó todo el proceso de data science para resolver un problema empresarial y pronosticar la rotación de clientes mediante un conjunto de datos de pérdida de clientes de empresas de telecomunicaciones.