¡Participa de la Maratón Behind the Code, la competencia de programación más desafiante! Inscríbete aqui

Crea un modelo predictivo de machine learning de manera rápida y sencilla con IBM SPSS Modeler

Módulos de esta ruta de aprendizaje

# Tipo Titulo Descripción
1 Artículos Introducción a IBM Cloud Pak for Data Conoce los conceptos básicos de IBM Cloud Pak for Data
2 Artículos Introducción a IBM Cloud Pak for Data (Parte 2) Comprende sus funciones y adquiere conocimientos prácticos de los diferentes pasos y tareas
3 Tutoriales Virtualización de datos en IBM Cloud Pak for Data Utiliza la virtualización de datos en IBM Cloud Pak for Data para realizar consultas en varios orígenes de datos
4 Tutoriales Visualización de datos con Data Refinery Utilice IBM Cloud Pak for Data para filtrar, limpiar y visualizar datos
5 Tutoriales Buscar, preparar y comprender datos con Watson Knowledge Catalog Resuelve los problemas de gobernanza de datos empresariales utilizando Watson Knowledge Catalog en la plataforma IBM Cloud Pak for Data
6 Tutoriales Automatizar la creación de modelos con AutoAI Aprende cómo se pueden manejar los problemas de regresión y clasificación sin necesidad de código
7 Tutoriales Crea un modelo predictivo de machine learning de manera rápida y sencilla con IBM SPSS Modeler Aprovecha los activos de datos y las aplicaciones modernas con algoritmos y modelos listos para usar
8 Code Pattern Cómo resolver un problema de negocio y pronosticar la rotación de clientes utilizando un conjunto de datos de pérdida de clientes Utiliza Watson Machine Learning y Jupyter Notebooks en IBM Cloud Pak for Data para pronosticar la pérdida de clientes
9 Code Pattern Monitoreo del modelo con Watson OpenScale Entrena, crea y despliega un modelo de machine learning con IBM Watson Machine Learning en IBM Cloud Pak for Data

En este tutorial, utilizaremos IBM Cloud Pak for Data para crear un modelo predictivo de machine learning con IBM SPSS Modeler y decidir si un cliente de telecomunicaciones abandonará su relación con la empresa o no. IBM Cloud Pak® for Data es un entorno interactivo y colaborativo basado en la nube que permite a los desarrolladores y científicos de datos trabajar en colaboración, obtener insights de los datos y crear modelos de machine learning.

Objetivos de aprendizaje

Tras completar este tutorial, aprenderás a:

  • Subir datos en IBM Cloud Pak for Data

  • Crear un flujo de SPSS® Modeler.

  • Utilizar la herramienta de SPSS para inspeccionar datos y obtener insights.

  • Modificar y preparar datos para la creación de modelos de IA mediante SPSS.

  • Entrenar un modelo de machine learning con SPSS y evaluar los resultados.

Prerrequisitos

Tiempo estimado

Completar este tutorial debería llevar aproximadamente 30 minutos.

Pasos

  1. Crear un proyecto y subir los datos

  2. Crear un flujo de SPSS Modeler

  3. Importar los datos

  4. Inspeccionar los datos

  5. Preparar los datos

  6. Entrenar el modelo de ML

  7. Evaluar los resultados

Paso 1. Crear un proyecto y subir los datos

Crear un proyecto de IBM Cloud Pak for Data

1.Utilizando un navegador, inicia sesión en la instancia de ICP4D y haz clic en el menú hamburguesa (☰) en la esquina superior izquierda; luego, haz clic en Projects (Proyectos). En la página Projects (Proyectos), haz clic en New Project + (Nuevo proyecto +).

Dashboard de IBM Cloud Pak for Data, crear nuevo proyecto

2.Selecciona Analytics project (Proyecto de análisis) y haz clic en Next (Siguiente).

Crear un nuevo proyecto

3.Selecciona Create an empty project (Crear un proyecto nuevo).

Seleccionar el crear un nuevo proyecto en blanco del listado

4.Asigna al proyecto un nombre y una descripción opcional, luego haz clic en Create (Crear).

Configurar la creación del nuevo proyecto

Se abre la página de activos de datos, que es donde se almacenan y se organizan los activos del proyecto.

Subir los datos

1.Descarga el conjunto de datos Telco-Customer-Churn.csv.(CSV, 970 KB)

2.En la pestaña Assets (Activos) de tu proyecto, haz clic en el icono 01/00. Es posible arrastrar y soltar el archivo o hacer clic en Browse (Buscar) para elegir y para subir el archivo Telco-Customer-Churn.csv.

Panel de assets del nuevo proyecto

Paso 2. Crear un flujo de SPSS Modeler

1.En la página de inicio del proyecto, haz clic en Add to Project + (Agregar al proyecto +) y elige Modeler flow (Flujo de Modeler).

Seleccionar tipo de asset del panel listado

2.Asigna al flujo un nombre significativo, como por ejemplo Flujo de abandono del cliente de telecomunicaciones y luego haz clic en Create (Crear).

Panel de configuración del nuevo asset previo a su creación

Paso 3. Importar los datos

1.En el panel izquierdo, expande Import (Importar) y luego arrastra y suelta un nodo Activo de datos en el lienzo. Haz doble clic en el nodo del lienzo y pulsa Change data asset (Cambiar activo de datos).

Importar un asset de datos dentro del dashboard del proyecto

2.En la página Assets (Activos), abre la pestaña Data Assets (Activos de datos), elige el archivo Telco-Customer-Churn.csv subido anteriormente y haz clic en OK (Aceptar).

Seleccionar el asset de datos dentro del listado

3.Haz clic en Save (Guardar).

Guardar la selección de asset de datos

Paso 4. Inspeccionar los datos

1.Para obtener insights acerca de los datos, abre la pestaña Output (Salida) y arrastra y suelta el nodo Auditoría de datos en el lienzo. Al pasar el cursor sobre el nodo Activo de datos que se arrastró y soltó en el lienzo anteriormente, debería mostrarse un ícono circular azul en el lateral. Haz clic en el ícono y arrástralo hasta el nodo Auditoría de datos. Esto conectará los dos nodos. El nombre del nodo Auditoría de datos cambiará automáticamente a 21 Campos.

Coordinar el asset de datos con un output dentro del dashboard

2.Pasa el cursor sobre el nodo Auditoría de datos y haz clic en los tres puntos verticales para abrir el menú del nodo. Como alternativa, haz clic con el botón derecho en el nodo Auditoría de datos y selecciona Run (Ejecutar). Una vez que esté listo, el resultado se puede ver abriendo el menú Outputs (Salidas) a la derecha. Haz doble clic en la salida (Auditoría de datos de [21 Campos]) para ver las estadísticas sobre los datos.

Correr la coordinación de datos dentro del dashboard

Listado de datos dentro del output

3.Haz clic en Return to flow (Volver al flujo) para volver atrás.

Paso 5. Preparar los datos

1.Expande la pestaña Field Operations (Operaciones de campo) y arrastra y suelta el nodo Tipo en el lienzo. Conecta el nodo Activo de datos con el nodo Tipo y luego haz doble clic en el nodo Tipo para realizar las configuraciones necesarias.

Seleccionar y coordinar operaciones dentro del dashboard

2.Haz clic en Read Values (Leer valores). Una vez completada la operación de lectura, comprueba que la medida y la función de cada campo son correctas. Cambia la función de churn (abandono) de Input (Entrada) a Target (Objetivo) y luego haz clic en Save (Guardar) para cerrar la pestaña.

Marcar los valores a utilizar dentro del listado

Paso 6. Entrenar el modelo de ML

1.Expande la pestaña Modeling (Modelación) y luego arrastra y suelta el nodo Bosque aleatorio en el lienzo. Conecta el nodo Tipo al nodo Bosque aleatorio. El nombre del nodo Bosque Aleatorio cambiará automáticamente a Abandono.

Seleccionar y coordinar el modelado a utilizar

2.Haz clic con el botón derecho en el nodo Bosque aleatorio y selecciona Run (Ejecutar). Cuando termine la ejecución, verás un nuevo nodo Abandono similar a una pepita dorada agregado al lienzo.

Correr la coordinación de los elementos seleccionados previamente

3.Haz clic con el botón derecho en el nuevo nodo Abandono de la pepita dorada y elige Preview (Vista previa) para inspeccionar los resultados de salida.

Tabla de preview de los datos

Paso 7. Evaluar los resultados

1.Expande la pestaña Salidas y luego arrastra y suelta un nodo Análisis en el lienzo. Conecta el nodo Abandono de la pepita dorada al nodo Análisis. Haz clic con el botón secundario en el nodo Análisis y selecciona Run (Ejecutar).

Agregar y coordinar otro output al proyecto

2.En la pestaña Outputs (Salidas) de la derecha, haz doble clic en la salida del análisis (análisis de [Abandono]) para obtener insights acerca de la precisión de los resultados.

Panel de análisis del output

3.Haz clic en Return to flow (Volver al flujo) para volver atrás.

4.Expande la pestaña Graphs (Gráficos) y luego arrastra y suelta el nodo Evaluación en el lienzo. Conecta el nodo Abandono de la pepita dorada al nodo Evaluación. El nombre del nodo Evaluación cambiará automáticamente a $R-Abandono. Haz clic con el botón derecho sobre el nodo y selecciona Run (Ejecutar).

Correr el proyecto con un nuevo output coordinado en el dashboard

5.Haz doble clic en la salida $R-Abandono (evaluación de [$R-Abandono]: Ganancias) para visualizar el gráfico. Haz clic en Return to flow (Volver al flujo) para volver atrás.

Gráfica de evaluación del output

Resumen

Este tutorial mostró un pequeño ejemplo de creación de un modelo predictivo de machine learning en IBM SPSS Modeler de IBM Cloud Pak for Data. Se revisó cómo importar los datos al proyecto y el flujo del modelador, cómo preparar los datos para la modelación, además de los pasos para elegir un algoritmo apropiado para los datos y entrenar un modelo de predicción. El último paso explicó cómo visualizar y evaluar los resultados del modelo entrenado.