Participa del Call for Code Global Challenge | Tienes tiempo hasta el 31 de Julio! Responde el llamado

Blog de desarrolladores de IBM

Siga los últimos acontecimientos con IBM Developer y manténgase informado.

Aprende cómo Watson AutoAI puede preparar datos de forma automática, aplicar algoritmos de machine learning y desarrollar pipelines de modelos que se adaptan mejor a tus conjuntos de datos y casos de uso


AutoML es actualmente una palabra de moda que aparece en muchos artículos e investigaciones del sector tecnológico, y es una oferta de productos en muchos catálogos de productos de proveedores. También es uno de los temas sobre los que me preguntan, entre ellos «¿Cómo abordar los productos de AutoML?», «¿Estos productos realizarán todos los pasos del ciclo de vida de machine learning y, como científico de datos, me darán control sobre los parámetros?» Considerando todos los rumores, ¿qué significa AutoML? ¿Por qué optamos por las ofertas de productos de AutoML? ¿Qué es IBM® Watson™ AutoAI? ¿Por qué es una solución tan completa y cómo se puede utilizar con sus mejores capacidades? Intentaré proporcionar toda esta información aquí.

¿No sería conveniente y menos estresante ver cómo tu pipeline de machine learning se completa automáticamente? ¿Automatizar tareas que a los científicos de datos les lleva semanas o incluso meses terminar? Este es el concepto fundamental de AutoML. Es fundamental que tomes tus datos y los ingreses en un software que analizará automáticamente tus datos y generará previsiones sólidas. Este «software» al que me refiero es un modelo completo de machine learning implementado que se puede utilizar para resolver muchos casos de uso diferentes del mundo real.

Una de las preguntas principales es «¿Por qué automated machine learning?» Para comenzar, primero debemos analizar las desventajas del machine learning tradicional. Existe una gran demanda de científicos de datos y especialistas en machine learning en todo el mundo, pero las habilidades actuales que tenemos no pueden satisfacer esa demanda. ¿Por qué sucede esto? Porque el desarrollo de un modelo predictivo lleva mucho tiempo, requiere mucho esfuerzo y requiere una gran cantidad de conocimiento de todos estos complejos algoritmos de machine learning.

Hay algunas tareas dentro del ciclo de vida de la inteligencia artificial que son triviales y monótonas y pueden automatizarse, lo que nos lleva esencialmente a las etapas de «inteligencia artificial diseñando inteligencia artificial e inteligencia artificial optimizando inteligencia artificial». Este es el principal objetivo detrás de cualquier AutoML actual. Esto nos lleva a Watson AutoAI, una oferta de IBM Cloud que prepara datos de forma automática, aplica algoritmos de machine learning y crea pipelines de modelos que se adaptan mejor a tus conjuntos de datos y casos de uso. AutoAI puede ayudar a resolver tus problemas relacionados con la regresión o clasificación en pocos segundos. ¿No es genial?

Desde la etapa de preparación de datos hasta el despliegue del modelo (incluida la optimización de hiperparámetros), la selección del mejor algoritmo/modelo e ingeniería de funciones, AutoAI se encarga de todo. Es una herramienta útil para que los principiantes la utilicen para comprender qué modelo funciona mejor, para qué tipo de conjunto de datos y qué caso de uso.

Gestión del ciclo de vida de la inteligencia artificial

Ahora, profundicemos un poco más en algunas etapas que AutoAI puede automatizar por nosotros.

Preparación de datos: como desarrolladores o científicos de datos, todos hemos visto conjuntos de datos inconsistentes con valores faltantes o redundantes. Personalmente, he pasado horas preparando conjuntos de datos utilizando Data Refinery. Una tarea bastante complicada, ¿no? El manejo de estos valores faltantes, la conversión de tipos de atributos y la normalización de conjuntos de datos es una de las primeras etapas en un pipeline de ciencia de datos, y AutoAI realiza este paso en pocos segundos. AutoAI utiliza múltiples algoritmos para limpiar y preparar los conjuntos de datos. También es posible clasificar características como numéricas o categóricas y realizar escalas variables, lo que a su vez reduce el sesgo de machine learning.

Ingeniería automatizada de funciones: elegir la combinación perfecta de funciones dentro de un conjunto de datos que mejor representa el caso de uso es un proceso que requiere mucho tiempo. AutoAI utiliza un enfoque único en su tipo para reducir el espacio y las opciones de funciones, al tiempo que mejora la precisión del modelo mediante el aprendizaje por refuerzo.

Optimización de hiperparámetros: cuando se analizan los modelos de machine learning, una de las cuestiones más desafiantes que debemos enfrentar es qué configuración de hiperparámetros funciona mejor para un caso de uso y datos de entrada determinados. AutoAI utiliza un algoritmo de optimización de hiperparámetros que está optimizado para evaluaciones de funciones costosas que refinan los pipelines de mejor rendimiento.

Selección de modelo automatizada: ¿Utilizamos un clasificador de bosque aleatorio o un clasificador LightGBM para nuestro caso de uso? ¿Cuál se adapta mejor a nuestro conjunto de datos y caso de uso? La selección automatizada de modelos es uno de los pasos más importantes realizados por AutoAI. Utiliza un enfoque innovador que prepara la clasificación de los algoritmos candidatos frente a pequeños subconjuntos de datos, aumentando gradualmente el tamaño del subconjunto para que los algoritmos más prometedores lleguen a la mejor opción.

Funciones

Solo es necesario cargar tus conjuntos de datos, seleccionar la columna que quieres predecir y hacer clic en Ejecutar experimento. Esto facilita que un principiante comience a practicar realizando solo dos pasos. También fomenta una mejor comprensión de los mejores algoritmos de machine learning para casos específicos de uso. AutoAI ofrece a los desarrolladores la comodidad de desplegar sus pipelines de modelos finales como un servicio web o exportarlos como un script de Python.

Resumen

En resumen, AutoAI puede ayudar a simplificar el complicado y lento proceso de desarrollo de la inteligencia artificial al automatizarlo por ti, desde la preparación de datos hasta el despliegue del modelo. Como científicos de datos, nos liberamos de los procesos de limpiar manualmente los datos y explorar, desarrollar y supervisar modelos de machine learning que son mejores para nuestro caso de uso, y pueden liberar nuestro tiempo para tareas más importantes dentro del pipeline.

Para aprender más sobre cómo AutoAI puede automatizar la preparación de datos, desarrollo de modelos, ingeniería de funciones y optimización de hiperparámetros, consulta AutoAI: humanos y máquinas mejor juntos.