¡Participa de la Maratón Behind the Code, la competencia de programación más desafiante! Inscríbete aqui

Visualizar datos no estructurados con Watson Natural Language Understanding

Este patrón forma parte de la ruta de aprendizaje Introducción al procesamiento del lenguaje natural.

Nivel Tema Tipo
100 Introducción al procesamiento del lenguaje natural de Watson Artículo
101 Observar más detalladamente la función Syntax API en Watson Natural Language Understanding Artículo
201 Visualizar datos no estructurados con Watson Natural Language Understanding Code pattern

Resumen

En este Code pattern, crearemos una aplicación web para visualizar datos no estructurados utilizando Watson™ Natural Understanding, Apache Tika y D3.js. Después de que un usuario carga un archivo local de su elección, la aplicación utiliza Apache Tika para extraer texto del archivo de datos no estructurados. Luego, el texto es analizado por Watson Natural Language Understanding, donde se extraen las entidades y conceptos. Finalmente, la aplicación utiliza la biblioteca D3.js como herramienta de visualización para mostrar los resultados al usuario.

Descripción

El principal beneficio de utilizar Watson Natural Understanding Service es su eficiente motor de análisis que proporciona enriquecimiento cognitivo e insights sobre los datos. Los incrementos clave que se extraen incluyen:

  • Entidades: personas, empresas, organizaciones, ciudades y más
  • Palabras clave: temas importantes que se suelen utilizar para indexar o buscar datos
  • Conceptos: conceptos generales identificados a los que no se hace referencia necesariamente en los datos
  • Sentimiento: el sentimiento general positivo o negativo de los datos

Los incrementos se mostrarán utilizando D3.js, una biblioteca de JavaScript que proporciona eficientes técnicas de visualización que ayudan a dar vida a los datos. En esta aplicación, lo usaremos para mostrar cada uno de los incrementos en una nube de burbujas interactiva, con el tamaño y ubicación de cada elemento determinados por su importancia relativa.

Cuando hayas completado este Code pattern, comprenderás cómo:

  • Crear y utilizar una instancia de Watson Natural Language Understanding
  • Aprovechar Apache Tika para extraer texto de archivos no estructurados
  • Usar D3.js para desplegar las imágenes

Flujo

flujo

  1. El usuario configura las credenciales para el servicio Watson Natural Language Understanding e inicia la aplicación.
  2. El usuario selecciona el archivo de datos para procesar y cargar.
  3. Apache Tika extrae texto del archivo de datos.
  4. El texto extraído se pasa a Watson NLU para su enriquecimiento.
  5. Los datos enriquecidos se visualizan en la interfaz de usuario mediante la biblioteca D3.js.

Instrucciones

¿Preparado para comenzar? Consulta README para obtener instrucciones detalladas.

Conclusión

Este patrón mostró cómo crear una aplicación web para visualizar datos no estructurados utilizando el servicio Watson Natural Understanding, Apache Tika y D3.js. El patrón forma parte de la ruta de aprendizaje Introducción al procesamiento del lenguaje natural.