¡Participa de la Maratón Behind the Code, la competencia de programación más desafiante! Inscríbete aqui

Introducción a Watson Discovery

Este artículo forma parte de la ruta de aprendizaje de Watson Discovery.

Introducción

Con IBM Watson Discovery, usted puede ingerir, normalizar, mejorar y buscar sus datos no estructurados (JSON, HTML, PDF, Word, etc.) con velocidad y precisión. Contiene las principales APIs de Watson como Natural Language Understanding y Document Conversion junto con herramientas de IU que le permite subir, mejorar e indexar fácilmente grandes colecciones de datos públicos o privados.

La siguiente imagen muestra una vista de alto nivel de todos los componentes que conforman el canal de Discovery.

Datos, Ingetión, Almacenamiento, Consulta, Salida

Este artículo es la primera parte de una ruta de aprendizaje que lo ayuda a entender mejor cómo funciona Discovery y cómo puede usarlo para crear sus propias soluciones de inteligencia artificial (IA).

Términos y conceptos

Términos del servicio de Watson Discovery

Esta sección cubre los términos y conceptos que son específicos de Discovery.

Término Definición
Recolección Una colección es una división lógica de sus datos en un entorno que se consulta de forma independiente.
Configuración Una configuración se puede asignar a una colección y se puede utilizar para convertir y normalizar datos, y para especificar qué mejoras aplicar.
Mejoras Discovery contiene un potente motor de analítica que brinda mejoras cognitivas e insights sobre los datos. Estas mejoras incluyen entidades, categorías, conceptos, palabras clave y pareceres.
Agregaciones Esto se refiere a la devolución de Discovery de un conjunto de valores de datos, como los principales valores para las mejoras seleccionadas. Por ejemplo, puede devolver los 10 principales conceptos que aparecen en una colección de datos.
Pasajes Cuando trabaja con documentos grandes, puede utilizar la función de búsqueda de pasajes para devolver extractos cortos y relevantes relacionados con las mejores coincidencias.
Discovery Query Language La sintaxis de las consultas que usted utilizará para buscar resultados, usando nombres de campo, operadores y palabras clave.
Consulta de Lenguaje Natural Como alternativa al estricto lenguaje de las consultas, también se puede consultar el lenguaje con frases sencillas, como “Cómo guardo un archivo.”
Watson Discovery News Una colección que está incluida en todos los servicios de Discovery que se han creado. Es un conjunto de datos indexados que se actualiza diariamente con más de 300.000 artículos de noticias.
Herramientas de Watson Discovery Un extenso conjunto de herramientas de IU que están disponibles desde la consola de IBM Cloud y que usted puede utilizar para crear y rellenar automáticamente su colección, aplicar mejoras y consultar y probar sus datos.

Mejoras

Discovery tiene un potente motor de analítica que brinda mejoras cognitivas e insights sobre los datos. Con los recursos que tiene incorporados para el procesamiento de lenguaje natural (NLP), puede extraer las mejoras de una gran cantidad de tipos de documentos, como JSON, HTML, PDF y Microsoft™ Word. La siguiente tabla muestra las principales mejoras.

Mejora Definición
Entidad Personas, compañías, organizaciones, ciudades y accidentes geográficos
Parecer Identifica el parecer general, positivo o negativo
Palabra clave Determina las palabras clave importantes, las clasifica y tiene la opción de detectar el parecer
Concepto Identifica conceptos generales a los que no necesariamente se les hace referencia de forma directa
Clasificación Los clasifica en una jerarquía de categorías que tiene cinco niveles
Relaciones Analiza frases en sujeto, acción y forma de acción, y devuelve información semántica adicional
Emoción Analiza las emociones, como la rabia, el disgusto, el miedo, la alegría y la tristeza

La capacidad de realizar consultas de lenguaje natural sobre estas mejoras proporciona una ventaja sobre los típicos motores de búsqueda de palabras clave.

Arquitectura

diagrama de flujo, público, nube, externo

Una forma habitual de usar Discovery es accediendo a las APIs de Discovery desde su aplicación. El equipo de Watson lanza SDKs que son compatibles con muchos lenguajes de programación, para que usted pueda usar Discovery fácilmente en la web o en una aplicación móvil.

Todo el contenido de los datos es almacenado y mejorado dentro de una colección de Discovery. Los datos no requieren de una estructura específica y pueden provenir de muchos orígenes de datos públicos y privados. Todos los entornos de Discovery vienen con una colección de datos premejorada llamada Watson Discovery News.

Opcionalmente, con Watson Knowledge Studio, usted puede recibir la ayuda de expertos en dominios para personalizar Discovery para que este entienda mejor las entidades y relaciones particulares que existen en los datos específicos de su industria u organización.

Entre algunos de los casos de uso típicos de Discovery se encuentran:

  • La necesidad de buscar miles de revisiones de productos a la vez: crear una colección de Discovery y crear una IU para consultar la colección y crear un gráfico del parecer a medida que pasa el tiempo.
  • La necesidad de encontrar texto de forma programática dentro de un documento: usar la función de recuperación de pasajes de Discovery para crear un chatbot de preguntas frecuentes.
  • Hay miles de documentos en diferentes formatos y hay que organizarlos de manera lógica: usar Discovery para extraer palabras clave, conceptos y relaciones para ordenarlos.

Acceder a Discovery

DevOps

Tal como se mencionó anteriormente, Discovery tiene su propio conjunto de herramientas que está disponible a través de IBM Cloud, y que proporciona una IU para gestionar manualmente sus colecciones de Discovery.

El siguiente vídeo muestra cómo puede utilizar la herramienta para crear una colección de datos nueva y, luego, ingerir archivos de datos para mejorarlos.

utilizar la herramienta para crear una colección de datos nueva y, luego, ingerir archivos de datos para mejorarlos

El tutorial de Introducción a Discovery proporciona otro gran recurso para la información en todas las funciones de las herramientas.

SDKs

Para el acceso programático, Discovery viene con soporte para un gran número de lenguajes. La siguiente lista muestra los actuales SDKs para desarrolladores.

API

Para obtener más información acerca de las APIs, consulte la documentación de la API de Discovery.

Muestra de código

La siguiente muestra de código de Node.js enseña cómo autorizar y consultar la colección de Discovery. Si necesita más información acerca de conceptos de las consultas, consulte la documentación de Discovery.


                    const DiscoveryV1 = require('watson‑developer‑cloud/discovery/v1');

                    const discovery = new DiscoveryV1({
                      version: '2019‑04‑02',
                      iam_apikey: '{apikey}',
                      url: '{url}',
                    });
                    
                    const queryParams = {
                      environment_id: '{environment_id}',
                      collection_id: '{collection_id}',
                    };
                    
                    discovery.query(queryParams)
                      .then(queryResponse => {
                        console.log(JSON.stringify(queryResponse, null, 2));
                      })
                      .catch(err => {
                        console.log('error:', err);
                      });

                

Resumen

Este artículo es la primera parte de una ruta de aprendizaje que lo guía a través del desarrollo de aplicaciones web completas sobre Watson Discovery Service. Dentro de esta ruta de aprendizaje, tendrá la oportunidad de trabajar con funciones avanzadas de Discovery y de descubrir cómo integrar Discovery con otros servicios de Watson.

Así que empecemos. El primer paso será desarrollar una aplicación sencilla que acceda a Watson Discovery News.