¡Participa de la Maratón Behind the Code, la competencia de programación más desafiante! Inscríbete aqui

¡Agarrate Catalina! Enséñale términos personalizados a Watson Speech-To-Text

Descripción

Watson Speech-To-Text, servicio que permite interpretar y transcribir audio, es de los mejor catalogados de la industria. Sin embargo, no conoce todas las palabras de un cierto idioma, puesto que fue entrenado para un uso general y no específico de una cierta área. Existen términos, expresiones y modismos que no es capaz de reconocer «out of the box».

Es aquí donde los «modelos personalizados» entran a jugar. Con ellos, es posible incluir vocabulario que es específico de un cierto dominio o área de conocimiento, como puede ser el ámbito médico o legal, por citar dos ejemplos.

En este Code Pattern aprenderás a crear, entrenar y consultar un modelos personalizado de lenguaje en Watson Speech-To-Text.

Objetivos de aprendizaje

Cuando hayas completado este Code Pattern, serás capaz de:

  • Utilizar el servicio de Watson Speech-To-Text
  • Crear y entrenar modelos de lenguaje personalizados
  • Realizar consultas a la API de Watson Speech-To-Text desde una aplicación NodeJS para transcribir audio empleando modelos personalizados así como el modelo por defecto

Resumen

En este Code Pattern has conseguido:

  • Crear un modelo de lenguaje personalizado en el servicio Watson Speech-To-Text
  • Utilizar un corpus de 836 palabras para entrenar un modelo de Español Argentino
  • Transcribir un archivo de audio de 2:40 minutos empleando tanto el modelo personalizado como el estándar
  • Realizar una comparación de los resultados obtenidos