Digital Developer Conference: Cloud Security 2021 ¡Regístrate ahora!

Virtualización de datos en IBM Cloud Pak for Data

Módulos de esta ruta de aprendizaje

# Tipo Título Descripción
1 Artículos Introducción a IBM Cloud Pak for Data Conoce los conceptos básicos de IBM Cloud Pak for Data
2 Artículos Introducción a IBM Cloud Pak for Data (Parte 2) Comprende sus funciones y adquiere conocimientos prácticos de los diferentes pasos y tareas
3 Tutoriales Virtualización de datos en IBM Cloud Pak for Data Utiliza la virtualización de datos en IBM Cloud Pak for Data para realizar consultas en varios orígenes de datos
4 Tutoriales Visualización de datos con Data Refinery Utilice IBM Cloud Pak for Data para filtrar, limpiar y visualizar datos
5 Tutoriales Buscar, preparar y comprender datos con Watson Knowledge Catalog Resuelve los problemas de gobernanza de datos empresariales utilizando Watson Knowledge Catalog en la plataforma IBM Cloud Pak for Data
6 Tutoriales Automatizar la creación de modelos con AutoAI Aprende cómo se pueden manejar los problemas de regresión y clasificación sin necesidad de código
7 Tutoriales Crea un modelo predictivo de machine learning de manera rápida y sencilla con IBM SPSS Modeler Aprovecha los activos de datos y las aplicaciones modernas con algoritmos y modelos listos para usar
8 Code Pattern Cómo resolver un problema de negocio y pronosticar la rotación de clientes utilizando un conjunto de datos de pérdida de clientes Utiliza Watson Machine Learning y Jupyter Notebooks en IBM Cloud Pak for Data para pronosticar la pérdida de clientes
9 Code Pattern Monitoreo del modelo con Watson OpenScale Entrena, crea y despliega un modelo de machine learning con IBM Watson Machine Learning en IBM Cloud Pak for Data

Durante décadas, las empresas han intentado romper los silos copiando los datos de diferentes sistemas operativos en almacenamientos de datos centrales para su análisis, como los mercados de datos, los data warehouses y los data lakes. Esto suele ser costoso y propenso a errores. La mayoría tiene dificultades para gestionar un promedio de 33 orígenes de datos únicos, de estructura y tipo diversos, que suelen quedar atrapados en silos de datos que son difíciles de encontrar y acceder.

Con la virtualización de datos, es posible consultar datos en muchos sistemas sin tener que copiar y replicar datos, lo que ayuda a reducir costos. También permite simplificar los análisis y hacerlos más actualizados y precisos, ya que se consultan los datos más recientes en su origen.

En este tutorial, vamos a aprender a utilizar la virtualización de datos en IBM Cloud Pak® for Data para realizar consultas en varios orígenes de datos, como Netezza® Performance Server y Db2® Warehouse.

Objetivos de aprendizaje

En este tutorial, aprenderás a:

  • Añadir conjuntos de datos a IBM Cloud Pak for Data.

  • Añadir un origen de datos para la virtualización de datos.

  • Virtualizar los datos y crear una vista combinada.

  • Asignar datos virtualizados a un proyecto.

  • Agregar roles a los usuarios y realizar tareas de administración.

Prerrequisitos

Tiempo estimado

La duración de este tutorial es de aproximadamente 30-45 minutos.

Paso 1. Obtener los datos

Descarga los tres archivos de datos:

1.billing.csv (CSV, 445 KB)

2.customer-service.csv (CSV, 208 KB)

3.products.csv (CSV, 494 KB)

Paso 2. Acerca del conjunto de datos

El conjunto de datos utilizado en este tutorial es originalmente de Watson Analytics®. Se utilizó en un proyecto de Kaggle y contiene información acerca de la pérdida de clientes (churn) de una empresa de telecomunicaciones. Los datos se dividen en tres archivos CSV.

billing.csv

Este archivo tiene los siguientes atributos:

  • ID del cliente

  • Contrato (Mes a mes, un año, dos años)

  • Facturación electrónica (Sí, No)

  • Método de pago (Transferencia bancaria, tarjeta de crédito, cheque electrónico, cheque enviado por correo)

  • Cargos mensuales (USD)

  • Cargos totales (USD)

  • Abandono (Sí, No)

customer-service.csv

  • ID del cliente

  • Género (Hombre, Mujer)

  • Adulto mayor (1, 0)

  • Pareja (Sí, No)

  • Dependientes (Sí, No)

  • Permanencia (1-100)

products.csv

  • ID del cliente

  • Servicio telefónico (Sí, No)

  • Varias líneas (Sí, No, Sin servicio telefónico)

  • Servicio de Internet (DSL, Fibra óptica, No)

  • Seguridad en línea (Sí, No, Sin servicio de Internet)

  • Copia de seguridad en línea (Sí, No, Sin servicio de Internet)

  • Protección de dispositivos (Sí, No, Sin servicio de Internet)

  • Soporte técnico (Sí, No, Sin servicio de Internet)

  • Servicio de transmisión de TV (Sí, No, Sin servicio de Internet)

  • Servicio de transmisión de películas (Sí, No, Sin servicio de Internet)

Paso 3. Configurar el proyecto y suministrar la virtualización de datos en IBM Cloud Pak for Data

Inicia sesión en IBM Cloud Pak for Data

Inicia un navegador y navega a tu despliegue de IBM Cloud Pak for Data.

Iniciar sesión en el portal de IBM Cloud Pak for Data

Crear un nuevo proyecto de IBM Cloud Pak for Data

1.Ve al menú hamburguesa (☰) y haz clic en Projects (Proyectos).

Sección “proyectos” dentro del portal

2.Haz clic en New project (Nuevo proyecto).

Crear un nuevo proyecto desde el panel

3.Selecciona Create an empty project (Crear un proyecto nuevo).

Seleccionar el crear un proyecto vació

4.Proporciona un nombre y una descripción opcional para el proyecto y haz clic en Create (Crear).

Configurar el nuevo proyecto

Suministrar la virtualización de datos en IBM Cloud Pak for Data

Ve a la pestaña Services (Servicios). En Data sources (Orígenes de datos), elige el módulo Data Virtualization (Virtualización de datos). Haz clic en los tres puntos verticales y elige Deploy (Desplegar).

Seleccionar el servicio a utilizar desde el panel

Sigue las instrucciones para desplegar la virtualización de datos.

Para el despliegue con Managed OpenShift®, debes hacer lo siguiente:

1.IMPORTANTE: Decide si deseas marcar el recuadro de selección Updated the kernel semaphore parameter (Actualizado el parámetro del semáforo del kernel).

2.IMPORTANTE: NO elijas los valores predeterminados para el almacenamiento. Debes elegir ibmc-file-gold-gid como clase de almacenamiento.

Paso 4. Configurar la base de datos

IBM Cloud Pak for Data puede funcionar con cualquier base de datos con un conector JDBC. Para este tutorial utilizaremos IBM Db2 Warehouse en la nube, IBM Db2 local y Netezza® Performance Server.

Configurar Netezza Performance Server

Antes de crear la conexión con IBM Netezza Performance Server (NPS), debes crear las tablas necesarias y cargar los datos csv en el servidor IBM NPS con el comando nzload de CLI. Para instalar el nzload de CLI, sigue las instrucciones.

Inicia sesión en la consola de IBM NPS y crea 3 tablas para facturación, clientes y productos. Ten en cuenta que las tablas deben existir antes de cargar los datos con nzload. A continuación, es posible utilizar el comando nzload de CLI para cargar los datos csv en la base de datos NPS. Descarga los datos de arriba para las tablas de facturación, clientes y productos:

bash

nzload -u <usuario> -pw <contraseña> -host <host> -db <base de datos> -t <nombre de la tabla> -delim ',' -df <nombre del archivo csv>

Si la el comando nzload de CLI no es compatible, por ejemplo, en Mac OSX, tendrás que crear sentencias de inserción para los datos csv proporcionados y ejecutarlas desde la consola de Netezza. Esto podría tardar un poco más que el comando nzload.

Configurar Db2 Warehouse en IBM Cloud

Necesitaremos un lugar donde almacenar los datos. Se sugiere utilizar Db2 Warehouse en IBM Cloud para conservar mejor los recursos en el clúster. Si deseas utilizar Db2 local en el clúster, omite esta sección y configura Db2 Warehouse local en IBM Cloud Pak for Data en su lugar.

NOTA: Asegúrate de haber suministrado Db2 Warehouse en IBM Cloud antes de continuar.

1.Obtén los detalles de conexión para Db2 Warehouse en IBM Cloud. 2.Ve a Service Credentials (Credenciales de Servicio) y haz clic en New credential + (Nueva credencial +). Haz clic en el ícono Copy to clipboard (Copiar al portapapeles) y guarda las credenciales para más adelante.

Copiar las credenciales del servicio desde el panel de control

3.Ahora ve a Manage (Gestionar) y haz clic en Open Console (Abrir consola).

Abrir la consola del servicio

Obtener el certificado SSL para Db2 Warehouse en IBM Cloud

Necesitarás un certificado SSL para que IBM Cloud Pak for Data pueda utilizar la instancia de Db2 Warehouse en IBM Cloud.

En la consola de Db2 Warehouse, en el menú hamburguesa superior izquierdo (☰), haz clic en CONNECTION INFO > Connection Information (INFORMACIÓN DE CONEXIÓN > Información de Conexión) y luego en Download SSL Certificate (Descargar Certificado SSL).

Descargar el certificado SSL desde el panel de información

Deberás convertir el certificado SSL de .crt a un archivo .pem utilizando OpenSSL. Ejecuta el siguiente comando:

bash
openssl x509 -in DigiCertGlobalRootCA.crt -out DigiCertGlobalRootCA.pem -outform PEM -inform DER

Sembrar Db2 Warehouse en IBM Cloud

1.En el menú hamburguesa superior izquierdo (☰), haz clic en LOAD > Load data (CARGAR > Cargar datos). Error! Filename not specified.

2.Haz clic en Browse files (Examinar archivos), selecciona el archivo billing.csv (CSV, 445 KB) descargado anteriormente y después haz clic en Next (Siguiente). Error! Filename not specified.

2.Haz clic en Browse files (Examinar archivos), selecciona el archivo billing.csv (CSV, 459 KB) descargado anteriormente y después haz clic en Next (Siguiente). Error! Filename not specified.

3.Elige el esquema NULLIDRA y haz clic en + New table (+ Nueva tabla). En Create a new Table (Crear una nueva tabla), proporciona BILLING como nombre de la tabla, haz clic en Create (Crear) y luego en Next (Siguiente). Error! Filename not specified.

4.Acepta los valores predeterminados y haz clic en Next (Siguiente). En la siguiente pantalla, haz clic en Begin Load (Comenzar carga). Error! Filename not specified.

Repite el proceso para el archivo products.csv (CSV, 494 KB), asignando el nombre PRODUCTOS a la tabla, y para el archivo customer-service.csv (CSV, 208 KB), asignando el nombre CLIENTES a la tabla.

Ahora que Db2 Warehouse se ha configurado en IBM Cloud, puedes pasar a añadir una nueva conexión de origen de datos.

Configurar Db2 Warehouse local en IBM Cloud Pak for Data

Estas instrucciones son para cargar los datos en la versión CP4D local de Db2 Warehouse. Si has utilizado la instancia de IBM Cloud de Db2 Warehouse, es posible pasar a la siguiente sección. Se sugiere utilizar Db2 Warehouse en IBM Cloud para conservar los recursos en el clúster CPD, como se describe en Configurar Db2 Warehouse en IBM Cloud. Si deseas utilizar Db2 local en el clúster, continúa con esta sección.

Ten en cuenta que IBM Cloud Pak for Data puede funcionar con cualquier base de datos con un conector JDBC, por lo que Db2 Warehouse es solamente una de las muchas opciones posibles.

NOTA: Asegúrate de haber suministrado Db2 Warehouse local en IBM Cloud Pak for Data antes de continuar.

IMPORTANTE: Al menos un nodo de OpenShift debe tener la etiqueta para db2wh (como icp4data=database-db2wh); de lo contrario, no podrás suministrar Db2 Warehouse local. La etiqueta se puede configurar utilizando el siguiente comando:

oc label node <NODE> icp4data=database-db2wh

Obtener los detalles de conexión para Db2 Warehouse local

1.Para obtener la información de conexión de Db2 Warehouse local, ve al menú hamburguesa (☰) y haz clic en la opción My Instances (Mis instancias).

Volver al dashboard de instancias

2.Ahora ve a la pestaña Provisioned instances (Instancias suministradas) y haz clic en la fila de tu Db2 Warehouse local. Esto abrirá los detalles de la instancia de Db2 Warehouse.

Verificar las instancias creadas en el listado

3.Mantén esta ventana abierta en una pestaña independiente o copia la información de conexión necesaria: Host, Puerto, Nombre de la base de datos, Nombre de usuario y Contraseña. Es posible obtener el puerto desde la URL de conexión JDBC; por ejemplo, para la URL jdbc:db2://10.221.243.172:31956/BLUDB, el puerto es el número que aparece después de los dos puntos: 31956.

Acceder a los detalles de la instancia seleccionada

Sembrar Db2 Warehouse local en IBM Cloud Pak for Data

1.Haz clic en el menú hamburguesa (☰) de la esquina superior izquierda y elige Collect > My data (Recopilar > Mis datos).

Recolectar los datos de la página de instancias

2.Ve a la pestaña Databases (Bases de datos), haz clic en las tres líneas verticales del ícono de Db2 Warehouse y luego en Open database (Abrir base de datos).

Abrir la base de datos creada desde el panel de instancias

3.En Summary (Resumen), elige Load* (Cargar) y Load Data** (Cargar datos).

Cargar los datos al resumen generado

4.Elige Browse files (Examinar archivos), selecciona el archivo billing.csv (CSV, 445 KB) descargado anteriormente y luego haz clic en Next (Siguiente).

Seleccionar los archivos a virtualizar

5.Elige el esquema NULLIDRA y haz clic en + New table (+ Nueva tabla). En New Table Name (Nuevo nombre de tabla), digita FACTURACIÓN, haz clic en Create (Crear) y luego en Next (Siguiente).

Panel de creación de una nueva tabla

6.Acepta los valores predeterminados y haz clic en Next (Siguiente). En la siguiente pantalla, haz clic en Begin Load (Comenzar carga).

Verificar la información a incluir en la tabla creada

Repite el proceso para el archivo products.csv (CSV, 494 KB), asignando el nombre PRODUCTOS a la tabla, y para el archivo customer-service.csv (CSV, 208 KB), asignando el nombre CLIENTES a la tabla.

Paso 5. Configurar Db2 Warehouse local en IBM Cloud Pak for Data

Estas instrucciones son para cargar los datos en la versión local de Db2 Warehouse en IBM Cloud Pak for Data. Si has utilizado la instancia de IBM Cloud de Db2 Warehouse, es posible pasar a la siguiente sección.

Se sugiere utilizar Db2 Warehouse en IBM Cloud para conservar los recursos en el clúster CPD, como se describe en Configurar Db2 Warehouse en IBM Cloud. Si deseas utilizar Db2 local en el clúster, continúa con esta sección.

Ten en cuenta que IBM Cloud Pak for Data puede funcionar con cualquier base de datos con un conector JDBC, por lo que Db2 Warehouse es solamente una de las muchas opciones posibles.

NOTA: Asegúrate de haber suministrado Db2 Warehouse local en IBM Cloud Pak for Data antes de continuar.

IMPORTANTE: Al menos un nodo de OpenShift debe tener la etiqueta para db2wh (como icp4data=database-db2wh); de lo contrario, no podrás suministrar Db2 Warehouse local. La etiqueta se puede configurar utilizando el siguiente comando:

oc label node <NODE> icp4data=database-db2wh

Obtener los detalles de conexión para Db2 Warehouse local

Para obtener la información de conexión de Db2 Warehouse local, ve al menú hamburguesa (☰) y haz clic en la opción My Instances (Mis instancias).

Error! Filename not specified.

Ahora ve a la pestaña Provisioned instances (Instancias suministradas) y haz clic en la fila de tu Db2 Warehouse local. Esto abrirá los detalles de la instancia de Db2 Warehouse.

Error! Filename not specified.

Mantén esta ventana abierta en una pestaña independiente o copia la información de conexión necesaria: Host, Puerto, Nombre de la base de datos, Nombre de usuario y Contraseña. Es posible obtener el puerto desde la URL de conexión JDBC; por ejemplo, para la URL jdbc:db2://10.221.243.172:31956/BLUDB, el puerto es el número que aparece después de los dos puntos: 31956.

Error! Filename not specified.

Sembrar Db2 Warehouse local en IBM Cloud Pak for Data

1.Haz clic en el menú hamburguesa (☰) de la esquina superior izquierda y elige Collect > My data (Recopilar > Mis datos). Error! Filename not specified.

2.Ve a la pestaña Databases (Bases de datos), haz clic en las tres líneas verticales del ícono de Db2 Warehouse y luego en Open database (Abrir base de datos). Error! Filename not specified.

3.En Resumen, elige Load > Load Data (Cargar > Cargar datos). Error! Filename not specified.

4.Elige Browse files (Examinar archivos), selecciona el archivo billing.csv (CSV, 445 KB) descargado anteriormente y luego haz clic en Next (Siguiente). Error! Filename not specified.

5.Elige el esquema NULLIDRA y haz clic en + New table (+ Nueva tabla). En New Table Name (Nuevo nombre de tabla), digita FACTURACIÓN y luego haz clic en Create > Next (Crear > Siguiente).

Confirmar la creación de la tabla virtualizada

6.Acepta los valores predeterminados y haz clic en Next (Siguiente). En la siguiente pantalla, haz clic en Begin Load (Comenzar carga).

Visualización de los nuevos datos agregados a la tabla

Repite el proceso para el archivo products.csv (CSV, 494 KB), asignando el nombre PRODUCTOS a la tabla, y para el archivo customer-service.csv (CSV, 208 KB), asignando el nombre CLIENTES a la tabla.

Paso 6. Agregar una nueva conexión de origen de datos

IBM Cloud Pak for Data puede trabajar con cualquier base de datos como IBM Db2 Warehouse en la nube, IBM Db2 local, Netezza Performance Server y MongoDB. Es posible utilizarlos para configurar la conexión y añadirlos como origen de datos en los pasos siguientes.

Obtener la información de conexión

Si estás utilizando cualquier base de datos como Db2 Warehouse en IBM Cloud o Netezza Performance Server, asegúrate de haber obtenido los detalles de conexión JDBC y el certificado SSL siguiendo las instrucciones proporcionadas en el Paso 4 anterior.

Si estás utilizando Db2 Warehouse local en IBM Cloud Pak for Data, asegúrate de haber obtenido los detalles de conexión JDBC mediante las instrucciones proporcionadas en el Paso 5 anterior.

Agregar el nuevo origen de datos

Para agregar un nuevo origen de datos, ve al menú hamburguesa (☰) y haz clic en la opción Connections (Conexiones).

Verificar el panel de conexiones

En la visión general, haz clic en New connection + (Nueva conexión +).

Agregar una nueva conexión al panel

Comienza por asignar un nombre a la nueva conexión y selecciona el tipo de conexión. Selecciona Db2 Warehouse on Cloud como tipo de conexión para la base de datos IBM Db2, o PureData System For Analytics para Netezza Performance Server.

Deberían aparecer más campos. Rellene los nuevos campos con las credenciales de tu conexión a Db2 Warehouse (local o en la nube). Haz clic en el recuadro de selección de Use SSL (Usar SSL).

NOTA: Si estás utilizando Db2 Warehouse en IBM Cloud, haz clic en Select file (Seleccionar archivo) y navega hasta donde convertiste el certificado SSL para Db2 Warehouse de un archivo .crt a un archivo .pem (probablemente denominado DigiCertGlobalRootCA.pem). Haz clic en Test Connection (Probar conexión) y, una vez que sea exitosa, haz clic en Create (Crear).

Configurar los datos de la nueva conexión

La nueva conexión se mostrará en la visión general.

Seleccionar la conexión a agregar

Paso 7. Virtualizar datos con la virtualización de datos

NOTA: Esta sección requiere el acceso del usuario administrador al clúster de IBM Cloud Pak for Data.

Para esta sección, utilizaremos la herramienta de virtualización de datos para importar los datos de cualquier base de datos como IBM Db2 Warehouse, Netezza Performance Server o MongoDB, que se muestra como una conexión en IBM Cloud Pak for Data.

1.Para iniciar la herramienta de virtualización de datos, ve al menú hamburguesa (☰), haz clic en Collect (Recopilar) y luego en Data Virtualization (Virtualización de datos).

Acceder al panel de virtualización de datos

2.En la visión general vacía, haz clic en la lista desplegable situada junto a Add new data source (Agregar nuevo origen de datos) y selecciona From existing connections (Desde conexiones existentes).

Agregar una nueva fuente de datos desde una conexión existente

3.Selecciona el origen de datos que creamos en el paso anterior y haz clic en Next (Siguiente). El origen de datos puede ser uno de IBM Db2, de Netezza (sistemas de datos puros), de MongoDB o cualquiera de la lista.

Seleccionar la conexión a agregar desde el panel de selección

4.La nueva conexión se mostrará como un origen de datos para la virtualización de datos.

Marcar la fuente de los datos

Comenzar a virtualizar datos

Debido a que ahora tenemos acceso a los datos de una base de datos, como IBM Db2 Warehouse o Netezza Performance Server, entonces podemos virtualizar los datos para nuestro proyecto de IBM Cloud Pak for Data. Haz clic en la lista desplegable Data Sources (Orígenes de datos) y elige Virtualize (Virtualizar).

Virtualizar los datos agregados

En la tabla aparecerán varias tablas, muchas de ellas creadas como datos de muestra cuando se suministra una instancia de Db2 Warehouse. Busca las tablas que creaste anteriormente (las instrucciones anteriores sugerían asignarles los nombres CLIENTES, PRODUCTOS y FACTURACIÓN). Una vez seleccionada, haz clic en Add to cart (Agregar al carrito) y luego en View Cart (Visualizar carrito).

Seleccionar las tablas a virtualizar desde el panel de selección

El siguiente panel solicita al usuario que elija a qué proyecto asignar los datos. Elige My virtualized data (Mis datos virtualizados) y desverifica la casilla que dice Submit to catalog (Enviar al catálogo). Haz clic en Virtualize (Virtualizar) para iniciar el proceso.

Marcar los datos virtualizados

Se te notificará que se han creado las tablas virtuales. Veamos los nuevos datos virtualizados de la herramienta de virtualización de datos haciendo clic en View my virtualized data (Visualizar mis datos virtualizados).

Visualizar los datos virtualizados

Unir los datos virtualizados

Ahora vamos a unir las tablas que creamos para tener un conjunto combinado de datos. Será más fácil hacerlo aquí en lugar de en un notebook, donde tendríamos que escribir código para manejar tres conjuntos de datos distintos. Haz clic en dos tablas cualesquiera (PRODUCTOS y FACTURACIÓN, por ejemplo) y luego haz clic en el botón Join (Unir).

Unir los datos a virtualizar

Para unir las tablas, necesitamos elegir una clave que sea común a ambos conjuntos de datos. Aquí elegimos asignar el campo customerID de la primera tabla al campo customerID de la segunda tabla. Para ello, haz clic en uno y arrástralo hacia el otro. Cuando se dibuje la línea, haz clic en Next (Siguiente).

Confirmar la unión de los datos a virtualizar

A continuación, tendrás la oportunidad de editar los nombres de las columnas, pero los mantendremos tal cual. Haz clic en Next (Siguiente).

Editar las columnas de datos virtualizados

En el siguiente panel, daremos a nuestros datos unidos un nombre único como FACTURACIÓNPRODUCTOS (para que sea coherente con los estándares SQL, elige un nombre en mayúsculas). En Assign to (Asignar a), elige My virtualized data (Mis datos virtualizados) y desverifica la casilla que dice Submit to catalog (Enviar al catálogo). Haz clic en Create view (Crear visualización) para iniciar el proceso.

Confirmar y crear la virtualización de los datos

Se te notificará que los datos se han unido correctamente. Haz clic en View my virtualized data (Visualizar mis datos virtualizados) para volver atrás y visualizar todos tus datos virtualizados.

Panel final de confirmación al momento de visualizar los datos virtualizados

IMPORTANTE Ahora une la nueva visualización combinada (FACTURACIÓNPRODUCTOS) y la última tabla virtualizada (CLIENTES) para crear una nueva visualización combinada que contenga las tres tablas, a la que llamaremos FACTURACIÓNPRODUCTOSCLIENTES. Al volver a la pantalla My virtualized data (Mis datos virtualizados), se deben mostrar las tres tablas virtualizadas y las dos tablas combinadas. No pases a la siguiente sección hasta que hayas realizado este paso.

Seleccionar las tablas virtualizadas desde el panel de selección

Otorgar acceso a los datos virtualizados

Para que otros usuarios tengan acceso a los datos que acabas de virtualizar, debes otorgarlo. Sigue estos pasos para que tus datos virtualizados sean visibles para ellos:

1.Ve a Data Virtualization (Virtualización de datos) desde el menú hamburguesa (☰). Haz clic en Menu > My virtualized data (Menú > Mis datos virtualizados).

2.Haz clic en los datos virtualizados que has creado, haz clic en los tres puntos verticales de la derecha y elige Manage Access (Gestionar acceso).

Marcar las tablas de acceso del usuario

3.Haz clic en el botón de selección Specific users (Usuarios específicos) y luego haz clic en Add user + (Agregar usuario +).

Administrar el nivel de acceso de los usuarios

4.Selecciona los usuarios a los que deseas otorgar acceso y haz clic en Add users (Agregar usuarios).

Cambiar el nivel de acceso de un usuario predetermindado

Repite los pasos anteriores para las tablas y visualizaciones restantes.

Asignar el rol de Ingeniero a los usuarios

A los usuarios de IBM Cloud Pak for Data que necesitan utilizar funciones de virtualización de datos se les deben asignar roles específicos en función de sus descripciones de trabajo. Estos roles son Administrador, Ingeniero, Usuario y Auxiliar.

Vamos a asignar el rol de Ingeniero a algunos usuarios:

1.En el menú hamburguesa (☰), elige la opción Data Virtualization (Virtualización de datos) y luego haz clic en My virtualized data > User management (Mis datos virtualizados > Gestión de usuarios).

Administrar el nivel de acceso de los usuarios

2.Haz clic en Add users + (Agregar usuarios +) y actualiza el rol de tus usuarios a Ingeniero.

Cambiar el nivel de acceso de un usuario predetermindado

Paso 7. Asignación de datos virtualizados por parte de los usuarios

Ahora veamos cómo un usuario que tiene acceso a los datos virtualizados puede asignar dichos datos a su proyecto, cómo agregar los datos virtualizados como activo en un proyecto.

Asignar los datos a tu proyecto

1.En el menú hamburguesa (☰), haz clic en Collect > Data Virtualization (Recopilar > Virtualización de datos). Se te llevará a la sección My virtualized data (Mis datos virtualizados). Aquí deberías ver los datos a los que es posible acceder (o que el administrador te ha asignado). Selecciona el recuadro de selección junto a nuestras tablas originales (FACTURACIÓN, PRODUCTOS y CLIENTES) y combinadas (FACTURACIÓNPRODUCTOS y FACTURACIÓNPRODUCTOSCLIENTES), y haz clic en el botón Assign (Asignar) para importarlas a tu proyecto.

Marcar las tablas de acceso del usuario

2.En la pantalla Assign virtual objects (Asignar objetos virtuales), elige el proyecto para asignar los datos. Si hay un recuadro de selección Submit to catalog (Enviar al catálogo) en la parte superior derecha, desverifícalo y haz clic en el botón Assign (Asignar) para añadir los datos a tu proyecto.

Asignar objetos virtuales al usuario seleccionado

3.En el panel emergente, recibirás una confirmación de que los objetos se han asignado a tu proyecto correctamente. Haz clic en el botón Go to Project (Ir al proyecto).

Confirmar la asignación de los objetos al usuario

4.Haz clic en Go to Project (Ir al proyecto). Alternativamente, cierra el modelo, ve tus proyectos haciendo clic en el menú hamburguesa (☰) y luego haz clic en Projects (Proyectos).

En la página del proyecto, al hacer clic en la pestaña Assets (Activos), se mostrarán las tablas virtualizadas y las tablas combinadas que ahora están en tu proyecto.

Confirmar los assets creados

Resumen

En este tutorial se explicó cómo virtualizar los datos de Db2 Warehouse con la virtualización de datos en IBM Cloud Pak for Data para realizar consultas en varios orígenes de datos.