Participe da Maratona Behind the Code! A competição de programação que mais te desafia! Inscreva-se aqui

Realize operações avançadas de ETL com o DataStage

Neste tutorial, aprenderemos a usar o DataStage para realizar operações de extração, transformação e carregamento (ETL) em dados armazenados no Netezza Performance Server. O IBM DataStage® no IBM Cloud Pak for Data permite que os usuários criem, editem, carreguem e executem tarefas do DataStage que podem ser usadas para fazer a integração de dados de várias origens de modo a obter informações significativas e valiosas. O Netezza® Performance Server para o IBM Cloud Pak for Data é uma eficiente plataforma de análise avançada que fornece um depósito de dados confiável e permite a verdadeira operacionalização da ciência de dados e do aprendizado de máquina, no local e em escala.

Objetivos de aprendizado

A finalidade deste tutorial é desenvolver uma tarefa do DataStage para atender à instrução de problema a seguir:

Como engenheiro de dados, a linha de negócios pediu que você contribuísse para a criação de uma tabela de dados que contenha todos os funcionários cuja remuneração ultrapassa US$ 50.000. O arquivo também precisa conter o nome do departamento do funcionário e a média salarial de todos os funcionários do departamento que recebem mais de US$ 50.000. Além disso, precisa estar classificado em ordem descendente, com base na média salarial. Por fim, o aplicativo que consumirá esses dados de saída espera que o nome completo do funcionário esteja em um campo, formatado como nome, inicial do segundo nome e sobrenome).

Neste tutorial, você aprenderá a:

  • Criar uma tarefa no DataStage
  • Carregar dados do Netezza Performance Server no DataStage
  • Realizar transformações, como modificar tabelas, unir tabelas, agregar dados da tabela e classificar os dados da tabela
  • Escrever dados tabulares do DataStage em uma tabela no Netezza Performance Server
  • Executar tarefas
  • Ver os logs das tarefas

Pré-requisitos

Tempo estimado

Este tutorial deve levar cerca de uma hora para ser concluído.

Sobre os dados

A entrada para essa tabela consiste nas tabelas a seguir.

A tabela DEPT contém as informações dos departamentos e possui estas colunas:

Nome da coluna Tipo de dado
DEPTNO VARCHAR(3)
DEPTNAME VARCHAR(28)
MGRNO VARCHAR(6)
ADMRDEPT VARCHAR(3)
LOCATION VARCHAR(5)

A tabela EMP contém as informações dos funcionários e possui estas colunas:

Nome da coluna Tipo de dado
EMPNO INTEGER
FIRSTNME VARCHAR(9)
MIDINIT VARCHAR(1)
LASTNAME VARCHAR(10)
WORKDEPT VARCHAR(3)
PHONENO VARCHAR(4)
HIREDATE DATE
JOB VARCHAR(8)
EDLEVEL SMALLINT
SEX VARCHAR(1)
BIRTHDATE DATE
SALARY DECIMAL(10,2)
BONUS DECIMAL(8,2)
COMM DECIMAL(8,2)

Os valores na coluna WORKDEPT da tabela EMP vêm da coluna DEPTNO da tabela DEPT.

Etapas

Etapa 1. Configurar a CLI do Netezza e o driver ODBC do Netezza para o DataStage

Para se conectar ao Netezza com o DataStage, é necessário baixar e instalar o driver ODBC do Netezza no pod is-engine-conductor-0:

OBSERVAÇÃO: Se estiver realizando estas etapas em um ambiente Linux, será necessário configurar a localização do caminho de instalação da CLI do Netezza (/usr/local/nz) como NETEZZA_HOME em vez de NZClientDir no arquivo dsenv.

NETEZZA_HOME=/usr/local/nz
export NETEZZA_HOME

Etapa 2. Carregar dados no Netezza Performance Server

Antes de se conectar ao IBM Netezza Performance Server com o DataStage no IBM Cloud Pak for Data, você deve criar as tabelas necessárias na sua instância do IBM Netezza Performance Server. Após a criação das tabelas, é possível preenchê-las com os dados.

Criar tabelas no Netezza Performance Server

  • Entre no seu console do IBM Netezza Performance Server. Clique no menu de hambúrguer (☰), localizado no canto superior esquerdo, e clique em Data.

    Dados no menu de hambúrguer no Netezza Performance Server

  • Clique em Create database +.

    Criar banco de dados

  • Forneça o nome do banco de dados como DATASTAGE e clique em Create.

    Criar novo banco de dados

  • O banco de dados foi criado. É possível ver que também foi criado um esquema com seu nome de usuário.

    Banco de dados criado

  • Adicione dados ao banco de dados DATASTAGE nesse esquema. Clique no menu de hambúrguer (☰) e em Query editor.

    Query editor

  • Especifique o uso do banco de dados DATASTAGE e defina o esquema como o esquema com o mesmo nome de <your_username>. Copie o conteúdo de CreateNPSTables.sql (SQL, 567 Bytes) e cole-o na seção abaixo do nome do esquema. Depois, clique em Run.

    Executar o SQL CreateNPSTables

Se a execução for concluída com sucesso, você deverá ver um resultado que diga “CREATE TABLE SUCCEEDED.”

OBSERVAÇÃO: Para soltar as tabelas, é possível remover os comentários e usar as linhas comentadas 2 e 3 no SQL.

Carregar os dados da tabela

É possível carregar os dados nas tabelas Netezza Performance Server usando o comando nzload da CLI do Netezza ou executando declarações de inserção SQL no console do Netezza Performance Server.

Carregar os dados da tabela usando a CLI do Netezza

OBSERVAÇÃO: Substitua <user> pelo nome de usuário do NPS, <password> pela senha do Netezza Performance Server e <host> pelo host do Netezza.

nzload -u <user> -pw <password> -host <host> -db DATASTAGE -t DEPT -delim ',' -df dept.csv
nzload -u <user> -pw <password> -host <host> -db DATASTAGE -t EMP -delim ',' -df emp.csv

Se a execução for concluída com sucesso, você deverá ver a saída a seguir, informando que a sessão de carregamento das tabelas foi concluída com sucesso.

Load session of table 'DEPT' completed successfully
Load session of table 'EMP' completed successfully

Carregar os dados da tabela usando o console do Netezza Performance Server

Um método alternativo para carregar dados nas tabelas é usar o console do Netezza Performance Server.

  • De volta ao console, acesse o Query editor. Como antes, especifique o uso do banco de dados DATASTAGE e defina o esquema como o esquema com o mesmo nome de <your_username>. Copie o conteúdo de LoadDataStageInput.sql (SQL, 7 KB) e cole-o na seção abaixo do nome do esquema. Depois, clique em Run.

    Executar o SQL LoadDataStageInput

Se a execução for concluída com sucesso, você deverá ver um resultado que diga “INSERT 0 1”.

OBSERVAÇÃO: Para truncar (esvaziar) as tabelas, é possível remover os comentários e usar as linhas comentadas 2 e 3 no SQL.

Etapa 3. Provisionar o serviço DataStage

  • Entre no console do IBM Cloud Pak for Data, acesse a guia Services, use a lista suspensa Category e selecione Data governance. Depois, clique no bloco DataStage Edition.

    Implementar o serviço DataStage Edition

  • Siga as instruções para provisionar o DataStage. Depois que o serviço for provisionado, você deverá ver Transform data no menu de hambúrguer (☰) > Organize no IBM Cloud Pak for Data.

    Transformar dados no menu de hambúrguer

Etapa 4. Adicionar as definições de tabela

  • Clique em Transform data.

    Abrir o DataStage

  • Você verá que um projeto denominado dstage1 já está disponível. Usaremos esse projeto existente. Clique em seu projeto para abri-lo.

    Abrir o projeto

OBSERVAÇÃO: Para criar um novo projeto, clique em + Create, o que abrirá um modal. Forneça o nome do projeto e clique em Create. O projeto levará alguns minutos para ser criado. Depois de pronto, estará visível na página. Clique em seu projeto para abri-lo.

Será necessário fornecer aqui as definições das tabelas de entrada DEPT e EMP para acessar os dados delas no DataStage. Para isso, precisaremos primeiramente adicionar a instância do Netezza Performance Server como uma conexão no DataStage. Em seguida, será possível importar as definições das tabelas usando essa conexão.

  • Clique na guia Connections e em + Create. Um modal será exibido. Na guia General, forneça o nome da conexão como Netezza. Mude para a guia Connection.

    Adicionar nova conexão ao DataStage

  • Na guia Connection, selecione o tipo de conector como Netezza. Especifique NZSQL, DATASTAGE, <seu nome de usuário do NPS> e <sua senha do NPS> como os valores da origem de dados, banco de dados, nome de usuário e senha, respectivamente. Clique em OK.

    Adicionar nova conexão ao DataStage - 2

  • Na próxima tela, clique em Save.

    Adicionar nova conexão ao DataStage - 3

A nova conexão denominada Netezza deve estar listada na guia Connections.

Conexão criada

  • Mude para a guia Table definitions, clique no ícone de importação no lado direito e, no modal que será aberto, selecione Netezza e clique em Next.

    Importar definição de tabela - 1

  • Selecione o esquema, que deve ser igual a <seu nome de usuário do NPS> e clique em Next.

    Importar definição de tabela - 2

  • Selecione a tabela com as definições que deseja importar. Selecione a tabela DEPT e clique em Next.

    Importar definição de tabela - 3

  • As colunas da tabela DEPT serão exibidas e, por padrão, todas as colunas serão selecionadas. Clique em Finish.

    Importar definição de tabela - 4

  • Clique em Save para salvar a definição de tabela. Observe que a definição de tabela será salva como <nome do esquema>.DEPT.

    Importar definição de tabela - 5

  • Repita as etapas acima para importar a definição de tabela EMP. A definição de tabela será salva como <nome do esquema>.EMP. Por fim, você deve ser capaz de ver as definições de tabela para as tabelas DEPT e EMP listadas na guia Table definitions.

    Definições de tabela importadas

Etapa 5. Criar e conceber uma tarefa paralela no DataStage

  • Clique na guia Jobs e em + Create > Parallel job.

    Criar tarefa paralela

  • Uma nova guia com o nome Job_1* será aberta. Nela, é possível começar a conceber a tarefa paralela.

    Canvas

Por alguns momentos, examine os vários botões e menus disponíveis:

  • O botão Show/Hide Palette pode ser usado para mostrar ou ocultar a paleta à esquerda da tela, que contém os conectores e estágios que é possível utilizar ao conceber a tarefa.
  • Os ícones Save, Compile e Run são usados para salvar, compilar e executar a tarefa.
  • O ícone Compare é usado para comparar essa tarefa com outra tarefa no projeto.
  • O menu View possui várias opções, incluindo:
    • Log para visualizar o log de execução da tarefa (disponível depois que a tarefa foi executada)
    • View code para visualizar o código OSH (disponível depois que a tarefa foi compilada com sucesso)
    • Switch view para mudar para outra tarefa aberta
    • Properties para ver as propriedades da tarefa
  • O ícone Schedule é usado para definir um cronograma para executar a tarefa.
  • O menu Settings possui várias opções, incluindo:
    • Apply horizontal layout, que organiza todos os conectores e estágios no canvas de maneira horizontal, com fluxo de dados da esquerda para a direita
    • A capacidade de visualizar/ocultar anotações, setas, nomes de links e o tipo de conector/estágio.
    • Auto propagation para especificar se você deseja a propagação automática de metadados
    • Smart palette, que aplica lógica inteligente com base em padrões de uso para reordenar os itens disponíveis na paleta; se estiver desativada, os itens na paleta serão exibidos em ordem alfabética
    • Smart stage suggestions aplica lógica inteligente com base em padrões de uso para sugerir a próxima etapa que você talvez queira adicionar à tarefa

Antes de começarmos a conceber a tarefa, vamos clicar no ícone Save para salvar essa tarefa vazia. No modal exibido, forneça o nome da tarefa como <usuário>_job em que \<usuário\> é seu nome. Depois, clique em Save.

Salvar a tarefa

OBSERVAÇÃO: Lembre-se de salvar periodicamente a tarefa durante a concepção. As alterações não são salvas automaticamente. Você perderá seu progresso se o navegador for fechado sem que a tarefa seja salva.

A primeira etapa na tarefa é incorporar as tabelas de entrada DEPT e EMP, que já foram carregadas na instância do Netezza Performance Server:

  • Arraste um conector do Netezza da paleta para o canvas. No modal que será aberto, selecione a definição de tabela DATASTAGE\<schema_name>.DEPT e clique em Next.

    Adicionar conector do Netezza

  • Na próxima tela, serão exibidas as colunas na definição de tabela. Todas as colunas serão selecionadas por padrão. Clique em Add to job.

    Adicionar conector do Netezza - adicionar à tarefa

  • Arraste outro conector do Netezza para o canvas e repita as etapas acima. Desta vez, porém, selecione a definição de tabela DATASTAGE\<schema_name>.EMP. Depois de concluir as etapas, você verá os dois conectores do Netezza no canvas.

    Adicionar conectores do Netezza - concluído

Em seguida, usaremos um estágio Modify para realizar as modificações a seguir nas colunas MIDINIT e WORKDEPT na tabela EMP:

  • Altere o nome da coluna WORKDEPT para DEPTNO a fim de garantir que ambas as tabelas tenham o mesmo nome para a coluna que contém as informações de número do departamento. Isso será necessário para uma etapa futura em que uniremos as duas tabelas.

  • Substitua os valores MIDINIT NULL por " ". Isso será necessário para uma etapa futura em que combinaremos as colunas FIRSTNME, MIDINIT e LASTNAME para criar o FULLNAME do funcionário.

  • Arraste e solte um estágio Modify ao lado do conector do Netezza para a tabela EMP. Forneça a saída do conector do Netezza da tabela EMP como entrada para o estágio Modify. Para isso, clique no pequeno ponto azul no lado direito do conector do Netezza e arraste o ponteiro do mouse para o estágio Modify.

OBSERVAÇÃO: Para outro método para conectar o conector do Netezza ao estágio Modify, clique no conector do Netezza para selecioná-lo e, então, arraste-o e solte-o no estágio Modify. O estágio Modify será automaticamente conectado ao conector do Netezza.

Adicionar modify para EMP

  • Agora que um link de saída foi adicionado ao conector do Netezza para a tabela EMP, é possível clicar duas vezes nesse conector para abrir a página Stage.

  • Aqui, precisaremos fornecer os detalhes de conexão para os dados que devem ser importados usando esse conector. Forneça a origem de dados, o banco de dados, o nome de usuário e a senha como NZSQL, DATASTAGE, <seu nome de usuário do NPS> e <sua senha do NPS>. Verifique se o nome da tabela é <schema_name>.EMP e clique em OK.

    Página Stage para EMP

  • Em seguida, arraste e solte um estágio Join no canvas e forneça a saída do estágio Modify como entrada.

    Adicionar estágio join

  • Clique duas vezes em Modify stage para abrir a página Stage. Na guia Properties, forneceremos duas especificações. Clique em + Add Specification e adicione as especificações a seguir nos espaços disponíveis:

DEPTNO=WORKDEPT

MIDINIT=handle_null(MIDINIT," ")

Estágio Modify - especificação

  • Mude para a guia Outputs, clique na linha de WORKDEPT para expandi-la, atualize o nome da coluna para DEPTNO e clique em Apply > OK.

    Estágio Modify - coluna de saída

  • Agora, as duas tabelas têm uma coluna denominada DEPTNO, que pode ser usada para uni-las. Forneça a saída do conector do Netezza da tabela DEPT como segunda entrada para o estágio Join.

  • Clique duas vezes no conector do Netezza para a tabela DEPT. Assim como no conector do Netezza da tabela EMP, forneça a origem de dados, o banco de dados, o nome de usuário e a senha como NZSQL, DATASTAGE, <seu nome de usuário do NPS> e <sua senha do NPS>. Verifique também se o nome da tabela para esse conector é <schema_name>.DEPT e clique em OK.

    Página Stage para DEPT

  • Clique duas vezes no estágio Join para abrir a página Stage. Aqui, é possível verificar que DEPTNO está sendo usado como JOIN KEY e que Join Type é Inner. Se JOIN KEY estiver em branco, clique na lista suspensa e selecione DEPTNO. Clique em OK para retornar ao canvas.

    Conectar DEPT a Join

  • Em seguida, adicione um estágio Transformer ao canvas e forneça a saída do estágio Join como entrada.

    Adicionar estágio Transformer

  • Clique duas vezes no estágio Transformer para abrir a página Stage. Adicionaremos duas variáveis de estágio a esse estágio. Na guia Properties, clique em + Add. Uma nova entrada será adicionada na tabela abaixo. Use-a para definir uma variável de estágio denominada TOTALCOMP, que representará a remuneração total (a soma de bônus, comissão e salário) do funcionário. Clique duas vezes em {derivation} para abrir o Derivation Builder.

    Transformer - adicionar TOTALCOMP

  • Crie a regra de derivação para TOTALCOMP localizando as colunas de entrada BONUS, COMM e SALARY na tabela. Ao clicar nas entradas na tabela, elas serão inseridas na derivação, na parte superior. Digite sinais de + entre elas para concluir a derivação. Também é possível usar a barra de pesquisa para encontrar os campos. Depois de inseridos na derivação, os nomes das colunas serão prefixados com o identificador para o link de entrada. Clique em OK para retornar à página Stage.

    Transformer - criar derivação TOTALCOMP

  • Atualize o nome da variável Stage para TOTALCOMP, o tipo de SQL para Double, a precisão para 9 e a escala para 2.

    Transformer - concluir TOTALCOMP

  • Repita o processo acima para adicionar outra variável Stage de FULLNAME, a qual representará o nome completo do funcionário. Forneça a derivação como CompactWhiteSpace(<Link>.FIRSTNME:" ":<Link>.MIDINIT:" ":<Link>.LASTNAME), o nome da variável Stage como FULLNAME, o tipo de SQL como Varchar, a precisão como 36 e a escala como 0. Clique em OK para salvar as alterações e retornar ao canvas.

OBSERVAÇÃO: <Link> é um placeholder para o link de entrada que chega ao estágio Transformer. Ao pesquisar as variáveis FIRSTNME, MIDINIT e LASTNAME na tabela de entradas na tela Derivation Builder, o nome do link já está especificado para todas as variáveis de entrada. CompactWhiteSpace é uma função que compactará todos os espaços brancos contínuos em um único espaço branco. CompactWhiteSpace também está disponível na tabela mostrada na tela Derivation Builder. : (dois pontos) é o operador usado para a concatenação.

Transformer - concluir FULLNAME

  • Em seguida, adicione um estágio Join e um estágio Aggregator ao canvas. Conecte o estágio Transformer aos dois estágios para que a saída do estágio Transformer seja fornecida como entrada para eles.

    Adicionar join e aggregator

  • Como os links de saída foram adicionados, podemos fornecer as duas variáveis de estágio TOTALCOMP e FULLNAME como saídas do estágio Transformer. Quando isso for concluído, tais valores estarão disponíveis como entradas nos estágios subsequentes.

  • Clique duas vezes no estágio Transformer para abrir a página Stage. Acesse a guia Outputs e clique em +Add duas vezes para adicionar duas entradas novas na tabela. Atualize uma entrada com o valor da derivação como TOTALCOMP, o nome da coluna como TOTALCOMP, o tipo de SQL como Double, a precisão como 9, a escala como 2 e defina Nullable como true. Atualize a segunda entrada com o valor da derivação como FULLNAME, o nome da coluna como FULLNAME, o tipo de SQL como Varchar, a precisão como 36 e a escala como 0.

  • Também é necessário adicionar uma restrição aqui, o que garantirá que somente os registros com TOTALCOMP superior a 50000 sejam enviados na saída. Clique no espaço vazio em Constraint para abrir o Derivation Builder. Especifique a derivação como TOTALCOMP>50000.

  • Mude para o segundo link de saída clicando em Link_<number> sob o nome da saída e repita as etapas acima para adicionar as duas variáveis de estágio à saída e adicionar a restrição. Clique em OK para salvar as alterações e retornar ao canvas.

    Transformer - adicionar colunas de saída e restrição

  • Forneça a saída do estágio Aggregator como entrada para o estágio Join, clique duas vezes no estágio Aggregator para abrir a página Stage e selecione DEPTNAME como chave de agrupamento.

    Aggregator - adicionar chave de agrupamento

  • Role a tela para baixo até as agregações e selecione o tipo de agregação como Calculation, a coluna como TOTALCOMP, o tipo de cálculo como Mean Value e clique em + Add Calculation.

    Aggregator - adicionar cálculo

  • Acesse a guia Outputs e verifique se é possível ver duas colunas de saída: MEAN_TOTALCOMP e DEPTNAME. Clique em OK para salvar as alterações e retornar ao canvas.

    Aggregator - confirmar as colunas de saída

  • Arraste e solte um estágio Sort no canvas e forneça a saída do estágio Join como entrada.

    Adicionar estágio Sort

  • Clique duas vezes no estágio Join para abrir a página Stage. Na guia Stage, verifique se a chave de junção é DEPTNAME e o tipo de junção é Inner.

    Confirmar estágio Join

  • Acesse a guia Outputs e verifique se é possível ver FULLNAME e MEAN_TOTALCOMP na lista de colunas de saída. Clique em OK para retornar ao canvas.

    Confirmar saídas do estágio Join

  • Clique duas vezes no estágio Sort para abrir a página Stage. Especifique a chave de classificação como MEAN_TOTALCOMP e a ordem de classificação como Descending. Depois, clique em OK.

    Atualizar estágio Sort

  • Arraste um estágio Peek para o canvas e conecte a saída do estágio Sort como entrada. O estágio Peek pode ser usado para examinar o estado intermediário dos dados em qualquer ponto da tarefa. A adição de um estágio Peek aqui permitirá examinarmos os dados que saem do estágio Sort.

    Adicionar estágio Peek

  • Clique duas vezes no estágio Peek. Por padrão, os primeiros 10 registros de cada partição de dados são exibidos. Ative All Records (After Skip) e clique em OK. Isso garantirá que o estágio Peek produza todos os registros, não apenas os primeiros 10.

    Atualizar estágio Peek

  • Arraste um conector do Netezza para o canvas. No modal que será aberto, clique em Add connector and configure details later.

    Adicionar conector de saída

  • Forneça a saída do estágio Peek como entrada para o conector de saída do Netezza. Clique duas vezes no conector do Netezza para abrir a página Stage. Forneça a origem de dados como NZSQL e o banco de dados como DATASTAGE. Além disso, forneça seu nome de usuário e senha do Netezza Performance Server como nome de usuário e senha, respectivamente.

    Conector de saída - adicionar detalhes

  • Role a tela para baixo e, na seção Usage, forneça o nome da tabela como <schema_name>.DEPTEMP e atualize a ação da tabela para Replace. Depois, clique em OK.

    Conector de saída - adicionar detalhes - 2

A concepção da tarefa foi concluída. Agora, ela está pronta para ser compilada e executada.

Etapa 6. Compilar e executar a tarefa paralela

  • Clique no ícone Save para salvar a tarefa. Depois que a tarefa for salva, clique no ícone Compile para compilá-la. Se a compilação for concluída com sucesso, você verá uma marca de verificação verde e a mensagem “Compiled successfully.”

    Salvar compilação

  • Clique no ícone Run para executar a tarefa. No modal que será aberto, clique em Run.

    Executar tarefa

  • Depois que a tarefa for concluída, você verá uma mensagem que diz “Run result: Successful with warnings”. Clique em Log para ver os avisos.

    Resultado da tarefa bem-sucedido

  • Role a tela para baixo e procure os avisos. É possível ver que o aviso foi dado porque a tarefa tentou descartar a tabela <schema_name>.DEPTEMP, que, neste momento, não existe. Esse aviso pode ser ignorado. Se você executar a tarefa novamente, o aviso deverá desaparecer, pois, desta vez, a tabela já existe. Você verá uma mensagem “Run result: Successful”.

    Visualizar log da tarefa

Etapa 7. Visualizar a saída

A saída foi salva na tabela <schema_name>.DEPTEMP no Netezza Performance Server. É possível visualizar o conteúdo dessa tabela no console do Netezza Performance Server.

  • Acesse o console do Netezza Performance Server e o Query editor. Como antes, especifique o uso do banco de dados DATASTAGE e defina o esquema como o esquema com o mesmo nome de <your_username>. Na seção abaixo do nome do esquema, digite a instrução SQL a seguir e, depois, clique em Run.
SELECT * FROM DEPTEMP;

Se a execução for concluída com sucesso, você deverá ver o conteúdo da tabela na seção Result.

Visualizar saída no console do Netezza

É possível visualizar o conteúdo da tabela acessando a instância do Netezza Performance Server. A saída também pode ser vista no canvas da tarefa usando o estágio Peek, que foi adicionado logo após o estágio Sort. Os dados exibidos são, portanto, a saída do estágio Sort. Os mesmos dados são passados para o conector do Netezza, que simplesmente registra os dados em uma tabela na instância do Netezza Performance Server.

Retorne à sua tarefa no DataStage no Cloud Pak for Data. Dentro do log da tarefa, procure as entradas semelhantes à entrada na imagem abaixo, que mostra os resultados de Peek.

Visualizar resultados de Peek

OBSERVAÇÃO: Neste caso específico, haverá duas entradas com os resultados de Peek, porque os dados de entrada foram divididos em duas partições com base em predefinições do DataStage.

Resumo

Este tutorial mostrou um exemplo de como é possível utilizar a força do DataStage no IBM Cloud Pak for Data para realizar transformações de ETL em dados armazenados no Netezza Performance Server. Para continuar desenvolvendo suas aptidões, confira o caminho de aprendizado do IBM Cloud Pak for Data.