Compartilhar via


Mapear Dados no Azure Synapse Analytics

O que é a ferramenta Mapear Dados?

A ferramenta Mapear Dados é um processo guiado para ajudar os usuários a criar mapeamentos de ETL e fluxos de dados de mapeamento de seus dados de origem para tabelas de banco de dados de lake do Synapse sem escrever código. Esse processo começa com o usuário escolhendo as tabelas de destino nos bancos de dados de lake do Synapse e, depois, mapeando seus dados de origem para essas tabelas.

Para obter mais informações sobre os bancos de dados de lake do Synapse, confira Visão geral dos modelos de banco de dados do Azure Synapse – Azure Synapse Analytics | Microsoft Docs

Mapear Dados fornece uma experiência guiada em que o usuário pode gerar um fluxo de dados de mapeamento sem precisar começar com uma tela em branco. E você pode gerar rapidamente um fluxo de dados de mapeamento escalonável nos pipelines do Synapse.

Introdução

A ferramenta Mapear Dados é iniciada de dentro da experiência de banco de dados de lake do Synapse. Nela, você pode selecionar a ferramenta Mapear Dados para iniciar o processo.

Captura de tela mostrando como abrir a opção Mapear Dados.

Mapear Dados precisa ter computação disponível para ajudar os usuários a visualizar dados e a ler o esquema de seus arquivos de origem. Ao usar Mapear Dados pela primeira vez em uma sessão, você precisará aquecer um cluster. Captura de tela mostrando clusters de depuração.

Para começar, escolha a fonte de dados que você deseja mapear para as tabelas de banco de dados do seu lake. As fontes de dados com suporte no momento são o Azure Data Lake Storage Gen 2 e os bancos de dados de lake do Synapse. Captura de tela mostrando as fontes.

Opções de tipo de arquivo

Ao escolher um armazenamento de arquivos, como o Azure Data Lake Storage Gen 2, há suporte para os seguintes tipos de arquivo:

  • Modelo de Dados Comuns
  • Texto delimitado
  • Parquet

Criar mapeamento de dados

Configure o mapeamento de dados com o tipo de fonte selecionado. Captura de tela mostrando as definições de configuração do arquivo de mapeamento de dados.

Observação

Você pode escolher uma pasta ou um único arquivo. Se você escolher uma pasta, poderá mapear vários arquivos para as tabelas do banco de dados lake. Se escolher uma pasta, você também será solicitado a incluir apenas arquivos específicos depois de selecionar Continuar, se desejar.

Nomeie o mapeamento de dados e selecione o destino do banco de dados de lake do Synapse. Captura de tela mostrando a nomenclatura e o destino.

Mapeamento de origem para destino

Escolha uma tabela de origem primária para mapear para a tabela de destino do banco de dados de lake do Synapse. Captura de tela mostrando as regras da opção Mapear Dados.

Novo mapeamento

Use o botão Novo Mapeamento para adicionar um método de mapeamento para criar um mapeamento ou transformação.

Fonte adicional

Use o botão Origem adicional para ingressar e adicionar outra fonte ao mapeamento.

Visualizar dados

A guia Visualização de Dados fornece um instantâneo interativo dos dados de cada transformação. Para obter mais informações, confira Visualização de dados no modo de depuração.

Métodos de mapeamento

Os seguintes métodos de mapeamento têm suporte:

Criar um pipeline

Quando terminar as transformações de Mapear Dados, selecione o botão Criar pipeline para gerar um fluxo de dados de mapeamento e um pipeline para depurar e executar a transformação.