Mapear Dados no Azure Synapse Analytics

O que é a ferramenta Mapear Dados?

A ferramenta Mapear Dados é um processo orientado para ajudar os utilizadores a criar mapeamentos de ETL e a mapear fluxos de dados dos respetivos dados de origem para tabelas de bases de dados lake do Synapse sem escrever código. Este processo começa com o utilizador a escolher as tabelas de destino nas bases de dados lake do Synapse e, em seguida, a mapear os respetivos dados de origem para essas tabelas.

Para obter mais informações sobre as bases de dados lake do Synapse, veja Descrição geral dos modelos de bases de dados do Azure Synapse - Azure Synapse Analytics | Microsoft Docs

A ferramenta Mapear Dados proporciona uma experiência orientada, em que o utilizador pode gerar um fluxo de dados de mapeamento sem ter de começar com uma tela em branco. Em seguida, pode gerar rapidamente um fluxo de dados de mapeamento dimensionável e executável em pipelines do Synapse.

Introdução

A ferramenta Dados de Mapa é iniciada a partir da experiência da base de dados do Synapse Lake. A partir daqui, pode selecionar a ferramenta Mapear Dados para iniciar o processo.

Captura de ecrã a mostrar como abrir um Mapa de dados.

O Map Data precisa de computação disponível para ajudar os utilizadores a pré-visualizar dados e a ler o esquema dos respetivos ficheiros de origem. Ao utilizar Dados de Mapa pela primeira vez numa sessão, terá de aquecer um cluster. Captura de ecrã a mostrar os clusters de depuração.

Para começar, escolha a origem de dados que pretende mapear para as tabelas da base de dados lake. Atualmente, as origens de dados suportadas são Azure Data Lake Storage bases de dados gen 2 e Synapse lake. Captura de ecrã a mostrar as origens.

Opções de tipo de ficheiro

Ao escolher um arquivo de ficheiros, como Azure Data Lake Storage Gen 2, são suportados os seguintes tipos de ficheiro:

  • Modelo de Dados Comuns
  • Texto Delimitado
  • Parquet

Criar um mapeamento de dados

Configure o mapeamento de dados com o tipo de origem que selecionou. Captura de ecrã a mostrar as definições de configuração do ficheiro de dados de mapa.

Nota

Pode escolher uma pasta ou um ficheiro individual. Se escolher uma pasta, poderá mapear vários ficheiros para as tabelas da base de dados lake. Se escolher uma pasta, também lhe é pedido, depois de selecionar, para continuar a incluir apenas ficheiros específicos, se assim o pretender.

Atribua um nome ao mapeamento de dados e selecione o destino da base de dados lake do Synapse. Captura de ecrã a mostrar a nomenclatura e o destino.

Mapeamento de origem para destino

Escolha uma tabela de origem primária para mapear para a tabela de destino da base de dados do Lago Synapse. Captura de ecrã a mostrar Regras de dados de mapa.

Novo mapeamento

Utilize o botão Novo Mapeamento para adicionar um método de mapeamento para criar um mapeamento ou transformação.

Origem adicional

Utilize o botão Origem adicional para associar e adicionar outra origem ao mapeamento.

Pré-visualizar dados

O separador Pré-visualização de Dados fornece-lhe um instantâneo interativo dos dados de cada transformação. Para obter mais informações, veja Pré-visualização de dados no modo de depuração.

Métodos de mapeamento

São suportados os seguintes métodos de mapeamento:

Criar pipeline

Quando terminar as transformações de Dados de Mapa, selecione o botão Criar pipeline para gerar um fluxo de dados de mapeamento e um pipeline para depurar e executar a sua transformação.