Mapeamento de fluxos de dados no Azure Data Factory

APLICA-SE A: Azure Data Factory Azure Synapse Analytics

Gorjeta

Data Factory em Microsoft Fabric é a próxima geração de Azure Data Factory, com uma arquitetura mais simples, IA incorporada e novas funcionalidades. Se és novo na integração de dados, começa pelo Fabric Data Factory. As cargas de trabalho existentes do ADF podem atualizar para o Fabric para aceder a novas capacidades em ciência de dados, análise em tempo real e relatórios.

O que são fluxos de dados de mapeamento?

Os fluxos de dados de mapeamento são transformações de dados visualmente concebidas no Azure Data Factory. Os fluxos de dados permitem que os engenheiros de dados desenvolvam lógica de transformação de dados sem escrever código. Os fluxos de dados resultantes são executados como atividades dentro dos pipelines do Azure Data Factory que utilizam clusters Apache Spark escalonados. As atividades de fluxo de dados podem ser operacionalizadas utilizando as capacidades existentes de agendamento, controlo, fluxo e monitorização do Azure Data Factory.

O mapeamento de fluxos de dados fornece uma experiência totalmente visual, sem necessidade de codificação. Seus fluxos de dados são executados em clusters de execução gerenciados pelo ADF para processamento de dados escalonado. O Azure Data Factory trata de toda a tradução de código, otimização de caminhos e execução dos seus trabalhos de fluxo de dados.

Começar

Os fluxos de dados são criados a partir do painel de recursos de fábrica, como pipelines e conjuntos de dados. Para criar um data flow, selecione o sinal de mais ao lado de Recursos de Fábrica e depois selecione Data Flow.

Captura de tela mostrando um novo fluxo de dados. Essa ação leva você para a tela de fluxo de dados, onde você pode criar sua lógica de transformação. Selecione Adicionar fonte para começar a configurar sua transformação de origem. Para obter mais informações, consulte Transformação de origem.

Criação de fluxos de dados

O mapeamento do fluxo de dados tem uma interface exclusiva projetada para facilitar a construção da lógica de transformação. A tela de fluxo de dados é separada em três partes: a barra superior, o gráfico e o painel de configuração.

A captura de tela mostra a tela de fluxo de dados com a barra superior, o gráfico e o painel de configuração rotulados.

Graph

O gráfico exibe o fluxo de transformação. Ele mostra a linhagem de dados de origem à medida que flui para um ou mais coletores. Os coletores podem ser qualquer destino de fonte de dados para onde você deseja mover os resultados dos dados transformados. Para adicionar uma nova fonte, selecione Adicionar fonte. Para adicionar uma nova transformação, selecione o sinal de adição no canto inferior direito de uma transformação existente. Saiba mais sobre como gerenciar o gráfico de fluxo de dados.

A captura de tela mostra a parte gráfica da tela com uma caixa de pesquisa de texto.

Painel de configuração

O painel de configuração mostra as configurações específicas para a transformação selecionada no momento. Se nenhuma transformação for selecionada, ela mostrará o fluxo de dados. Na configuração geral do fluxo de dados, você pode adicionar parâmetros por meio da guia Parâmetros . Para obter mais informações, consulte Mapeando parâmetros de fluxo de dados.

Cada transformação contém pelo menos quatro guias de configuração.

Configurações de transformação

A primeira guia no painel de configuração de cada transformação contém as configurações específicas dessa transformação. Para obter mais informações, consulte a página de documentação dessa transformação.

Captura de ecrã a mostrar o separador de definições de origem.

Otimização

O separador Otimizar contém opções para definir esquemas de particionamento. Para saber mais sobre como otimizar os fluxos de dados, consulte o Guia de Desempenho do Fluxo de Dados de Mapeamento.

A captura de tela mostra a guia Otimizar, que inclui a opção Partição, Tipo de partição e Número de partições.

Inspecionar

O separador Inspecionar fornece uma visualização dos metadados do fluxo de dados que está a transformar. Você pode ver as contagens de colunas, as colunas alteradas, as colunas adicionadas, os tipos de dados, a ordem das colunas e as referências de coluna. Inspecionar é uma exibição somente leitura de seus metadados. Não é necessário ter o modo de depuração ativado para ver os metadados no painel Inspecionar .

Inspecionar

À medida que você altera a forma dos dados por meio de transformações, você pode ver o fluxo de alterações de metadados no painel Inspecionar . Se não houver um esquema definido na transformação de origem, os metadados não estarão visíveis no painel Inspecionar . A falta de metadados é comum em cenários de desvio de esquema.

Pré-visualização de dados

Se o modo de depuração estiver ativado, a Pré-visualização de Dados fornece um instantâneo interativo dos dados em cada transformação. Para obter mais informações, consulte Visualização de dados no modo de depuração.

Barra superior

A barra superior contém ações que afetam todo o fluxo de dados, como salvar e validar. Você também pode visualizar o código JSON subjacente e o script de fluxo de dados da sua lógica de transformação. Para obter mais informações, saiba mais sobre o script de fluxo de dados.

Transformações disponíveis

Veja a visão geral da transformação de fluxo de dados de mapeamento para obter uma lista das transformações disponíveis.

Tipos de dados de fluxo

matriz
binário
boolean
complexo
decimal (inclui precisão)
data
float
número inteiro
long
mapa
breve
cadeia (de caracteres)
carimbo de data/hora

Atividade de fluxo de dados

Os fluxos de dados de mapeamento são operacionalizados dentro de pipelines do ADF usando a atividade de fluxo de dados de mapeamento. Tudo o que um usuário precisa fazer é especificar qual tempo de execução de integração usar e passar valores de parâmetro. Para mais informações, saiba mais sobre o runtime de integração Azure.

Modo de depuração

O modo de depuração permite que você veja interativamente os resultados de cada etapa de transformação enquanto cria e depura seus fluxos de dados. A sessão de depuração pode ser usada ao criar sua lógica de fluxo de dados e ao executar execuções de depuração de pipeline com atividades de fluxo de dados. Para saber mais, consulte a documentação de modo de depuração.

Monitorizar fluxos de dados

O mapeamento do fluxo de dados integra-se com as capacidades de monitorização existentes do Azure Data Factory. Para saber como entender a saída de monitoramento de fluxo de dados, consulte Monitoramento de fluxos de dados de mapeamento.

A equipa do Azure Data Factory criou um guia de afinação de desempenho para o ajudar a otimizar o tempo de execução dos seus fluxos de dados após construir a sua lógica de negócio.

Saiba como criar uma transformação de origem.
Saiba como criar seus fluxos de dados no modo de depuração.

Comentários

Esta página foi útil?

Last updated on 2026-04-07

Mapeamento de fluxos de dados no Azure Data Factory

O que são fluxos de dados de mapeamento?

Começar

Criação de fluxos de dados

Graph

Painel de configuração

Configurações de transformação

Otimização

Inspecionar

Pré-visualização de dados

Barra superior

Transformações disponíveis

Tipos de dados de fluxo

Atividade de fluxo de dados

Modo de depuração

Monitorizar fluxos de dados

Conteúdos relacionados

Comentários

Recursos adicionais