Explore o Dataflows Gen2 no Microsoft Fabric

Concluído

No Microsoft Fabric, você pode criar um Dataflow Gen2 na carga de trabalho do Data Factory ou no espaço de trabalho do Power BI ou diretamente no lakehouse. Como nosso cenário é focado na ingestão de dados, vamos examinar a experiência de carga de trabalho do Data Factory . Os fluxos de dados Gen2 utilizam o Power Query Online para visualizar transformações. Veja uma visão geral da interface:

Captura de ecrã da interface do Power Query Online.

1. Friso do Power Query

O Dataflows Gen2 suporta uma ampla variedade de conectores de fonte de dados. As fontes comuns incluem bancos de dados relacionais na nuvem e locais, Excel ou arquivos simples, SharePoint, SalesForce, Spark e Fabric lakehouses. Depois, há inúmeras transformações de dados possíveis, tais como:

  • Filtrar e Ordenar linhas
  • Pivotar e Despivotar
  • Mesclar e acrescentar consultas
  • Divisão e Divisão condicional
  • Substituir valores e remover duplicados
  • Adicionar, Renomear, Reordenar ou Excluir colunas
  • Calculadora de classificação e percentagem
  • Escolha Top N e Bottom N

Você também pode criar e gerenciar conexões de fonte de dados, gerenciar parâmetros e configurar o destino de dados padrão nesta faixa de opções.

2. Painel de consultas

O painel Consultas mostra as diferentes fontes de dados - agora chamadas de consultas. Essas consultas são chamadas de tabelas quando carregadas no armazenamento de dados. Você pode duplicar ou fazer referência a uma consulta se precisar de várias cópias dos mesmos dados, como criar um esquema em estrela e dividir dados em tabelas separadas e menores. Você também pode desativar o carregamento de uma consulta, caso precise apenas da importação única.

3. Visualização do diagrama

A Visualização de Diagrama permite que você veja visualmente como as fontes de dados estão conectadas e as diferentes transformações aplicadas. Por exemplo, seu fluxo de dados se conecta a uma fonte de dados, duplica a consulta, remove colunas da consulta de origem e, em seguida, desdinamiza a consulta duplicada. Cada consulta é representada como uma forma com todas as transformações aplicadas e conectada por uma linha para a consulta duplicada. Pode ativar ou desativar esta vista.

4. Painel Pré-visualização de Dados

O painel Visualização de Dados mostra apenas um subconjunto de dados para permitir que você veja quais transformações você deve fazer e como elas afetam os dados. Você também pode interagir com o painel de visualização arrastando e soltando colunas para alterar a ordem ou clicando com o botão direito do mouse nas colunas para filtrar ou fazer alterações. A visualização de dados mostra todas as suas transformações para a consulta selecionada.

5. Painel Configurações de consulta

O painel Configurações de Consulta inclui as Etapas Aplicadas. Cada transformação é representada como uma etapa, algumas das quais são aplicadas automaticamente quando você conecta a fonte de dados. Dependendo da complexidade das transformações, você pode ter várias etapas aplicadas para cada consulta. A maioria das etapas tem um ícone de engrenagem que permite modificar a etapa, caso contrário, você deve excluir e repetir a transformação.

Cada etapa também tem um menu contextual quando você clica com o botão direito do mouse para que possa renomear, reordenar ou excluir as etapas. Você também pode exibir a consulta da fonte de dados ao se conectar a uma fonte de dados que ofereça suporte à dobragem de consulta.

Embora essa interface visual seja útil, você também pode visualizar o código M através do editor Avançado.

Captura de tela do editor avançado com código de exemplo

No painel Configurações de consulta, você pode ver uma opção Destino de dados para colocar seus dados em um dos seguintes locais em seu ambiente de malha:

  • Casa do Lago
  • Armazém
  • Base de dados SQL

Você também pode carregar seu fluxo de dados no Banco de Dados SQL do Azure, no Azure Data Explorer ou no Azure Synapse Analytics.

O Dataflows Gen2 fornece uma solução low-to-no-code para ingerir, transformar e carregar dados em seus armazenamentos de dados de malha. Os desenvolvedores do Power BI estão familiarizados e podem começar rapidamente a executar transformações upstream para melhorar o desempenho de seus relatórios.

Nota

Para obter mais informações, consulte a documentação do Power Query para otimizar seus fluxos de dados.