Partilhar via


Práticas recomendadas para reutilizar fluxos de dados entre ambientes e espaços de trabalho

Este artigo discute uma coleção de práticas recomendadas para reutilizar fluxos de dados de forma eficaz e eficiente. Leia este artigo para evitar armadilhas de design e possíveis problemas de desempenho ao desenvolver fluxos de dados para reutilização.

Separe os fluxos de dados de transformação de dados dos fluxos de dados de preparação/extração

Se um fluxo de dados executar todas as ações, será difícil reutilizar suas tabelas em outros fluxos de dados ou para outras finalidades. Os melhores fluxos de dados para reutilizar são aqueles fluxos de dados que fazem apenas algumas ações. Criar fluxos de dados especializados em uma tarefa específica é uma das melhores maneiras de reutilizá-los. Se você tiver um conjunto de fluxos de dados que você usa como fluxos de dados de preparação, sua única ação é extrair dados como estão do sistema de origem. Esses fluxos de dados podem ser reutilizados em vários outros fluxos de dados.

Se você tiver fluxos de dados de transformação de dados, poderá dividi-los em fluxos de dados que fazem transformações comuns. Cada fluxo de dados pode fazer apenas algumas ações. Essas poucas ações por fluxo de dados garantem que a saída desse fluxo de dados seja reutilizável por outros fluxos de dados.

Dataflow doing only a few actions.

Imagem com dados sendo extraídos de uma fonte de dados para fluxos de dados de preparação, onde as tabelas são armazenadas no armazenamento Dataverse ou Azure Data Lake. Em seguida, os dados são movidos para fluxos de dados de transformação, onde os dados são transformados e convertidos na estrutura do data warehouse. Finalmente, os dados são carregados para um modelo semântico do Power BI.

Usar vários espaços de trabalho

Cada espaço de trabalho (ou ambiente) está disponível apenas para membros desse espaço de trabalho. Se você criar todos os seus fluxos de dados em um espaço de trabalho, estará minimizando a reutilização de seus fluxos de dados. Você pode ter alguns espaços de trabalho genéricos para fluxos de dados que estão processando tabelas de toda a empresa. Você também pode ter algum espaço de trabalho para fluxos de dados para processar tabelas em vários departamentos. E você também pode ter alguns espaços de trabalho para fluxos de dados a serem usados apenas em departamentos específicos.

Image showing the separate workspaces.

Definir os níveis de acesso corretos em espaços de trabalho

Para dar acesso a fluxos de dados em outros espaços de trabalho para usar a saída de um fluxo de dados em um espaço de trabalho, você só precisa conceder a eles acesso de exibição no espaço de trabalho. Para saber mais sobre outras funções em um espaço de trabalho do Power BI, vá para Funções nos novos espaços de trabalho.

Screenshot showing how to access to the Power BI workspace.

Endosso sobre o fluxo de dados no Power BI

Pode haver muitos fluxos de dados criados em uma organização de locatário e pode ser difícil para os usuários saber qual fluxo de dados é mais confiável. Os autores de um fluxo de dados, ou aqueles usuários que têm acesso de edição a ele, podem endossar o fluxo de dados em três níveis: sem endosso, promovido ou certificado.

Esses níveis de endosso ajudam os usuários a encontrar fluxos de dados confiáveis de forma mais fácil e rápida. O fluxo de dados com um nível de endosso mais alto aparece primeiro. O administrador do Power BI pode delegar a outras pessoas a capacidade de endossar fluxos de dados para o nível certificado. Para obter mais informações: Endosso - Promover e certificar conteúdo do Power BI

Screenshot of the Power Query Navigator showing the promoted and certified endorsement labels on specific dataflows.

Tabelas separadas em vários fluxos de dados

Você pode ter várias tabelas em um fluxo de dados. Uma das razões pelas quais você pode dividir tabelas em vários fluxos de dados é o que você aprendeu anteriormente neste artigo sobre como separar os fluxos de dados de ingestão e transformação de dados. Outra boa razão para ter tabelas em vários fluxos de dados é quando você deseja uma agenda de atualização diferente de outras tabelas.

No exemplo mostrado na imagem a seguir, a tabela de vendas precisa ser atualizada a cada quatro horas. A tabela de datas precisa ser atualizada apenas uma vez por dia para manter o registro de data atual atualizado. E uma tabela de mapeamento de produtos só precisa ser atualizada uma vez por semana. Se você tiver todas essas tabelas em um fluxo de dados, terá apenas uma opção de atualização para todas. No entanto, se você dividir essas tabelas em vários fluxos de dados, poderá agendar a atualização de cada fluxo de dados separadamente.

Image showing dataflows with different schedules for the refresh.

Bons candidatos a tabelas para tabelas de fluxo de dados

Quando desenvolve soluções com o Power Query nas ferramentas de ambiente de trabalho, pode perguntar-se; Quais dessas tabelas são boas candidatas a serem movidas para um fluxo de dados? As melhores tabelas a serem movidas para o fluxo de dados são aquelas que precisam ser usadas em mais de uma solução ou em mais de um ambiente ou serviço. Por exemplo, a tabela Date mostrada na imagem a seguir precisa ser usada em dois arquivos separados do Power BI. Em vez de duplicar essa tabela em cada arquivo, você pode criar a tabela em um fluxo de dados como uma tabela e reutilizá-la nesses arquivos do Power BI.

Image showing a shared table used in a dataflow.