Compartilhar via


Guia rápido do Power BI

Esta página fornece diretrizes claras e opinativas para gerenciar com eficiência seus dados no Power BI e no Azure Databricks para otimizar o desempenho da consulta e criar painéis eficientes.

Conectar o Azure Databricks e o Power BI

Melhor prática Impacto Docs
Usar parâmetros do Power BI ao se conectar a diferentes ambientes do Azure Databricks Permite flexibilidade ao se conectar a diferentes workspaces do Azure Databricks ou a diferentes sql warehouses do Azure Databricks.
Usar a funcionalidade de publicação do Azure Databricks para o serviço Power BI. Habilita a integração perfeita do catálogo e a sincronização de modelos de dados sem sair da interface do usuário do Azure Databricks.
Usar a Publicação Automática do Azure Databricks no Power BI Publicar conjuntos de dados do Unity Catalog diretamente a partir de pipelines de dados no Power BI.

Escolha o modo de armazenamento mais apropriado

Melhor prática Impacto Docs
Usar DirectQuery para tabelas de fatos e Dual para tabelas de dimensões (não Importar) Gere consultas SQL mais eficientes usando o modo de armazenamento mais adequado.
Preferir DirectQuery em vez de Importar sempre que possível Permite manter a governança e a audibilidade.
Usar modelos compostos para modos de armazenamento misto Permite o uso misto das tabelas DirectQuery, Dual, modo de Importação, e tabelas de Agregação e Híbridas.
Usar tabelas híbridas para dados históricos agregados com dados em tempo real Habilita consultas eficientes na memória.

Otimizar o acesso a dados

Melhor prática Impacto Docs
Usar agregações definidas pelo usuário Melhora o desempenho da consulta em relação a grandes modelos semânticos do DirectQuery armazenando dados pré-agregados em cache.
Usar agregações automáticas Otimiza continuamente os modelos semânticos do DirectQuery criando agregações com base no Histórico de Consultas para o desempenho máximo do relatório.
Usar o particionamento de tabela ou a atualização incremental Permite importar dados mais rapidamente e gerenciar conjuntos de dados maiores, especialmente para relatórios muito pequenos, estáticos e sensíveis ao desempenho (menos de 2 segundos).
Adicionar Aplicar todas as segmentações de dados e limpar todos os botões de segmentação de dados Impede consultas desnecessárias aproveitando as configurações de redução de consulta quando os usuários interagem com filtros de relatório.
Use Assumir integridade referencial ao definir as relações de tabela se a integridade referencial tiver sido validada na ingestão anterior Permite estratégias de junção mais eficientes em consultas SQL.

Ajustar seu modelo de dados

Melhor prática Impacto Docs
Transformações de "mover para a esquerda" As visualizações do SQL aproveitam o poder do mecanismo SQL do Databricks para uma execução mais eficiente de relatórios em comparação com transformações do PowerQuery e fórmulas DAX.
Se você precisar usar fórmulas DAX, otimize as fórmulas DAX e evite grandes conjuntos de resultados. Impede cálculos ineficientes que levam ao desempenho deteriorado
Evite colunas calculadas da DAX e tabelas calculadas em modelos semânticos e defina esses dados diretamente em suas tabelas Gold As medidas pré-computadas têm o melhor desempenho na camada Gold
Para DirectQuery, verifique se há configurações de paralelização de consulta Melhora a paralelização de consulta e maximiza a utilização do SQL Warehouse para melhorar o desempenho geral.
Para o DirectQuery, verifique quantas consultas o Power BI pode enviar em paralelo ao Azure Databricks Garante que o Databricks SQL Warehouse seja dimensionado adequadamente para lidar com o nível necessário de paralelismo, evitando que as consultas sejam enfileiradas, o que resulta em relatórios lentos.

Monitorar o desempenho e as métricas

Melhor prática Impacto Docs
Usar o Analisador de Desempenho do Power BI para examinar o desempenho do elemento de relatório Identifica a visualização que leva mais tempo para carregar e onde está o gargalo.
Avalie as seguintes propriedades de modelos semânticos do Power BI:
  • Máximo de conexões por fonte de dados
  • Número máximo de avaliações simultâneas
  • Número máximo de trabalhos simultâneos
  • MaxParallelismPerQuery
Ajusta o desempenho do modelo.