Dimensionamento de gateway de dados local

Este artigo se destina aos administradores do Power BI que precisam instalar e gerenciar o gateway de dados local.

O gateway é necessário sempre que o Power BI precisa acessar dados que não estão acessíveis diretamente pela Internet. Ele pode ser instalado em um servidor local ou em uma IaaS (infraestrutura como serviço) hospedada pela VM.

Cargas de trabalho do gateway

O gateway de dados local dá suporte a duas cargas de trabalho. É importante que você entenda primeiro essas cargas de trabalho antes de discutirmos o dimensionamento e as recomendações do gateway.

Carga de trabalho de dados armazenados em cache

A carga de trabalho de Dados armazenados em cache recupera e transforma os dados de origem para carregá-los em modelos semânticos do Power BI (conhecidos anteriormente como conjuntos de dados). Ela faz isso em três etapas:

  1. Conexão: o gateway se conecta aos dados de origem.
  2. Recuperação de dados e transformação: os dados são recuperados e, quando necessário, são transformados. Sempre que possível, o mecanismo de mashup do Power Query envia as etapas de transformação para a fonte de dados – isso é conhecido como dobragem de consultas . Quando isso não é possível, as transformações devem ser feitas pelo gateway. Nesse caso, o gateway consumirá mais recursos de CPU e memória.
  3. Transferência: os dados são transferidos para o serviço do Power BI – uma conexão de Internet confiável e rápida é importante, especialmente para grandes volumes de dados.

Diagrama de Dados do Cache mostrando o gateway de dados local conectando-se a fontes locais.

Cargas de trabalho de Conexão Dinâmica e DirectQuery

As cargas de trabalho de Conexão Dinâmica e DirectQuery funcionam principalmente no modo de passagem. O serviço do Power BI envia consultas, e o gateway responde com os resultados da consulta. Em geral, os resultados da consulta têm um tamanho pequeno.

Essa carga de trabalho requer recursos de CPU para roteamento e resultados de consultas. Geralmente, há uma demanda muito menor por CPU do que a exigida pela carga de trabalho de dados de cache, especialmente quando é necessário transformar dados para armazenamento em cache.

Uma conectividade confiável, rápida e consistente é importante para garantir que os usuários de relatórios tenham experiências dinâmicas.

Diagrama da Conexão Dinâmica e do DirectQuery mostrando o gateway de dados local se conectando a fontes locais.

Considerações de dimensionamento

Determinar o dimensionamento correto para o computador de gateway pode depender das seguintes variáveis:

  • Para cargas de trabalho de dados de cache:
    • O número de atualizações simultâneas do modelo semântico
    • Os tipos de fontes de dados (banco de dados relacional, banco de dados analítico, feeds de dados ou arquivos)
    • O volume de dados a ser recuperado das fontes de dados
    • As transformações necessárias a serem feitas pelo mecanismo de mashup do Power Query
    • O volume de dados a ser transferido para o serviço do Power BI
  • Para cargas de trabalho de conexão dinâmica e DirectQuery:
    • O número de usuários de relatórios simultâneos
    • O número de visuais nas páginas de relatório (cada visual envia pelo menos uma consulta)
    • A frequência de atualizações do cache de consulta do dashboard do Power BI
    • O número de relatórios em tempo real que usam o recurso de Atualização automática de página
    • Se os modelos semânticos impõem Segurança em Nível de Linha (RLS)

Geralmente, as cargas de trabalho de Conexão Dinâmica e DirectQuery exigem recursos suficientes de CPU, enquanto as cargas de trabalho de dados de cache exigem mais recursos de CPU e memória. Ambas as cargas de trabalho dependem de uma boa conectividade com o serviço do Power BI e com as fontes de dados.

Observação

As capacidades do Power BI impõem limites quanto ao paralelismo de atualização do modelo e à taxa de transferência de Conexão Dinâmica e DirectQuery. Não faz sentido dimensionar seus gateways para oferecer mais do que o serviço do Power BI suporta. Os limites diferem na SKU Premium (e na SKU A de tamanho equivalente). Para obter mais informações, consulte as licenças de capacidade do Microsoft Fabric e O que é o Power BI Premium? (Nós de Capacidade).

Importante

Às vezes, este artigo se refere ao Power BI Premium ou às suas assinaturas de capacidade (P SKUs). Lembre-se de que a Microsoft está consolidando atualmente as opções de compra e desativando os SKUs do Power BI Premium por capacidade. Em vez disso, os clientes novos e existentes devem considerar a compra de SKUs (assinaturas de capacidade do Fabric).

Para obter mais informações, consulte Atualização importante chegando ao de licenciamento do Power BI Premium e Perguntas frequentes do Power BI Premium.

Recomendações

As recomendações de dimensionamento de gateway dependem de muitas variáveis. Nesta seção, fornecemos recomendações gerais que você pode levar em consideração.

Dimensionamento inicial

Pode ser difícil estimar com precisão o tamanho correto. Recomendamos que você inicie com um computador com pelo menos 8 núcleos de CPU, 8 GB de RAM e vários adaptadores de rede Gigabit. Em seguida, você pode medir uma carga de trabalho de gateway típica registrando contadores de sistema de CPU e memória. Para obter mais informações, confira Monitorar e otimizar o desempenho do gateway de dados local.

Conectividade

Planeje a melhor conectividade possível entre o serviço do Power BI e o gateway e entre o gateway e as fontes de dados.

  • Procure confiabilidade, velocidades rápidas e latências baixas e consistentes.
  • Elimine ou reduza saltos de máquina entre o gateway e suas fontes de dados.
  • Remova qualquer limitação imposta pela camada de proxy do firewall. Para saber mais sobre pontos de extremidade do Power BI, confira Adicionar URLs do Power BI à sua lista de permissões.
  • Configure o Azure ExpressRoute para estabelecer conexões privadas e gerenciadas com o Power BI.
  • Para fontes de dados em VMs do Azure, certifique-se de que as VMs sejam colocadas com o serviço do Power BI.
  • Para cargas de trabalho de Conexão Dinâmica com o SQL Server Analysis Services (SSAS) que envolvem RLS dinâmicos, garanta uma boa conectividade entre o computador de gateway e o Active Directory local.

Clustering

Para implantações em larga escala, você pode criar um gateway com vários membros do cluster. Os clusters evitam pontos únicos de falha e podem balancear a carga do tráfego entre gateways. Você poderá:

  • Instale um ou mais gateways em um cluster.
  • Isole cargas de trabalho em gateways autônomos ou clusters de servidores de gateway.

Para obter mais informações, confira Gerenciar clusters de alta disponibilidade e balanceamento de carga do gateway de dados local.

Design e configurações do modelo semântico

O design do modelo semântico e suas configurações podem impactar as cargas de trabalho do gateway. Para reduzir a carga de trabalho do gateway, você pode considerar as seguintes ações.

Para importar modelos semânticos:

  • Configure uma atualização de dados menos frequente.
  • Configure a atualização incremental para minimizar a quantidade de dados a serem transferidos.
  • Sempre que possível, certifique-se de que ocorra a dobragem de consultas.
  • Especialmente para grandes volumes de dados ou uma necessidade de resultados de baixa latência, converta o design em um modelo do DirectQuery ou Composto.

Para modelos semânticos do DirectQuery:

  • Otimizar fontes de dados, modelo e designs de relatório – para obter mais informações, confira Diretrizes de modelo do DirectQuery no Power BI Desktop.
  • Crie agregações para armazenar em cache resultados de nível superior para reduzir o número de solicitações do DirectQuery.
  • Restrinja intervalos de atualização de página automática, em designs de relatório e configurações de capacidade.
  • Especialmente quando o RLS dinâmico for imposto, restrinja a frequência de atualização do cache do painel.
  • Especialmente para volumes de dados menores ou para dados não voláteis, converta o design em um modelo de Importação ou Composto.

Para modelos semânticos da Conexão Dinâmica:

  • Especialmente quando o RLS dinâmico for imposto, restrinja a frequência de atualização do cache do painel.

Para obter mais informações relacionadas a este artigo, confira os seguintes recursos: