Partilhar via


Dimensionamento do gateway de dados local

Este artigo destina-se a administradores do Power BI que precisam instalar e gerenciar o gateway de dados local.

O gateway é necessário sempre que o Power BI precisa acessar dados que não estão acessíveis diretamente pela Internet. Ele pode ser instalado em um servidor local ou em uma infraestrutura como serviço (IaaS) hospedada por VM.

Cargas de trabalho de gateway

O gateway de dados local suporta duas cargas de trabalho. É importante que você primeiro entenda essas cargas de trabalho antes de discutirmos o dimensionamento e as recomendações do gateway.

Carga de trabalho de dados em cache

A carga de trabalho de dados em cache recupera e transforma dados de origem para carregamento em modelos semânticos do Power BI (anteriormente conhecidos como conjuntos de dados). Fá-lo em três etapas:

  1. Conexão: O gateway se conecta aos dados de origem.
  2. Recuperação e transformação de dados: os dados são recuperados e, quando necessário, transformados. Sempre que possível, o mecanismo de mashup do Power Query envia etapas de transformação para a fonte de dados — é conhecido como dobragem de consulta. Quando não é possível, as transformações devem ser feitas pelo gateway. Nesse caso, o gateway consumirá mais recursos de CPU e memória.
  3. Transferência: os dados são transferidos para o serviço do Power BI — uma conexão de Internet confiável e rápida é importante, especialmente para grandes volumes de dados.

Diagrama de dados de cache mostrando o gateway de dados local se conectando a fontes locais.

Cargas de trabalho de conexão ao vivo e DirectQuery

A carga de trabalho Live Connection e DirectQuery funciona principalmente no modo de passagem. O serviço do Power BI envia consultas e o gateway responde com resultados de consulta. Geralmente, os resultados da consulta são pequenos em tamanho.

Essa carga de trabalho requer recursos da CPU para rotear consultas e resultados de consultas. Normalmente, há muito menos demanda por CPU do que a exigida pela carga de trabalho de dados de cache, especialmente quando é necessário transformar dados para cache.

A conectividade confiável, rápida e consistente é importante para garantir que os usuários do relatório tenham experiências responsivas.

Diagrama de Live Connection e DirectQuery mostrando o gateway de dados local se conectando a fontes locais.

Considerações sobre dimensionamento

Determinar o dimensionamento correto para sua máquina de gateway pode depender das seguintes variáveis:

  • Para cargas de trabalho de dados de cache:
    • O número de atualizações simultâneas do modelo semântico
    • Os tipos de fontes de dados (banco de dados relacional, banco de dados analítico, feeds de dados ou arquivos)
    • O volume de dados a recuperar de fontes de dados
    • Quaisquer transformações necessárias para serem feitas pelo mecanismo de mashup do Power Query
    • O volume de dados a ser transferido para o serviço do Power BI
  • Para cargas de trabalho do Live Connection e DirectQuery:

Geralmente, as cargas de trabalho Live Connection e DirectQuery exigem CPU suficiente, enquanto as cargas de trabalho de dados de cache exigem mais CPU e memória. Ambas as cargas de trabalho dependem de uma boa conectividade com o serviço do Power BI e as fontes de dados.

Nota

As capacidades do Power BI impõem limites ao paralelismo de atualização do modelo e à taxa de transferência do Live Connection e do DirectQuery. Não faz sentido dimensionar seus gateways para fornecer mais do que o que o serviço do Power BI suporta. Os limites diferem por SKU Premium (e SKU A de tamanho equivalente). Para obter mais informações, consulte Licenças de capacidade do Microsoft Fabric e O que é o Power BI Premium? (Nós de capacidade).

Importante

Às vezes, este artigo se refere ao Power BI Premium ou suas assinaturas de capacidade (SKUs P). Lembre-se de que a Microsoft está atualmente consolidando opções de compra e desativando as SKUs do Power BI Premium por capacidade. Em vez disso, os clientes novos e existentes devem considerar a compra de assinaturas de capacidade de malha (SKUs F).

Para obter mais informações, consulte Atualização importante chegando ao licenciamento do Power BI Premium e Perguntas frequentes sobre o Power BI Premium.

Recomendações

As recomendações de dimensionamento do gateway dependem de muitas variáveis. Nesta secção, fornecemos-lhe recomendações gerais que pode ter em consideração.

Dimensionamento inicial

Pode ser difícil estimar com precisão o tamanho certo. Recomendamos que você comece com uma máquina com pelo menos 8 núcleos de CPU, 8 GB de RAM e vários adaptadores de rede Gigabit. Em seguida, você pode medir uma carga de trabalho típica de gateway registrando contadores de CPU e sistema de memória. Para obter mais informações, consulte Monitorar e otimizar o desempenho do gateway de dados local.

Conectividade

Planeje a melhor conectividade possível entre o serviço do Power BI e seu gateway, e seu gateway e as fontes de dados.

  • Procure confiabilidade, velocidades rápidas e latências baixas e consistentes.
  • Elimine — ou reduza — os saltos de máquina entre o gateway e suas fontes de dados.
  • Remova qualquer limitação de rede imposta pela camada de proxy do firewall. Para obter mais informações sobre pontos de extremidade do Power BI, consulte Adicionar URLs do Power BI à sua lista de permissões.
  • Configure o Azure ExpressRoute para estabelecer conexões privadas e gerenciadas com o Power BI.
  • Para fontes de dados em VMs do Azure, verifique se as VMs estão colocalizadas com o serviço do Power BI.
  • Para cargas de trabalho de Conexão em tempo real com o SQL Server Analysis Services (SSAS) envolvendo RLS dinâmica, garanta uma boa conectividade entre a máquina gateway e o Ative Directory local.

Clustering

Para implantações em grande escala, você pode criar um gateway com vários membros do cluster. Os clusters evitam pontos únicos de falha e podem balancear a carga do tráfego entre gateways. Pode:

  • Instale um ou mais gateways em um cluster.
  • Isole cargas de trabalho em gateways autônomos ou clusters de servidores gateway.

Para obter mais informações, consulte Gerenciar clusters de alta disponibilidade do gateway de dados local e balanceamento de carga.

Design e configurações do modelo semântico

O design do modelo semântico e suas configurações podem afetar as cargas de trabalho do gateway. Para reduzir a carga de trabalho do gateway, você pode considerar as seguintes ações.

Para Importar modelos semânticos:

  • Configure uma atualização de dados menos frequente.
  • Configure a atualização incremental para minimizar a quantidade de dados a serem transferidos.
  • Sempre que possível, certifique-se de que a dobragem da consulta ocorra.
  • Especialmente para grandes volumes de dados ou uma necessidade de resultados de baixa latência, converta o design em um modelo DirectQuery ou Composto .

Para modelos semânticos DirectQuery:

  • Otimizar fontes de dados, modelos e designs de relatório — para obter mais informações, consulte Diretrizes de modelo do DirectQuery no Power BI Desktop.
  • Crie agregações para armazenar em cache resultados de nível superior para reduzir o número de solicitações DirectQuery.
  • Restringir intervalos de atualização automática de página, em designs de relatório e configurações de capacidade.
  • Especialmente quando a RLS dinâmica é imposta, restrinja a frequência de atualização do cache do painel.
  • Especialmente para volumes de dados menores ou para dados não voláteis, converta o design em um modelo Import ou Composto .

Para modelos semânticos Live Connection:

  • Especialmente quando a RLS dinâmica é imposta, restrinja a frequência de atualização do cache do painel.

Para obter mais informações relacionadas a este artigo, confira os seguintes recursos: