Considerações e limitações dos fluxos de dados
Há algumas limitações de fluxo de dados na criação, atualizações e gerenciamento de capacidade que os usuários devem ter em mente, conforme descrito nas seções a seguir.
Limitações gerais
- Os fluxos de dados podem não estar disponíveis para todos os clientes do DoD do governo dos EUA. A paridade de recursos entre ambientes governamentais pode ser encontrada no artigo Disponibilidade de recursos do Power BI para governo .
- As fontes de dados excluídas não são removidas da página da fonte de dados de fluxo de dados, o que é um comportamento benigno e não afeta a atualização ou edição de fluxos de dados. No Modo de Exibição de Linhagem, as fontes de dados excluídas aparecem como linhagem para um fluxo de dados.
- As fontes de dados excluídas ainda aparecem na página Configuração no menu suspenso do gateway.
- A profundidade equivale a fluxos de dados vinculados a outros fluxos de dados. A profundidade máxima atual é de 32.
- A amplitude equivale a entidades dentro de um fluxo de dados.
- Não há orientação ou limites para o número ideal de entidades em um fluxo de dados, no entanto, os fluxos de dados compartilhados têm um limite de atualização de duas horas por entidade e três por fluxo de dados. Portanto, se você tiver duas entidades, e cada uma leva duas horas, não deve colocá-las no mesmo fluxo de dados.
- Para o Power BI Premium, a orientação e os limites são baseados em casos de uso individuais e não em requisitos específicos. O único limite para o Power BI Premium é uma atualização de 24 horas por fluxo de dados.
- É necessária uma subscrição do Power BI Premium para atualizar mais de 10 fluxos de dados entre espaços de trabalho.
- As limitações do PowerQuery encontram-se no artigo Limites do Power Query Online.
- Os fluxos de dados do Power BI não suportam o uso de variáveis globais em um argumento de URL.
- Atualmente, não há suporte para Multi-Geo, a menos que configure o armazenamento para usar sua própria conta de armazenamento do Azure Data Lake Gen2.
- O suporte Vnet é obtido usando um gateway.
- Quando você usa entidades computadas com fontes de dados de gateway, a ingestão de dados deve ser executada em fontes de dados diferentes dos cálculos. As entidades computadas devem se basear em entidades que são usadas apenas para ingestão, e não ingerir dados dentro de suas próprias etapas de mash-up.
- Nos fluxos de dados do Power BI, você pode usar parâmetros, mas não pode editá-los, a menos que edite todo o fluxo de dados. A este respeito, os parâmetros nos fluxos de dados comportam-se de forma semelhante às constantes declaradas.
- Alguns conectores encontrados em Solucionar problemas de cenários de atualização não são suportados para fluxos de dados e datamarts em espaços de trabalho Premium.
- Ao usar o DirectQuery com um fluxo de dados, as pesquisas usando o visual de segmentação de dados diferenciam maiúsculas de minúsculas.
Criação de fluxo de dados
Ao criar fluxos de dados, esteja atento às seguintes considerações:
A criação em fluxos de dados é feita no ambiente do Power Query Online (PQO); consulte as limitações descritas em Limites do Power Query. Como a criação de fluxos de dados é feita no ambiente do Power Query Online (PQO), as atualizações executadas nas configurações de carga de trabalho de fluxos de dados afetam apenas as atualizações e não afetam a experiência de criação.
Os fluxos de dados só podem ser modificados pelos seus proprietários.
Os fluxos de dados não estão disponíveis em Meu Espaço de Trabalho.
Os fluxos de dados que usam fontes de dados de gateway não oferecem suporte a várias credenciais para a mesma fonte de dados.
Usar o conector Web.Page requer um gateway.
Na experiência de edição do Dataflows Gen1, os usuários talvez não consigam remover uma conexão do Data Gateway local do fluxo de dados usando Opções>do Project>Data load>select (none) na lista suspensa Data Gateway. As seguintes etapas podem resolver o problema:
- Comece a editar o fluxo de dados onde você deseja remover a conexão do Gateway de Dados local.
- Selecione Opções>de carregamento de dados do projeto Gateway>de dados, selecione Nenhum e, em seguida, OK.
- Se aparecer um aviso amarelo com um botão "Configurar conexão", selecione "Configurar conexão", selecione a conexão na nuvem na caixa suspensa e insira as credenciais, se necessário, para a conexão na nuvem.
- Selecione Gerenciar conexões> e, em seguida, selecione o botão desvincular da conexão de gateway.
- Feche a caixa de diálogo Gerenciar conexões , se for necessário "Configurar conexão" novamente, faça isso. Selecione Salvar e fechar e aguarde a conclusão da operação de salvamento.
- Se o aviso "Configurar conexão" não aparecer depois de aplicar as etapas anteriores, aplique as etapas anteriores, salve e feche o fluxo de dados, edite-o novamente e verifique se o aviso "Configurar conexão" aparece para que você tome medidas sobre ele.
Se a conexão com o Gateway ainda não for removida do fluxo de dados, talvez seja necessário recriar um novo fluxo de dados com as mesmas consultas, não vinculado ao Gateway.
Considerações sobre a API
Mais informações sobre fluxos de dados suportados As APIs REST podem ser encontradas na referência da API REST. Seguem-se algumas considerações a ter em conta:
Exportar e importar um fluxo de dados dá a esse fluxo de dados uma nova ID.
A importação de fluxos de dados que contêm tabelas vinculadas não atualiza as referências existentes dentro do fluxo de dados (essas consultas devem ser atualizadas manualmente antes de importar o fluxo de dados).
Ao implantar um fluxo de dados, você pode usar os manipuladores de conflitos GenerateUniqueName e os parâmetros Abort para anular a operação quando ela já existir ou instruir a API a criar automaticamente um nome exclusivo. Os fluxos de dados podem ser substituídos pelo parâmetro CreateOrOverwrite , se tiverem sido criados inicialmente usando a API de importação.
Fluxos de dados em capacidades partilhadas
Existem limitações para os fluxos de dados em capacidades partilhadas (capacidades não premium):
- Quando um fluxo de dados é atualizado, os tempos limite em uma capacidade compartilhada são de 2 horas por tabela e 3 horas por fluxo de dados.
- As tabelas vinculadas não podem ser criadas em fluxos de dados compartilhados, embora possam existir dentro do fluxo de dados, desde que a propriedade Load Enabled na consulta esteja desabilitada.
- Não é possível criar tabelas computadas em fluxos de dados compartilhados.
- AutoML e serviços cognitivos não estão disponíveis em fluxos de dados compartilhados.
- A atualização incremental não funciona em fluxos de dados compartilhados.
Fluxos de dados no Premium
Os fluxos de dados que existem no Premium têm as seguintes considerações e limitações.
Atualizações e considerações sobre dados:
Ao atualizar fluxos de dados, os tempos limite são de 24 horas (sem distinção para tabelas e/ou fluxos de dados).
Alterar um fluxo de dados de uma política de atualização incremental para uma atualização normal, ou vice-versa, descarta todos os dados.
Modificar o esquema de um fluxo de dados descarta todos os dados.
Ao usar uma licença Premium por usuário (PPU) com fluxos de dados, os dados são limpos ao mover dados para fora de um ambiente PPU.
Quando um fluxo de dados é atualizado em um contexto Premium por usuário (PPU), os dados não são visíveis para usuários que não são PPU.
A atualização incremental funciona com fluxos de dados somente quando o mecanismo de computação aprimorado está habilitado.
Tabelas vinculadas e computadas:
As tabelas vinculadas podem descer até uma profundidade de 32 referências.
Dependências cíclicas de tabelas vinculadas não são permitidas.
Uma tabela vinculada não pode ser unida a uma tabela regular que obtém seus dados de uma fonte de dados local.
Quando uma consulta (consulta A, por exemplo) é usada no cálculo de outra consulta (consulta B) em fluxos de dados, a consulta B torna-se uma tabela calculada. As tabelas calculadas não podem fazer referência a fontes locais.
Mecanismo de computação:
Ao usar o mecanismo de computação, há um aumento inicial aproximado de 10% a 20% no tempo de ingestão de dados.
- Isso se aplica apenas ao primeiro fluxo de dados que está no mecanismo de computação e lê dados da fonte de dados.
- Os fluxos de dados subsequentes que usam o fluxo de dados de origem não incorrem na mesma penalidade.
Apenas certas operações fazem uso do mecanismo de computação, e somente quando usadas através de uma tabela vinculada ou como uma tabela computada. Uma lista completa de operações está disponível nesta postagem do blog.
Gerenciamento de capacidade:
Por design, as Capacidades Premium do Power BI têm um Gerenciador de Recursos interno que limita as cargas de trabalho de maneiras diferentes quando a capacidade está sendo executada com pouca memória.
- Para fluxos de dados, essa pressão de limitação reduz o número de contêineres M disponíveis.
- A memória para fluxos de dados pode ser definida como 100%, com um contêiner de tamanho apropriado para seus tamanhos de dados, e a carga de trabalho gerenciará o número de contêineres adequadamente.
O número aproximado de contêineres pode ser encontrado dividindo a memória total alocada para a carga de trabalho pela quantidade de memória alocada para um contêiner.
Uso de fluxo de dados em modelos semânticos
- Ao criar um modelo semântico no Power BI Desktop e, em seguida, publicá-lo no serviço do Power BI, verifique se as credenciais usadas no Power BI Desktop para a fonte de dados de fluxos de dados são as mesmas usadas quando o modelo semântico é publicado no serviço.
- A falha ao garantir que essas credenciais sejam as mesmas resulta em um erro de chave não encontrada na atualização do modelo semântico
Nota
Se a estrutura de fluxo de dados for alterada, como uma coluna nova ou renomeada, o modelo semântico não mostrará a alteração e a alteração também poderá fazer com que uma atualização de dados falhe no serviço do Power BI para o modelo semântico, até ser atualizada no Power BI Desktop e republicada.
Fluxos de dados e conexões nomeadas
Ao usar fluxos de dados com conexões nomeadas, as seguintes limitações se aplicam:
- Você só pode criar uma conexão de nuvem de um determinado caminho e tipo, por exemplo, você só pode criar uma conexão de nuvem SQL mais servidor/banco de dados. Você pode criar várias conexões de gateway.
- Não é possível nomear ou renomear fontes de dados na nuvem; Você pode nomear ou renomear conexões de gateway.
Limitações da ADLS
- O ADLS não está disponível em ambientes GCC, GCC High ou DOD. Para obter mais informações, consulte Power BI para clientes do governo dos EUA.
- Você deve ser atribuído como proprietário do recurso, devido a alterações nas APIs ADLS Gen 2.
- A migração de assinatura do Azure não é suportada, mas há duas alternativas para fazer isso:
- Primeira abordagem: após a migração, o usuário pode desanexar espaços de trabalho e reanexá-los. Se estiver usando a conta de nível de locatário, você deverá desanexar todos os espaços de trabalho, desanexar no nível do locatário e reanexar. Isso pode ser indesejável para clientes que não querem excluir todos os seus fluxos de dados ou têm muitos espaços de trabalho.
- Segunda abordagem: se a abordagem anterior não for viável, envie uma solicitação de suporte para alterar o ID da assinatura no banco de dados.
- O ADLS não oferece suporte à maioria dos elementos na lista na seção Diretórios e nomes de arquivo do artigo para nomeação de espaço de trabalho e nomeação de fluxo de dados, devido às seguintes limitações:
- O Power BI retorna um erro inútil ou permite que o processo aconteça, mas a atualização falhará.
- Não há suporte para assinaturas ADLS entre locatários. O ADLS anexado ao Power BI deve fazer parte do mesmo locatário do Azure que o Power BI usa para o Microsoft Entra ID.
Tipos de dados de fluxo de dados
Os tipos de dados suportados em fluxos de dados são os seguintes:
Tipo de dados Mashup | Tipo de dados de fluxo de dados |
---|---|
Hora | Hora |
Date | Date |
DateTime | DateTime |
DateTimeZone | DateTimeOffset |
Lógico | Boolean |
Texto | String |
Qualquer | String |
Moeda | Decimal |
Int8 | Int64 |
Int16 | Int64 |
Int32 | Int64 |
Int64 | Int64 |
Duplo | Duplo |
Percentagem | Duplo |
Única | Duplo |
Decimal | Duplo |
Número | Duplo |
Duração | Não suportado |
Binário | Não suportado |
Function | Não suportado |
Tabela | Não suportado |
Listagem | Não suportado |
Registo | Não suportado |
Type | Não suportado |
Ação | Não suportado |
Nenhuma | Não suportado |
Nulo | Não suportado |
Conteúdos relacionados
Os seguintes artigos fornecem mais informações sobre fluxos de dados e o Power BI:
- Introdução aos fluxos de dados e preparação de dados de autoatendimento
- Criando um fluxo de dados
- Configurar e consumir um fluxo de dados
- Configurando o armazenamento de fluxo de dados para usar o Azure Data Lake Gen 2
- Recursos premium de fluxos de dados
- IA com fluxos de dados
- Práticas recomendadas de fluxos de dados