Melhorar a atualização e a função de um modelo

Concluído

Antes de explorar ainda mais como melhorar a atualização e a função de um modelo, deve saber como o Power BI armazena dados. Semelhante aos ficheiros hyper do Tableau, o Power BI armazena dados como uma base de dados columnar.

Captura de ecrã da base de dados baseada em linhas e da base de dados columnar do Power BI.

Nota

Uma base de dados columnar armazena cada coluna como o seu próprio ficheiro em vez de armazenar os dados linha a linha (base de dados baseada em linhas).

Armazenar os seus dados como uma base de dados columnar é ideal para tabelas longas em que a obtenção de linhas para uma coluna é muito mais rápida. Os dados numa coluna são sempre do mesmo tipo, como uma cadeia ou número inteiro. Uma vez que todas as entradas de um tipo estão agrupadas, podem ser comprimidas de forma mais eficiente, o que leva a um melhor desempenho ao analisar grandes volumes de dados.

Nota

O Power BI também tenta armazenar estas colunas de forma ideal ao agrupá-las em conjunto, como itens. Depois de as colunas terem sido agrupadas, será criado um dicionário de valores distintos mapeados.

Melhorar um modelo

Considere os seguintes fatores quando pretende melhorar o desempenho de um modelo:

  • Cardinalidade

  • Alterar os BLANKs para valores

  • Remover campos redundantes e desnecessários

  • Esquemas de estrela

  • Data/hora automática

  • Números inteiros versus cadeias

Remover campos de cardinalidade elevada

Cardinalidade refere-se ao número de valores exclusivos contidos numa coluna ou campo de base de dados. Normalmente, os valores de cardinalidade elevada são números de identificação, endereços de e-mail ou nomes de utilizador.

Exemplo de captura de ecrã de uma coluna de tabela de dados com cardinalidade elevada é uma tabela USERS com uma coluna com o nome USER_ID.

A sua primeira consideração deve ser a remoção de campos de elevada cardinalidade. Se tiver um ID exclusivo para cada linha, remova esse campo. Quanto maior for a cardinalidade, mais dispendiosa é armazenar; valores distintos são iguais a custos elevados.

Um problema comum é um campo Data/Hora , onde a combinação da data e hora aumenta a cardinalidade do campo. Para resolver este problema, considere dividir o campo em campos de data e hora separados.

Alterar OS BLANKs para valores

Ao escrever medidas, poderá encontrar cenários em que não é possível devolver um valor significativo. Nestes casos, poderá sentir-se tentado a devolver um valor, como zero. Por uma questão de desempenho, deve reconsiderar esta tentação.

Durante a maioria dos cálculos, os valores BLANK são ignorados, mas os valores zero não são. Converter os valores BLANK em zero irá forçar o cálculo a avaliar mais linhas e devolver um conjunto de resultados de consulta grande, o que muitas vezes leva à composição lenta de relatórios. Por outras palavras, converter os valores BLANK em zero adiciona ao custo de cálculo.

Remover campos redundantes e desnecessários

A remoção de campos redundantes e desnecessários é importante porque está a tentar limitar a largura das tabelas, o que melhora o desempenho da atualização. Normalmente, pode remover campos redundantes porque criou um esquema de star e não precisa que o mesmo campo apareça várias vezes. Com campos desnecessários, está a identificar que campos serão utilizados na importação. É melhor começar pequeno e crescer em vez de juntar todos os seus dados num conjunto de dados maciço.

Criar modelos de alto desempenho com esquemas de star

O design de esquema de estrela é relevante para desenvolver modelos do Power BI utilizáveis e de elevado desempenho. Cada relatório do Power BI cria uma consulta que é enviada para o modelo do Power BI. Estas consultas são utilizadas para filtrar, agrupar e resumir os dados do modelo. Ter um modelo bem concebido fornece tabelas para filtrar, agrupar e resumir.

Nota

Um esquema de star é um tipo de esquema de modelação de dados com uma tabela de factos no meio e várias tabelas de dimensão associadas à volta da tabela de factos. Os esquemas de estrela estão otimizados para consultar conjuntos de dados grandes.

Este modelo bem concebido funciona bem com os requisitos de esquema star:

  • As tabelas de dimensões suportam filtragem e agrupamento

  • A tabela de factos suporta o resumo

Um esquema de star impede o cálculo e o processamento de associações de adição que obteria a partir de um esquema de floco de neve, mas ainda proporciona o benefício dos dados condensados que uma tabela plana não pode fornecer.

Desativar Data/hora automáticas

A data/hora automática é uma opção de carregamento de dados no Power BI Desktop que suporta relatórios de análise de tempo úteis com base em colunas de data que são carregadas para um modelo. Com esta opção ativada, Power BI Desktop cria tabelas de data/hora ocultas atrás de cada campo de data no seu conjunto de dados.

Com todas estas tabelas de data/hora ocultas e campos de data em conjunto, o tamanho do modelo aumenta significativamente. A redução do tamanho do modelo otimiza o desempenho, especialmente com conjuntos de dados maiores. Idealmente, criaria uma tabela de datas e ligava para a mesma. Também pode adicionar outras dimensionalidades de data com a sua própria tabela de datas que podem fornecer mais funcionalidades do que a tabela de data/hora automática oculta.

Para desativar a opção Data/hora automática no Power BI, utilize o seguinte procedimento.

  1. Selecione Opções e definições de Ficheiro>.

  2. Selecione Opções.

    Captura de ecrã das opções e definições utilizadas para desativar a data/hora automática.

  3. Selecione a opção Carregamento de Dados nas secções Global ou Ficheiro Atual .

  4. Desmarque a caixa Data/hora automática para novos ficheiros na secção Análise de tempo .

Utilizar números inteiros através de cadeias

Os números inteiros são melhores que as cadeias por dois motivos:

  • A correspondência de um número inteiro com outro número inteiro é mais rápida do que corresponder uma cadeia a uma cadeia.

  • As cadeias têm de ser armazenadas de forma a que primeiro tenha de encontrar o índice e, em seguida, encontrará o valor.

As cadeias são referenciadas duas vezes, enquanto os números inteiros são referenciados apenas uma vez.

Para obter mais informações, veja Compreender o que é um esquema de estrela e qual a importância para o Power BI.