Design do esquema em estrela

Concluído

É incomum que um modelo semântico do Power BI seja composto por apenas uma tabela. Um modelo com apenas uma tabela pode ser um design simples, que talvez seja adequado para uma tarefa de exploração de dados ou para uma prova de conceito, mas certamente não é um design de modelo ideal. Um modelo ideal deve aderir aos princípios de design do esquema em estrela. O esquema em estrela refere-se a uma abordagem de design normalmente usada por designers de data warehouse relacionais, pois apresenta uma estrutura amigável e é compatível com consultas analíticas de alto desempenho.

Esse princípio de design é chamado de esquema em estrela, pois classifica as tabelas do modelo como tabela de fatos ou tabelas de dimensões. No diagrama, a tabela de fatos forma o centro da estrela, ao passo que as tabelas de dimensões, quando colocadas ao redor de uma tabela de fatos, representam as pontas da estrela.

Tabela de fatos

A função de uma tabela de fatos é armazenar uma acumulação de linhas que representam observações ou eventos que registram uma atividade de negócios específica. Por exemplo, os eventos que são armazenados em uma tabela de fatos de vendas podem ser pedidos de vendas ou linhas de pedidos. Você também pode usar uma tabela de fatos para registrar movimentos de estoque, saldos de estoque ou taxas de câmbio diárias. Em geral, as tabelas de fatos contêm inúmeras linhas. À medida que o tempo passa, as linhas da tabela de fatos são acumuladas. Em consultas analíticas (que serão definidas mais adiante neste módulo), os dados da tabela de fatos são resumidos para produzir valores como vendas e quantidade.

Tabelas de dimensões

As tabelas de dimensões descrevem suas entidades de negócios, que normalmente representam pessoas, lugares, produtos ou conceitos. Uma tabela de dimensões de data, que contém uma linha para cada data, é um exemplo comum de uma tabela de dimensões conceitual. As colunas de uma tabela de dimensões permitem a filtragem e o agrupamento dos dados da tabela de fatos.

Toda tabela de dimensões deve ter uma coluna exclusiva, que será chamada de coluna de chave. Uma coluna exclusiva não contém valores duplicados e jamais deve ter valores ausentes. Em uma tabela de dimensões de produto, a coluna pode ser designada como ProductKey ou ProductID. Provavelmente, colunas adicionais armazenarão valores descritivos, como o nome do produto, a subcategoria, a categoria, a cor e assim por diante. Nas consultas analíticas, essas colunas são usadas para filtrar e agrupar os dados.

Comparar tabelas de fatos e tabelas de dimensões

A figura a seguir compara as características das tabelas de fatos e de dimensões.

Característica Tabela de dimensões Tabela de fatos
Finalidade do modelo Armazena entidades de negócios Armazena eventos ou observações
Estrutura da tabela Inclui uma coluna de chave e colunas descritivas para filtragem e agrupamento Inclui colunas de chave de dimensão e colunas de medidas numéricas que podem ser resumidas
Volume de dados Normalmente, contém menos linhas (em relação às tabelas de fatos) Pode conter inúmeras linhas
Finalidade da consulta Filtrar e agrupar Resumir

Relacionar tabelas do esquema em estrela

No modelo, as tabelas de dimensões são relacionadas às tabelas de fatos usando relações um-para-muitos. As relações permitem que os filtros e os grupos aplicados às colunas da tabela de dimensões sejam propagados para a tabela de fatos. Este padrão de design é comum.

As tabelas de dimensões podem ser usadas para filtrar várias tabelas de fatos e as tabelas de fatos podem ser filtradas por várias tabelas de dimensões. No entanto, não é uma boa prática relacionar uma tabela de fatos diretamente a outra tabela de fatos.

Para praticar esse conceito, baixe o arquivo Adventure Works DW 2020 M01.pbix, abra-o e, em seguida, alterne para o diagrama do modelo.

Imagem mostra sete tabelas do modelo. A tabela Vendas está localizada no centro do diagrama. As outras seis tabelas são posicionadas ao redor da tabela Vendas.

Observe que o modelo é composto por sete tabelas, uma das quais é chamada de Vendas e é a tabela de fatos. As tabelas restantes são tabelas de dimensões e têm os seguintes nomes:

  • Cliente
  • Data
  • Product
  • Reseller
  • Pedido de Vendas
  • Território de Vendas

Observe as relações entre as tabelas de dimensões e de fatos e note que a direção do filtro de cada relação está apontando para a tabela de fatos. Como resultado, quando os filtros são aplicados às colunas da tabela de dimensões (para filtrar ou agrupar por valores de coluna), os fatos relacionados são filtrados e resumidos.

Se você examinar o padrão, poderá ver a forma de uma estrela.

Imagem mostra uma estrela sobreposta às sete tabelas do modelo. A estrela ajuda na compreensão do design do esquema em estrela.

Para obter mais informações sobre o design do esquema em estrela, confira Noções básicas do esquema em estrela e a importância dele para o Power BI.