Design do esquema de estrela

Concluído

É invulgar um modelo semântico do Power BI ser composto por uma única tabela. Um modelo de tabela única pode ser um design simples, que talvez seja adequado para uma tarefa de exploração de dados ou uma prova de conceito, mas não um que seja um design de modelo ideal. Um modelo ideal cumpre star princípios de design de esquema. O esquema de estrela refere-se a uma abordagem de estrutura que é frequentemente utilizada pelos designers do armazém de dados relacionais, uma vez que apresenta uma estrutura compatível com o utilizador e suporta consultas analíticas de alto desempenho.

Este princípio de design denomina-se esquema de estrela porque classifica tabelas de modelos como facto ou dimensão. Num diagrama, uma tabela de factos forma o centro de uma estrela, enquanto as tabelas de dimensões, quando colocadas à volta de uma tabela de factos, representam os pontos da estrela.

Tabelas de factos

A função de uma tabela de factos é armazenar uma acumulação de linhas que representam observações ou eventos que registam uma atividade comercial específica. Por exemplo, os eventos que são armazenados numa tabela de factos de vendas podem ser encomendas de vendas e linhas de encomenda. Também pode usar uma tabela de factos para registar movimentos de ações, saldos de ações ou taxas de câmbio diárias. Em geral, as tabelas de factos contêm várias linhas. À medida que o tempo passa, as linhas da tabela de factos acumulam-se. Em consultas analíticas (que serão definidas mais adiante neste módulo), os dados da tabela de factos são resumidos para produzir valores como vendas e quantidade.

Tabelas de dimensões

As tabelas de dimensões descrevem as suas entidades comerciais, que normalmente representam pessoas, lugares, produtos ou conceitos. Uma tabela de dimensões de data, que contém uma linha para cada data, é um exemplo comum de uma tabela de dimensões de conceito. As colunas nas tabelas de dimensões permitem filtrar e agrupar os dados da tabela de factos.

Cada tabela de dimensões deve ter uma coluna exclusiva, que é conhecida como a sua coluna de chaves. Uma coluna exclusiva não contém valores duplicados e nunca deve ter valores em falta. Numa tabela de dimensões de produto, a coluna pode chamar-se ProductKey ou ProductID. Provavelmente, as colunas adicionais armazenarão valores descritivos, como o nome do produto, a subcategoria, a categoria, a cor e assim por diante. Em consultas analíticas, estas colunas servem para filtrar e agrupar dados.

Comparar tabelas de factos e de dimensões

A figura seguinte compara as características das tabelas de factos e de dimensões.

Característica Tabela de dimensões Tabela de factos
Objetivo do modelo Armazena entidades empresariais Armazena eventos ou observações
Estrutura da tabela Inclui uma coluna de chaves e colunas descritivas para filtrar e agrupar Inclui colunas de chaves de dimensão e colunas de medidas numéricas que podem ser resumidas
Volume de dados Normalmente, contém menos linhas (em relação às tabelas de factos) Pode conter várias linhas
Qualquer objetivo Para filtrar e agrupar Para resumir

Relacionar tabelas de esquema de estrela

No modelo, as tabelas de dimensões estão relacionadas com tabelas de factos através de relações um-para-muitos. As relações permitem que os filtros e grupos aplicados às colunas da tabela de dimensões sejam propagados para a tabela de factos. Este padrão de design é comum.

As tabelas de dimensões podem servir para filtrar várias tabelas de factos e as tabelas de factos podem ser filtradas por várias tabelas de dimensões. No entanto, não é uma boa prática relacionar uma tabela de factos diretamente com outra tabela de factos.

Para praticar este conceito, transfira e abra o ficheiro Adventure Works DW 2020 M01.pbix e, em seguida, mude para o diagrama de modelo.

Uma imagem mostra sete tabelas de modelo. A tabela Vendas está localizada no centro do diagrama. As outras seis tabelas são colocadas sobre a tabela Vendas.

Repare que o modelo é composto por sete tabelas, uma das quais denomina-se Vendas e é a tabela de factos. As tabelas restantes são tabelas de dimensões e têm os seguintes nomes:

  • Cliente
  • Data
  • Product
  • Reseller
  • Encomenda de Vendas
  • Território de Vendas

Repare nas relações entre as tabelas de dimensões e de factos e que cada direção de filtro de relação está a apontar para a tabela de factos. Como resultado, quando os filtros são aplicados às colunas da tabela de dimensões (para filtrar ou agrupar por valores de coluna), os factos relacionados são filtrados e resumidos.

Se examinar o padrão, poderá ver a forma de um estrela.

Uma imagem mostra uma estrela sobreposta às sete tabelas do modelo. A estrela ajuda a compreender o design do esquema de estrela.

Para obter mais informações sobre star estrutura do esquema, veja Compreender star esquema e a importância para o Power BI.