Compartilhar via


Tabelas no armazenamento de dados no Microsoft Fabric

Aplica-se a: Depósito no Microsoft Fabric

Este artigo detalha os principais conceitos para criar tabelas no Microsoft Fabric.

Nas tabelas, os dados são organizados de maneira lógica em um formato de linha-e-coluna semelhante ao de uma planilha. Cada linha representa um registro exclusivo e cada coluna representa um campo no registro.

  • No Warehouse, as tabelas são objetos de banco de dados que contêm todos os dados transacionais.

Determinar a categoria da tabela

Um esquema em estrela organiza dados em tabelas de fatos e tabelas de dimensões. Algumas tabelas são usadas para dados de integração ou de preparo antes de irem para uma tabela de fatos ou dimensões. Ao criar uma tabela, decida se os dados da tabela pertencem a uma tabela de integração, de dimensão ou de fato. Essa decisão informa a distribuição e a estrutura da tabela apropriadas.

  • As Tabelas de fatos contêm dados quantitativos normalmente gerados em um sistema transacional e, depois, carregados no data warehouse. Por exemplo, uma empresa de varejo gera transações de vendas todos os dias e, em seguida, carrega os dados para uma tabela de fatos do data warehouse para análise.

  • As Tabelas de dimensões contêm dados de atributo que podem ser alterados, mas essas alterações são raras. Por exemplo, um nome e endereço do cliente são armazenados em uma tabela de dimensões e atualizados somente quando o perfil do cliente é alterado. Uma tabela de fatos grande pode ser minimizada: não é preciso deixar o nome e o endereço do cliente em todas as linhas. Em vez disso, a tabela de fatos e a tabela de dimensões podem compartilhar uma ID do cliente. Uma consulta pode unir as duas tabelas para associar o perfil e as transações de um cliente.

  • As Tabelas de integrações oferecem um local para dados de preparo ou integração. Por exemplo, é possível carregar dados em uma tabela de preparo, executar transformações nos dados de preparo e, em seguida, inserir os dados em uma tabela de produção.

Uma tabela armazena dados no OneLake como parte do Warehouse. A tabela e os dados persistem, estando uma sessão aberta ou não.

Tabelas no Warehouse

Para mostrar a organização das tabelas, você pode usar fact, dim, ou int como prefixos para os nomes das tabelas. A tabela a seguir mostra alguns dos nomes de esquema e tabela para o data warehouse de amostra WideWorldImportersDW.

Nome da tabela de origem WideWorldImportersDW Tipo de Tabela Nome da Tabela do SQL Data Warehouse
City Dimensão wwi.DimCity
Pedido Fato wwi.FactOrder
  • Os nomes das tabelas diferenciam maiúsculas e minúsculas.
  • Os nomes de tabela não podem conter / ou \ ou terminar com um ..

Criar uma tabela

Você pode criar uma tabela como uma nova tabela vazia. Você também pode criar e popular uma tabela com os resultados de uma instrução de seleção. A seguir estão os comandos T-SQL para criar uma tabela.

Instrução T-SQL Descrição
CREATE TABLE Cria uma tabela vazia com a definição de todas as opções e colunas da tabela.
CREATE TABLE AS SELECT Popula uma tabela nova com os resultados de uma instrução selecionada. Os tipos de dados e colunas de tabela baseiam-se nos resultados da instrução selecionada. Para importar dados, essa instrução pode selecionar de uma tabela externa.

Esse exemplo cria uma tabela com duas colunas.

CREATE TABLE MyTable (col1 int, col2 int );  

Nomes do esquema

O Warehouse é compatível com a criação de esquemas personalizados. Os esquemas são uma boa maneira de agrupar objetos usados de forma semelhante. O código a seguir cria um esquema definido pelo usuário chamado wwi.

  • Os nomes de esquema diferenciam minúsculas e maiúsculas.
  • Os nomes de esquema não podem conter / ou \ ou terminar com um ..
CREATE SCHEMA wwi;

Tipos de dados

O Microsoft Fabric é compatível com os tipos de dados mais usados.

Ordenação

Atualmente, Latin1_General_100_BIN2_UTF8 é a ordenação padrão e com suporte apenas para tabelas e metadados.

Estatísticas

O otimizador de consulta usa estatísticas de nível de coluna quando cria o plano para executar uma consulta. Para melhorar o desempenho de consulta, é importante criar estatísticas em colunas individuais, especialmente nas colunas usadas em junções de consulta. O Warehouse é compatível com a criação automática de estatísticas.

A atualização estatística não ocorre automaticamente. Atualize as estatísticas depois que um número significativo de linhas for adicionado ou alterado. Por exemplo, atualize as estatísticas depois de uma carga. Para obter mais informações, consulte Estatísticas.

Chave primária, chave estrangeira e chave exclusiva

Para Warehouse, a restrição PRIMARY KEY e UNIQUE só têm suporte quando NONCLUSTERED e NOT ENFORCED são usados.

Há suporte para a restrição UNIQUE somente quando NOT ENFORCED é usado.

Alinhar dados de origem com o data warehouse

As tabelas do data warehouse são populadas pelo carregamento de dados de outra fonte de dados. Para executar um carregamento bem-sucedido, os números e os tipos de dados das colunas na fonte de dados devem se alinhar com a definição da tabela no data warehouse.

Se os dados forem provenientes de vários armazenamentos de dados, você pode trazer os dados para o data warehouse e armazená-los em uma tabela de integração. Depois que os dados estiverem na tabela de integração, você poderá usar o poder do data warehouse para implementar operações de transformação. Quando os dados estiverem preparados, será possível inseri-los nas tabelas de produção.

Limitações

O Warehouse oferece suporte a muitos, mas não a todos, os recursos de tabela oferecidos por outros bancos de dados.

A lista a seguir mostra alguns dos recursos de tabela que não têm suporte no momento.

  • Máximo de 1024 colunas por planilha
  • Colunas computadas
  • Exibições indexadas
  • Tabelas particionadas
  • Sequência
  • Colunas esparsas
  • Chaves substitutas em sequências numéricas com colunas de identidade
  • Sinônimos
  • Tabelas temporárias
  • Gatilhos
  • Índices exclusivos
  • Tipos definidos pelo usuário