Armazenar dados no Microsoft Fabric

O Microsoft Fabric oferece múltiplas opções de armazenamento concebidas para suportar análises, processamento em tempo real e relatórios operacionais dentro de uma plataforma unificada. Escolher a experiência de armazenamento certa ajuda-o a otimizar o desempenho, gerir custos e alinhar a sua arquitetura de dados com os requisitos de carga de trabalho. Independentemente da origem ou método de preparação, todos os dados ficam numa base de armazenamento unificada chamada OneLake.

Este artigo explica como os dados são armazenados no Fabric e descreve as experiências de armazenamento principais disponíveis. As secções seguintes abrangem:

OneLake – O data lake unificado e lógico que sustenta todas as cargas de trabalho do Fabric.
Lakehouse – Armazene e analise dados estruturados e não estruturados utilizando tabelas Delta.
Warehouse – Armazenar dados relacionais otimizados para análises SQL de alto desempenho.
Eventhouse – Armazenar e consultar dados de eventos em grande volume e tempo real.
Bases de dados e outras experiências de armazenamento – Compreenda capacidades adicionais de armazenamento disponíveis no Fabric.

Use esta visão geral para compreender como funciona cada opção de armazenamento e escolher a que melhor se adequa aos seus cenários analíticos e operacionais.

Lakehouse para armazenamento de dados flexível

Um Lakehouse é um elemento central de armazenamento no Fabric que utiliza o OneLake para armazenar dados tanto em formatos de ficheiro como de tabela. Um Lakehouse representa uma estrutura de pastas selecionada no OneLake e inclui uma interface SQL. Um Lakehouse armazena dados como ficheiros Delta Parquet. Pode organizar ficheiros brutos como ficheiros CSV ou imagens em pastas, e pode criar tabelas Delta geridas para dados estruturados. Este modelo suporta dados estruturados e não estruturados no mesmo ambiente.

O Fabric fornece automaticamente um endpoint de análise SQL para cada Lakehouse. Você e ferramentas como o Power BI podem consultar tabelas Delta usando o Transact-SQL, como se estivessem a consultar uma base de dados relacional. O Lakehouse combina a escalabilidade e flexibilidade de um data lake com capacidades centrais de armazém, incluindo consulta direta de tabela e gestão de esquemas.

Armazém para análises estruturadas

Um Warehouse no Fabric proporciona uma experiência tradicional de armazenamento de dados SQL (com tabelas, vistas SQL, procedimentos armazenados e mais) no armazenamento unificado do Fabric. Quando crias um Warehouse, ele armazena os dados no OneLake em formato Delta como um conjunto organizado de tabelas Delta com uma interface ANSI SQL por cima. O Warehouse fornece computação dedicada e desempenho afinado para consultas SQL complexas e cargas de trabalho ao estilo BI. Suporta funcionalidades como indexação, procedimentos armazenados e transações ACID robustas em tabelas.

O Armazém e a Casa do Lago partilham o mesmo armazenamento subjacente do OneLake. Pode integrá-los usando atalhos ou outras funcionalidades de interoperabilidade quando necessário. No entanto, normalmente mantém-nos separados para diferentes casos de uso. O Warehouse é ideal para dados estruturados e relacionais em esquema estrela que precisas de analisar com SQL. Podes usar pipelines Fabric para carregar dados no Warehouse. O Power BI pode ligar-se usando Direct Lake ou DirectQuery para recuperar dados sem importação.

Guia de decisão: Lakehouse vs. Armazém

Armazéns e Casas de Lago desempenham funções distintas, mas complementares.

Os armazéns são otimizados para data warehousing estruturado em escala empresarial, com suporte completo a T-SQL, transações ACID e forte aplicação de esquemas — ideais para BI e relatórios. Escolha um Warehouse para cargas de trabalho SQL governadas e de alto desempenho e um Lakehouse para processamento de big data, análises exploratórias e cenários que envolvam formatos de dados variados ou integração externa com lagos.
As Lakehouses oferecem armazenamento flexível e escalável para dados estruturados e não estruturados, suportando engenharia de dados baseada em Spark e análise SQL apenas de leitura através de endpoints automáticos.

Muitas organizações beneficiam de usar ambos em conjunto: Lakehouses para ingestão e transformação, e Warehouses para análises e relatórios refinados. Para saber mais, consulte o guia de decisão.

Bases de dados espelhadas para replicação quase em tempo real

Uma base de dados espelhada no Fabric é uma cópia replicada continuamente de uma base de dados operacional externa, como Azure SQL Database, SQL Server, Azure Cosmos DB ou Snowflake. O Fabric armazena dados espelhados em OneLake no formato Delta Lake.

O espelhamento sincroniza quase em tempo real as alterações de origem diretamente no Fabric, sem a necessidade de pipelines tradicionais de extração, transformação e carregamento. Após a replicação, os dados tornam-se imediatamente consultáveis através de endpoints SQL e estão disponíveis em cargas de trabalho Fabric, incluindo Power BI, notebooks Spark e pipelines.

Esta arquitetura suporta cenários híbridos de processamento transacional e analítico (HTAP), onde se analisam dados operacionais mantendo a integridade do sistema de origem.

Eventhouse para análise de eventos em tempo real

Um Eventhouse fornece um ambiente de análise em tempo real escalável, concebido para ingerir, armazenar e analisar grandes volumes de dados de eventos. É o motor fundamental para cargas de trabalho de Inteligência em Tempo Real.

Um Eventhouse aloja uma ou mais bases de dados da Linguagem de Consulta Kusto baseadas no motor Kusto. Estas bases de dados indexam e particionam automaticamente os dados por tempo de ingestão. Consulta os dados usando a Linguagem de Consulta Kusto.

A Eventhouse é adequada para telemetria, registos de segurança, registos de conformidade e transações financeiras onde são necessárias análises de baixa latência e ingestão de alta escala.

Base de dados SQL para cargas de trabalho transacionais

As bases de dados SQL no Fabric suportam cargas de trabalho transacionais e operacionais de análise. Proporcionam uma experiência de base de dados relacional totalmente gerida, com suporte para T-SQL, incluindo capacidades de definição de dados (DDL), manipulação (DML) e consulta (DQL). Pode usar procedimentos armazenados, vistas e funções para construir soluções transacionais e analíticas.

As bases de dados SQL utilizam um serviço automático de espelhamento para replicar tabelas transacionais no OneLake para análise. Quando crias uma base de dados SQL, o Fabric inicia um motor de replicação que captura operações de inserção, atualização e eliminação através do feed de alterações do motor SQL e escreve essas alterações no OneLake como ficheiros Delta Parquet. A replicação ocorre quase em tempo real e começa automaticamente. Todas as tabelas suportadas são espelhadas por padrão. Este comportamento garante que a cópia do OneLake se mantém sincronizada com a base de dados operacional.

As bases de dados SQL integram-se com outras experiências Fabric como Power BI, notebooks, funções de dados de utilizador, pipelines e ferramentas externas através do protocolo TDS. Esta integração permite-lhe construir soluções de ponta a ponta, desde a ingestão e transformação de dados até à visualização e relatórios, sem sair do ambiente Fabric. A plataforma gere automaticamente a indexação e a otimização de desempenho, por isso não precisa de ajustar ou gerir manualmente a infraestrutura.

Cosmos DB para cargas de trabalho NoSQL distribuídas

O Cosmos DB no Microsoft Fabric é uma base de dados NoSQL totalmente gerida e distribuída, concebida para aplicações de alto rendimento e distribuídas globalmente. Suporta modelos de esquema flexíveis e dados JSON semi-estruturados.

O Cosmos DB é automaticamente espelhado no OneLake em formato Delta para suportar análises sem afetar o desempenho operacional. A replicação é contínua e quase em tempo real e não requer configuração manual.

Após a replicação, os dados tornam-se acessíveis através de um endpoint de análise SQL. Pode consultar dados usando Transact-SQL, criar vistas e integrar com Power BI, notebooks e pipelines.

O endpoint de análise SQL fornece uma interface de apenas leitura para os dados espelhados, garantindo que as consultas analíticas não interfiram com as operações transacionais. Esta arquitetura suporta processamento híbrido transacional e analítico (HTAP), para que possa unificar cargas de trabalho operacionais e analíticas numa única plataforma.

Modelo semântico para lógica de negócio e relatórios

Os modelos semânticos fornecem a camada estruturada e curada que define lógica de negócio, medidas, hierarquias, relações e metadados, por cima dos dados brutos no Microsoft Fabric. Tornam os dados interpretáveis e reutilizáveis em toda a plataforma para experiências analíticas.

Os modelos semânticos no Fabric estão fortemente integrados com o modelo de capacidade e a estrutura do espaço de trabalho da plataforma. Modelos semânticos suportam três modos de consulta: Importação, DirectQuery e Direct Lake. Cada modo oferece diferentes compromissos entre desempenho, frescura e escalabilidade:

O modo de importação copia dados da fonte para o modelo semântico durante atualizações programadas ou manuais. Este modo oferece o desempenho de consulta mais rápido porque o Power BI funciona com dados em memória, mas introduz latência entre as atualizações de origem e a visibilidade dos relatórios. O modo de importação é ideal para dashboards de alto desempenho onde os dados em tempo real não são críticos.
O modo DirectQuery envia consultas diretamente para o sistema de origem em tempo de execução sem armazenar dados no modelo semântico. Esta abordagem garante resultados atualizados, mas pode levar a um desempenho mais lento, dependendo da responsividade do sistema de origem. O DirectQuery é adequado para cenários onde a novidade dos dados é mais importante do que a velocidade, como relatórios operacionais.
O modo Direct Lake permite que o Power BI consulte tabelas Delta armazenadas diretamente no OneLake. Combina as características de desempenho do Import com a frescura do DirectQuery. Evita a duplicação de dados e utiliza a arquitetura lake-native para análises escaláveis e quase em tempo real. O Direct Lake é recomendado para análises em larga escala de dados geridos pelo Fabric.

Modelos semânticos também permitem IA conversacional, pesquisa semântica, relatórios empresariais e raciocínio entre domínios, reunindo funcionalidades avançadas como Fabric Data Agents, Power BI Copilot, Ontologias e relatórios Power BI. Os utilizadores empresariais também podem aceder a modelos semânticos através do Excel, onde podem explorar dados e insights numa interface de Tabela Dinâmica que utiliza dados em tempo real do modelo semântico.

Guia de decisão: Escolha o armazenamento de dados certo

O Microsoft Fabric oferece múltiplas opções de armazenamento de dados, cada uma otimizada para cargas de trabalho específicas:

Lakehouse para engenharia de dados em grande escala e armazenamento em formato aberto como Delta e Iceberg, com suporte para motores Spark e SQL.
Warehouse para análises estruturadas e relacionais com capacidades SQL de alto desempenho e relatórios empresariais.
Eventhouse para telemetria em tempo real e análise de registos utilizando a Linguagem de Consultas Kusto.
Base de dados SQL para cargas de trabalho transacionais e análises operacionais.
Cosmos DB para aplicações NoSQL distribuídas globalmente, aplicações multimodelo com acesso de baixa latência.

A seleção do armazenamento apropriado depende da estrutura de dados, requisitos de latência, complexidade da consulta e necessidades de integração. Para mais orientações, consulte Escolher a loja certa.

Comentários

Esta página foi útil?

Last updated on 2026-03-13