Compartilhar via


O que é armazenamento de dados no Microsoft Fabric?

Aplica se:✅ Ponto de extremidade de análise SQL e Warehouse no Microsoft Fabric

O Data Warehouse do Fabric é uma solução de data warehouse de última geração no Microsoft Fabric.

O warehouse centrado em lake é criado em um mecanismo de processamento distribuído de nível empresarial que permite o desempenho líder do setor em escala, minimizando a necessidade de configuração e gerenciamento. Residindo no data lake e projetado para oferecer suporte nativo a formatos de dados abertos, o data warehouse do Fabric permite a colaboração perfeita entre engenheiros de dados e usuários de negócios sem comprometer a segurança ou a governança.

A experiência SaaS fácil de usar também está totalmente integrada ao Power BI, facilitando a análise e a geração de relatórios, convergindo o mundo dos data lakes e data warehouses e simplificando muito o investimento das organizações em seu patrimônio analítico. 

Os clientes de data warehouse se beneficiam com o seguinte:

  • Os dados armazenados no formato Delta-parquet permitem transações ACID e interoperabilidade com outras cargas de trabalho do Fabric significa que você não precisa de várias cópias de dados.
  • Consultas entre bancos de dados podem usar várias fontes de dados para insights rápidos com zero duplicação de dados.
  • Ingerir, carregar e transformar dados facilmente em escala por meio de pipelines, fluxos de dados, consultas entre bancos de dados ou o comando COPY INTO.
  • Gerenciamento autônomo de carga de trabalho com mecanismo de processamento de consultas distribuídas líder do setor significa que não há necessidade de girar botões para atingir o melhor desempenho da categoria.
  • Escale quase instantaneamente para atender às demandas comerciais. O armazenamento e a computação são separados.
  • Tempo reduzido para obter insights com um modelo semântico sempre conectado e de fácil consumo, integrado ao Power BI no modo Direct Lake. Os relatórios sempre têm os dados mais recentes para análise e reportagem.
  • Criado para qualquer nível de habilidade, do desenvolvedor cidadão ao DBA ou ao engenheiro de dados.

Itens de armazenamento de dados

O Armazém de Dados do Fabric não é um armazém de dados empresarial tradicional, é um data lake que dá suporte a dois itens de armazenamento distintos: o Armazém de Dados do Fabric e o endpoint de análise SQL. Ambos são desenvolvidos especificamente para atender às necessidades de negócios dos clientes, proporcionando o melhor desempenho da categoria, minimizando custos e reduzindo a sobrecarga administrativa.

Data Warehouse do Fabric

Em um espaço de trabalho do Microsoft Fabric, um warehouse do Fabric é rotulado como Warehouse na coluna Tipo. Quando você precisa de toda a potência e recursos transacionais (suporte a consultas DDL e DML) de um data warehouse, esta é a solução rápida e simples para você.

Captura de tela mostrando o tipo armazém no espaço de trabalho.

O warehouse pode ser populado por qualquer um dos métodos de ingestão de dados com suporte, como COPY INTO, Pipelines, Dataflows ou opções de ingestão entre bancos de dados, como CREATE TABLE AS SELECT (CTAS), INSERT..SELECT ou SELECT INTO.

Para começar a usar o Warehouse, consulte:

Endpoint de análise SQL do Lakehouse

Em um workspace do Microsoft Fabric, cada Lakehouse possui um "endpoint de análise SQL" gerado automaticamente, que pode ser utilizado para fazer a transição da visão "Lake" do Lakehouse (que oferece suporte à engenharia de dados e ao Apache Spark) para a visão "SQL" do mesmo Lakehouse, permitindo a criação de visões, funções, procedimentos armazenados e a aplicação de medidas de segurança SQL.

Captura de tela mostrando o tipo de ponto de extremidade de análise SQL no espaço de trabalho.

Usando tecnologia semelhante, um warehouse, um banco de dados SQL e Fabric OneLake provisionam automaticamente um ponto de extremidade de análise SQL quando criados.

Com o endpoint de análise SQL, os comandos T-SQL podem definir e consultar objetos de dados, mas não manipular ou modificar os dados. Você pode executar as seguintes ações no endpoint de análise SQL:

  • Consulte as tabelas que referenciam os dados nas suas pastas do Delta Lake no lake.
  • Crie visões, TVFs inline e procedimentos para encapsular sua semântica e lógica de negócios no T-SQL.
  • Gerenciar permissões nos objetos.

Para começar a usar o endpoint do SQL Analytics, consulte:

Armazém ou casa do lago

Ao decidir entre usar um warehouse ou um lakehouse, é importante considerar as necessidades específicas e o contexto dos seus requisitos de gerenciamento e análise de dados. Igualmente importante, esta não é uma decisão unidirecional!

Você sempre tem a oportunidade de adicionar um ou outro posteriormente, caso suas necessidades de negócios mudem e, independentemente de onde você comece, o warehouse e o lakehouse usam o mesmo mecanismo SQL poderoso para todas as consultas T-SQL.

Aqui estão algumas diretrizes gerais para ajudá-lo a tomar a decisão:

  • Escolha um data warehouse quando precisar de uma solução de escala empresarial com formato padrão aberto, sem desempenho de botões e configuração mínima.  Mais adequado para formatos de dados semiestruturados e estruturados, o data warehouse é adequado para profissionais de dados iniciantes e experientes, oferecendo experiências simples e intuitivas.

  • Escolha um lakehouse quando precisar de um grande repositório de dados altamente não estruturados de fontes heterogêneas, aproveitando o armazenamento de objetos de baixo custo e deseja usar o SPARK como sua principal ferramenta de desenvolvimento. Funcionando como um data warehouse “leve”, ele dá sempre tem a opção de usar o ponto de extremidade SQL e as ferramentas T-SQL para fornecer cenários de relatórios e inteligência de dados no seu data lakehouse.

Para obter diretrizes de decisão mais detalhadas, consulte o guia de decisão do Microsoft Fabric: Escolha entre o Warehouse e o Lakehouse.