O que é armazenamento de dados no Microsoft Fabric?
Aplica-se a:✅ Ponto de extremidade de análise do SQL e Warehouse no Microsoft Fabric
O Microsoft Fabric é uma solução de data warehousing de última geração no Microsoft Fabric.
O data warehouse centrado em lagos foi desenvolvido com base em um mecanismo de processamento distribuído de nível empresarial que permite o desempenho líder do setor em escala, minimizando a necessidade de configuração e gerenciamento. Residindo no data lake e projetado para oferecer suporte nativo a formatos de dados abertos, o data warehouse do Fabric permite a colaboração perfeita entre engenheiros de dados e usuários de negócios sem comprometer a segurança ou a governança.
A experiência SaaS fácil de usar também está totalmente integrada ao Power BI para facilitar a análise e a geração de relatórios, convergindo o mundo dos data lakes e data warehouses e simplificando muito o investimento das organizações em suas propriedades analíticas.
Os clientes de data warehouse se beneficiam com o seguinte:
- Os dados armazenados no formato Delta-parquet permitem transações ACID e a interoperabilidade com outras cargas de trabalho do Fabric significa que você não precisa de várias cópias de dados.
- As consultas entre bancos de dados podem usar várias fontes de dados para obter insights rápidos sem duplicação de dados.
- Ingira, carregue e transforme facilmente dados em escala por meio de Pipelines, Fluxos de dados, consulta entre bancos de dados ou o comando COPY INTO.
- O gerenciamento autônomo da carga de trabalho com o mecanismo de processamento de consultas distribuído líder do setor significa que não há botões para girar para obter o melhor desempenho da categoria.
- Dimensione quase instantaneamente para atender às demandas de negócios. O armazenamento e a computação são separados.
- Tempo reduzido para insights com um modelo semântico facilmente consumível e sempre conectado que é integrado ao Power BI no modo Direct Lake. Os relatórios sempre têm os dados mais recentes para análise e relatórios.
- Criado para qualquer nível de habilidade, desde o desenvolvedor cidadão até DBA ou engenheiro de dados.
Itens de armazenamento de dados
O Fabric Warehouse não é um data warehouse corporativo tradicional, é um lake warehouse que dá suporte a dois itens de armazenamento distintos: o data warehouse do Fabric e o ponto de extremidade de análise SQL. Ambos são desenvolvidos especificamente para atender às necessidades de negócios dos clientes, proporcionando o melhor desempenho da categoria, minimizando custos e reduzindo a sobrecarga administrativa.
Data Warehouse do Synapse
Em um workspace do Microsoft Fabric, um Data Warehouse ou Warehouse do Synapse é rotulado como 'Warehouse' na coluna Tipo. Quando você precisa de toda a potência e recursos transacionais (suporte a consultas DDL e DML) de um data warehouse, esta é a solução rápida e simples para você.
O warehouse pode ser preenchido por qualquer um dos métodos de ingestão de dados com suporte, como COPY INTO, Pipelines, Fluxos de dados ou opções de ingestão entre bancos de dados, como CREATE TABLE AS SELECT (CTAS),INSERT..SELECT ou SELECT INTO.
Para começar a usar o Warehouse, consulte:
Ponto de extremidade de análise SQL do Lakehouse
Em um workspace do Microsoft Fabric, cada Lakehouse tem um "ponto de extremidade de análise SQL" gerado automaticamente que pode ser usado para fazer a transição da exibição "Lake" do Lakehouse (que dá suporte à engenharia de dados e ao Apache Spark) para a exibição "SQL" do mesmo Lakehouse para criar exibições, funções, procedimentos armazenados e aplicar a segurança SQL.
Com o endpoint de análise de SQL do Lakehouse, os comandos T-SQL podem definir e consultar objetos de dados, mas não manipular ou modificar os dados. Você pode executar as seguintes ações no ponto de extremidade de análise SQL:
- Consulte as tabelas que fazem referência aos dados em suas pastas do Delta Lake no lake.
- Crie exibições, TVFs embutidos e procedimentos para encapsular sua semântica e lógica de negócios no T-SQL.
- Gerenciar permissões nos objetos.
Para começar a usar o endpoint do SQL Analytics, consulte:
- Melhor juntos: o Lakehouse e o Warehouse no Microsoft Fabric
- Considerações de desempenho do ponto de extremidade de análise SQL
- Consultar o ponto de extremidade de análise do SQL ou Warehouse no Microsoft Fabric
Armazém ou casa do lago
Ao decidir entre usar um warehouse ou um lakehouse, é importante considerar as necessidades específicas e o contexto de seus requisitos de gerenciamento e análise de dados. Igualmente importante, esta não é uma decisão unilateral!
Você sempre tem a oportunidade de adicionar um ou outro posteriormente, caso suas necessidades de negócios mudem e, independentemente de onde você comece, o warehouse e o lakehouse usam o mesmo mecanismo SQL poderoso para todas as consultas T-SQL.
Aqui estão algumas diretrizes gerais para ajudá-lo a tomar a decisão:
Escolha um data warehouse quando precisar de uma solução de escala empresarial com formato padrão aberto, desempenho sem botões e configuração mínima. Mais adequado para formatos de dados semiestruturados e estruturados, o data warehouse é adequado para profissionais de dados iniciantes e experientes, oferecendo experiências simples e intuitivas.
Escolha um lakehouse quando precisar de um grande repositório de dados altamente não estruturados de fontes heterogêneas, aproveitando o armazenamento de objetos de baixo custo e quiser usar o SPARK como sua principal ferramenta de desenvolvimento. Atuando como um data warehouse "leve", você sempre tem a opção de usar o ponto de extremidade SQL e as ferramentas T-SQL para fornecer cenários de relatórios e inteligência de dados em seu lakehouse.
Para obter diretrizes de decisão mais detalhadas, consulte Guia de decisão do Microsoft Fabric: Escolher entre Warehouse e Lakehouse.