O que é o espelhamento no Fabric?

Como uma solução de duplicação de dados, o Espelhamento no Fabric é uma solução de baixo custo e baixa latência para reunir dados de vários sistemas em uma única plataforma de análise. É possível duplicar continuamente o estado dos dados existentes diretamente no OneLake do Fabric, inclusive dados do Banco de Dados SQL do Azure, do Azure Cosmos DB e do Snowflake.

Com os dados mais atualizados em formato consultável no OneLake, agora você pode usar todos os diferentes serviços do Fabric, como execução de análises com Spark, execução de notebooks, engenharia de dados, visualização por meio de relatórios do Power BI e muito mais.

O espelhamento no Fabric permite aos usuários usar um produto altamente integrado de ponta a ponta e fácil de usar, projetado para simplificar suas necessidades de análise. Criado para abertura e colaboração entre a Microsoft e soluções de tecnologia capazes de ler o formato de tabela Delta Lake de código aberto, o Espelhamento é uma solução turnkey de baixo custo e baixa latência que permite criar uma réplica de seus dados no OneLake que pode ser usada para todas as suas necessidades analíticas.

Em seguida, é possível usar as tabelas Delta em qualquer local do Fabric, permitindo que os usuários acelerem o percurso até o Fabric.

Importante

Esse recurso está na versão prévia.

Por que usar o espelhamento no Fabric?

Hoje, muitas organizações têm dados operacionais ou analíticos de missão crítica em silos.

Acessar e trabalhar com esses dados hoje requer pipelines complexos de ETL (Extract Transform Load), processos de negócios e silos de decisão, criando:

  • Acesso restrito e limitado a dados importantes e em constante mudança
  • Atrito entre pessoas, processos e tecnologia
  • Longos tempos de espera para criar pipelines de dados e processos para dados criticamente importantes
  • Sem liberdade para usar as ferramentas necessárias para analisar e compartilhar insights confortavelmente
  • Falta de uma base adequada para as pessoas compartilharem e colaborarem em dados
  • Não há formatos de dados abertos comuns para todos os cenários analíticos - BI, IA, Integração, Engenharia e até mesmo Aplicativos

O espelhamento no Fabric oferece uma experiência fácil para acelerar o tempo de obtenção de valor para insights e decisões e para eliminar silos de dados entre soluções de tecnologia.

  • Duplicação quase em tempo real de dados em um data lake SaaS, com análise integrada para BI e IA

A plataforma do Microsoft Fabric foi criada com base no SaaS (Software como serviço), que leva a simplicidade e a integração a um nível totalmente novo. Para saber mais sobre o Microsoft Fabric, consulte O que é o Microsoft Fabric?

O espelhamento cria três itens no espaço de trabalho do Fabric:

Além do Editor de Consultas SQL do Microsoft Fabric, há um amplo ecossistema de ferramentas, incluindo o SQL Server Management Studio, o Azure Data Studio e até mesmo o GitHub Copilot.

O compartilhamento permite a facilidade de controle e gerenciamento de acesso, para garantir que você possa controlar o acesso a informações confidenciais. O compartilhamento também permite a tomada de decisões seguras e democratizadas em toda a organização.

Como faço para habilitar o espelhamento no meu locatário?

Os administradores do Power BI podem habilitar ou desabilitar o espelhamento para toda a organização ou para grupos de segurança específicos usando a configuração encontrada no portal de administração do Power BI. Os itens de espelhamento aparecem nas opções Criar. Para obter mais informações, consulte Habilitar o espelhamento em seu locatário do Microsoft Fabric.

Atualmente, os seguintes bancos de dados externos estão disponíveis na visualização.

Plataforma Duplicação quase em tempo real Tutorial de ponta a ponta
Bancos de dados espelhados do Microsoft Fabric do Azure Cosmos DB Yes Tutorial: Azure Cosmos DB
Bancos de dados espelhados do Microsoft Fabric do Banco de Dados SQL do Azure Yes Tutorial do Banco de Dados SQL do Azure
Bancos de dados espelhado do Microsoft Fabric do Snowflake Yes Tutorial: Snowflake

Como funciona a duplicação quase em tempo real do espelhamento?

O espelhamento é habilitado criando uma conexão segura com sua fonte de dados operacionais. Você escolhe se deseja duplicar um banco de dados inteiro ou tabelas individuais e o espelhamento manterá automaticamente seus dados sincronizados. Uma vez configurados, os dados serão duplicados continuamente no OneLake para consumo analítico.

Estes são os princípios básicos do espelhamento:

  • Habilitar o espelhamento no Fabric é simples e intuitivo, sem a necessidade de criar pipelines de ETL complexos, alocar outros recursos de computação e gerenciar a movimentação de dados.

  • O espelhamento no Fabric é um serviço totalmente gerenciado, portanto, você não precisa se preocupar com hospedagem, manutenção ou gerenciamento da duplicação da conexão espelhada.

Compartilhamento

O compartilhamento permite a facilidade de controle e gerenciamento de acesso, enquanto controles de segurança como RLS (Segurança em nível de linha) e OLS (Segurança em nível de objeto) e muito mais garantem que você possa controlar o acesso a informações confidenciais. O compartilhamento também permite a tomada de decisões seguras e democratizadas em toda a organização.

Ao compartilhar, os usuários concedem a outros usuários ou a um grupo de usuários acesso a um lakehouse sem dar acesso ao espaço de trabalho e ao restante de seus itens. Quando alguém compartilha um banco de dados espelho, também concede acesso ao ponto de extremidade de análise do SQL e ao modelo semântico padrão associado.

Acesse a caixa de diálogo Compartilhamento com o botão Compartilhar ao lado do nome do banco de dados espelhado no modo de exibição Espaço de Trabalho. Os bancos de dados espelhados compartilhados podem ser encontrados no Hub de Dados do OneLake ou na seção Compartilhado Comigo no Microsoft Fabric.

Para obter mais informações, consulte Compartilhar seu depósito e gerenciar permissões.

Consultas entre bancos de dados

Com os dados do banco de dados espelhado armazenados no OneLake, é possível gravar consultas entre bancos de dados, unindo dados de bancos de dados espelhados, depósitos e pontos de extremidade de análise SQL de Lakehouses em uma única consulta T-SQL. Para obter mais informações, consulte Gravar uma consulta entre bancos de dados.

Por exemplo, é possível fazer referência à tabela de bancos de dados espelhados e depósitos usando a nomeação de três partes. No exemplo a seguir, use o nome de três partes para se referir a ContosoSalesTable no depósito ContosoWarehouse adicionado. De outros bancos de dados ou armazéns, a primeira parte da convenção de nomenclatura de três partes SQL padrão é o nome do banco de dados espelhado.

SELECT * 
FROM ContosoWarehouse.dbo.ContosoSalesTable AS Contoso
INNER JOIN Affiliation
ON Affiliation.AffiliationId = Contoso.RecordTypeID;

Engenharia de dados com seus dados de banco de dados espelhados

O Microsoft Fabric fornece vários recursos de engenharia de dados para garantir que seus dados sejam facilmente acessíveis, bem organizados e tenham alta qualidade. Na Engenharia de Dados do Fabric, é possível:

  • Criar e gerenciar seus dados como Spark usando um lakehouse
  • Projetar pipelines para copiar dados para o lakehouse
  • Usar definições de trabalho do Spark para enviar trabalhos de lote/streaming para o cluster do Spark
  • Usar notebooks para gravar código para ingestão, preparação e transformação de dados

Ciência de dados com seus dados de banco de dados espelhados

O Microsoft Fabric oferece a Ciência de Dados do Synapse para habilitar os usuários a concluir fluxos de trabalho de ciência de dados de ponta a ponta para fins de enriquecimento de dados e informações de negócios. Você pode concluir uma ampla gama de atividades em todo o processo de ciência de dados, desde exploração, preparação e limpeza de dados até experimentação, modelagem, pontuação de modelo e fornecimento de insights preditivos para relatórios do BI.

Os usuários do Microsoft Fabric podem acessar as cargas de trabalho de Ciência de Dados. A partir daí, eles podem descobrir e acessar vários recursos relevantes. Por exemplo, eles podem criar experimentos, modelos e notebooks de aprendizado de máquina. Eles também podem importar blocos de anotações existentes na página inicial da Ciência de Dados.