Compartilhar via


Espelhando Floco de Neve no Microsoft Fabric

O espelhamento no Fabric fornece uma experiência fácil para evitar ETL complexo (Extrair Carga de Transformação) e integrar os dados existentes do snowflake warehouse com o restante dos dados no Microsoft Fabric. Você pode replicar continuamente os dados existentes do Snowflake diretamente no OneLake do Fabric. No Fabric, você pode desbloquear poderosos cenários de business intelligence, inteligência artificial, Engenharia de Dados, Ciência de Dados e compartilhamento de dados.

Para obter um tutorial sobre como configurar seu banco de dados Snowflake para Espelhamento no Fabric, consulte Tutorial: Configurar bancos de dados espelhados do Microsoft Fabric do Snowflake.

Por que usar o Espelhamento no Fabric?

Com o Espelhamento no Fabric, você não precisa reunir serviços diferentes de vários fornecedores. Em vez disso, você pode desfrutar de um produto altamente integrado, de ponta a ponta e fácil de usar que foi projetado para simplificar suas necessidades de análise e criado para abertura e colaboração entre a Microsoft, Snowflake e os anos 1000 de soluções tecnológicas que podem ler o formato de tabela delta lake de software livre.

Quais experiências de análise são internas?

Bancos de dados espelhados são um item no Fabric Data Warehousing distinto do ponto de extremidade de análise do Warehouse e do SQL.

Diagrama do espelhamento de banco de dados do Fabric para Snowflake.

O espelhamento cria estes itens no workspace do Fabric:

  • O item de banco de dados espelhado. Isso permite cenários downstream, como engenharia de dados, ciência de dados e muito mais. Gerenciamento de espelhamento:
    • A replicação dos metadados da Tabela Iceberg no OneLake, utilizando atalhos para o armazenamento que contém suas tabelas Iceberg. O OneLake converte automaticamente essas tabelas Iceberg em tabelas no formato Delta Lake para uso em cargas de trabalho do Fabric.
    • A replicação de dados de tabela gerenciada no OneLake e a conversão em Parquet, em um formato pronto para análise.
  • Um ponto de extremidade de análise do SQL

Cada banco de dados espelhado tem um ponto de extremidade de análise de SQL gerado automaticamente que fornece uma experiência analítica avançada sobre as Tabelas Delta criadas pelo processo de espelhamento. Os usuários têm acesso a comandos T-SQL familiares que podem definir e consultar objetos de dados, mas não manipular os dados do ponto de extremidade de análise do SQL, pois são uma cópia somente leitura. Você pode executar as seguintes ações no ponto de extremidade de análise do SQL:

  • Explore as tabelas que fazem referência aos dados em suas tabelas do Delta Lake do Snowflake.
  • Não crie consultas e exibições de código e explore dados visualmente sem escrever uma linha de código.
  • Desenvolva exibições SQL, TVFs embutidas (Funções com valor de tabela) e procedimentos armazenados para encapsular sua semântica e lógica de negócios no T-SQL.
  • Gerenciar permissões nos objetos.
  • Consultar dados em outros Warehouses e Lakehouses no mesmo workspace.

Além do editor de consultas SQL, há um amplo ecossistema de ferramentas que pode consultar o ponto de extremidade de análise do SQL, incluindo o SSMS (SQL Server Management Studio),a extensão mssql com o Visual Studio Code e até mesmo o GitHub Copilot.

Considerações de segurança

Para habilitar o espelhamento do Fabric, você precisará de permissões de usuário para o banco de dados Snowflake que contém as seguintes permissões:

  • CREATE STREAM
  • SELECT table
  • SHOW tables
  • DESCRIBE tables

Para obter mais informações, consulte a documentação do Snowflake sobre privilégios de controle de acesso para tabelas de streaming e permissões necessárias para fluxos.

Importante

Qualquer segurança granular estabelecida no armazém Snowflake de origem deve ser configurada novamente no banco de dados espelhado no Microsoft Fabric. Para obter mais informações, confira Permissões granulares do SQL no Microsoft Fabric.

Espelhando Floco de Neve atrás do firewall

Verifique os requisitos de rede para acessar sua fonte de dados snowflake. Se a fonte de dados snowflake não estiver acessível publicamente e estiver dentro de uma rede privada, crie um gateway de dados de rede virtual ou instale um gateway de dados local para espelhar os dados. A Rede Virtual do Azure ou a rede da máquina de gateway devem se conectar à instância do Snowflake por meio de um ponto de extremidade privado ou ser permitida pela regra de firewall. Para começar, consulte Tutorial: Configurar bancos de dados espelhados do Microsoft Fabric do Snowflake.

Considerações de custo espelhadas do Floco de Neve

A computação de malha usada para replicar seus dados no Fabric OneLake é gratuita. O custo de armazenamento de espelhamento é gratuito até um limite com base na capacidade. Para obter mais informações, consulte Custo de espelhamento e Preços do Microsoft Fabric. A computação para consultar dados usando SQL, Power BI ou Spark é cobrada a taxas regulares.

O Fabric não cobra taxas de entrada de dados de rede no OneLake for Mirroring.

Há custos de computação e consulta na nuvem do Snowflake quando os dados estão sendo espelhados: computação de armazém virtual e computação de serviços de nuvem.

  • Encargos de computação do armazém virtual Snowflake:
    • Os encargos de computação serão cobrados no lado snowflake se houver alterações de dados que estão sendo lidas no Snowflake e, por sua vez, estão sendo espelhadas no Fabric.
    • As consultas de metadados executadas nos bastidores para verificar se há alterações de dados não são cobradas por nenhuma computação snowflake; no entanto, as consultas que produzem dados como um SELECT * ativarão o armazém Snowflake e a computação serão cobradas.
  • Encargos de computação dos serviços snowflake:
    • Embora não haja encargos de computação para tarefas de bastidores, como criação, consultas de metadados, controle de acesso, exibição de alterações de dados e até consultas DDL, há custos de nuvem associados a essas consultas.
    • Dependendo do tipo de edição snowflake que você tem, você será cobrado pelos créditos correspondentes para quaisquer custos de serviços de nuvem.

Na captura de tela a seguir, você pode ver os custos de computação e computação de serviços de nuvem do banco de dados Snowflake associado que está sendo espelhado no Fabric. Nesse cenário, a maioria dos custos de computação dos serviços de nuvem (em amarelo) vem de consultas de alteração de dados com base nos pontos mencionados anteriormente. Os encargos de computação do armazém virtual (em azul) vêm estritamente das alterações de dados que estão sendo lidas do Snowflake e espelhadas no Fabric.

Captura de tela do grafo de custos do Snowflake.

Para obter mais informações sobre os custos de consulta de nuvem específicos do Snowflake, consulte documentos do Snowflake: Noções básicas sobre o custo geral.

Próxima etapa