Zrcadlení Snowflake v Microsoft Fabric

Mirroring v platformě Fabric poskytuje snadný způsob, jak se vyhnout složitému procesu ETL (extrakce, transformace, nahrání) a integrovat stávající data ve vašem skladu Snowflake se zbývajícími daty v Microsoft Fabric. Můžete průběžně replikovat stávající data Snowflake přímo do OneLake od Fabric. Uvnitř platformy Fabric můžete odemknout výkonnou businessovou inteligenci, umělou inteligenci, datové inženýrství, datovou vědu a smysluplné scénáře pro sdílení dat.

Pro návod ke konfiguraci Snowflake databáze pro zrcadlení ve Fabricu, viz Tutorial: Konfigurace zrcadlených databází Microsoft Fabric ze Snowflake.

Proč používat zrcadlení v Fabric?

Díky zrcadlení ve Fabricu nemusíte skládat různé služby od několika dodavatelů. Místo toho si můžete vychutnat vysoce integrovaný, ucelený a snadno použitelný produkt, který je navržený tak, aby zjednodušil vaše potřeby analýzy a vytvořil pro otevřenost a spolupráci mezi Microsoftem, Snowflakem a 1000 technologickými řešeními, která můžou číst opensourcový formát tabulky Delta Lake.

Jaká analytická prostředí jsou integrovaná?

Zrcadlené databáze jsou položkou ve Fabric Data Warehousing, odlišnou od skladu a koncového bodu SQL analytiky.

Diagram zrcadlení databáze Fabric pro Snowflake

Zrcadlení vytvoří tyto položky ve vašem pracovním prostoru Fabric:

  • Zrcadlová položka databáze. To umožňuje podřízené scénáře, jako jsou datové inženýrství, datové vědy a další. Zrcadlení spravuje:
    • Replikace metadat tabulek Iceberg do OneLake pomocí odkazů na úložiště, které obsahuje vaše tabulky Iceberg. OneLake tyto tabulky Iceberg automaticky převede na tabulky ve formátu Delta Lake pro použití napříč úlohami Fabric.
    • Replikace dat spravovaných tabulek do OneLake a převod na Parquet v analytickém formátu.
  • Koncový bod analýzy SQL

Každá zrcadlená databáze má automaticky vygenerovaný koncový bod analýzy SQL , který poskytuje bohaté analytické prostředí nad tabulkami Delta vytvořenými procesem zrcadlení. Uživatelé mají přístup ke známým příkazům T-SQL, které mohou definovat a dotazovat datové objekty, ale nebudou manipulovat s daty z koncového bodu analýzy SQL, protože se jedná o kopii určenou jen pro čtení. V koncovém bodu analýzy SQL můžete provést následující akce:

  • Prozkoumejte tabulky, které odkazují na data v tabulkách Delta Lake ze Snowflake.
  • Vytvářejte bezkódové dotazy a zobrazení a prozkoumávejte data vizuálně, aniž byste museli napsat řádek kódu.
  • Vyvíjejte zobrazení SQL, vložené TVFy (funkce s hodnotami tabulky) a uložené procedury pro zapouzdření sémantiky a obchodní logiky v T-SQL.
  • Umožňuje spravovat oprávnění k objektům.
  • Dotazování dat v jiných skladech a lakehousech ve stejném pracovním prostoru.

Kromě editoru dotazů SQL existuje široký ekosystém nástrojů, který se může dotazovat na koncový bod analýzy SQL, včetně SQL Server Management Studio (SSMS), rozšíření MSSQL pro Visual Studio Code a dokonce i GitHub Copilot.

Bezpečnostní aspekty

Pokud chcete povolit zrcadlení Fabric, budete potřebovat uživatelská oprávnění pro vaši databázi Snowflake, která zahrnují následující oprávnění:

  • CREATE STREAM
  • SELECT table
  • SHOW tables
  • DESCRIBE tables

Další informace najdete v dokumentaci Snowflake k oprávněním pro řízení přístupu k tabulkám pro streamování a požadovaným oprávněním pro streamy.

Důležité

Veškeré podrobné zabezpečení vytvořené ve zdrojovém skladu Snowflake musí být znovu nakonfigurováno v zrcadlené databázi v Microsoft Fabric. Další informace najdete v tématu SQL granular permissions in Microsoft Fabric.

Zrcadlení Snowflake za bránou firewall

Zkontrolujte požadavky na síť pro přístup ke zdroji dat Snowflake. Pokud váš zdroj dat Snowflake není veřejně přístupný a nachází se v privátní síti, vytvořte bránu dat virtuální sítě nebo nainstalujte místní bránu dat pro zrcadlení dat. Azure Virtual Network nebo síť bránového serveru se musí připojit k instanci Snowflake prostřednictvím privátního koncového bodu nebo musí být povolen pravidlem brány firewall. Pokud chcete začít, přečtěte si Výukový program: Konfigurace zrcadlených databází Microsoft Fabric z platformy Snowflake.

Nákladová hlediska replikace ve Snowflake

Výpočetní prostředky Fabric používané k replikaci dat do Fabric OneLake jsou zdarma. Náklady na zrcadlení úložiště jsou bezplatné až do limitu, který je stanoven na základě kapacity. Další informace najdete v tématu náklady na zrcadlení a Ceny Microsoft Fabric. Výpočty pro dotazování dat pomocí SQL, Power BI nebo Sparku jsou účtovány podle pravidelných sazeb.

Fabric neúčtuje poplatky za vstup síťových dat do OneLake pro účely zrcadlení.

Při zrcadlení dat existují náklady na výpočetní prostředky Snowflake a na dotazy v cloudu: výpočetní prostředky virtuálního skladu a výpočty cloudových služeb.

  • Poplatky za výpočetní prostředky virtuálního skladu Snowflake:
    • Výpočetní poplatky budou účtovány na straně Snowflake, pokud dojde ke změnám dat, která se čtou ve Snowflake a následně se zrcadlí do Fabric.
    • Za žádné dotazy na metadata spuštěné na pozadí, které slouží ke kontrole změn dat, se neúčtují žádné výpočetní prostředky Snowflake. Dotazy, které generují data, jako je například SELECT *, probudí sklad Snowflake a výpočetní prostředky se budou účtovat.
  • Poplatky za výpočetní služby Snowflake
    • I když se na pozadí neúčtují žádné poplatky za výpočetní prostředky, jako jsou vytváření, dotazy na metadata, řízení přístupu, zobrazování změn dat a dokonce dotazy DDL, jsou k těmto dotazům spojené náklady na cloud.
    • V závislosti na typu edice Snowflake se vám budou účtovat odpovídající kredity za všechny náklady na cloudové služby.

Na následujícím snímku obrazovky můžete vidět náklady na výpočet virtuálního skladu a cloudových služeb pro databázi Snowflake, která se zrcadlí do Fabric. V tomto scénáři většina nákladů na výpočetní prostředky cloudových služeb (žlutá) pochází z dotazů na změnu dat na základě výše uvedených bodů. Poplatky za výpočetní prostředky virtuálního skladu, zobrazené modře, pocházejí výhradně ze změn dat, které se čtou ze Snowflake a zrcadlí se do Fabric.

Snímek obrazovky s grafem nákladů Snowflake

Další informace o nákladech na cloudové dotazy specifické pro Snowflake najdete v dokumentaci snowflake: Vysvětlení celkových nákladů.

Další krok