Sdílet prostřednictvím


Co je zrcadlení v rámci technologie Fabric?

Zrcadlení ve Fabric je cenově výhodné řešení s nízkou latencí, které integruje data z různých systémů do jednotné analytické platformy. Stávající datová aktiva můžete replikovat průběžně přímo do OneLake od Fabricu z různých databází Azure a externích zdrojů dat.

S nejaktuálnějšími daty v dotazovatelném formátu v OneLake můžete používat všechny různé služby v rámci Fabric, jako je provádění analýz pomocí Spark, spouštění poznámkových bloků, příprava dat, vizualizaci prostřednictvím sestav Power BI a další.

Díky funkci Mirroring ve Fabric získáte vysoce integrovaný, end-to-end a snadno použitelný produkt, který zjednodušuje vaše potřeby analýzy. Zrcadlení je postavené na otevřenosti a spolupráci mezi Microsoftem a technologickými řešeními, která můžou číst opensourcový formát tabulky Delta Lake. Jedná se o nízkonákladové řešení s nízkou latencí na klíč, které vytvoří repliku dat ve OneLake pro všechny vaše analytické potřeby.

Tabulky Delta můžete používat všude v prostředí Fabric, což vám pomůže urychlit cestu do prostředí Fabric.

Zrcadlení povolíte vytvořením zabezpečeného připojení k vašemu provoznímu zdroji dat. Rozhodnete se, jestli chcete replikovat celou databázi nebo jednotlivé tabulky, a zrcadlení automaticky udržuje vaše data synchronizovaná. Po nastavení se data průběžně replikují do OneLake pro spotřebu analýz.

Proč používat zrcadlení ve Fabric?

Dnes má mnoho organizací klíčová provozní nebo analytická data, která se nachází v silech.

Přístup k těmto datům a práce s ním vyžaduje komplexní kanály ETL (Extract Transform Load), obchodní procesy a rozhodovací oddělení, což vytváří:

  • Omezený a omezený přístup k důležitým, někdy měnícím se datům
  • Tření mezi lidmi, procesy a technologiemi
  • Dlouhé doby čekání při vytváření kanálů a procesů pro kriticky důležitá data
  • Žádná svoboda používat nástroje, které potřebujete k analýze a sdílení přehledů pohodlně
  • Nedostatek správných základů sdílení a spolupráce na datech
  • Žádné běžné otevřené formáty dat pro všechny analytické scénáře – BI, AI, integrace, inženýrství a dokonce i aplikace

Zrcadlení v platformě poskytuje snadné prostředí pro urychlení času potřebného k získání hodnoty z přehledů a rozhodnutí a pro odstranění datových sil mezi technologickými řešeními.

  • Replikace dat a metadat téměř v reálném čase do datového jezera SaaS s integrovanou analýzou pro BI a AI

Platforma Microsoft Fabric je založená na základu softwaru jako služby (SaaS), který zjednodušuje a integruje zcela novou úroveň. Další informace o Microsoft Fabric najdete v tématu Co je Microsoft Fabric?

Toto jsou základní principy zrcadlení:

  • Povolení zrcadlení v rámci Fabric je jednoduché a intuitivní, aniž byste museli vytvářet složité kanály ETL, přidělovat další výpočetní prostředky nebo spravovat pohyb dat.

  • Zrcadlení ve službě Fabric je plně spravovaná služba, takže se nemusíte starat o hostování, údržbu nebo správu replikace daného zrcadleného připojení.

Zrcadlení objektů

Zrcadlení vytvoří v pracovním prostoru Fabric tyto položky:

  • Proces, který spravuje replikaci dat a metadat do OneLake a převod na Parquet v analytickém formátu. Tento proces umožňuje podřízené scénáře, jako jsou datové inženýrství, datové vědy a další.
  • Koncový bod analýzy SQL

Kromě editoru dotazů SQL existuje široký ekosystém nástrojů, mezi které patří SQL Server Management Studio (SSMS),rozšíření MSSQL pro Visual Studio Code a dokonce i GitHub Copilot.

Sdílení usnadňuje řízení přístupu a správy oprávnění, abyste mohli chránit citlivé informace. Sdílení také umožňuje zabezpečené a demokratizované rozhodování ve vaší organizaci.

Typy zrcadlení

Microsoft Fabric nabízí tři různé přístupy pro přenos dat do OneLake prostřednictvím zrcadlení.

  • Zrcadlení databáze – Zrcadlení databáze v prostředí Fabric replikuje celé databáze a tabulky, tak aby se data z různých systémů spojila do jedné analytické platformy.
  • Zrcadlení metadat – Zrcadlení metadat ve Fabric synchronizuje metadata (například názvy katalogů, schémata a tabulky) místo fyzického přesouvání dat. Tento přístup používá klávesové zkratky a zajišťuje, aby data zůstala ve svém zdroji a byla stále snadno přístupná v rámci prostředků infrastruktury.
  • Otevřené zrcadlení v prostředí Fabric je navrženo tak, aby rozšířilo zrcadlení založené na otevřeném formátu tabulky Delta Lake. Tato funkce umožňuje všem vývojářům psát data změny aplikace přímo do zrcadlené databázové položky v prostředcích Fabric na základě otevřeného přístupu zrcadlení a veřejných rozhraní API.

V současné době jsou k dispozici následující externí databáze:

Platforma Replikace téměř v reálném čase Typ zrcadlení Kompletní kurz
Zrcadlené databáze Microsoft Fabric z Azure Cosmos DB Ano Zrcadlení databáze Kurz: Azure Cosmos DB
Zrcadlené databáze Microsoft Fabric z Azure Databricks Ano Zrcadlení metadat Kurz: Azure Databricks
Databáze Microsoft Fabric zrcadlené ze služby Azure Database for PostgreSQL Ano Zrcadlení databáze Návod: Azure Database for PostgreSQL
Zrcadlené databáze Microsoft Fabric ze služby Azure Database for MySQL (Preview) Ano Zrcadlení databáze Výukový program: Azure Database for MySQL (náhled)
Microsoft Fabric zrcadlené databáze z Azure SQL Database Ano Zrcadlení databáze Kurz: Azure SQL Database
Microsoft Fabric databáze zrcadlené z Azure SQL Managed Instance Ano Zrcadlení databáze Kurz: Azure SQL Managed Instance
Microsoft Fabric zrcadlené databáze z Google BigQuery (Preview) Ano Zrcadlení databáze Tutoriál: Google BigQuery
Zrcadlené databáze Microsoft Fabric od Oracle Ano Zrcadlení databáze Kurz: Oracle
Zrcadlené databáze ze SAP v Microsoft Fabric Ano Zrcadlení databáze Kurz: SAP
Databáze Microsoft Fabric zrcadlené ze Snowflake Ano Zrcadlení databáze Kurz: Snowflake
Microsoft Fabric databáze zrcadlené ze SQL Serveru Ano Zrcadlení databáze Kurz: SQL Server
Otevření zrcadlených databází Ano Otevřít zrcadlení Tutoriál: Otevřené zrcadlení
Microsoft Fabric zrcadlené databáze z databáze SQL Fabric Ano Zrcadlení databáze Automaticky nakonfigurované

Replikace téměř v reálném čase

Replikace téměř v reálném čase může záviset na různých faktorech, mezi které patří:

  • Umístění nebo oblast zdroje
  • Umístění nebo oblast cíle
  • Objem změn
  • Frekvence změn
  • Šířka pásma a latence sítě ze zdroje
  • Výpočetní prostředky přidělené místní bráně dat

Jak funguje zrcadlení databáze?

Rozdílové soubory přicházejí postupně do datové infrastruktury ze zdroje dat. Metoda identifikace přírůstkově změněných dat se v jednotlivých zdrojích dat liší. V SQL Server 2025 například SQL Database Engine prohledá transakční protokol zdrojové databáze s vysokou frekvencí. SQL Server publikuje změny pro každou tabulku v odpovídajících souborech v cílové zóně Fabric.

Uvnitř Fabric vždy běží replikátorový engine a ve vysoké frekvenci skenuje nově publikované soubory. Fabric okamžitě sloučí příchozí změny do cílové tabulky Delta. Změny lze publikovat každých 15 sekund.

Logika ústupu, která detekuje nízkou aktivitu, zabraňuje nadměrné zátěži motorů zdrojů dat mimo Fabric a snižuje latenci reagováním na frekvenci změn příchozích dat.

Diagram, jak funguje zrcadlení databáze Fabric.

Jak funguje zrcadlení metadat?

Zrcadlení umožňuje nejen replikaci dat, ale lze jej také dosáhnout pomocí zástupců nebo zrcadlení metadat namísto úplné replikace dat, což zajišťuje zpřístupnění dat bez jejich fyzického přesunu nebo duplikace. Zrcadlení v tomto kontextu odkazuje na replikaci pouze metadat, jako jsou názvy katalogů, schémata a tabulky, nikoli samotná skutečná data. Tento přístup umožňuje technologii Fabric zpřístupnit data z různých zdrojů, aniž by došlo k jejich duplikaci, čímž zjednodušuje správu dat a minimalizuje potřebu úložiště.

Například při přístupu k datům zaregistrovaným v katalogu Unity Fabric zrcadlí jenom strukturu katalogu z Azure Databricks, což umožňuje přístup k podkladovým datům prostřednictvím zástupců. Tato metoda zajišťuje, že všechny změny ve zdrojových datech se okamžitě projeví ve Fabric bez nutnosti přesunu dat, udržuje synchronizaci v reálném čase a zvyšuje efektivitu při přístupu k aktuálním informacím.

Jak funguje otevírání zrcadlení?

Kromě povolení replikace dat díky vytvoření zabezpečeného připojení ke zdroji dat vám technika zrcadlení umožní vybrat existujícího poskytovatele dat nebo vytvořit vlastní aplikaci k uložení dat do zrcadlové databáze. Když vytvoříte otevřenou zrcadlenou databázi prostřednictvím veřejného rozhraní API nebo portálu Fabric, získáte adresu URL cílové zóny ve OneLake, kde můžete změnit data podle specifikace otevřeného zrcadlení.

Jakmile jsou data v přijímací zóně se správným formátem, proces replikace se spustí a spravuje složitost sloučení změn včetně aktualizací, vložení a odstranění, které se odrazí v rozdílových tabulkách. Tato metoda zajišťuje, že všechna data zapsaná do cílové zóny se okamžitě odrážejí, což udržuje data ve Fabric aktuální.

Sdílení

Sdílení usnadňuje řízení přístupu a správu. Ovládací prvky zabezpečení, jako je zabezpečení na úrovni řádků (RLS), zabezpečení na úrovni objektů (OLS) a další, zajistí, že můžete ovládat přístup k citlivým informacím. Sdílení také umožňuje zabezpečené a demokratizované rozhodování ve vaší organizaci.

Sdílením uživatelé udělují jiným uživatelům nebo skupině uživatelů přístup ke zrcadlené databázi bez udělení přístupu k pracovnímu prostoru a zbývajícím jeho položkám. Když někdo sdílí zrcadlenou databázi, udělí mu také přístup ke koncovému bodu analýzy SQL.

Další informace najdete v tématu Sdílení zrcadlené databáze a správy oprávnění.

Dotazy napříč databázemi

S daty z zrcadlené databáze uložené ve OneLake můžete psát dotazy mezi databázemi, spojovat data ze zrcadlených databází, skladů a koncových bodů analýzy SQL Lakehouses v jednom dotazu T-SQL. Další informace najdete v tématu Zápis dotazu mezi databázemi.

Na tabulku můžete například odkazovat ze zrcadlených databází a skladů pomocí třídílného pojmenování. V následujícím příkladu použijte třídílný název k odkazování na ContosoSalesTable ve skladu ContosoWarehouse. Z jiných databází nebo skladů je první část standardní tříčástkové konvence SQL název zrcadlené databáze.

SELECT *
FROM ContosoWarehouse.dbo.ContosoSalesTable AS Contoso
INNER JOIN Affiliation
ON Affiliation.AffiliationId = Contoso.RecordTypeID;

Náklady na zrcadlení

Pro zrcadlení databáze a otevřené zrcadlení jsou výpočetní služby Fabric a úložiště OneLake zdarma až do kapacitního limitu.

  • Úložiště pro repliky je bezplatné až do limitu na základě velikosti kapacity. Zrcadlení nabízí terabajt úložného prostoru pro zrcadlení zdarma pro každou jednotku kapacity (CU), kterou zakoupíte. Pokud například zakoupíte kapacitu F64, získáte 64 terabajtů úložiště zdarma, výhradně použité pro zrcadlení. Za úložiště OneLake platíte, pokud překročíte limit úložiště bezplatného "mirroring" nebo když je kapacita pozastavena. Další informace najdete v tématu Microsoft Fabric Ceník.
  • Výpočetní prostředky infrastruktury na pozadí používané k replikaci dat do Fabric OneLake jsou bezplatné a nevyužívají kapacitu. Požadavky přímo na OneLake pro zrcadlená data spotřebovávají kapacitu stejně jako běžná spotřeba výpočetních prostředků OneLake. Výpočetní výkon používaný k dotazování na data pomocí SQL, Power BI nebo Sparku se účtuje podle běžných sazeb.
  • Kapacita Fabricu je vyžadována pouze pro počáteční nastavení zrcadlení.

Datové inženýrství se zrcadlenými databázovými daty

Microsoft Fabric poskytuje různé možnosti přípravy dat, které zajistí, že jsou vaše data snadno přístupná, dobře uspořádaná a vysoce kvalitní. Z Fabric Data Engineering můžete:

  • Vytvářejte a spravujte svá data jako Spark pomocí lakehouse
  • Navrhněte datové toky pro kopírování dat do lakehouse.
  • Použití definic úloh Sparku k odeslání dávkové úlohy nebo úlohy streamování do clusteru Spark
  • Používejte poznámkové bloky k psaní kódu pro příjem, přípravu a transformaci dat.

Datové vědy s využitím zrcadlených databázových dat

Microsoft Fabric nabízí Fabric Data Science pro zmocnění uživatelů k dokončení úplných end-to-end pracovních postupů datové vědy za účelem obohacení dat a obchodních přehledů. Můžete dokončit celou řadu aktivit v celém procesu datových věd, počínaje zkoumáním dat, přípravou a čištěním, experimentováním, modelováním, vyhodnocováním modelu a obsluhou prediktivních přehledů v sestavách BI.

Microsoft Fabric uživatelé mají přístup k úlohám Data Science. Odtud můžou zjišťovat a přistupovat k různým relevantním prostředkům. Můžou například vytvářet experimenty, modely a poznámkové bloky strojového učení. Můžou také importovat existující poznámkové bloky na domovské stránce datové vědy.

Direct Lake se zrcadlenými daty databáze

Režim Direct Lake můžete použít se zrcadlenými databázemi v Microsoft Fabric, abyste umožnili vysoce výkonné dotazování na zrcadlená data bez nutnosti přesunu nebo duplikování dat. Při vytváření zrcadlené databáze se její data ukládají ve formátu Delta Lake v rámci OneLake. Tento nativní formát umožňuje připojení Power BI a dalších analytických nástrojů prostřednictvím režimu Direct Lake a nabízí přehledy téměř v reálném čase přímým přístupem k podkladovým souborům. Tato integrace kombinuje jednoduchost zrcadlení s rychlostí a škálovatelností Direct Lake a umožňuje rychlé a aktuální vytváření sestav z provozních dat.

Uchovávání zrcadlených dat

Zrcadlení v Fabric průběžně replikuje vaši stávající datovou platformu do OneLake ve formátu tabulek Delta Lake. Pokud chcete, aby zrcadlená data byla efektivně uložená a vždy připravená k analýze, zrcadlení automaticky spustí vakuum pro odebrání starých souborů, na které už protokol Delta neodkazuje.

Nastavení uchovávání můžete přizpůsobit podle svých požadavků. Můžete například zvolit kratší dobu uchovávání, abyste snížili spotřebu zrcadlového úložiště nebo rozšířili dobu uchovávání, aby využili možnosti časového cestování Delta pro účely analýzy.

U zrcadlených databází vytvořených z portálu Fabric po polovině června 2025 je výchozí uchovávání jeden den. U starých zrcadlených databází je výchozí hodnota sedm dnů. Pokud chcete zkontrolovat nebo aktualizovat nastavení uchovávání informací, přejděte na portálu Fabric na kartu zrcadlené databáze -> ->Delta table management a zadejte prahovou hodnotu uchovávání. Můžete jej také nakonfigurovat prostřednictvím veřejného rozhraní API zadáním vlastnosti retentionInDays.

Databáze SQL v platformě Fabric

Databázi SQL můžete také přímo vytvořit a spravovat v Microsoft Fabric na portálu Fabric. Databáze SQL ve Fabric na základě Azure SQL Database automaticky zrcadlí data pro účely analýzy a můžete snadno vytvořit provozní databázi ve Fabric. SQL Database je domovem v infrastruktuře Fabric pro úlohy OLTP a může být integrováno s integrací správy zdrojového kódu Fabric.