Poznámka:
Přístup k této stránce vyžaduje autorizaci. Můžete se zkusit přihlásit nebo změnit adresáře.
Přístup k této stránce vyžaduje autorizaci. Můžete zkusit změnit adresáře.
Zrcadlení v prostředcích infrastruktury je nízkonákladové řešení s nízkou latencí, které spojuje data z různých systémů do jedné analytické platformy. Stávající datová aktiva můžete průběžně replikovat přímo do OneLake fabric z různých databází Azure a externích zdrojů dat.
S největší up-todaty v dotazovatelném formátu v OneLake teď můžete používat všechny různé služby v Prostředcích infrastruktury, jako je spouštění analýz pomocí Sparku, spouštění poznámkových bloků, přípravy dat, vizualizace v sestavách Power BI a další.
Zrcadlení v prostředcích infrastruktury umožňuje uživatelům využívat vysoce integrovaný, ucelený a snadno použitelný produkt, který je navržený tak, aby zjednodušil potřeby analýzy. Díky otevřenosti a spolupráci mezi Microsoftem a technologickými řešeními, která můžou číst opensourcový formát tabulky Delta Lake, zrcadlení je nízkonákladové řešení s nízkou latencí na klíč, které umožňuje vytvořit repliku dat v OneLake, která se dá použít pro všechny vaše analytické potřeby.
Tabulky Delta se pak dají používat všude v prostředcích Fabric, což uživatelům umožňuje urychlit jejich cestu k Prostředkům infrastruktury.
Proč používat zrcadlení v prostředcích infrastruktury?
Dnes má mnoho organizací klíčové provozní nebo analytické údaje, které se nachází v sila.
Přístup k datům a práce s ním dnes vyžaduje komplexní kanály ETL (Extrakce transformační zátěže), obchodní procesy a rozhodovací sila, které vytvářejí:
- Omezený a omezený přístup k důležitým, někdy měnícím se datům
- Tření mezi lidmi, procesy a technologiemi
- Dlouhé doby čekání při vytváření kanálů a procesů pro kriticky důležitá data
- Žádná svoboda používat nástroje, které potřebujete k analýze a sdílení přehledů pohodlně
- Nedostatek správných základů sdílení a spolupráce na datech
- Žádné běžné otevřené formáty dat pro všechny analytické scénáře – BI, AI, integrace, inženýrství a dokonce i aplikace
Zrcadlení v prostředcích infrastruktury poskytuje snadné prostředí pro urychlení časového limitu pro přehledy a rozhodování a rozdělení datových sil mezi technologickými řešeními:
- Replikace dat a metadat téměř v reálném čase do datového jezera SaaS s integrovanými analytickými funkcemi pro BI a AI
Platforma Microsoft Fabric je založená na základu softwaru jako služby (SaaS), který zjednodušuje a integraci na zcela novou úroveň. Další informace o Microsoft Fabric najdete v tématu Co je Microsoft Fabric?
Zrcadlení vytvoří tyto položky v pracovním prostoru Prostředky infrastruktury:
- Zrcadlení spravuje replikaci dat a metadat do OneLake a převod na Parquet v analytickém formátu. To umožňuje podřízené scénáře, jako jsou datové inženýrství, datové vědy a další.
- Koncový bod analýzy SQL
Kromě editoru dotazů SQL existuje široký ekosystém nástrojů, včetně SQL Server Management Studia (SSMS),rozšíření mssql se sadou Visual Studio Code a dokonce i GitHubu Copilot.
Sdílení umožňuje snadné řízení přístupu a správu, abyste měli jistotu, že můžete řídit přístup k citlivým informacím. Sdílení také umožňuje zabezpečené a demokratizované rozhodování ve vaší organizaci.
Typy zrcadlení
Fabric nabízí tři různé přístupy k přenesení dat do OneLake prostřednictvím zrcadlení.
- Zrcadlení databáze – Zrcadlení databází v Microsoft Fabric umožňuje replikaci celých databází a tabulek, což umožňuje spojit data z různých systémů do jedné analytické platformy.
- Zrcadlení metadat – Zrcadlení metadat v prostředcích infrastruktury synchronizuje metadata (například názvy katalogů, schémata a tabulky) místo fyzického přesouvání dat. Tento přístup využívá klávesové zkratky a zajišťuje, aby data zůstala ve zdroji a zároveň byla snadno přístupná v rámci prostředků infrastruktury.
- Otevřené zrcadlení – Otevřené zrcadlení v Prostředcích infrastruktury je navrženo k rozšíření zrcadlení na základě otevřeného formátu tabulky Delta Lake. Tato funkce umožňuje všem vývojářům psát data změny aplikace přímo do zrcadlené databázové položky v Microsoft Fabric na základě přístupu otevřeného zrcadlení a veřejných rozhraní API.
V současné době jsou k dispozici následující externí databáze:
Jak funguje replikace zrcadlení databáze téměř v reálném čase?
Zrcadlení je povoleno vytvořením zabezpečeného připojení k vašemu provoznímu zdroji dat. Rozhodnete se, jestli chcete replikovat celou databázi nebo jednotlivé tabulky a zrcadlení automaticky zajistí synchronizaci vašich dat. Po nastavení se data průběžně replikují do OneLake pro spotřebu analýz.
Toto jsou základní principy zrcadlení:
Povolení zrcadlení v prostředcích infrastruktury je jednoduché a intuitivní, aniž byste museli vytvářet složité kanály ETL, přidělovat další výpočetní prostředky a spravovat přesun dat.
Zrcadlení v prostředcích infrastruktury je plně spravovaná služba, takže se nemusíte starat o hostování, údržbu nebo správu replikace zrcadlených připojení.
Jak funguje zrcadlení metadat?
Zrcadlení umožňuje nejen replikaci dat, ale také prostřednictvím zástupců nebo zrcadlení metadat místo úplné replikace dat, což umožňuje jejich zpřístupnění bez fyzického přesunutí nebo duplikování dat. Zrcadlení v tomto kontextu odkazuje na replikaci pouze metadat , jako jsou názvy katalogů, schémata a tabulky, a ne samotná data. Tento přístup umožňuje prostředkům Infrastruktury zpřístupnit data z různých zdrojů, aniž by je duplikoval, zjednodušil správu dat a minimalizoval potřeby úložiště.
Například při přístupu k datům registrovaným v katalogu Unity zrcadlí prostředky Infrastruktury jenom strukturu katalogu z Azure Databricks, což umožňuje přístup k podkladovým datům prostřednictvím zástupců. Tato metoda zajišťuje, že všechny změny ve zdrojových datech se okamžitě projeví v prostředcích infrastruktury bez nutnosti přesunu dat, udržování synchronizace v reálném čase a zvýšení efektivity při přístupu k informacím o up-to-date.
Jak funguje otevírání zrcadlení?
Kromě zrcadlení, které umožňuje replikaci dat vytvořením zabezpečeného připojení ke zdroji dat, můžete také vybrat existujícího zprostředkovatele dat nebo napsat vlastní aplikaci, která přistane data do zrcadlené databáze. Jakmile vytvoříte otevřenou zrcadlenou databázi prostřednictvím veřejného rozhraní API nebo přes portál Fabric, budete moct získat adresu URL cílové zóny ve OneLake, kde můžete změnit data podle specifikace otevřeného zrcadlení.
Jakmile jsou data v cílové zóně se správným formátem, replikace začne běžet a bude spravovat složitost sloučení změn s aktualizacemi, vložením a odstraněním, které se projeví v rozdílových tabulkách. Tato metoda zajišťuje, že všechna data zapsaná do cílové zóny budou okamžitě a data v prostředcích infrastruktury up-to-date.
Sdílení
Sdílení umožňuje snadné řízení přístupu a správu, zatímco bezpečnostní prvky, jako jsou zabezpečení na úrovni řádků (RLS) a zabezpečení na úrovni objektů (OLS) a další, ujistěte se, že máte kontrolu nad přístupem k citlivým informacím. Sdílení také umožňuje zabezpečené a demokratizované rozhodování ve vaší organizaci.
Sdílením uživatelé udělují jiným uživatelům nebo skupině uživatelů přístup ke zrcadlené databázi bez udělení přístupu k pracovnímu prostoru a zbývajícím jeho položkám. Když někdo sdílí zrcadlenou databázi, udělí mu také přístup ke koncovému bodu analýzy SQL.
Další informace najdete v tématu Sdílení zrcadlené databáze a správy oprávnění.
Dotazy napříč databázemi
S daty z zrcadlené databáze uložené v OneLake můžete psát dotazy mezi databázemi, připojovat data ze zrcadlených databází, skladů a koncových bodů analýzy SQL v jednom dotazu T-SQL. Další informace najdete v tématu Zápis dotazu mezi databázemi.
Můžete například odkazovat na tabulku ze zrcadlených databází a skladů pomocí třídílného pojmenování. V následujícím příkladu použijte třídílný název odkazující na ContosoSalesTable sklad ContosoWarehouse. Z jiných databází nebo skladů představuje první část standardní zásady vytváření názvů SQL název zrcadlené databáze.
SELECT *
FROM ContosoWarehouse.dbo.ContosoSalesTable AS Contoso
INNER JOIN Affiliation
ON Affiliation.AffiliationId = Contoso.RecordTypeID;
Náklady na zrcadlení
Pro zrcadlení databáze a otevřené zrcadlení se výpočetní prostředky infrastruktury a úložiště OneLake uvolní až do limitu založeného na kapacitě.
- Úložiště pro repliky je bezplatné až do limitu na základě velikosti kapacity. Zrcadlení nabízí zdarma terabajt zrcadlení úložiště pro každou jednotku kapacity (CU), kterou jste zakoupili. Pokud například zakoupíte kapacitu F64, získáte 64 bezplatných terabajtů, které stojí za úložiště, výhradně používané pro zrcadlení. Při překročení bezplatného limitu úložiště zrcadlení nebo při pozastavení kapacity se účtuje úložiště OneLake. Další informace najdete v tématu Microsoft Fabric Pricing.
- Výpočetní prostředky infrastruktury na pozadí používané k replikaci dat do Fabric OneLake jsou bezplatné a nevyužívají kapacitu. Požadavky přímo na OneLake pro zrcadlená data spotřebovávají kapacitu jako normální spotřebu výpočetních prostředků OneLake. Výpočetní prostředky pro dotazování na data pomocí SQL, Power BI nebo Sparku se účtují podle pravidelných sazeb.
- Spuštěná kapacita prostředků infrastruktury se vyžaduje pouze pro počáteční nastavení zrcadlení.
Příprava dat se zrcadlenými databázovými daty
Microsoft Fabric nabízí různé možnosti přípravy dat, které zajistí, že vaše data budou snadno přístupná, dobře uspořádaná a vysoce kvalitní. Z přípravy dat infrastruktury můžete:
- Vytvoření a správa dat jako Spark pomocí jezerahouse
- Návrh kanálů pro kopírování dat do jezerahouse
- Použití definic úloh Sparku k odeslání dávkové úlohy nebo úlohy streamování do clusteru Spark
- Psaní kódu pro příjem dat, přípravu a transformaci pomocí poznámkových bloků
Datové vědy se zrcadlenými databázovými daty
Microsoft Fabric nabízí datové vědy, které uživatelům umožňují kompletní pracovní postupy datových věd pro účely rozšiřování dat a obchodních přehledů. Celou řadu aktivit v rámci celého procesu datových věd, od zkoumání dat, přípravy a čištění až po experimentování, modelování, bodování modelu a poskytování prediktivních přehledů sestav BI.
Uživatelé Microsoft Fabric mají přístup k úlohám datových věd. Odtud můžou zjišťovat a přistupovat k různým relevantním prostředkům. Můžou například vytvářet experimenty, modely a poznámkové bloky strojového učení. Můžou také importovat existující poznámkové bloky na domovské stránce datové vědy.
Direct Lake se zrcadlenými daty databáze
Režim Direct Lake je možné použít se zrcadlenými databázemi v Microsoft Fabric, abyste umožnili vysoce výkonné dotazování na zrcadlená data bez nutnosti přesunu nebo duplikování dat. Při vytvoření zrcadlené databáze se její data ukládají ve formátu Delta Lake v rámci OneLake. Tento nativní formát umožňuje Power BI a dalším analytickým nástrojům připojit se prostřednictvím režimu Direct Lake, který nabízí přehledy téměř v reálném čase přímým přístupem k podkladovým souborům. Tato integrace kombinuje jednoduchost zrcadlení s rychlostí a škálovatelností Direct Lake a umožňuje rychlé up-togenerování sestav provozních dat.
Uchovávání zrcadlených dat
Zrcadlení v prostředcích infrastruktury průběžně replikuje vaše stávající datové aktiva do OneLake ve formátu tabulky Delta Lake. Pokud chcete, aby zrcadlená data byla efektivně uložená a vždy připravená k analýze, zrcadlení automaticky spustí vakuum pro odebrání starých souborů, na které už protokol Delta neodkazuje.
Nastavení uchovávání můžete přizpůsobit podle svých požadavků. Můžete například zvolit kratší dobu uchovávání, abyste snížili spotřebu úložiště zrcadlení nebo rozšířili dobu uchovávání tak, aby využívala možnosti časového cestování delta pro účely analýzy.
U zrcadlených databází vytvořených z portálu Fabric po polovině června 2025 je výchozí uchovávání jeden den. U starých zrcadlených databází je výchozí hodnota sedm dnů. Pokud chcete zkontrolovat nebo aktualizovat nastavení uchovávání informací, přejděte na portálu Fabric na kartu Zrcadlené databáze -> ->Maintenance a zadejte prahovou hodnotu uchovávání. Můžete ho také nakonfigurovat prostřednictvím retentionInDays zadáním vlastnosti.
Databáze SQL v platformě Fabric
Databázi SQL můžete také přímo vytvořit a spravovat v Microsoft Fabric na portálu Fabric. Na základě Azure SQL Database se databáze SQL v prostředcích infrastruktury automaticky zrcadlí pro účely analýzy a umožňuje snadno vytvořit provozní databázi v prostředcích infrastruktury. Databáze SQL je domovská stránka v prostředcích Infrastruktury pro úlohy OLTP a může integrovat s integrací správy zdrojového kódu Fabric.