Sdílet prostřednictvím


Dostupnost Eventhouse OneLake

V objektu událostí můžete vytvořit jednu logickou kopii dat databáze KQL zapnutím dostupnosti OneLake. Zapnutí dostupnosti OneLake znamená, že můžete dotazovat data v databázi KQL ve formátu Delta Lake prostřednictvím jiných modulů Infrastruktury, jako je režim Direct Lake v Power BI, Warehouse, Lakehouse, Notebooks a další.

Delta Lake je jednotný formát tabulky Data Lake, který umožňuje bezproblémový přístup k datům napříč všemi výpočetními moduly v Microsoft Fabric. Další informace o Delta Lake najdete v tématu Co je Delta Lake?.

V tomto článku se dozvíte, jak zapnout dostupnost dat databáze KQL ve OneLake.

Jak to funguje

Následující tabulka popisuje chování databáze a tabulek KQL při zapnutí nebo vypnutí dostupnosti OneLake.

Zapnutý Vypnuto
Databáze KQL – Stávající tabulky nejsou ovlivněné. Nové tabulky jsou dostupné ve OneLake.
– Zásady uchovávání dat databáze KQL se použijí také na data v OneLake. Data odebraná z databáze KQL na konci doby uchovávání se také odeberou z OneLake.
– Stávající tabulky nejsou ovlivněné. Nové tabulky nebudou ve OneLake dostupné.
Tabulka v databázi KQL - Nová data jsou k dispozici ve OneLake.
– Existující data se nevyplní.
– Data nelze odstranit, zkrátit ani vymazat.
– Schéma tabulky nelze změnit a tabulku nelze přejmenovat.
– Ve OneLake nejsou k dispozici nová data.
– Data lze odstranit, zkrátit nebo vymazat.
– Schéma tabulky lze změnit a tabulku lze přejmenovat.
- Data se z OneLake odstraní.

Důležité

Zobrazení dat ve OneLake může trvat až několik hodin. Další informace naleznete v tématu Adaptivní chování.

Za zapnutí dostupnosti OneLake nejsou žádné další náklady na úložiště. Další informace najdete v tématu o spotřebě prostředků.

Požadavky

Zapnutí dostupnosti OneLake

Dostupnost OneLake můžete zapnout buď na úrovni databáze KQL, nebo tabulky.

  1. Dostupnost OneLake zapnete tak, že přejdete na stránku podrobností databáze nebo tabulky KQL.

  2. Vedle dostupnosti OneLake v podokně Podrobností databáze vyberte ikonu Upravit (tužka).

    Snímek obrazovky s podoknem Podrobností databáze ve funkci Analýza v reálném čase zobrazující přehled databáze se zvýrazněnou možností upravit dostupnost OneLake

  3. Zapněte tuto funkci přepnutím tlačítka na Aktivní a pak vyberte Hotovo. Databáze se aktualizuje automaticky.

    Snímek obrazovky s oknem podrobností složky OneLake v sadě Microsoft Fabric v sadě Real-Time Intelligence Možnost zveřejnit data pro OneLake je zapnutá.

V databázi KQL jste zapnuli dostupnost OneLake. Teď máte přístup ke všem novým datům přidaných do databáze na dané cestě OneLake ve formátu Delta Lake. Můžete také vytvořit zástupce OneLake z Lakehouse, Data Warehouse nebo dotazovat data přímo v režimu Power BI Direct Lake.

Adaptivní chování

Eventhouse nabízí robustní mechanismus, který inteligentně dávková příchozí datové proudy do jednoho nebo více souborů Parquet strukturovaných pro analýzu. Dávkování datových proudů je důležité při práci s podvodnými daty. Zápis mnoha malých souborů Parquet do jezera může být neefektivní, což vede k vyšším nákladům a nízkému výkonu.

Adaptivní mechanismus eventhouse může zpozdit operace zápisu až na několik hodin, pokud není dostatek dat k vytvoření optimálních souborů Parquet. Tím se zajistí optimální velikost souborů Parquet a dodržování osvědčených postupů pro Delta Lake. Adaptivní mechanismus Eventhouse zajišťuje, aby soubory Parquet byly předváděny pro analýzu a vyrovnává potřebu dostupnosti dat s ohledem na náklady a výkon.

Pomocí příkazu .show table mirroring operations můžete monitorovat, jak dlouho byla v jezeře přidána nová data.

Výsledky se měří od posledního přidání dat. Pokud latence způsobí 00:00:00, všechna data v databázi KQL jsou k dispozici ve OneLake.

Prohlížení souborů

Když zapnete dostupnost OneLake v tabulce, vytvoří se spolu s odpovídajícími soubory JSON a Parquet složka s rozdílovým protokolem. Můžete zobrazit soubory, které byly zpřístupněny ve OneLake, a jejich vlastnosti a zůstat v reálném čase.

  • Chcete-li zobrazit soubory, najeďte myší na tabulku v podokně Průzkumník a pak vyberte nabídku Další [...]>Umožňuje zobrazit soubory.

    Snímek obrazovky s podoknem Průzkumníka s rozevíracím seznamem Nabídky Další v tabulce

  • Pokud chcete zobrazit vlastnosti složky rozdílového protokolu nebo jednotlivých souborů, najeďte myší na složku nebo soubor a pak vyberte nabídku Další [...]>Vlastnosti.

  • Zobrazení souborů ve složce rozdílového protokolu:

    1. Vyberte složku _delta_log.
    2. Výběrem souboru zobrazíte metadata a schéma tabulky. Editor, který se otevře, je ve formátu jen pro čtení.

Zásady zrcadlení přístupu

Pokud je ve výchozím nastavení zapnutá dostupnost OneLake, povolí se zásada zrcadlení. Zásady můžete použít k monitorování latence dat nebo k jejich změně na rozdílové tabulky oddílů.

Poznámka:

Pokud vypnete dostupnost OneLake, vlastnost zásady IsEnabled zrcadlení je nastavená na false (IsEnabled=false).

Rozdílové tabulky oddílů

Rozdílové tabulky můžete rozdělit tak, aby se zlepšila rychlost dotazů. Informace o tom, kdy rozdělit soubory OneLake, naleznete v tématu Kdy rozdělit tabulky. Každý oddíl je reprezentován jako samostatný sloupec pomocí Názvu oddílu uvedeného v seznamu Oddíly. To znamená, že vaše kopie OneLake má více sloupců než zdrojová tabulka.

K rozdělení tabulek delta použijte příkaz zrcadlení zásad tabulky .alter-merge.