Zdieľať cez


Dostupnosť služby Eventhouse OneLake

Zapnutím dostupnosti služby OneLake môžete vytvoriť jednu logickú kópiu údajov databázy KQL v službe eventhouse. Zapnutie dostupnosti služby OneLake znamená, že údaje v databáze KQL môžete dotazovať vo formáte Delta Lake prostredníctvom iných strojov služby Fabric, ako je napríklad režim Direct Lake v službe Power BI, Warehouse, Lakehouse, Notebooks a ďalšie.

Delta Lake je jednotný formát tabuľky data lake, ktorý dosahuje bezproblémový prístup k údajom vo všetkých výpočtových nástrojoch v službe Microsoft Fabric. Ďalšie informácie o Delta Lake nájdete v téme Čo je Delta Lake?.

V tomto článku sa dozviete, ako zapnúť dostupnosť údajov databázy KQL v službe OneLake.

Ako to funguje

Nasledujúca tabuľka popisuje správanie vašej databázy KQL a tabuliek pri zapnutí alebo vypnutí dostupnosti OneLake.

Zapnuté Vypnutý
Databáza KQL – Existujúce tabuľky sa nezmenia. Nové tabuľky sú k dispozícii v službe OneLake.
– Politika uchovávania údajov databázy KQL sa tiež použije na údaje v službe OneLake. Údaje odstránené z vašej databázy KQL na konci obdobia uchovávania sa tiež odstránia zo služby OneLake.
– Existujúce tabuľky sa nezmenia. Nové tabuľky nebudú k dispozícii v službe OneLake.
Tabuľka v databáze KQL – Nové údaje sú k dispozícii v OneLake.
– Existujúce údaje sa nevyplnia.
– Údaje nie je možné odstrániť, skrátiť alebo vymazať.
– Schému tabuľky nemožno zmeniť a tabuľku nie je možné premenovať.
– V službe OneLake nie sú k dispozícii nové údaje.
– Údaje možno odstrániť, skrátiť alebo vymazať.
– Schému tabuľky možno zmeniť a tabuľku možno premenovať.
– Údaje nie sú odstránené z OneLake.

Dôležité

Zobrazenie údajov vo OneLake môže trvať niekoľko hodín. Ďalšie informácie nájdete v téme Adaptívne správanie.

Na zapnutie dostupnosti služby OneLake nie sú potrebné žiadne dodatočné náklady na úložisko. Ďalšie informácie nájdete v téme Spotreba zdrojov.

Požiadavky

Zapnutie dostupnosti OneLake

Dostupnosť oneLake môžete zapnúť buď v databáze KQL, alebo na úrovni tabuľky.

  1. Ak chcete zapnúť dostupnosť služby OneLake, prejdite na stránku s podrobnosťami o databáze KQL alebo tabuľke.

  2. Vedľa položky Dostupnosť OneLake na table Podrobnosti o databáze vyberte ikonu Upraviť (ceruzka).

    Snímka obrazovky s tablou Podrobnosti databázy v nástroji Inteligencia v reálnom čase zobrazujúca prehľad databázy so zvýraznenou možnosťou upraviť dostupnosť OneLake.

  3. Zapnite funkciu tak, že prepnete tlačidlo na hodnotu Aktívne a potom vyberte položku Hotovo. Databáza sa obnoví automaticky.

    Snímka obrazovky znázorňujúca okno s podrobnosťami priečinka OneLake v službe Microsoft Fabric v reálnom čase. Možnosť vystavenia údajov službe OneLake je zapnutá.

Zapli ste dostupnosť OneLake v databáze KQL. Teraz môžete získať prístup ku všetkým novým údajom pridaným do databázy na danej ceste OneLake vo formáte Delta Lake. Môžete sa tiež rozhodnúť vytvoriť odkaz OneLake z balíka Lakehouse, Data Warehouse alebo dotazovať údaje priamo cez režim Power BI Direct Lake.

Adaptívne správanie

Eventhouse ponúka robustný mechanizmus, ktorý inteligentne dávkuje prichádzajúce dátové prúdy do jedného alebo viacerých súborov parquet, štruktúrovaných na analýzu. Dávkovanie streamov údajov je dôležité pri práci s podvodnými údajmi. Písanie mnohých malých súborov parquet do jazera môže byť neefektívne vyplývajúce z vyšších nákladov a slabý výkon.

Adaptívny mechanizmus eventhouse môže oddialiť operácie zapisovaia až o niekoľko hodín, ak nie je k dispozícii dostatok údajov na vytvorenie optimálnych parquet súborov. Vďaka tomu sú súbory vo formáte Parquet optimálne a dodržiavajú najvhodnejšie postupy pre Delta Lake. Adaptívny mechanizmus Eventhouse zabezpečuje, že súbory vo formáte Parquet sú pripravené na analýzu a vyrovnávajú potrebu okamžitej dostupnosti údajov s ohľadom na náklady a výkon.

Kontrolu latencie údajov môžete pomocou príkazu .show table mirroring operations (zobraziť operácie zrkadlenia tabuľky) monitorovať, ako dávno sa do jazera pridali nové údaje.

Výsledky sa merajú z posledného pridania údajov. Keď má latencia výsledok 00:00:00, všetky údaje v databáze KQL sú k dispozícii v službe OneLake.

Zobrazenie súborov

Keď v tabuľke zapnete dostupnosť OneLake, vytvorí sa priečinok delta log spolu so všetkými zodpovedajúcimi súbormi JSON a Parquet. Môžete zobraziť súbory, ktoré boli sprístupnené v službe OneLake, a ich vlastnosti, pričom zostávajú v službe V reálnom čase inteligencie.

  • Ak chcete zobraziť súbory, ukážte kurzorom myši na tabuľku v table Prieskumník a potom vyberte ponuku Viac [...]>Zobraziť súbory.

    Snímka obrazovky tably Prieskumník zobrazujúca rozbaľovací zoznam ponuky Ďalšie v tabuľke.

  • Ak chcete zobraziť vlastnosti priečinka denníkov delta alebo jednotlivé súbory, ukážte na priečinok alebo súbor a potom vyberte ponuku Viac [...]>Vlastnosti.

  • Ak chcete zobraziť súbory v priečinku delta denníka:

    1. Vyberte priečinok _delta_log.
    2. Ak chcete zobraziť metaúdaje a schému tabuľky, vyberte súbor. Editor, ktorý sa otvorí, je vo formáte iba na čítanie.

Politika zrkadlenia prístupu

Keď je zapnutá dostupnosť oneLake, politika zrkadlenia je predvolene zapnutá. Pomocou politiky môžete monitorovať latenciu údajov alebo ju zmeniť na tabuľky partition delta.

Poznámka

Ak vypnete dostupnosť OneLake, vlastnosť politiky IsEnabled zrkadlenia je nastavená na hodnotu false (IsEnabled=false).

Deltové tabuľky oblastí

Na zlepšenie rýchlosti dotazu môžete rozdeliť tabuľky delta. Informácie o tom, kedy rozdeliť vaše súbory OneLake, nájdete v téme Kedy rozdeliť tabuľky na oblasti. Každá oblasť je znázornená ako samostatný stĺpec pomocou partitionName , ktorý je uvedený v zozname Oblasti . To znamená, že vaša kópia onelake má viac stĺpcov ako zdrojová tabuľka.

Ak chcete rozdeliť tabuľky delta, použite príkaz na zrkadlenie politiky .alter-merge tabuľky.