Dostupnosť služby Eventhouse OneLake
Zapnutím dostupnosti služby OneLake môžete vytvoriť jednu logickú kópiu údajov databázy KQL v službe eventhouse. Zapnutie dostupnosti služby OneLake znamená, že údaje v databáze KQL môžete dotazovať vo formáte Delta Lake prostredníctvom iných strojov služby Fabric, ako je napríklad režim Direct Lake v službe Power BI, Warehouse, Lakehouse, Notebooks a ďalšie.
Delta Lake je jednotný formát tabuľky data lake, ktorý dosahuje bezproblémový prístup k údajom vo všetkých výpočtových nástrojoch v službe Microsoft Fabric. Ďalšie informácie o Delta Lake nájdete v téme Čo je Delta Lake?.
V tomto článku sa dozviete, ako zapnúť dostupnosť údajov databázy KQL v službe OneLake.
Ako to funguje
Nasledujúca tabuľka popisuje správanie vašej databázy KQL a tabuliek pri zapnutí alebo vypnutí dostupnosti OneLake.
Zapnuté | Vypnutý | |
---|---|---|
Databáza KQL | – Existujúce tabuľky sa nezmenia. Nové tabuľky sú k dispozícii v službe OneLake. – Politika uchovávania údajov databázy KQL sa tiež použije na údaje v službe OneLake. Údaje odstránené z vašej databázy KQL na konci obdobia uchovávania sa tiež odstránia zo služby OneLake. |
– Existujúce tabuľky sa nezmenia. Nové tabuľky nebudú k dispozícii v službe OneLake. |
Tabuľka v databáze KQL | – Nové údaje sú k dispozícii v OneLake. – Existujúce údaje sa nevyplnia. – Údaje nie je možné odstrániť, skrátiť alebo vymazať. – Schému tabuľky nemožno zmeniť a tabuľku nie je možné premenovať. – Zabezpečenie na úrovni riadkov sa nedá použiť v tabuľke. |
– V službe OneLake nie sú k dispozícii nové údaje. – Údaje možno odstrániť, skrátiť alebo vymazať. – Schému tabuľky možno zmeniť a tabuľku možno premenovať. – Údaje nie sú odstránené z OneLake. |
Dôležité
Zobrazenie údajov vo OneLake môže trvať niekoľko hodín. Ďalšie informácie nájdete v téme Adaptívne správanie.
Na zapnutie dostupnosti služby OneLake nie sú potrebné žiadne dodatočné náklady na úložisko. Ďalšie informácie nájdete v téme Spotreba zdrojov.
Požiadavky
- Pracovný priestor s kapacitou povolenou pre službu Microsoft Fabric
- Databáza KQL s povoleniami na úpravu a údajmi
Zapnutie dostupnosti OneLake
Dostupnosť oneLake môžete zapnúť buď v databáze KQL, alebo na úrovni tabuľky.
Ak chcete zapnúť dostupnosť služby OneLake, prejdite do časti OneLake na table s podrobnosťami vašej databázy alebo tabuľky KQL.
Nastavte dostupnosť na možnosť Zapnuté.
Databáza sa obnoví automaticky.
Zapli ste dostupnosť OneLake v databáze KQL. Teraz môžete získať prístup ku všetkým novým údajom pridaným do databázy na danej ceste OneLake vo formáte Delta Lake. Môžete sa tiež rozhodnúť vytvoriť odkaz OneLake z balíka Lakehouse, Data Warehouse alebo dotazovať údaje priamo cez režim Power BI Direct Lake.
Adaptívne správanie
Eventhouse ponúka robustný mechanizmus, ktorý inteligentne dávkuje prichádzajúce dátové prúdy do jedného alebo viacerých súborov parquet, štruktúrovaných na analýzu. Dávkovanie streamov údajov je dôležité pri práci s podvodnými údajmi. Písanie mnohých malých súborov parquet do jazera môže byť neefektívne vyplývajúce z vyšších nákladov a slabý výkon.
Adaptívny mechanizmus eventhouse môže oddialiť operácie zapisovaia až o niekoľko hodín, ak nie je k dispozícii dostatok údajov na vytvorenie optimálnych parquet súborov. Vďaka tomu sú súbory vo formáte Parquet optimálne a dodržiavajú najvhodnejšie postupy pre Delta Lake. Adaptívny mechanizmus Eventhouse zabezpečuje, že súbory vo formáte Parquet sú pripravené na analýzu a vyrovnávajú potrebu okamžitej dostupnosti údajov s ohľadom na náklady a výkon.
Kontrolu latencie údajov môžete pomocou príkazu .show table mirroring operations (zobraziť operácie zrkadlenia tabuľky) monitorovať, ako dávno sa do jazera pridali nové údaje.
Výsledky sa merajú z posledného pridania údajov. Keď má latencia výsledok 00:00:00, všetky údaje v databáze KQL sú k dispozícii v službe OneLake.
Zobrazenie súborov
Keď v tabuľke zapnete dostupnosť OneLake, vytvorí sa priečinok delta log spolu so všetkými zodpovedajúcimi súbormi JSON a Parquet. Môžete zobraziť súbory, ktoré boli sprístupnené v službe OneLake, a ich vlastnosti, pričom zostávajú v službe V reálnom čase inteligencie.
Ak chcete zobraziť súbory, ukážte kurzorom myši na tabuľku v table Prieskumník a potom vyberte ponuku Viac [...]>Zobraziť súbory.
Ak chcete zobraziť vlastnosti priečinka denníkov delta alebo jednotlivé súbory, ukážte na priečinok alebo súbor a potom vyberte ponuku Viac [...]>Vlastnosti.
Ak chcete zobraziť súbory v priečinku delta denníka:
- Vyberte priečinok _delta_log.
- Ak chcete zobraziť metaúdaje a schému tabuľky, vyberte súbor. Editor, ktorý sa otvorí, je vo formáte iba na čítanie.
Politika zrkadlenia prístupu
Keď je zapnutá dostupnosť oneLake, politika zrkadlenia je predvolene zapnutá. Pomocou politiky môžete monitorovať latenciu údajov alebo ju zmeniť na tabuľky partition delta.
Poznámka
Ak vypnete dostupnosť OneLake, vlastnosť politiky IsEnabled
zrkadlenia je nastavená na hodnotu false (IsEnabled=false
).
Deltové tabuľky oblastí
Na zlepšenie rýchlosti dotazu môžete rozdeliť tabuľky delta. Informácie o tom, kedy rozdeliť vaše súbory OneLake, nájdete v téme Kedy rozdeliť tabuľky na oblasti. Každá oblasť je znázornená ako samostatný stĺpec pomocou partitionName , ktorý je uvedený v zozname Oblasti . To znamená, že vaša kópia onelake má viac stĺpcov ako zdrojová tabuľka.
Ak chcete rozdeliť tabuľky delta, použite príkaz na zrkadlenie politiky .alter-merge tabuľky.
Súvisiaci obsah
- Ak chcete sprístupniť údaje v službe OneLake, pozrite si tému Vytvorenie skratky v službe OneLake.
- Ak chcete vytvoriť odkaz OneLake v Lakehouse, pozrite si tému Čo sú skratky v lakehouse?
- Ak chcete dotazovať odkazované údaje z OneLake v databáze alebo tabuľke KQL, pozrite si tému Vytvorenie odkazu na OneLake v databáze KQL