Zdieľať cez


Čo je lakehouse v službe Microsoft Fabric?

Microsoft Fabric Lakehouse je platforma architektúry údajov na ukladanie, spravovanie a analýzu štruktúrovaných a neštruktúrovaných údajov na jednom mieste. Ide o flexibilné a škálovateľné riešenie, ktoré umožňuje organizáciám zvládnuť veľké objemy údajov pomocou rôznych nástrojov a rámcov na spracovanie a analýzu týchto údajov. Integruje sa s inými nástrojmi na správu údajov a analýzu s cieľom poskytnúť komplexné riešenie dátového inžinierstva a analýzy.

Gif of overall lakehouse experience.

Koncový bod analýzy Lakehouse SQL

Lakehouse vytvára slúžiacu vrstvu tým, že automaticky generuje koncový bod analýzy SQL a predvolený sémantický model pri vytváraní. Táto nová funkcia priezoru umožňuje používateľovi pracovať priamo na tabulkách Delta v jazere, čo poskytuje trenie a výkonné prostredie úplne od príjmu údajov až po vytváranie zostáv.

Je dôležité poznamenať, že koncový bod analýzy SQL je iba na čítanie a nepodporuje úplnú oblasť prostredia T-SQL skladu údajov s transakčnými údajmi.

Poznámka

V koncovom bode analýzy SQL sú k dispozícii iba tabuľky vo formáte Delta. Parket, CSV a iné formáty nie je možné dotazovať pomocou koncového bodu analýzy SQL. Ak sa tabuľka nezobrazuje, budete ju musieť skonvertovať na formát Delta.

Automatické vyhľadávanie a registrácia tabuľky

Automatické vyhľadávanie a registrácia tabuľky je funkciou lakehouse, ktorá poskytuje plne spravovaný súbor na tabuľku skúseností pre dátových inžinierov a dátových vedcov. Súbor môžete presunúť do spravovanej oblasti Lakehouse a systém ho automaticky overí pre podporované štruktúrované formáty a zaregistruje ho do metaúdajov s potrebnými metaúdajmi, ako sú názvy stĺpcov, formáty, kompresia a ďalšie. (V súčasnosti je jediným podporovaným formátom tabuľka Delta.) Potom môžete na súbor odkazovať ako na tabuľku a na interakciu s údajmi použiť syntax SparkSQL.

Interakcia s položkou Lakehouse

Dátový inžinier môže pracovať s budovou jazera a s údajmi v dome jazera niekoľkými spôsobmi:

  • Lakehouse prieskumník: prieskumník je hlavnou stránku interakcie Lakehouse. Môžete načítať údaje do služby Lakehouse, preskúmať údaje v Lakehouse pomocou prieskumníka objektov, nastaviť označenia MIP a rôzne ďalšie veci. Ďalšie informácie o používateľskom prostredí prieskumníka: Navigácia v prieskumníkovi služby Fabric Lakehouse.

  • Poznámkové bloky: Dátoví inžinieri môžu používať poznámkový blok na písanie kódu na čítanie, transformáciu a zapisovaovanie priamo do služby Lakehouse ako tabuľky alebo priečinky. Získajte ďalšie informácie o tom, ako používať poznámkové bloky pre Lakehouse: Preskúmajte údaje v službe Lakehouse pomocou notebooku a ako používať notebook na načítanie údajov do svojho jazera.

  • Kanály: Dátoví inžinieri môžu používať nástroje na integráciu údajov, ako je napríklad nástroj na kopírovanie kanála na naťahovanie údajov z iných zdrojov a pristátie do služby Lakehouse. Ďalšie informácie o tom, ako používať aktivitu kopírovania: Ako kopírovať údaje pomocou kopírovanej aktivity.

  • Definície úloh v službe Apache Spark: Dátoví inžinieri môžu vyvíjať robustné aplikácie a koordinovať vykonávanie kompilovaných úloh spark v jazykoch Java, Scala a Python. Ďalšie informácie o úlohách Spark: Čo je definícia práce v Apache Spark?

  • Toky údajov Gen2: Dátoví inžinieri môžu používať toky údajov Gen2 na ingest a prípravu údajov. Získajte ďalšie informácie o načítavaní údajov pomocou tokov údajov: Vytvorte svoj prvý tok údajov na získanie a transformáciu údajov.

Ďalšie informácie o rôznych spôsoboch načítania údajov do svojho jazera: Možnosti na získanie údajov do služby Fabric Lakehouse.

Multitasking s lakehouse

Multitasking prostredie poskytuje návrh karty prehliadača, ktorý umožňuje otvárať a prepínať medzi viacerými položkami bez problémov a umožňuje vám spravovať svoje dátové jazero efektívnejšie než kedykoľvek predtým. Už žiadne prepínanie medzi rozličnými oknami alebo stratu prehľadu o svojich úlohách. Lakehouse poskytuje vylepšené multitasking prostredie, vďaka čomu bude vaša cesta spravovania údajov čo najefektívnejšia a používateľsky prístupná a poskytne vám nasledujúce možnosti:

  • Zachovanie spustených operácií: Operáciu načítania údajov môžete nahrať alebo spustiť na jednu kartu a skontrolovať inú úlohu na inej karte. V prípade vylepšených úloh sa spustené operácie pri prechádzaní medzi kartami nezrušia. Môžete sa zamerať na prácu bez prerušenia.

  • Zachovať kontext: Vybraté objekty, údajové tabuľky alebo súbory zostávajú otvorené a ľahko dostupné po prepnutí medzi kartami. Kontext vášho dátového jazera máte vždy poruke.

  • Opätovné načítanie zoznamu bez blokovania: Mechanizmus opätovného nablokovania pre súbory a zoznam tabuliek. Môžete ďalej pracovať, kým sa zoznam obnoví na pozadí. Zaistíte tým najnovšie údaje a zároveň zaistíte plynulý a neprerušovaný zážitok.

  • Jasne definované oznámenia: Toastové oznámenia určujú, z ktorého jazera pochádzajú, čo uľahčuje sledovanie zmien a aktualizácií v prostredí s viacerými úlohami.

Prístupný dizajn jazera

Zjednodušenie ovládania bolo vždy najvyššou prioritou, aby sa zabezpečilo, že lakehouse je inkluzívny a používateľsky príjemný pre každého. Tu sú kľúčové iniciatívy, ktoré sme implementovali doteraz v oblasti zjednodušenia ovládania:

  • Kompatibilita s čítačkou obrazovky: Bezproblémovo môžete pracovať s populárnymi čítačkami obrazovky, čo používateľom so zrakovým postihnutím umožňuje efektívne navigovať a pracovať s našou platformou.

  • Natečenie textu Flexibilný návrh, ktorý sa prispôsobí rôznym veľkostiám a orientáciám obrazovky. Text a obsah sa dynamicky pretečú, čím sa používateľom zjednoduší zobrazovanie a interakcia s našou aplikáciou v rôznych zariadeniach.

  • Navigácia na klávesnici: vylepšená navigácia na klávesnici, aby používatelia mohli prechádzať cez jazero bez toho, aby sa spoliehali na myš a zlepšili zážitok pre osoby s motorickým postihnutím.

  • Alternatívny text pre obrázky: Všetky obrázky teraz obsahujú popisný alternatívny text, ktorý umožňuje čítačkám obrazovky sprostredkovať zmysluplné informácie.

  • Polia formulára a Označenia: Všetky polia formulára majú priradené označenia, čím sa zjednodušuje zadávanie údajov pre všetkých používateľov vrátane tých, ktoré používajú čítačky obrazovky.

V tomto prehľade získate základné znalosti o dome lakehouse. Prejdite na ďalší článok a naučte sa vytvárať a používať vlastné jazero: