Čo je lakehouse v službe Microsoft Fabric?
Microsoft Fabric Lakehouse je platforma architektúry údajov na ukladanie, spravovanie a analýzu štruktúrovaných a neštruktúrovaných údajov na jednom mieste. Ide o flexibilné a škálovateľné riešenie, ktoré umožňuje organizáciám zvládnuť veľké objemy údajov pomocou rôznych nástrojov a rámcov na spracovanie a analýzu týchto údajov. Integruje sa s inými nástrojmi na správu údajov a analýzu s cieľom poskytnúť komplexné riešenie dátového inžinierstva a analýzy.
Koncový bod analýzy Lakehouse SQL
Lakehouse vytvára slúžiacu vrstvu tým, že automaticky generuje koncový bod analýzy SQL a predvolený sémantický model pri vytváraní. Táto nová funkcia priezoru umožňuje používateľovi pracovať priamo na tabulkách Delta v jazere, čo poskytuje trenie a výkonné prostredie úplne od príjmu údajov až po vytváranie zostáv.
Je dôležité poznamenať, že koncový bod analýzy SQL je iba na čítanie a nepodporuje úplnú oblasť prostredia T-SQL skladu údajov s transakčnými údajmi.
Poznámka
V koncovom bode analýzy SQL sú k dispozícii iba tabuľky vo formáte Delta. Parket, CSV a iné formáty nie je možné dotazovať pomocou koncového bodu analýzy SQL. Ak sa tabuľka nezobrazuje, budete ju musieť skonvertovať na formát Delta.
Automatické vyhľadávanie a registrácia tabuľky
Automatické vyhľadávanie a registrácia tabuľky je funkciou lakehouse, ktorá poskytuje plne spravovaný súbor na tabuľku skúseností pre dátových inžinierov a dátových vedcov. Súbor môžete presunúť do spravovanej oblasti Lakehouse a systém ho automaticky overí pre podporované štruktúrované formáty a zaregistruje ho do metaúdajov s potrebnými metaúdajmi, ako sú názvy stĺpcov, formáty, kompresia a ďalšie. (V súčasnosti je jediným podporovaným formátom tabuľka Delta.) Potom môžete na súbor odkazovať ako na tabuľku a na interakciu s údajmi použiť syntax SparkSQL.
Interakcia s položkou Lakehouse
Dátový inžinier môže pracovať s budovou jazera a s údajmi v dome jazera niekoľkými spôsobmi:
Lakehouse prieskumník: prieskumník je hlavnou stránku interakcie Lakehouse. Môžete načítať údaje do služby Lakehouse, preskúmať údaje v Lakehouse pomocou prieskumníka objektov, nastaviť označenia MIP a rôzne ďalšie veci. Ďalšie informácie o používateľskom prostredí prieskumníka: Navigácia v prieskumníkovi služby Fabric Lakehouse.
Poznámkové bloky: Dátoví inžinieri môžu používať poznámkový blok na písanie kódu na čítanie, transformáciu a zapisovaovanie priamo do služby Lakehouse ako tabuľky alebo priečinky. Získajte ďalšie informácie o tom, ako používať poznámkové bloky pre Lakehouse: Preskúmajte údaje v službe Lakehouse pomocou notebooku a ako používať notebook na načítanie údajov do svojho jazera.
Kanály: Dátoví inžinieri môžu používať nástroje na integráciu údajov, ako je napríklad nástroj na kopírovanie kanála na naťahovanie údajov z iných zdrojov a pristátie do služby Lakehouse. Ďalšie informácie o tom, ako používať aktivitu kopírovania: Ako kopírovať údaje pomocou kopírovanej aktivity.
Definície úloh v službe Apache Spark: Dátoví inžinieri môžu vyvíjať robustné aplikácie a koordinovať vykonávanie kompilovaných úloh spark v jazykoch Java, Scala a Python. Ďalšie informácie o úlohách Spark: Čo je definícia práce v Apache Spark?
Toky údajov Gen2: Dátoví inžinieri môžu používať toky údajov Gen2 na ingest a prípravu údajov. Získajte ďalšie informácie o načítavaní údajov pomocou tokov údajov: Vytvorte svoj prvý tok údajov na získanie a transformáciu údajov.
Ďalšie informácie o rôznych spôsoboch načítania údajov do svojho jazera: Možnosti na získanie údajov do služby Fabric Lakehouse.
Multitasking s lakehouse
Multitasking prostredie poskytuje návrh karty prehliadača, ktorý umožňuje otvárať a prepínať medzi viacerými položkami bez problémov a umožňuje vám spravovať svoje dátové jazero efektívnejšie než kedykoľvek predtým. Už žiadne prepínanie medzi rozličnými oknami alebo stratu prehľadu o svojich úlohách. Lakehouse poskytuje vylepšené multitasking prostredie, vďaka čomu bude vaša cesta spravovania údajov čo najefektívnejšia a používateľsky prístupná a poskytne vám nasledujúce možnosti:
Zachovanie spustených operácií: Operáciu načítania údajov môžete nahrať alebo spustiť na jednu kartu a skontrolovať inú úlohu na inej karte. V prípade vylepšených úloh sa spustené operácie pri prechádzaní medzi kartami nezrušia. Môžete sa zamerať na prácu bez prerušenia.
Zachovať kontext: Vybraté objekty, údajové tabuľky alebo súbory zostávajú otvorené a ľahko dostupné po prepnutí medzi kartami. Kontext vášho dátového jazera máte vždy poruke.
Opätovné načítanie zoznamu bez blokovania: Mechanizmus opätovného nablokovania pre súbory a zoznam tabuliek. Môžete ďalej pracovať, kým sa zoznam obnoví na pozadí. Zaistíte tým najnovšie údaje a zároveň zaistíte plynulý a neprerušovaný zážitok.
Jasne definované oznámenia: Toastové oznámenia určujú, z ktorého jazera pochádzajú, čo uľahčuje sledovanie zmien a aktualizácií v prostredí s viacerými úlohami.
Prístupný dizajn jazera
Zjednodušenie ovládania bolo vždy najvyššou prioritou, aby sa zabezpečilo, že lakehouse je inkluzívny a používateľsky príjemný pre každého. Tu sú kľúčové iniciatívy, ktoré sme implementovali doteraz v oblasti zjednodušenia ovládania:
Kompatibilita s čítačkou obrazovky: Bezproblémovo môžete pracovať s populárnymi čítačkami obrazovky, čo používateľom so zrakovým postihnutím umožňuje efektívne navigovať a pracovať s našou platformou.
Natečenie textu Flexibilný návrh, ktorý sa prispôsobí rôznym veľkostiám a orientáciám obrazovky. Text a obsah sa dynamicky pretečú, čím sa používateľom zjednoduší zobrazovanie a interakcia s našou aplikáciou v rôznych zariadeniach.
Navigácia na klávesnici: vylepšená navigácia na klávesnici, aby používatelia mohli prechádzať cez jazero bez toho, aby sa spoliehali na myš a zlepšili zážitok pre osoby s motorickým postihnutím.
Alternatívny text pre obrázky: Všetky obrázky teraz obsahujú popisný alternatívny text, ktorý umožňuje čítačkám obrazovky sprostredkovať zmysluplné informácie.
Polia formulára a Označenia: Všetky polia formulára majú priradené označenia, čím sa zjednodušuje zadávanie údajov pre všetkých používateľov vrátane tých, ktoré používajú čítačky obrazovky.
Súvisiaci obsah
V tomto prehľade získate základné znalosti o dome lakehouse. Prejdite na ďalší článok a naučte sa vytvárať a používať vlastné jazero:
- Ak chcete začať používať domovy jazier, pozrite si tému Vytvorenie jazera v službe Microsoft Fabric.