OneLake, Údaje z OneDrivu
OneLake je jediné zjednotené, logické dátové jazero pre celú organizáciu. Dátové jazero spracúva veľké objemy údajov z rôznych zdrojov. Podobne ako OneDrive, OneLake sa automaticky dodáva so všetkými nájomníkmi služby Microsoft Fabric a je navrhnutý ako jediné miesto pre všetky vaše analytické údaje. OneLake prináša zákazníkov:
- Jedno dátové jazero pre celú organizáciu
- Jedna kópia údajov na použitie s viacerými analytickými zariadeniami
Pred OneLake, to bolo jednoduchšie pre zákazníkov vytvoriť viac jazier pre rôzne obchodné skupiny, skôr než spolupracovať na jednom jazere, a to aj s extra režijné náklady na spravovanie viacerých zdrojov. OneLake sa zameriava na odstránenie týchto výziev zlepšením spolupráce. Každý nájomník má presne jeden OneLake. Tam nikdy nemôže byť viac ako jeden, a ak máte Fabric, nemôže byť nikdy nula. Každý nájomník služby Fabric automaticky zriadi OneLake bez ďalších zdrojov na nastavenie alebo správu.
Koncept nájomníka predstavuje jedinečnú výhodu služby SaaS. Informácie o tom, kde organizácia zákazníka začína a končí, poskytujú prirodzenú správu a hranicu súladu, ktorú má pod kontrolou správca nájomníka. Všetky údaje uložené v službe OneLake sa riadia predvolene. Aj keď sa všetky údaje nachádzajú v rámci hraníc nastavených správcom nájomníka, je dôležité, aby sa tento správca nestal centrálnym vrátnikom, ktorý zabráni iným častiam organizácie prispievať do služby OneLake.
V rámci nájomníka môžete vytvoriť ľubovoľný počet pracovných priestorov. Pracovné priestory umožňujú rôznym častiám organizácie distribuovať politiky vlastníctva a prístupu. Každý pracovný priestor je súčasťou kapacity, ktorá je prepojená s konkrétnou oblasťou a účtuje sa samostatne.
V pracovnom priestore môžete vytvárať položky údajov a získať prístup ku všetkým údajom v službe OneLake prostredníctvom položiek údajov. Podobne ako office ukladá wordové, excelové a powerpointové súbory vo OneDrive, fabric ukladá domovy jazera, sklady a ďalšie položky v službe OneLake. Položky vám môžu poskytnúť prispôsobené prostredie pre každú osobu, napríklad prostredie pre vývojárov Apache Spark v úzovni Lakehouse.
Ďalšie informácie o tom, ako začať používať službu OneLake, nájdete v téme Vytvorenie jazera pomocou služby OneLake.
OneLake je otvorený na každej úrovni. OneLake je postavené na službe Azure Data Lake Storage (ADLS) Gen2 a môže podporovať akýkoľvek typ súboru, štruktúrovaného alebo neštruktúrovaného. Všetky údajové položky služby Fabric, ako sú napríklad sklady údajov a jazerá, automaticky ukladajú svoje údaje vo formáte OneLake vo formáte Delta Parquet. Ak dátový inžinier načíta údaje do úložiska lakehouse pomocou Apache Spark a potom vývojár SQL použije T-SQL na načítanie údajov v plne transakčných skladoch údajov, obaja prispievajú do toho istého dátového jazera. OneLake ukladá všetky tabuľkové údaje vo formáte Delta Parquet.
OneLake podporuje rovnaké rozhrania API a SDK ADLS Gen2, ktoré sú kompatibilné s existujúcimi aplikáciami ADLS Gen2 vrátane Azure Databricks. Údaje v službe OneLake môžete riešiť tak, ako keby úložný účet ADLS bol jeden pre celú organizáciu. Každý pracovný priestor sa v danom konte úložiska zobrazí ako kontajner a rôzne položky údajov sa zobrazia ako priečinky v rámci týchto kontajnerov.
Ďalšie informácie o rozhraniach API a koncových bodoch nájdete v téme Prístup k službe OneLake a rozhrania API. Príklady integrácie OneLake s Azure nájdete v článkoch o Azure Synapse Analytics, Prieskumníkovi úložiska Azure, Azure Databricks a Azure HDInsight .
OneLake je OneDrive pre údaje. Rovnako ako OneDrive, môžete jednoducho preskúmať údaje OneLake z Windowsu pomocou prieskumníka súborov OneLake pre systém Windows. Môžete sa pohybovať vo všetkých pracovných priestoroch a položkách údajov, jednoducho nahrávať, sťahovať alebo upravovať súbory rovnako ako v Office. Prieskumník súborov OneLake zjednodušuje prácu s dátovými jazerami, čo umožňuje dokonca aj netechnickým podnikovým používateľom ich používať.
Ďalšie informácie nájdete v téme Prieskumník súborov OneLake.
OneLake si kladie za cieľ poskytnúť vám čo najväčšiu hodnotu z jednej kópie údajov bez pohybu alebo duplikácie údajov. Údaje už nemusíte kopírovať, len ich použiť s iným strojom alebo rozdeliť silá, aby ste mohli analyzovať údaje s údajmi z iných zdrojov.
Skratky umožňujú vašej organizácii jednoducho zdieľať údaje medzi používateľmi a aplikáciami bez toho, aby ste museli zbytočne presúvať informácie a duplikovať ich. Keď tímy pracujú nezávisle v samostatných pracovných priestoroch, skratky umožňujú kombinovať údaje v rôznych obchodných skupinách a doménach do produktu s virtuálnymi údajmi, aby vyhovovali špecifickým potrebám používateľa.
Odkaz je odkaz na údaje uložené v iných umiestneniach súboru. Tieto umiestnenia súborov sa môžu nachádzať v tom istom pracovnom priestore alebo v rôznych pracovných priestoroch, v rámci OneLake alebo externé vo oneLake v službách ADLS, S3 alebo Dataverse – s viacerými cieľovými miestami čoskoro. Bez ohľadu na umiestnenie skratky vyzerajú, ako by súbory a priečinky vyzerali tak, ako keby boli uložené lokálne.
Ďalšie informácie o používaní skratiek nájdete v téme Skratky OneLake.
Hoci aplikácie môžu mať oddelenie úložiska a počítača, údaje sú často optimalizované pre jeden nástroj, čo sťažuje opätovné použitie rovnakých údajov pre viaceré aplikácie. S fabricom rôzne analytické nástroje (T-SQL, Apache Spark, Analysis Services atď.) ukladajú údaje v otvorenom formáte Delta Parquet, aby ste mohli používať rovnaké údaje v rámci viacerých nástrojov.
Údaje už nemusíte kopírovať, len aby sa použili s iným strojom. Vždy môžete vybrať najlepší nástroj pre úlohu, ktorú sa snažíte vykonať. Predstavte si napríklad, že máte tím inžinierov SQL, ktorý vytvára plne transakčné sklady údajov. Môžu používať nástroj T-SQL a všetok výkon T-SQL na vytváranie tabuliek, transformáciu údajov a načítanie údajov do tabuliek. Ak chce dátový vedec využívať tieto údaje, už nemusí prechádzať špeciálnym ovládačom Spark/SQL. OneLake ukladá všetky údaje vo formáte Delta Parquet. Dátoví vedci môžu využívať úplnú silu nástroja Spark a jeho open-source knižníc priamo nad údajmi.
Podnikoví používatelia môžu vytvárať zostavy Power BI priamo na základe onelakeu pomocou nového režimu Direct Lake v nástroji Analysis Services. Nástroj služby Analysis Services poháňa sémantické modely služby Power BI a vždy ponúkal dva režimy prístupu k údajom: import a priamy dotaz. Režim Direct Lake umožňuje používateľom všetky rýchlosti importu bez nutnosti kopírovať údaje a skombinovať to najlepšie z importu a priameho dotazu. Ďalšie informácie nájdete v téme Direct Lake.
Príklad diagramu znázorňujúci načítanie údajov pomocou Spark, dotazovanie pomocou T-SQL a zobrazenie údajov v zostave Power BI.