OneLake, Údaje z OneDrivu

Článok
26. 07. 2024

OneLake je jediné zjednotené, logické dátové jazero pre celú organizáciu. Dátové jazero spracúva veľké objemy údajov z rôznych zdrojov. Podobne ako OneDrive, OneLake sa automaticky dodáva so všetkými nájomníkmi služby Microsoft Fabric a je navrhnutý ako jediné miesto pre všetky vaše analytické údaje. OneLake prináša zákazníkov:

Jedno dátové jazero pre celú organizáciu
Jedna kópia údajov na použitie s viacerými analytickými zariadeniami

Jedno dátové jazero pre celú organizáciu

Pred OneLake, to bolo jednoduchšie pre zákazníkov vytvoriť viac jazier pre rôzne obchodné skupiny, skôr než spolupracovať na jednom jazere, a to aj s extra režijné náklady na spravovanie viacerých zdrojov. OneLake sa zameriava na odstránenie týchto výziev zlepšením spolupráce. Každý nájomník má presne jeden OneLake. Tam nikdy nemôže byť viac ako jeden, a ak máte Fabric, nemôže byť nikdy nula. Každý nájomník služby Fabric automaticky zriadi OneLake bez ďalších zdrojov na nastavenie alebo správu.

Predvolene sa riadi distribuovaním vlastníctva na spoluprácu

Koncept nájomníka predstavuje jedinečnú výhodu služby SaaS. Informácie o tom, kde organizácia zákazníka začína a končí, poskytujú prirodzenú správu a hranicu súladu, ktorú má pod kontrolou správca nájomníka. Všetky údaje uložené v službe OneLake sa riadia predvolene. Aj keď sa všetky údaje nachádzajú v rámci hraníc nastavených správcom nájomníka, je dôležité, aby sa tento správca nestal centrálnym vrátnikom, ktorý zabráni iným častiam organizácie prispievať do služby OneLake.

V rámci nájomníka môžete vytvoriť ľubovoľný počet pracovných priestorov. Pracovné priestory umožňujú rôznym častiám organizácie distribuovať politiky vlastníctva a prístupu. Každý pracovný priestor je súčasťou kapacity, ktorá je prepojená s konkrétnou oblasťou a účtuje sa samostatne.

V pracovnom priestore môžete vytvárať položky údajov a získať prístup ku všetkým údajom v službe OneLake prostredníctvom položiek údajov. Podobne ako office ukladá wordové, excelové a powerpointové súbory vo OneDrive, fabric ukladá domovy jazera, sklady a ďalšie položky v službe OneLake. Položky vám môžu poskytnúť prispôsobené prostredie pre každú osobu, napríklad prostredie pre vývojárov Apache Spark v úzovni Lakehouse.

Ďalšie informácie o tom, ako začať používať službu OneLake, nájdete v téme Vytvorenie jazera pomocou služby OneLake.

Otvoriť na každej úrovni

OneLake je otvorený na každej úrovni. OneLake je postavené na službe Azure Data Lake Storage (ADLS) Gen2 a môže podporovať akýkoľvek typ súboru, štruktúrovaného alebo neštruktúrovaného. Všetky údajové položky služby Fabric, ako sú napríklad sklady údajov a jazerá, automaticky ukladajú svoje údaje vo formáte OneLake vo formáte Delta Parquet. Ak dátový inžinier načíta údaje do úložiska lakehouse pomocou Apache Spark a potom vývojár SQL použije T-SQL na načítanie údajov v plne transakčných skladoch údajov, obaja prispievajú do toho istého dátového jazera. OneLake ukladá všetky tabuľkové údaje vo formáte Delta Parquet.

OneLake podporuje rovnaké rozhrania API a SDK ADLS Gen2, ktoré sú kompatibilné s existujúcimi aplikáciami ADLS Gen2 vrátane Azure Databricks. Údaje v službe OneLake môžete riešiť tak, ako keby úložný účet ADLS bol jeden pre celú organizáciu. Každý pracovný priestor sa v danom konte úložiska zobrazí ako kontajner a rôzne položky údajov sa zobrazia ako priečinky v rámci týchto kontajnerov.

Ďalšie informácie o rozhraniach API a koncových bodoch nájdete v téme Prístup k službe OneLake a rozhrania API. Príklady integrácie OneLake s Azure nájdete v článkoch o Azure Synapse Analytics, Prieskumníkovi úložiska Azure, Azure Databricks a Azure HDInsight .

Prieskumník súborov OneLake pre Windows

OneLake je OneDrive pre údaje. Rovnako ako OneDrive, môžete jednoducho preskúmať údaje OneLake z Windowsu pomocou prieskumníka súborov OneLake pre systém Windows. Môžete sa pohybovať vo všetkých pracovných priestoroch a položkách údajov, jednoducho nahrávať, sťahovať alebo upravovať súbory rovnako ako v Office. Prieskumník súborov OneLake zjednodušuje prácu s dátovými jazerami, čo umožňuje dokonca aj netechnickým podnikovým používateľom ich používať.

Ďalšie informácie nájdete v téme Prieskumník súborov OneLake.

Jedna kópia údajov

OneLake si kladie za cieľ poskytnúť vám čo najväčšiu hodnotu z jednej kópie údajov bez pohybu alebo duplikácie údajov. Údaje už nemusíte kopírovať, len ich použiť s iným strojom alebo rozdeliť silá, aby ste mohli analyzovať údaje s údajmi z iných zdrojov.

Skratky pripájajú údaje naprieč doménami bez premiestňovaných údajov

Skratky umožňujú vašej organizácii jednoducho zdieľať údaje medzi používateľmi a aplikáciami bez toho, aby ste museli zbytočne presúvať informácie a duplikovať ich. Keď tímy pracujú nezávisle v samostatných pracovných priestoroch, skratky umožňujú kombinovať údaje v rôznych obchodných skupinách a doménach do produktu s virtuálnymi údajmi, aby vyhovovali špecifickým potrebám používateľa.

Odkaz je odkaz na údaje uložené v iných umiestneniach súboru. Tieto umiestnenia súborov sa môžu nachádzať v tom istom pracovnom priestore alebo v rôznych pracovných priestoroch, v rámci OneLake alebo externé vo oneLake v službách ADLS, S3 alebo Dataverse – s viacerými cieľovými miestami čoskoro. Bez ohľadu na umiestnenie skratky vyzerajú, ako by súbory a priečinky vyzerali tak, ako keby boli uložené lokálne.

Ďalšie informácie o používaní skratiek nájdete v téme Skratky OneLake.

Jedna kópia údajov s viacerými analytickými zariadeniami

Hoci aplikácie môžu mať oddelenie úložiska a počítača, údaje sú často optimalizované pre jeden nástroj, čo sťažuje opätovné použitie rovnakých údajov pre viaceré aplikácie. S fabricom rôzne analytické nástroje (T-SQL, Apache Spark, Analysis Services atď.) ukladajú údaje v otvorenom formáte Delta Parquet, aby ste mohli používať rovnaké údaje v rámci viacerých nástrojov.

Údaje už nemusíte kopírovať, len aby sa použili s iným strojom. Vždy môžete vybrať najlepší nástroj pre úlohu, ktorú sa snažíte vykonať. Predstavte si napríklad, že máte tím inžinierov SQL, ktorý vytvára plne transakčné sklady údajov. Môžu používať nástroj T-SQL a všetok výkon T-SQL na vytváranie tabuliek, transformáciu údajov a načítanie údajov do tabuliek. Ak chce dátový vedec využívať tieto údaje, už nemusí prechádzať špeciálnym ovládačom Spark/SQL. OneLake ukladá všetky údaje vo formáte Delta Parquet. Dátoví vedci môžu využívať úplnú silu nástroja Spark a jeho open-source knižníc priamo nad údajmi.

Podnikoví používatelia môžu vytvárať zostavy Power BI priamo na základe onelakeu pomocou nového režimu Direct Lake v nástroji Analysis Services. Nástroj služby Analysis Services poháňa sémantické modely služby Power BI a vždy ponúkal dva režimy prístupu k údajom: import a priamy dotaz. Režim Direct Lake umožňuje používateľom všetky rýchlosti importu bez nutnosti kopírovať údaje a skombinovať to najlepšie z importu a priameho dotazu. Ďalšie informácie nájdete v téme Direct Lake.

Príklad diagramu znázorňujúci načítanie údajov pomocou Spark, dotazovanie pomocou T-SQL a zobrazenie údajov v zostave Power BI.

Vytvorenie jazerahouse s OneLake

Zdieľať cez

OneLake, Údaje z OneDrivu

Jedno dátové jazero pre celú organizáciu

Predvolene sa riadi distribuovaním vlastníctva na spoluprácu

Otvoriť na každej úrovni

Prieskumník súborov OneLake pre Windows

Jedna kópia údajov

Skratky pripájajú údaje naprieč doménami bez premiestňovaných údajov

Jedna kópia údajov s viacerými analytickými zariadeniami

Pripomienky

Ďalšie zdroje informácií

Zdieľať cez

OneLake, Údaje z OneDrivu

Jedno dátové jazero pre celú organizáciu

Predvolene sa riadi distribuovaním vlastníctva na spoluprácu

Otvoriť na každej úrovni

Prieskumník súborov OneLake pre Windows

Jedna kópia údajov

Skratky pripájajú údaje naprieč doménami bez premiestňovaných údajov

Jedna kópia údajov s viacerými analytickými zariadeniami

Súvisiaci obsah

Pripomienky

Ďalšie zdroje informácií