OneLake, az adatok OneDrive-ja

A OneLake egyetlen, egységes, logikai adattó a teljes szervezet számára. A OneDrive-hoz hasonlóan a OneLake minden Microsoft Fabric-bérlőhöz automatikusan elérhető, és úgy lett kialakítva, hogy az összes elemzési adat egyetlen helye legyen.

A OneLake a következő ügyfeleket hozza el:

  • Egy adattó a teljes szervezet számára
  • Egy adatmásolat több elemzési motorral való használatra
  • Beépített adatvédelem automatikus helyreállítható törlési és vészhelyreállítási lehetőségekkel

Egy adattó a teljes szervezet számára

A OneLake előtt számos szervezet több tavat hozott létre a különböző üzleti csoportok számára, ami további többletterhelést eredményezett több erőforrás kezeléséhez. A OneLake az együttműködés javításával elhárítja ezeket a kihívásokat:

  • Minden Fabric tenant automatikusan kap egy OneLake-et
  • Nem hozhat létre több OneLakes-t, és nem törölheti a OneLake-et
  • Nincs szükség további erőforrások kiépítésére vagy kezelésére

Ez az egyszerűség segíti a szervezetet abban, hogy egyetlen egységes adattón működjön együtt.

Az együttműködés érdekében alapértelmezés szerint elosztott tulajdonjoggal.

A Fabric-adatok szervezetének és szabályozásának legfelső szintje a bérlő. A OneLake-ben található összes adatot automatikusan védik bérlőszintű biztonsági, megfelelőségi és adatkezelési szabályzatok.

A bérlőn belül az együttműködés a munkaterületeken belül történik. Tetszőleges számú munkaterületet létrehozhat az adatok rendszerezéséhez. A munkaterületek lehetővé teszik a szervezet különböző részei számára a tulajdonjogi és hozzáférési szabályzatok terjesztését. Minden munkaterület egy adott régióhoz kötődő és külön számlázott kapacitás része.

A OneLake függvényét és szerkezetét bemutató ábra.

Egy munkaterületen belül az összes adatot adatelemeken keresztül hozhatja létre és érheti el. Hasonlóan ahhoz, ahogyan az Office a OneDrive-ban tárolja a Word-, Excel- és PowerPoint-fájlokat, a Fabric a OneLake-ben tárolja a tóházakat, raktárakat és egyéb elemeket. Minden elemtípus személyre szabott élményt nyújt a különböző személyek számára, például az Apache Spark fejlesztői élményét egy lakehouse-ban.

Nyílt szabványokra és formátumokra épül

A OneLake az Azure Data Lake Storage (ADLS) Gen2-n alapul, és bármilyen típusú, strukturált vagy strukturálatlan fájlt támogat. Minden Fabric-adatelem, például az adattárházak és a lakehouse-k automatikusan, Delta Parquet formátumban tárolják az adataikat a OneLake-ben. Ha egy adatszakértő az Apache Spark használatával tölt be adatokat egy tóházba, és egy SQL-fejlesztő T-SQL használatával tölt be adatokat egy teljesen tranzakciós adattárházba, mindkettő ugyanahhoz a data lake-hez járul hozzá. A OneLake az összes táblázatos adatot Delta Parquet formátumban tárolja.

A OneLake ugyanazokat az ADLS Gen2 API-kat és SDK-kat támogatja, amelyek kompatibilisek a meglévő ADLS Gen2-alkalmazásokkal, beleértve az Azure Databrickset is. A OneLake-ben úgy kezelheti az adatokat, mintha egy nagy ADLS-tárfiók lenne a teljes szervezet számára. Minden munkaterület tárolóként jelenik meg a tárfiókon belül, és a különböző adatelemek mappákként jelennek meg ezekben a tárolókban.

A OneLake-adatok API-kkal és SDK-kkal való elérését bemutató ábra.

Az API-kkal és végpontokkal kapcsolatos további információkért lásd a OneLake hozzáférését és API-jait.

Példák az Azure-ral való OneLake-integrációkra:

Windows OneLake fájlkezelő

A Windows OneLake-adatokat a Windows OneLake fájlkezelőjében ismerheti meg. Navigálhat az összes munkaterületen és adatelemben, egyszerűen feltölthet, tölthet le vagy módosíthat fájlokat, akárcsak az Office-ban. A OneLake fájlkezelő leegyszerűsíti a data lake-ekkel való munkát, így még a nem műszaki üzleti felhasználók is használhatják őket.

További információ: OneLake fájlkezelő.

Egy adatmásolat

A OneLake célja, hogy a lehető legtöbb értéket adja meg egyetlen adatmásolatból adatáthelyezés vagy duplikáció nélkül. Nem kell másolnia az adatokat csak azért, hogy más motorral használja, vagy több forrásból származó adatokat elemezzen.

A billentyűparancsok adatáthelyezés nélkül kapcsolják össze az adatokat a tartományok között

A parancsikon más fájlhelyeken tárolt adatokra mutató hivatkozás. Ezek a fájlhelyek lehetnek ugyanazon a munkaterületen belül vagy különböző munkaterületeken belül, a OneLake-on belül vagy a OneLake-on kívül, például ADLS-ben, S3-ban vagy Dataverse-ben. A helytől függetlenül a parancsikonokkal a fájlok és mappák úgy jelennek meg, mintha helyben tárolva lenne.

A billentyűparancsokkal a szervezet anélkül oszthat meg adatokat a felhasználók és alkalmazások között, hogy szükségtelenül kellene áthelyeznie és duplikálnia az adatokat. Ha a csapatok egymástól függetlenül dolgoznak külön munkaterületeken, a parancsikonok lehetővé teszik az adatok különböző üzleti csoportok és tartományok közötti kombinálását egy virtuális adattermékben, a felhasználó igényeinek megfelelően.

Diagram, amely bemutatja, hogy a billentyűparancsok hogyan kapcsolják össze az adatokat a munkaterületek és elemek között.

A billentyűparancsok használatáról további információt a OneLake billentyűparancsai című témakörben talál.

Adatok csatlakoztatása több elemzési motorhoz

Az adatokat gyakran egyetlen motorra optimalizálják, ami megnehezíti ugyanazon adatok több alkalmazáshoz való újrafelhasználását. A Fabric segítségével a különböző elemzési motorok (T-SQL, Apache Spark, Analysis Services és mások) nyílt Delta Parquet formátumban tárolják az adatokat, hogy ugyanazokat az adatokat több motoron is használhassa.

Nem kell másolnia az adatokat csak azért, hogy egy másik motorral használja, vagy úgy érzi, hogy elakadt egy adott motor használatakor, mert itt találhatók az adatok. Tegyük fel például, hogy egy SQL-mérnökökből álló csapat teljesen tranzakciós adattárházat hoz létre. A T-SQL motort és a T-SQL minden erejét használhatják táblák létrehozására, adatok átalakítására és az adatok táblákba való betöltésére. Ha egy adatelemző használni szeretné ezeket az adatokat, nem kell egy speciális Spark-/SQL-illesztőprogramon keresztül mennie. A OneLake az összes adatot Delta Parquet formátumban tárolja. Az adatelemző közvetlenül az adatokon keresztül használhatja a Spark motor és a nyílt forráskódú kódtárak teljes erejét.

Az üzleti felhasználók közvetlenül a OneLake fölé készíthetnek Power BI-jelentéseket az Analysis Services motor Direct Lake-módjával. Az Analysis Services motorja a Power BI szemantikai modelljeit működteti, és mindig két módot kínált az adatok elérésére: az importálást és a közvetlen lekérdezést. Ez a harmadik mód, a Direct Lake mód minden importálási sebességet biztosít a felhasználóknak anélkül, hogy át kellene másolnia az adatokat, és a lehető legjobb importálást és közvetlen lekérdezést kombinálja. További információ: Direct Lake.

Példadiagram az adatok Spark használatával való betöltéséről, a T-SQL használatával történő lekérdezésről és az adatok Power BI-jelentésekben való megtekintéséről.

Beépített adatvédelem

A OneLake automatikusan védi az adatokat beépített funkciókkal, amelyek segítenek helyreállítani a véletlen törléseket, és felkészülni a regionális kimaradásokra.

Helyreállítható törlés a fájlhelyreállításhoz

A OneLake-fájlok törlésekor a rendszer nem távolítja el azonnal a fájlokat. A OneLake hét napig megőrzi a törölt fájlokat, így időt biztosít a véletlen törlések vagy felhasználói hibák utáni helyreállításra. Visszavonhatóan törölt fájlokat az Azure Storage Explorer vagy a PowerShell használatával állíthat vissza.

Részletes útmutatásért tekintse meg a Törölt fájlok helyreállítása a OneLake-ben című témakört.

Katasztrófa utáni helyreállítás

A OneLake zónaredundáns tárolást (ZRS) használ, ahol elérhető az adatközpontok meghibásodásai elleni védelemhez. Emellett engedélyezheti az üzletmenet-folytonosságot és a vészhelyreállítást (BCDR) is az adatok másodlagos földrajzi régióba való replikálásához.

További információ: Vészhelyreállítási és adatvédelmi terv.

Következő lépések

Készen áll a OneLake használatára? Első lépések: