Olvasás angol nyelven

Megosztás a következőn keresztül:


OneLake, a OneDrive for data

A OneLake egyetlen, egységes, logikai adattó a teljes szervezet számára. A data Lake nagy mennyiségű adatot dolgoz fel különböző forrásokból. A OneDrive-hoz hasonlóan a OneLake minden Microsoft Fabric-bérlőhöz automatikusan elérhető, és úgy lett kialakítva, hogy az összes elemzési adat egyetlen helye legyen. A OneLake a következő ügyfeleket hozza el:

  • Egy adattó a teljes szervezet számára
  • Egy adatmásolat több elemzési motorral való használatra

Egy adattó a teljes szervezet számára

A OneLake előtt az ügyfelek egyszerűbben hoztak létre több tavat a különböző üzleti csoportok számára, és nem egyetlen tóban működtek együtt, még akkor is, ha több erőforrást kezelnek. A OneLake célja, hogy az együttműködés javításával elhárítsa ezeket a kihívásokat. Minden ügyfélbérlmének pontosan egy OneLake-je van. Soha nem lehet több, mint egy, és ha fabric, soha nem lehet nulla. Minden Háló-bérlő automatikusan kiépít egy OneLake-t, és nincs szükség további erőforrások beállítására vagy kezelésére.

Alapértelmezés szerint elosztott tulajdonjoggal az együttműködéshez

A bérlő fogalma egy SaaS-szolgáltatás egyedi előnye. Annak ismerete, hogy az ügyfél szervezete hol kezdődik és végződik, természetes szabályozási és megfelelőségi határt biztosít, amely egy bérlői rendszergazda felügyelete alatt áll. A OneLake-ben landolt adatokra alapértelmezés szerint az irányadó. Bár minden adat a bérlői rendszergazda által meghatározott határokon belül van, fontos, hogy ez a rendszergazda ne váljon központi kapuőrré, így a szervezet más részei nem járulnak hozzá a OneLake-hez.

A bérlőn belül tetszőleges számú munkaterületet hozhat létre. A munkaterületek lehetővé teszik a szervezet különböző részei számára a tulajdonjogi és hozzáférési szabályzatok terjesztését. Minden munkaterület egy adott régióhoz kötődő kapacitás része, és külön számlázva van.

A OneLake függvényét és szerkezetét bemutató ábra.

Egy munkaterületen belül létrehozhat adatelemeket, és az adatelemeken keresztül hozzáférhet a OneLake összes adatához. Hasonlóan ahhoz, ahogyan az Office a OneDrive-ban tárolja a Word-, Excel- és PowerPoint-fájlokat, a Fabric a OneLake-ben tárolja a tóházakat, raktárakat és egyéb elemeket. Az elemek személyre szabott élményt biztosíthatnak az egyes személyek számára, például az Apache Spark fejlesztői élményét egy lakehouse-ban.

A OneLake használatának megkezdésével kapcsolatos további információkért lásd : Tóház létrehozása a OneLake-nal.

Megnyitás minden szinten

A OneLake minden szinten nyitva van. A OneLake az Azure Data Lake Storage (ADLS) Gen2-n alapul, és bármilyen típusú, strukturált vagy strukturálatlan fájlt támogat. Minden Fabric-adatelem, például az adattárházak és a lakehouse-k automatikusan, Delta Parquet formátumban tárolják az adataikat a OneLake-ben. Ha egy adatszakértő az Apache Spark használatával tölt be adatokat egy tóházba, és egy SQL-fejlesztő T-SQL használatával tölt be adatokat egy teljesen tranzakciós adattárházba, mindkettő ugyanahhoz a data lake-hez járul hozzá. A OneLake az összes táblázatos adatot Delta Parquet formátumban tárolja.

A OneLake ugyanazokat az ADLS Gen2 API-kat és SDK-kat támogatja, amelyek kompatibilisek a meglévő ADLS Gen2-alkalmazásokkal, beleértve az Azure Databrickset is. A OneLake-ben úgy kezelheti az adatokat, mintha egy nagy ADLS-tárfiók lenne a teljes szervezet számára. Minden munkaterület tárolóként jelenik meg a tárfiókon belül, és a különböző adatelemek mappákként jelennek meg ezekben a tárolókban.

A OneLake-adatok API-kkal és SDK-kkal való elérését bemutató ábra.

Az API-kkal és végpontokkal kapcsolatos további információkért lásd a OneLake hozzáférését és API-jait. Az Azure-ral való OneLake-integrációs példákért tekintse meg az Azure Synapse Analytics, az Azure Storage Explorer, az Azure Databricks és az Azure HDInsight cikkeit.

Windows OneLake fájlkezelő

A OneLake a OneDrive for data. A OneDrive-hoz hasonlóan a Windows OneLake-adatok is könnyen felfedezhetők a Windows OneLake fájlkezelőjében . Navigálhat az összes munkaterületen és adatelemben, egyszerűen feltölthet, tölthet le vagy módosíthat fájlokat, akárcsak az Office-ban. A OneLake fájlkezelő leegyszerűsíti a data lake-ekkel való munkát, így még a nem műszaki üzleti felhasználók is használhatják őket.

További információ: OneLake fájlkezelő.

Egy adatmásolat

A OneLake célja, hogy a lehető legtöbb értéket adja meg egyetlen adatmásolatból adatáthelyezés vagy duplikáció nélkül. Már nem kell másolnia az adatokat csak azért, hogy egy másik motorral használja, vagy lebontsa a silókat, hogy más forrásokból származó adatokkal elemezhesse az adatokat.

A billentyűparancsok adatáthelyezés nélkül kapcsolják össze az adatokat a tartományok között

A billentyűparancsokkal a szervezet egyszerűen megoszthatja az adatokat a felhasználók és az alkalmazások között anélkül, hogy szükségtelenül kellene áthelyeznie és duplikálnia az adatokat. Ha a csapatok egymástól függetlenül dolgoznak külön munkaterületeken, a parancsikonok lehetővé teszik az adatok különböző üzleti csoportok és tartományok közötti kombinálását egy virtuális adattermékben, a felhasználó igényeinek megfelelően.

A parancsikon más fájlhelyeken tárolt adatokra mutató hivatkozás. Ezek a fájlhelyek lehetnek ugyanazon a munkaterületen belül vagy különböző munkaterületeken belül, a OneLake-ben vagy az ADLS-ben, az S3-ban vagy a Dataverse-ben a OneLake-on kívül is – hamarosan további célhelyek is elérhetők lesznek. A helytől függetlenül a parancsikonokkal a fájlok és mappák úgy jelennek meg, mintha helyben tárolva lenne.

Diagram, amely bemutatja, hogy a billentyűparancsok hogyan kapcsolják össze az adatokat a munkaterületek és elemek között.

A billentyűparancsok használatáról további információt a OneLake billentyűparancsai című témakörben talál.

Egy adatmásolat több elemzési motorral

Bár az alkalmazások a tárolás és a számítástechnika elkülönítésével rendelkezhetnek, az adatok gyakran egyetlen motorra vannak optimalizálva, ami megnehezíti ugyanazon adatok több alkalmazáshoz való újrafelhasználását. A Fabric használatával a különböző elemzési motorok (T-SQL, Apache Spark, Analysis Services stb.) nyílt Delta Parquet formátumban tárolják az adatokat, hogy ugyanazokat az adatokat több motoron is használhassa.

Már nincs szükség adatok másolására csak azért, hogy egy másik motorral használhassa. Mindig kiválaszthatja a legjobb motort ahhoz a feladathoz, amelyet el szeretne végezni. Tegyük fel például, hogy sql-mérnökökből álló csapata teljesen tranzakciós adattárházat hoz létre. A T-SQL motort és a T-SQL minden erejét használhatják táblák létrehozására, adatok átalakítására és az adatok táblákba való betöltésére. Ha egy adatelemző használni szeretné ezeket az adatokat, többé nem kell egy speciális Spark-/SQL-illesztőprogramon keresztül mennie. A OneLake az összes adatot Delta Parquet formátumban tárolja. Az adattudósok közvetlenül az adatokon keresztül használhatják a Spark motor és a nyílt forráskódú kódtárak teljes erejét.

Az üzleti felhasználók közvetlenül a OneLake-ra készíthetnek Power BI-jelentéseket az Analysis Services motor új Direct Lake-módjával. Az Analysis Services motor az, amely a Power BI szemantikai modelljeit működteti, és mindig két módot kínált az adatok elérésére: az importálást és a közvetlen lekérdezést. A Direct Lake mód minden importálási sebességet biztosít a felhasználóknak anélkül, hogy át kellene másolnia az adatokat, így a lehető legjobb importálást és közvetlen lekérdezést kombinálhatja. További információ: Direct Lake.

Diagram, amely bemutatja, hogy több elem és motor hogyan használja ugyanazt az adatmásolatot.

Példadiagram az adatok Spark használatával való betöltéséről, a T-SQL használatával történő lekérdezésről és az adatok Power BI-jelentésekben való megtekintéséről.