Mi az a lakehouse a Microsoft Fabricben?

A Microsoft Fabric Lakehouse egy adatarchitektúra-platform a strukturált és strukturálatlan adatok egyetlen helyen történő tárolására, kezelésére és elemzésére. Ez egy rugalmas és méretezhető megoldás, amely lehetővé teszi a szervezetek számára, hogy nagy mennyiségű adatot kezeljenek különböző eszközökkel és keretrendszerekkel az adatok feldolgozásához és elemzéséhez. Integrálható más adatkezelési és elemzési eszközökkel, hogy átfogó megoldást nyújtson az adatfeldolgozáshoz és az elemzéshez.

Gif of overall lakehouse experience.

Lakehouse SQL Analytics-végpont

A Lakehouse létrehoz egy kiszolgálóréteget, amely automatikusan létrehoz egy SQL Analytics-végpontot és egy alapértelmezett szemantikai modellt a létrehozás során. Ez az új átlátszatlan funkció lehetővé teszi a felhasználó számára, hogy közvetlenül a tó Delta-tábláira dolgozzon, hogy zökkenőmentes és teljesítménnyel járjon az adatbetöltéstől a jelentéskészítésig.

Fontos megjegyezni, hogy az SQL Analytics-végpont írásvédett felület, és nem támogatja a tranzakciós adattárház teljes T-SQL felületét.

Megjegyzés:

Csak a Delta formátumú táblák érhetők el az SQL Analytics-végponton. A parquet, a CSV és más formátumok nem kérdezhetők le az SQL Analytics-végpont használatával. Ha nem látja a táblát, át kell alakítania Delta formátumba.

Automatikus táblafelderítés és -regisztráció

Az automatikus táblafelderítés és -regisztráció a Lakehouse szolgáltatása, amely teljes körűen felügyelt fájlt biztosít az adatmérnökök és adattudósok számára. A fájlokat a Lakehouse felügyelt területére helyezheti, és a rendszer automatikusan ellenőrzi a támogatott strukturált formátumokat, és regisztrálja azt a metaadattárba a szükséges metaadatokkal, például oszlopnevekkel, formátumokkal, tömörítéssel és egyebekkel. (Jelenleg az egyetlen támogatott formátum a Delta-tábla.) Ezután táblázatként hivatkozhat a fájlra, és SparkSQL-szintaxissal kezelheti az adatokat.

A Lakehouse-elem interakciója

Az adatmérnökök többféleképpen kezelhetik a tóházat és az adatokat a tóházban:

  • A Lakehouse explorer: Az explorer a fő Lakehouse interakciós oldal. A Lakehouse-ban adatokat tölthet be, adatokat vizsgálhat meg a Lakehouse-ban az objektumkezelővel, beállíthatja a MIP-címkéket és egyéb dolgokat. További információ a kezelő felületéről: Navigáljon a Fabric Lakehouse explorerben.

  • Jegyzetfüzetek: Az adatszakértők a jegyzetfüzet használatával kódot írhatnak közvetlenül a Lakehouse-ba táblázatokként és/vagy mappákként való olvasásra, átalakításra és írásra. További információ arról, hogyan használhat jegyzetfüzeteket a Lakehouse-hoz: A lakehouse-ban lévő adatok felfedezése jegyzetfüzettel , és hogyan tölthet be adatokat a lakehouse-ba.

  • Folyamatok: Az adatszakértők adatintegrációs eszközöket, például folyamatmásoló eszközt használhatnak más forrásokból származó adatok lekéréséhez, és a Lakehouse-ba való landoláshoz. További információ a másolási tevékenység használatáról: Adatok másolása másolási tevékenység használatával.

  • Apache Spark-feladatdefiníciók: Az adatmérnökök robusztus alkalmazásokat fejleszthetnek, és vezénylik a lefordított Spark-feladatok végrehajtását Java, Scala és Python nyelven. További információ a Spark-feladatokról: Mi az Apache Spark-feladatdefiníció?

  • Adatfolyamok 2. generációs: Az adatmérnökök a Gen 2 adatfolyamokkal betölthetik és előkészíthetik az adataikat. További információ az adatfolyamok használatával történő adatbetöltésről: Hozza létre az első adatfolyamot az adatok lekéréséhez és átalakításához.

További információ az adatok tóházba való betöltésének különböző módjairól: Adatok beolvasásának lehetőségei a Fabric Lakehouse-ba.

Multitasking with lakehouse

A többfeladatos használat lehetővé teszi a böngészőlap kialakítását, amely lehetővé teszi több elem zökkenőmentes megnyitását és közötti váltást, így minden eddiginél hatékonyabban kezelheti a data lakehouse-t. Nincs több zsonglőrkedés a különböző ablakok között, vagy a feladatok nyomon követése. A Lakehouse továbbfejlesztett többfeladatos kezelői felületet biztosít az adatkezelési folyamat lehető leghatékonyabb és felhasználóbarátabbá tétele érdekében az alábbi funkciókkal:

  • Futó műveletek megőrzése: Feltöltheti vagy futtathatja az adatbetöltési műveletet az egyik lapon, és ellenőrizheti egy másik feladatot egy másik lapon. Továbbfejlesztett többfeladatos működés esetén a futtatott műveletek nem lesznek megszakítva a lapok közötti navigáláskor. Zavartalanul összpontosíthat a munkájára.

  • A környezet megőrzése: A kijelölt objektumok, adattáblák vagy fájlok nyitva maradnak, és könnyen elérhetők maradnak a lapok közötti váltáskor. A data lakehouse környezete mindig kéznél van.

  • Nem blokkoló lista újrabetöltése: A fájlok és táblák listájának blokkolásmentes újrabetöltési mechanizmusa. Továbbra is dolgozhat, amíg a lista frissül a háttérben. Biztosítja, hogy a legújabb adatokkal rendelkezzen, miközben zökkenőmentes és zavartalan élményt nyújt.

  • Egyértelműen definiált értesítések: A bejelentési értesítések meghatározzák, hogy melyik lakehouse-ból érkeznek, így könnyebben nyomon követhetők a módosítások és frissítések a többfeladatos környezetben.

Akadálymentes lakehouse kialakítás

Az akadálymentesség mindig is elsődleges szempont volt annak biztosítása érdekében, hogy a Lakehouse mindenki számára befogadó és felhasználóbarát legyen. Az akadálymentesség támogatásához az eddigi legfontosabb kezdeményezéseket vezettük be:

  • Képernyőolvasó kompatibilitása: Zökkenőmentesen dolgozhat a népszerű képernyőolvasókkal, így a látássérült felhasználók hatékonyan navigálhatnak és használhatják platformunkat.

  • A szöveg áttördelése rugalmas kialakítás, amely alkalmazkodik a különböző képernyőméretekhez és tájolásokhoz. A szöveg és a tartalom dinamikusan újrafolyik, így a felhasználók többféle eszközön tekinthetik meg és használhatják az alkalmazást.

  • Billentyűzet-navigáció: Továbbfejlesztett billentyűzet-navigáció, amely lehetővé teszi a felhasználók számára, hogy egér használata nélkül haladjanak végig a tóparton, ami növeli a mozgássérültek élményét.

  • Helyettesítő szöveg képekhez: Mostantól minden kép tartalmaz egy leíró helyettesítő szöveget, így a képernyőolvasók értelmes információkat közvetítenek.

  • Űrlapmezők és címkék: Minden űrlapmezőhöz társított címkék tartoznak, ami leegyszerűsíti az adatbevitelt mindenki számára, beleértve a képernyőolvasókat használókat is.

Ebben az áttekintésben alapszintű ismereteket szerezhet egy tóházról. A következő cikkből megtudhatja, hogyan hozhatja létre és használhatja saját tóházát:

  • A lakehouse-k használatának megkezdéséhez tekintse meg a Lakehouse létrehozása a Microsoft Fabricben című témakört.