Data lakehouse architektúra: A Databricks jól tervezett keretrendszere
Ez a Data Lakehouse architektúracikkek olyan alapelveket és ajánlott eljárásokat tartalmaz, amelyek a lakehouse Azure Databricks használatával történő implementálásához és üzemeltetéséhez nyújtanak segítséget.
A Databricks jól tervezett keretrendszere a lakehouse-hoz
A jól felépítésű tóház 7 pillérből áll, amelyek a felhőben található data lakehouse megvalósításával kapcsolatos különböző területeket írják le:
Adatszabályozás
Annak biztosítása, hogy az adatok értéket teremthessenek, és támogathassák az üzleti stratégiát.
Interoperabilitás és használhatóság
A lakehouse képessége a felhasználókkal és más rendszerekkel való interakcióra.
Működésbeli kiválóság
Minden olyan üzemeltetési folyamat, amely éles környezetben tartja a lakehouse-t.
Biztonság, adatvédelem és megfelelőség
Az Azure Databricks-alkalmazás, az ügyfél számítási feladatai és az ügyféladatok védelme a fenyegetések ellen.
Megbízhatóság
A rendszer azon képessége, hogy helyreálljon a hibák után, és folytassa a működést.
Teljesítményhatékonyság
A rendszer terhelésváltozáshoz való alkalmazkodási képessége.
Költségoptimalizálás
Költségek kezelése a nyújtott érték maximalizálásához
A jól megtervezett lakehouse kiterjeszti a Microsoft Azure Well-Architected Frameworkt a Databricks adatintelligencia-platformra, és megosztja az "Operatív kiválóság", a "Biztonság" (biztonság, adatvédelem és megfelelőség), a "Megbízhatóság", a "Teljesítményhatékonyság" és a "Költségoptimalizálás" pilléreket.
Ezen öt pillér esetében a felhőalapú keretrendszer alapelvei és ajánlott eljárásai továbbra is érvényesek a lakehouse-ra. A jól megépített tóház ezeket a lakehouse-ra jellemző alapelvekkel és ajánlott eljárásokkal egészíti ki, és fontos, hogy hatékony és hatékony tóházat építsen ki.
Data Governance and Interoperability & Usability in lakehouse architectures
Az "Adatszabályozás" és az "Interoperabilitás és használhatóság" pillérek a lakehouse-ra vonatkozó kérdéseket fedik le.
Az adatszabályozás magában foglalja azokat a szabályzatokat és eljárásokat, amelyeket a szervezet adategységeinek biztonságos kezelése érdekében hajtottak végre. A lakehouse egyik alapvető aspektusa a központosított adatszabályozás: A lakehouse egyesíti az adatraktározást, az AI pedig egyetlen platformon használja az eseteket. Ez leegyszerűsíti a modern adatvermet azáltal, hogy kiküszöböli az adatsilókat, amelyek hagyományosan elválasztják és bonyolítják az adatelemzést, az elemzést, a BI-t, az adatelemzést és a gépi tanulást. Az adatszabályozás egyszerűsítése érdekében a lakehouse egységes szabályozási megoldást kínál az adatokhoz, az elemzésekhez és az AI-hoz. Ha minimalizálja az adatok másolatát, és egyetlen adatfeldolgozási rétegbe kerül, ahol az összes adatszabályozási vezérlő együtt futtatható, javíthatja a megfelelőség és az adatszivárgás észlelésének esélyét.
A tóház egy másik fontos eleme, hogy nagyszerű felhasználói élményt nyújtson a vele dolgozó összes személynek, és hogy képes legyen a külső rendszerek széles ökoszisztémájával kommunikálni. Az Azure már számos olyan adateszközrel rendelkezik, amelyek a legtöbb olyan feladatot végrehajtják, amelyekre egy adatvezérelt vállalatnak szüksége lehet. Ezeket az eszközöket azonban megfelelően kell összeállítani az összes funkció biztosításához, és minden szolgáltatás más felhasználói élményt nyújt. Ez a megközelítés magas megvalósítási költségekhez vezethet, és általában nem ugyanazt a felhasználói élményt nyújtja, mint a natív Lakehouse-platform: A felhasználókat az eszközök közötti ellentmondások és az együttműködési képességek hiánya korlátozza, és gyakran összetett folyamatokat kell végigmenni a rendszerhez és így az adatokhoz való hozzáféréshez.
A másik oldalon található integrált tóház egységes felhasználói élményt biztosít az összes számítási feladathoz, így növeli a használhatóságot. Ez csökkenti a betanítási és előkészítési költségeket, és javítja a funkciók közötti együttműködést. Emellett az új funkciók idővel automatikusan hozzáadódnak – a felhasználói élmény további javítása érdekében – anélkül, hogy belső erőforrásokat és költségvetéseket kellene befektetni.
A többfelhős megközelítés lehet egy vállalat szándékos stratégiája, vagy a különböző felhőszolgáltatókat jelölő egyesülések és felvásárlások vagy független üzleti egységek eredménye. Ebben az esetben a többfelhős lakehouse használata egységes felhasználói élményt eredményez az összes felhőben. Ez csökkenti a rendszerek elterjedését a vállalaton belül, ami viszont csökkenti az adatvezérelt feladatokban részt vevő alkalmazottak képzettségi és képzési követelményeit.
Végül, egy vállalatközi üzleti folyamatokkal rendelkező hálózatos világban a rendszereknek a lehető leggördülékenyen kell együttműködniük. Az interoperabilitás foka kulcsfontosságú kritérium, és a legfrissebb adatoknak, mint minden üzlet alapvető eszközének, biztonságosan kell áramlani a belső és a külső partnerek rendszerei között.
Alapelvek és ajánlott eljárások
Visszajelzés
https://aka.ms/ContentUserFeedback.
Hamarosan elérhető: 2024-ben fokozatosan kivezetjük a GitHub-problémákat a tartalom visszajelzési mechanizmusaként, és lecseréljük egy új visszajelzési rendszerre. További információ:Visszajelzés küldése és megtekintése a következőhöz: