Adatkezelés az Azure Data Lake-ben a Microsoft Purview használatával

Azure Data Factory
Microsoft Purview
Azure Data Lake Storage
Azure Synapse Analytics
Power BI

Megoldási ötletek

Ez a cikk egy megoldási ötlet. Ha azt szeretné, hogy további információkkal bővítsük a tartalmat, például a lehetséges használati eseteket, alternatív szolgáltatásokat, megvalósítási szempontokat vagy díjszabási útmutatást, a GitHub visszajelzésével tudassa velünk.

Ez a cikk egy olyan megoldást ismertet, amely az Azure Purview használatával építi ki az adatszabályozás és -kezelés alapjait, amelyek kiváló minőségű, megbízható adatokat hozhatnak létre és szolgáltathatnak.

Architektúra

Architecture diagram that shows how Azure Purview scans and classifies data.

Diagram, amely bemutatja, hogy az Azure Purview hogyan vizsgálja és osztályozza az adatokat. A Data Lake Storage egy modern adatplatformon keresztül csatlakozik az Azure Purview-hoz. Az Azure Purview a Power BI-hoz is csatlakozik. A diagram ezen szolgáltatások és a Microsoft Entra ID, az Azure Monitor és az Azure Key Vault integrációját is mutatja.

Töltse le az architektúra Visio-fájlját.

Adatfolyam

Az Azure Purview egyetlen egységes adatkezelési szolgáltatást biztosít az összes forrásból, a data lake-ből és a végfelhasználói jelentéskészítési eszközökből származó adatokhoz.

Az Azure Purview Data Lake-szolgáltatásokhoz való csatlakoztatásának forgatókönyvei:

  1. Az Azure Purview továbbfejlesztett biztonsági kapcsolatot biztosít a data lake-betöltési, tárolási és elemzési folyamatokhoz az adategységek automatikus katalogizálásához. Ezen szolgáltatások között is biztosít életútot. Egyes Azure-szolgáltatások közé tartozik a Data Factory, a Data Lake Storage és az Azure Synapse Analytics.

  2. Az Azure Purview natív módon csatlakozik a Power BI-hoz és más jelentéskészítési és vizualizációs eszközökhöz. A zárójelentésekben használt adatsorokat jeleníti meg. Emellett bizalmassági adatokat is megoszt a Power BI-objektumokból a helytelen adathasználat megakadályozása érdekében.

Fontos

A forrásokból az Azure Purview-ba továbbított információk olyan metaadatok, amelyek a beolvasott forrásokon belüli adatokat írják le. A forrásból nem kerülnek át tényleges adatok az Azure Purview-ba.

Képességek

  • Katalógus. Az Azure Purview Data Catalog automatikusan rögzítheti és leírhatja a forrásban lévő adatok alapvető jellemzőit, beleértve a sémát, a műszaki tulajdonságokat és a helyet. Az Azure Purview-szószedet lehetővé teszi az adatok üzleti felhasználóbarát definíciójának rétegezését a keresés és a felderítés javítása érdekében.

  • Besorolás. Az Azure Purview automatikusan osztályozza az adathalmazokat és adatelemeket 100 előre definiált bizalmasadat-besorolással. Emellett saját egyéni besorolási sémákat is meghatározhat, amelyeket manuálisan és automatikusan alkalmazhat.

  • Életút. Az Azure Purview diagramszerűen ábrázolja a data factoryi, az Azure Synapse Analytics és a Power BI-folyamatok közötti vonalvezetést. Ezek a vizualizációk részletes szinten jelenítik meg az adatok végpontok közötti áramlását.

  • Hozzáférés-vezérlés. Az Azure Purview hozzáférés-vezérlési szabályzata lehetővé teszi, hogy közvetlenül a mögöttes forrásokon definiálja és engedélyezze az adategységekhez való hozzáférést a katalógusból.

  • Tulajdon. Az Azure Purview lehetővé teszi az adatok tulajdonjogának és gondnokságának alkalmazását a katalógusban szereplő adategységekre és szószedetelemekre.

  • Megállapítás. Elemzések az Azure Purview-ban több előre definiált jelentést is biztosít, amelyek segítenek a CDO-knak, az adatszakértőknek és az adatszabályozási szakembereknek az adat-környezet részletes megismerésében.

Összetevők

  • Az Azure Purview egy egységes adatkatalógus, amely helyszíni, többfelhős és szoftveres (SaaS-) adatokat kezel. Ez az adatszabályozási szolgáltatás az adatok fekvő tájolású térképeit kezeli. A funkciók közé tartozik az automatizált adatfelderítés, a bizalmas adatbesorolás és az adatsorozás.

  • A Data Factory egy teljes mértékben felügyelt, kiszolgáló nélküli adatintegrációs szolgáltatás, amely segít ETL- és ELT-folyamatok létrehozásában.

  • A Data Lake Storage nagymértékben skálázható, magas biztonsági szintű, költséghatékony felhőalapú tárolást biztosít a nagy teljesítményű elemzési számítási feladatokhoz.

  • Az Azure Synapse Analytics egy korlátlan elemzési szolgáltatás, amely egyesíti az adatintegrációt, a nagyvállalati adattárházakat és a big data elemzéseket.

  • A Power BI szoftverszolgáltatások és alkalmazások gyűjteménye. Ezek a szolgáltatások olyan jelentéseket hoznak létre és osztanak meg, amelyek több adatforrást kapcsolnak össze és vizualizálnak. Ha a Power BI-t az Azure Purview-val használja, az képes az adatok katalogizálására és besorolására, valamint részletes, a végpontok közötti ábrázolású leszármakozásra.

  • Az Azure Private Link privát kapcsolatot biztosít egy virtuális hálózatról az Azure Platform szolgáltatásként (PaaS) nyújtott szolgáltatásaihoz, az Ön tulajdonában lévő szolgáltatásokhoz vagy a Microsoft partnerszolgáltatásaihoz.

  • Az Azure Key Vault tárolja és szabályozza a titkos kulcsokhoz, például jogkivonatokhoz, jelszavakhoz és API-kulcsokhoz való hozzáférést. A Key Vault emellett titkosítási kulcsokat is létrehoz és szabályoz, valamint kezeli a biztonsági tanúsítványokat.

  • A Microsoft Entra ID felhőalapú identitás- és hozzáférés-kezelési szolgáltatásokat kínál. Ezek a funkciók lehetővé teszik, hogy a felhasználók bejelentkezhessenek és hozzáférjenek az erőforrásokhoz.

  • Az Azure Monitor adatokat gyűjt és elemez a környezetekről és az Azure-erőforrásokról. Ezek az adatok alkalmazástelemetria, például teljesítménymetrikák és tevékenységnaplók.

Forgatókönyv részletei

Ahogy több adatot tölt be az Azure-ba, egyre nagyobb szükség van az adatok megfelelő szabályozására és kezelésére az összes adatforrásban és adatfelhasználóban.

Ha nem rendelkezik jó minőségű adatokkal az Azure-adatvagyonban, az Azure üzleti értéke csökken. A megoldás egy olyan adatszabályozási és -kezelési alap létrehozása, amely kiváló minőségű, megbízható adatokat képes előállítani és szolgáltatni.

Az adatokat nagy méretekben kell kezelni a helyszíni, felhőbeli és többfelhős tárolókban, hogy azok megfeleljenek a biztonság, az adatvédelem és a használat megfelelőségi követelményeinek. A jól felügyelt adatok az önfelderítést, az adatmegosztást és az adatminőséget is javíthatják, ami javítja az adatok alkalmazásokban és elemzésekben való használatát.

Az Azure Purview szabályozást biztosít a szabályzatok és szabványok kereséséhez, osztályozásához, meghatározásához és kikényszerítéséhez az adatok között. Segítségével egységesen alkalmazhat definíciókat, besorolásokat és szabályozási folyamatokat az adatok között. Az összes adatforrást katalogizálja, azonosítja a bizalmas információkat, és meghatározza az adatsorokat. Központi platformot biztosít, ahol definíciókat és tulajdonjogokat alkalmazhat az adatokra. A jelentések és megállapítások egyetlen nézetével olyan adatszabványokat hozhat létre, amelyeket alkalmazni kell az adatokra.

Más Azure-szolgáltatásokkal együttműködve az Azure Purview automatikusan felderítheti, katelogizálhatja, osztályozhatja és kezelheti az adatokat az Azure Data Lake-ajánlatokban és a partnerszolgáltatásokban.

Lehetséges használati esetek

Az adatkezelés követelményei iparágonként eltérőek. Az adatok és az adatarchitektúrák méretének és összetettségének növekedésével minden iparágban egyre nagyobb igény van az adatok nagy léptékű szabályozására. Ez azoknak a szervezeteknek megfelelő, amelyek a jól szabályozott adatok következő eredményeiből profitálnak:

  • Adatok automatikus felderítése a felhőbevezetés felgyorsítása érdekében.
  • Az adatok nagyobb biztonsága az adattörvényeknek és előírásoknak való megfelelés érdekében.
  • A felügyelt adatok jobb elérése, felderítése és minősége az elemzés javítása érdekében.

Közreműködők

Ezt a cikket a Microsoft tartja karban. Eredetileg a következő közreműködők írták.

Fő szerző:

Következő lépések