Megosztás a következőn keresztül:


Metaadat-szabványok

A metaadatok kezelése kulcsfontosságú szerepet játszik az adatarchitektúra terén. A metaadatok más adatok adatai. Az adatokat írja le, és olyan hivatkozást biztosít, amely segít az adatok keresésében, védelmében és szabályozásában. A metaadatok az adatokat is összefűzik. Használható az adatok integritásának és minőségének ellenőrzésére, az adatok új helyre való átirányítására vagy replikálására, az adatok átalakítására és az adatjelentések megértésére. A metaadatok elengedhetetlenek az adatok önkiszolgáló portálokon keresztüli demokratizálásában is.

Az iparágban egyre nagyobb a tendencia, hogy az adatelemzések közelebb kerüljenek az adatelemzőkhöz és a tudósokhoz, több metaadatot használó portált használva. Ezt a trendet adatmegfigyelésnek nevezzük. Az adatmegfigyelés olyan fogalmakat használ, mint a metaadat-tó, a tudásgráfok vagy a metaadat-gráfok a metaadatokat központosított platformok leírására. Így egységes képet készíthet arról, hogy az elosztott adathálók használatakor hogyan használják és használják fel az adatokat a szervezeten belül.

A jó metaadat-kezelési stratégia organikusan növekszik. Először a legfontosabb területek azonosításával kezdi az egyszerűt és a kicsit. A jó metaadat-kezelési stratégiát a szolgáltatások és a tiszta folyamatok is támogatják. Első lépésként érdemes tisztában lenni a különböző metaadat-kategóriákkal:

  • Az üzleti metaadatok az irányításhoz, az adatok kereséséhez és megértéséhez használt összes szempontot ismertetik. Néhány jól ismert példa az üzleti kifejezésekre és definíciókra, valamint az adatok tulajdonjogára, használatára és eredetére vonatkozó információkra.
  • A műszaki metaadatok az adatok szerkezeti aspektusait ismertetik a tervezéskor. Néhány jól ismert példa a sémainformációk, az adatformátum és a protokolladatok, valamint a titkosítási és visszafejtési kulcsok.
  • Az operatív metaadatok az adatok futásidőben történő feldolgozását ismertetik. Néhány jól ismert példa a folyamatinformációkra, a végrehajtási időre, a folyamathiba adataira és a feladatazonosítókra.
  • A közösségi metaadatok a felhasználók adatainak felhasználói perspektíváját írják le. Néhány jól ismert példa: használati és felhasználókövetési információk, keresési eredmények adatai, szűrők és kattintások, megtekintési idő, profiltalálatok és megjegyzések.

A decentralizált adatarchitektúra esetében a metaadatok kezelése egy olyan szervezeti kihívás, amely megköveteli a központilag felügyelt metaadatok és az összevont felügyelt metaadatok közötti egyensúlyt. A metaadatok kezelésének megtervezése során fontos, hogy megismerje az Azure-beli felhőalapú elemzések csapatait és funkcióit. Az együttműködésen alapuló adatkezelési gyakorlat használatával javíthatja a csapatok közötti kommunikációt, integrációt és adatfolyam-automatizálást. A metaadatok kezelésének összetettségével a központi irányítás és a tartomány tulajdonjoga közötti megfelelő egyensúly megteremtésével foglalkozhat.

Amikor eldönti, hogy milyen metaadatokat szeretne központilag kezelni vagy összevonni az adattartományokkal, és megkezdi a megvalósítást, tegye fel a kérdést:

  • Milyen üzleti metaadatok fontosak?
  • Milyen technikai metaadatok szükségesek az együttműködéshez?
  • Milyen folyamatok és streamek rögzítik az adatokat?
  • Hol vannak létrehozva és karbantartva a modellek vagy sémák?
  • Milyen információkat kell a csapatoknak központilag szolgáltatnia ahhoz, hogy az adatszabályozási részleg megfelelően végezze a munkáját?

Az ezekre a kérdésekre adott válaszok segítségével képezheti le az egyes metaadat-adatfolyamok tartalom-életciklusát, és meghatározhatja az összes függőséget. Ezután rendelkezik egy metaadat-modellel, amely képes összekapcsolni az üzleti tartományokat, folyamatokat, technológiát és adatokat.

Miután megismerte, hogy mely metaadatokra van szüksége, ki kell választania a tárolási és feldolgozási helyet. Ehhez használhatja a Microsoft Purview-t.

A Microsoft Purview használata az adatvagyon nagy méretű kezeléséhez

A Microsoft Purview egy egységes adatszabályozási megoldás, amely segít a helyszíni, többfelhős és szolgáltatott szoftveres (SaaS-) adatok kezelésében és szabályozásában. A metaadatokat nagy méretekben kezeli, mivel ez egy teljesen automatizált szolgáltatás, amely intelligensen végzi az adatfelderítést, az adatvizsgálatot, az adatminőséget és a hozzáférés-kezelést. Emellett egy holisztikus térképet is biztosít, amely számos megállapítást tartalmaz az adathálós architektúráról.

A Microsoft Purview olyan megoldások átfogó készlete, amelyek segíthetnek a szervezetnek az adatok szabályozásában, védelmében és kezelésében, bárhol is él. A Microsoft Purview-megoldások integrált lefedettséget biztosítanak, és segítenek kezelni a szervezetek adatainak töredezettségét, az adatvédelem és a szabályozást gátló láthatóság hiányát, valamint a hagyományos informatikai felügyeleti szerepkörök elmosódását.

A Microsoft Purview egyesített platformmá egyesíti az adatszabályozási és megfelelőségi megoldásokat és szolgáltatásokat, hogy segítse a szervezetet:

  • A szervezet adatainak láthatósága
  • Bizalmas adatok védelme és kezelése az életciklusa során bárhol is él
  • Az adatok zökkenőmentes szabályozása új, átfogó módon
  • Kritikus adatkockázatok és szabályozási követelmények kezelése

A Microsoft Purview implementálása során kerülje a túl sok változás és összetettség gyors bevezetését. A technikai metaadatok alkotják a Microsoft Purview alapjait. Az szükséges, hogy gyűjtse és rendszerezze a metaadatait, mielőtt értelmet adna nekik.

Miután elvégezte a metaadatokat, kezdje az alapokkal:

  • Üzleti feltételek
  • Mérvadó adatforrások listája
  • Adatbázisok listája
  • Szabályozási tartományok
  • Sémaadatok
  • Adatok tulajdonjoga
  • Adatgondnokság
  • Biztonság
  • Adatminőség

Ezután skálázással lassan több tartománytulajdonost és adatgondnokot von be, és további besorolásokat és bizalmassági címkéket ad hozzá. Ezek a kiegészítések javítják a keresési élményt, és jobb adathozzáférés-kezelést tesznek lehetővé.

A Microsoft Purview egy Szabályozási tartományok nevű funkciót kínál, amely határokat határoz meg az adattermékek és üzleti fogalmak egységes szabályozásához, tulajdonjogához és felderítéséhez a tartományorientált architektúrában. ** További információkért lásd: Kormányzási tartományok a Microsoft Purview-ban.

Tudásgráf létrehozása az Azure Cosmos DB használatával

Az adatelemzési megoldásnak le kell írnia az adatok használatát, valamint az entitások, például a forrásadatok és az adattermékek, valamint az egyik tartományból származó adattermékek és egy másik tartomány függő termékei közötti kapcsolatokat. A kapcsolatok modellezéséhez használhat gráfadatbázist vagy egyéni felhasználói felületet.

Ha egységes nézetet szeretne készíteni a szervezet adatairól egyéni felhasználói felülettel, fontolja meg az Azure Cosmos DB használatát. Az Azure Cosmos DB egy globálisan elosztott, többmodelles adatbázis-szolgáltatás NoSQL-végpontokkal. Gráfadatbázis-szolgáltatást nyújt az Apache Gremlinhez készült Azure Cosmos DB-n keresztül, amely hatalmas gráfokat képes több milliárd csúcstal és éllel tárolni.

Az Azure Cosmos DB-architektúra végeredménye egy szervezeti szintű gráf, amely egységes nézetet biztosít a szervezet összes adatáról, teljes körű környezettel. A metaadat-tó nem csak az információk tárolásáról szól. Emellett aktívan rendszerezi a metaadatokat gráfként úgy, hogy más szolgáltatásokhoz és eszközökhöz csatlakoztatja. Ez a rendszerezett gráf lehetővé teszi, hogy összevetse a tárgyterületeket, többek között az alábbiakat:

  • Tartományok
  • Adatminőség
  • Adathasználat
  • Üzleti képességek
  • Alkalmazásfüggvények
  • Műszaki architektúrával kapcsolatos információk
  • Működési események
  • Szervezeti metaadatok
  • Alkalmazás tulajdonjogának metaadatai
  • Helyadatok
  • Alkalmazás életciklus-kezelési információi

Következő lépések