Delen via


Metagegevensstandaarden

Metagegevensbeheer speelt een cruciale rol in de gegevensarchitectuur. Metagegevens zijn gegevens over andere gegevens. Hierin worden gegevens beschreven, met een verwijzing waarmee u gegevens kunt vinden, beveiligen en beheren. Metagegevens binden ook gegevens aan elkaar. Het kan worden gebruikt om de integriteit en kwaliteit van gegevens te valideren, gegevens te routeren of te repliceren naar een nieuwe locatie, gegevens te transformeren en betekenissen van gegevens te kennen. Metagegevens zijn ook essentieel voor het democratiseren van gegevens via selfserviceportals.

Een goede strategie voor metagegevensbeheer groeit organisch. Het begint eenvoudig en klein door eerst de belangrijkste gebieden te identificeren. Een goede strategie voor metagegevensbeheer wordt ook ondersteund met services en duidelijke processen. Om aan de slag te gaan, is het handig om op de hoogte te zijn van de verschillende metagegevenscategorieën:

  • Zakelijke metagegevens beschrijven alle aspecten die worden gebruikt voor governance, het vinden en begrijpen van gegevens. Enkele bekende voorbeelden zijn zakelijke termen en definities en informatie over het eigendom, het gebruik en de oorsprong van gegevens.
  • Technische metagegevens beschrijven de structurele aspecten van gegevens tijdens het ontwerp. Enkele bekende voorbeelden zijn schemagegevens, gegevensindeling en protocolgegevens, en versleutelings- en ontsleutelingssleutels.
  • Operationele metagegevens beschrijven de verwerkingsaspecten van gegevens tijdens runtime. Enkele bekende voorbeelden zijn procesinformatie, uitvoeringstijd, informatie over procesfouten en taak-id's.
  • Sociale metagegevens beschrijven het gebruikersperspectief van de gegevens van de consumenten. Enkele bekende voorbeelden zijn gebruiks- en gebruikerstraceringsgegevens, zoekresultaatgegevens, filters en klikken, weergavetijd, profieltreffers en opmerkingen.

In de gedecentraliseerde gegevensarchitectuur is metagegevensbeheer een organisatorische uitdaging waarvoor een balans moet worden gevonden tussen centraal beheerde metagegevens en federatieve beheerde metagegevens. Het is belangrijk dat u inzicht krijgt in teams en functies voor analyses op cloudschaal in Azure wanneer u uw metagegevensbeheer plant. Door gebruik te maken van een samenwerkingspraktijk voor gegevensbeheer, verbetert u de automatisering van communicatie, integratie en gegevensstromen tussen uw teams. U kunt de complexiteit van metagegevensbeheer aanpakken door het juiste evenwicht te vinden tussen centraal beheer en eigendom van het domein.

Wanneer u bepaalt welke metagegevens centraal moeten worden beheerd of gefedereerd moeten worden aan uw gegevensdomeinen en uw implementatie begint, vraagt u zich af:

  • Welke zakelijke metagegevens zijn essentieel?
  • Welke technische metagegevens zijn vereist voor interoperabiliteit?
  • Welke processen en stromen leggen de gegevens vast?
  • Waar worden de modellen of schema's gemaakt en onderhouden?
  • Welke informatieteams moeten centraal leveren om de datagovernanceafdeling in staat te stellen zijn werk correct uit te voeren?

Gebruik uw antwoorden op deze vragen, wijs de levenscyclus van de inhoud voor elk van uw metagegevensstromen toe en bepaal alle afhankelijkheden. Vervolgens hebt u een metagegevensmodel waarmee zakelijke domeinen, processen, technologie en gegevens kunnen worden verbonden.

Zodra u weet welke metagegevens u nodig hebt, moet u een locatie kiezen om deze op te slaan en te verwerken. U kunt dit doen met behulp van Azure Purview.

Azure Purview gebruiken om uw gegevensdomein te beheren

Azure Purview is een geïntegreerde oplossing voor gegevensbeheer waarmee u uw on-premises, multicloud- en SaaS-gegevens (Software as a Service) kunt beheren en beheren. Het beheer van metagegevens wordt op schaal uitgevoerd, omdat het een volledig geautomatiseerde service is die op intelligente wijze gegevensdetectie, gegevensscans en toegangsbeheer uitvoert. Het biedt ook een holistische kaart van veel inzichten over uw data mesh-architectuur.

Bij het implementeren van Azure Purview introduceert u niet te veel wijzigingen en complexiteit. Technische metagegevens zijn de basis van Azure Purview. U moet uw metagegevens verzamelen en ordenen voordat u deze begrijpt.

Zodra u uw metagegevens hebt, begint u met de basisbeginselen:

  • Zakelijke voorwaarden
  • Lijsten met gezaghebbende gegevensbronnen
  • Lijsten met databases
  • Schemagegevens
  • Eigendom van gegevens
  • Data-stewardship
  • Beveiliging

Schaal vervolgens langzaam door meer domeineigenaren en gegevensstewards te betrekken en door meer classificaties en vertrouwelijkheidslabels toe te voegen. Deze toevoegingen verbeteren de zoekervaring en zorgen voor beter beheer van gegevenstoegang.

Voor uw aangepaste metagegevenskenmerken, zoals lijsten met domeinen en toepassingsmetagegevens, kunt u extra typedefinities maken in Azure Purview.

Voor uw domeingerichte architectuur kunt u uw Azure Purview-verzamelingen en woordenlijsten uitlijnen op uw gegevensdomeinen. Azure Purview Collections organiseren assets en bronnen. U kunt een verzameling gebruiken als grens voor uw assets en bronnen en deze uitlijnen op een bepaald domein. U kunt hetzelfde doen met uw woordenlijst. Maak hiërarchiestructuren in uw woordenlijst en lijn deze uit met uw domeinen. Vraag uw domeinen om eigenaar te worden van het maken van relaties tussen uw woordenlijsttermen en verzamelingskenmerken. Dit zorgt voor transparantie van gegevenseigendom en verbetert de semantiek van uw gegevens.

Azure Cosmos DB gebruiken om knowledge graph van de organisatie te maken

Er is een groeiende trend in de branche om gegevensinzichten dichter bij gegevensanalisten en wetenschappers te brengen met behulp van portals die intensief gebruikmaken van metagegevens. Deze trend staat bekend als waarneembaarheid van gegevens. Waarneembaarheid van gegevens maakt gebruik van concepten zoals metadata lake, kennisgrafieken of metagegevensgrafieken om platforms te beschrijven waar metagegevens zijn gecentraliseerd. Dit is een goede manier om een uniforme weergave te maken van hoe gegevens worden gebruikt en afkomstig in uw organisatie wanneer u een gedistribueerd gegevensnet gebruikt.

Een oplossing voor gegevensanalyse moet beschrijven hoe gegevens worden gebruikt en de relaties tussen entiteiten, zoals brongegevens en gegevensproducten, en tussen gegevensproducten van het ene domein en afhankelijke producten uit een ander domein. U kunt een grafiekdatabase of aangepaste gebruikersinterface gebruiken om deze relaties te modelleren.

Als u een uniforme weergave wilt maken van de gegevens van uw organisatie met aangepaste gebruikerservaring, bekijkt u Azure Cosmos DB. Azure Cosmos DB is een wereldwijd gedistribueerde databaseservice met meerdere modellen met NoSQL-eindpunten. Het biedt een grafiekdatabaseservice via Azure Cosmos DB voor Apache Gremlin voor het opslaan van enorme grafieken met miljarden hoekpunten en randen.

Het eindresultaat van de Azure Cosmos DB-architectuur is een organisatiebrede grafiek die een uniforme weergave biedt van alle gegevens in uw organisatie met behulp van end-to-end context. Het metagegevensmeer gaat niet alleen over het opslaan van informatie. Het organiseert ook uw metagegevens actief als een grafiek door deze te verbinden met andere services en hulpprogramma's. Met deze georganiseerde grafiek kunt u veel onderwerpgebieden kruislings correleren, waaronder:

  • Domeinen
  • Gegevenskwaliteit
  • Gegevensgebruik
  • Bedrijfsmogelijkheden
  • Toepassingsfuncties
  • Technische architectuurinformatie
  • Operationele gebeurtenissen
  • Organisatiemetagegevens
  • Metagegevens van toepassingseigendom
  • Informatie-locatie
  • Informatie over het beheer van de levenscyclus van toepassingen

Volgende stappen