Delen via


Data catalogus

Een gegevenscatalogus registreert en onderhoudt gegevensgegevens op een gecentraliseerde locatie, zodat deze beschikbaar is voor uw organisatie. Het minimaliseert de kans dat verschillende projectteams redundante gegevens opnemen, waardoor dubbele gegevensproducten worden voorkomen. U wordt aangeraden een gegevenscatalogusservice te maken om de metagegevens van gegevensproducten te definiëren die u opslaat in landingszones voor gegevens.

Cloudanalyses zijn afhankelijk van Microsoft Purview om zakelijke gegevensbronnen te registreren, ze te classificeren, gegevenskwaliteit te garanderen en zeer veilige, selfservicetoegang te bieden.

Microsoft Purview is een tenantservice die kan communiceren met elke gegevenslandingszone. Er wordt een beheerd virtueel netwerk gemaakt en geïmplementeerd in de regio van uw gegevenslandingszone. U kunt Azure Managed Virtual Network Integration Runtimes (IR) implementeren binnen deze beheerde virtuele netwerken in elke beschikbare Microsoft Purview-regio. De IR van het beheerde virtuele netwerk kan vervolgens privé-eindpunten gebruiken om veilig verbinding te maken met de ondersteunde gegevensbronnen en deze te scannen. Deze aanpak helpt bij het isoleren en beveiligen van het proces voor gegevensintegratie. Zie Beheerde virtuele netwerken gebruiken met uw Microsoft Purview-account voor meer informatie.

Als u Azure Databricks gebruikt, raden we u aan Azure Databricks Unity Catalog te gebruiken naast Microsoft Purview. Unity Catalog biedt gecentraliseerd toegangsbeheer, controle, herkomst en mogelijkheden voor gegevensdetectie in Databricks-werkruimten. Zie Best practices voor Unity Catalog voor meer informatie.

Notitie

Dit artikel richt zich op het gebruik van Microsoft Purview voor governance, maar uw onderneming kan investeringen hebben in andere producten, zoals Alation, Okera of Collibra. Deze oplossingen zijn gebaseerd op abonnementen. U wordt aangeraden ze te implementeren in de landingszone voor gegevensbeheer. Hiervoor is mogelijk aangepaste integratie vereist.

Gegevensdetectie

Gegevensdetectie weerspiegelt de status van alle gegevens waarvan de onderneming eigenaar is. Deze gegevens worden de gegevensdomein genoemd. Tijdens gegevensdetectie wordt de gegevensomgeving gescand en geclassificeerd. Het proces voor het scannen van gegevens maakt rechtstreeks verbinding met de gegevensbron volgens een vast schema.

Wanneer u een nieuwe gegevenslandingszone aan de omgeving toevoegt, moeten de gekoppelde data lakes en polyglot persistentiebronnen worden geregistreerd als bronnen voor de datacataloguscrawlers die moeten worden gescand.

Met geautomatiseerde detectie van uw gegevensomgeving om de catalogus te vullen, kunt u het volgende doen:

  • Metagegevens verkennen vanuit Azure- en on-premises gegevensbronnen
  • Uw data lakes, blobs en andere ondersteunde doelen scannen
  • Schema extraheren uit uw gegevensdoelen voor XML-, TSV-, CSV-, PSV-, SSV-, JSON-, Parquet-, Avro- en ORC-bestandstypen
  • Automatische catalogusupdates toestaan via configureerbare planning van scans en scanregelsets

Belangrijk

Wanneer u een nieuwe gegevenslandingszone toevoegt aan de omgeving, registreert u de gekoppelde data lakes en polyglot opslag via Azure DevOps als bron voor de datacataloguscrawlers om te scannen, te beheren en gegevensintegriteit te waarborgen.

Gegevensclassificatie

Met Microsoft Purview kunt u systeem- of aangepaste gegevensclassificaties toepassen op bestands-, tabel- of kolomassets.

Gegevensclassificaties zijn net als onderwerptags. Microsoft Purview markeert en identificeert de inhoud van specifieke gegevenstypen die tijdens het scannen in uw gegevensomgeving zijn gevonden. U gebruikt vertrouwelijkheidslabels om de categorieën classificatietypen binnen uw organisatiegegevens te identificeren. U kunt ook vertrouwelijkheidslabels gebruiken om het beleid te groeperen dat u op elke categorie wilt toepassen. Microsoft Purview maakt gebruik van dezelfde typen gevoelige informatie als Microsoft 365, zodat u uw bestaande beveiligingsbeleid en -beveiligingen kunt uitbreiden voor uw hele inhoud en gegevensomgeving.

Microsoft Purview kan documenten scannen en automatisch classificeren. Als u bijvoorbeeld een bestand hebt met de naam multiple.docx en het een nationaal id-nummer bevat in de inhoud, voegt Microsoft Purview een classificatie toe, zoals EU National Identification Number op de detailpagina van de asset.

Microsoft Defender voor SQL is een functie die beschikbaar is voor Azure SQL Database en Azure SQL Managed Instance. Het bevat functionaliteit voor het detecteren en classificeren van gevoelige gegevens, het zichtbaar maken en inperken van potentiële beveiligingsproblemen in uw database, en het detecteren van afwijkende activiteiten die kunnen duiden op een bedreiging van de database. Microsoft Defender voor SQL biedt één goto-locatie voor het inschakelen en beheren van deze mogelijkheden.

Volgende stappen