Delen via


Gegevensherkomst

Gegevensherkomst speelt een belangrijke rol in analyses op cloudschaal. Herkomst toont afhankelijkheden tussen onbewerkte gegevens en eindproducten, waarin de transformaties en manipulaties worden beschreven die die onbewerkte gegevens omzetten in de uiteindelijke gegevensproducten. Het helpt organisaties inzicht te hebben in de kwaliteit van gegevens en naleving te valideren. Er wordt ook context toegevoegd aan gegevenssets en producten waarmee gegevensproducten kunnen worden gedetecteerd en selfservicebaar kunnen worden.

Een primaire gegevenscatalogus is de mogelijkheid om de herkomst tussen gegevensproducten weer te geven. Azure Purview biedt ondersteuning voor het vastleggen van gegevensherkomsten vanuit drie Azure Data Factory-activiteiten:

  • Gegevens kopiĆ«ren
  • Gegevensstroom
  • SSIS-pakket uitvoeren

Naast deze systeemeigen herkomstrapportage biedt Azure Purview ook aangepaste herkomstrapportage via Apache Atlas-hooks of REST API.

Diagram van gegevensherkomst.

Belangrijk

Azure Data Factory- en Azure Synapse-pijplijnen worden aanbevolen voor opnameoplossingen omdat ze gegevensherkomst in Azure Purview inschakelen. Alternatieve opnamepatronen moeten Apache Atlas-API gebruiken om gegevensherkomst bij te werken als onderdeel van hun gegevensverwerking.

Gegevensherkomst van Azure Purview

Een van de platformfuncties van Azure Purview is de mogelijkheid om de herkomst weer te geven tussen gegevenssets die zijn gemaakt door gegevensprocessen. Systemen zoals Data Factory, Data Share en Power BI leggen de herkomst van gegevens vast terwijl deze worden verplaatst. U kunt ook aangepaste herkomstrapportage ophalen via Atlas hooks en REST API.

Tip

Zie de gebruikershandleiding voor Microsoft Purview-gegevenscatalogus herkomst voor meer informatie over ondersteunde systemen en aanbevolen procedures.

Volgende stappen

Meer informatie over het beheren van hoofdgegevens in Azure.