Partager via


Gestion des données de référence

Les données de référence sont des données qui décrivent les objets autour d’un processus métier. Les données client, données produit et autres données de référence constituent toutes des objets de données de référence. Les données de référence ne sont pas fréquemment modifiées. Par ailleurs, bien qu’elles soient utilisées pour décrire des transactions, elles ne sont pas de nature transactionnelle.

La gestion des données de référence (MDM) est essentielle à tout programme de gouvernance des données, ce qui rend critique la création des données de référence critiques fiables. Créez des données de référence en définissant des entités de données de référence dans le glossaire métier de votre catalogue de données. Vous pouvez inscrire des sources de données dans votre catalogue de données et effectuer une recherche dans plusieurs magasins de données à travers le paysage des données distribuées pour découvrir où se trouvent différentes données de référence.

Vous pouvez mapper les noms de données physiques des données de référence découvertes à votre vocabulaire métier commun dans Microsoft Purview. Vous pouvez également nettoyer, rapprocher et intégrer les données trouvées dans le paysage des données distribuées afin de créer des enregistrements golden stockés dans un système central de gestion des données de référence.

Diagramme illustrant la gestion centralisée des données de référence.

Une fois les données de référence créées et stockées de manière centralisée, elles peuvent être synchronisées avec tous les systèmes qui utilisent des données de référence afin de garantir leur cohérence.

Il est important de gérer la maintenance des données de référence. Identifiez les endroits où a lieu la maintenance, en notant les tâches dans lesquelles des processus métier sont impliqués. Vous pouvez utiliser l’identification des processus d’entreprise et l’analyse CRUD (Create, Read, Update, Delete) pour détecter ces tâches de maintenance. Vous serez alors en mesure de gérer les données. L’élaboration de cette gouvernance des données constitue souvent une tâche manuelle. Cependant, l’exploration des processus et l’analyse des fichiers journaux de base de données peuvent vous y aider.

Solutions de partenaires de données de référence

Microsoft s'est associé à Microsoft Purview pour fournir des intégrations natives pour Microsoft Purview. Évaluez ces produits par rapport aux exigences de données de référence de votre organisation.

Solutions alternatives

En l’absence d’application spécialisée de gestion des données de référence, il est possible de trouver dans l’écosystème Azure certaines des fonctionnalités techniques nécessaires à l’élaboration d’une solution de gestion des données de référence.

  • Qualité des données : vous pouvez renforcer la qualité des données dans vos processus d’intégration lors du chargement sur une plateforme d’analytique. Appliquez par exemple des transformations de la qualité des données dans un pipeline Azure Data Factory à l’aide de scripts codés en dur.

  • Normalisation et enrichissement des données : Azure Maps est disponible pour assurer la vérification et la normalisation des données d’adresse, qui peuvent être utilisées dans Azure Functions et Azure Data Factory. La normalisation des autres données peut exiger le développement de scripts codés en dur.

  • Gestion des données en double : vous pouvez utiliser Azure Data Factory pour dédupliquer les lignes quand il existe suffisamment d’identificateurs disponibles pour obtenir une correspondance exacte. Des scripts codés en dur personnalisés sont probablement requis par la logique pour fusionner les correspondances avec la survivance appropriée.

  • Gérance des données : Power Apps permet de développer rapidement des solutions simples de gérance des données dans Azure. Ces solutions contiennent les interfaces utilisateur appropriées pour la révision, le flux de travail, les alertes et les validations.

Étapes suivantes