Partager via


Data Catalog

Le catalogue de données inscrit et conserve les informations sur les données dans un emplacement centralisé et les met à la disposition de l’organisation. Il garantit que les entreprises évitent les jeux de données en double causés par l’ingestion de données redondantes par différentes équipes de projet.

Nous vous recommandons de créer un service de catalogue de données pour définir les métadonnées des produits de données stockés dans les zones d'atterrissage des données.

L'analyse à l'échelle du cloud dépend de Microsoft Purview pour enregistrer les sources de données de l'entreprise, les classer, assurer la qualité des données et offrir un accès sécurisé en libre-service.

Microsoft Purview est un service basé sur les locataires et peut communiquer avec chaque zone d'atterrissage des données en créant un réseau virtuel géré déployé dans la région de vos zones d'atterrissage des données. Vous pouvez déployer Azure Managed Virtual Network Integration Runtimes (IR) au sein des réseaux virtuels gérés de Microsoft Purview dans n'importe quelle région disponible de Microsoft Purview. À partir de là, le réseau virtuel géré IR peut utiliser des points de terminaison privés pour se connecter en toute sécurité aux sources de données prises en charge et les analyser. Pour plus d'informations, voir Utiliser le réseau virtuel géré avec votre compte Microsoft Purview. La création d'un RI de réseau virtuel géré au sein d'un réseau virtuel géré garantit que le processus d'intégration des données est isolé et sécurisé.

Remarque

Bien que cette documentation se concentre principalement sur l'utilisation de Microsoft Purview pour la gouvernance, les entreprises peuvent avoir investi dans d'autres produits, tels que Alation, Okera ou Collibra. Ces solutions sont basées sur des abonnements et nous vous recommandons de les déployer dans la zone d'atterrissage de la gestion des données. N’oubliez pas qu’une intégration personnalisée peut être nécessaire.

Découverte de données

La découverte des données reflète l'état de toutes les données appartenant à l'entreprise. Ces données sont appelées patrimoine de données. Lors de la découverte des données, le patrimoine de données est analysé puis classé. Le processus d’analyse des données se connecte directement à la source de données selon une planification définie.

Lorsque vous ajoutez une nouvelle zone d'atterrissage des données à l'environnement, les lacs de données et les sources de persistance polyglottes associés doivent être enregistrés en tant que sources à analyser par les crawlers du catalogue de données.

Avec la découverte automatisée de votre patrimoine de données pour remplir le catalogue, vous pouvez :

  • Analyser les métadonnées provenant de sources de données Azure et locales
  • Analyser vos lacs de données, objets blob et autres cibles prises en charge
  • Extraire le schéma de vos cibles de données pour les types de fichiers XML, TSV, CSV, PSV, SSV, JSON, Parquet, Avro et ORC
  • Cela permet des mises à jour automatiques du catalogue via une planification configurable des analyses et des ensembles de règles d’analyse

Important

Lorsque vous ajoutez une nouvelle zone d'atterrissage des données à l'environnement, enregistrez les lacs de données et le stockage polyglotte associés via Azure DevOps en tant que source pour que les crawlers du catalogue de données puissent analyser, gouverner et gérer l'intégrité des données.

Classification des données

Microsoft Purview vous permet d’appliquer des classifications système ou des classifications de données personnalisées sur une ressource de type fichier, table ou colonne.

Les classifications de données sont similaires aux étiquettes d’objet. Microsoft Purview marque et identifie le contenu de types de données spécifiques trouvés dans votre patrimoine de données lors de l’analyse. Vous utilisez les étiquettes de confidentialité pour identifier des catégories de types de classifications dans les données de l’organisation. Vous pouvez également utiliser des étiquettes de confidentialité pour regrouper les stratégies à appliquer à chaque catégorie. Microsoft Purview utilise les mêmes types d’informations sensibles que Microsoft 365, ce qui vous permet d’étendre vos protections et vos stratégies de sécurité existantes à l’ensemble de votre patrimoine de contenus et de données.

Microsoft Purview peut analyser et classer automatiquement des documents. Par exemple, si vous avez un fichier nommé multiple.docx contenant un numéro d’identification national, Microsoft Purview ajoute une classification telle que EU National Identification Number à la page des détails de la ressource.

Microsoft Defender pour SQL est une fonctionnalité disponible pour Azure SQL Database, Azure SQL Managed Instance et Azure Synapse Analytics. Il inclut des fonctionnalités permettant de découvrir et de classifier les données sensibles, de présenter et de corriger les vulnérabilités de votre base de données et de détecter les activités anormales susceptibles d’indiquer une menace ciblant votre base de données. Microsoft Defender pour SQL vous permet d’activer et de gérer ces fonctionnalités à partir d’un seul et même emplacement.

Étapes suivantes