Comment détecter les sources de données dans Azure Data Catalog

Important

Les nouveaux comptes Azure Data Catalog ne peuvent plus être créés.

Pour les fonctionnalités de catalogue de données mises à jour, utilisez le service Microsoft Purview, qui offre une gouvernance des données unifiée pour l’ensemble de votre patrimoine de données.

Si vous utilisez déjà Azure Data Catalog, vous devez créer un plan de migration pour que votre organisation se déplace vers Microsoft Purview d’août 2025.

Introduction

Azure Data Catalog est un service cloud entièrement géré qui permet d’inscrire et de détecter les sources de données d’entreprise. En d’autres termes, Data Catalog aide les gens à détecter, à comprendre et à utiliser des sources de données. Il permet aux organisations de mieux exploiter leurs données existantes. Une fois qu’une source de données a été inscrite auprès d’Azure Data Catalog, ses métadonnées sont indexées par le service. Vous pouvez donc effectuer des recherches pour détecter les données dont vous avez besoin.

Recherche et filtrage

Dans Data Catalog, la détection utilise deux mécanismes principaux : la recherche et le filtrage.

La recherche est conçue pour être intuitive et puissante. Par défaut, les termes de recherche sont comparés à toutes les propriétés du catalogue, notamment aux annotations fournies par l’utilisateur.

Le filtrage est conçu pour compléter la recherche. Vous pouvez sélectionner des caractéristiques telles que les experts, le type de source de données, le type d’objet ou les balises. Vous pouvez afficher uniquement les ressources de données correspondant à votre recherche et limiter les résultats de recherche aux ressources correspondantes.

En combinant recherche et filtrage, vous pouvez parcourir rapidement les sources de données qui ont été inscrites dans Data Catalog pour découvrir celles qui vous sont utiles.

Syntaxe de recherche

La recherche en texte libre par défaut est simple et intuitive. Cependant, vous pouvez également utiliser la syntaxe de recherche de Data Catalog pour mieux contrôler les résultats de recherche. La recherche avec Data Catalog prend en charge les techniques suivantes :

Technique Utilisation Exemple
Recherche de base Recherche de base à l’aide d’un ou plusieurs termes de recherche. Les résultats sont constitués de toutes les ressources correspondant à une propriété quelconque avec un ou plusieurs termes spécifiés. sales data
Étendue de la propriété Retourne des sources de données uniquement si le terme de recherche correspond à la propriété spécifiée. name:finance
Opérateurs booléens Les opérations booléennes permettent d’étendre et de limiter une recherche. finance NOT corporate
Parenthèses de regroupement Utilisez des parenthèses pour grouper les parties de la requête à isoler logiquement, notamment avec des opérateurs booléens. name:finance AND (tags:Q1 OR tags:Q2)
Opérateurs de comparaison Utilisez des comparaisons autres que l’égalité pour les propriétés comportant des types de données numériques et de date. modifiedTime > "11/05/2014"

Pour plus d’informations sur la recherche Data Catalog, consultez l’article de l’API REST Azure Data Catalog.

Mise en surbrillance des correspondances

Lorsque vous affichez les résultats de la recherche, les propriétés affichées correspondant aux termes de recherche spécifiés (par exemple, le nom de la ressource de données, sa description ou ses balises) sont mises en surbrillance. Il est ainsi plus facile d’identifier la raison pour laquelle une ressource de données spécifique a été retournée par une recherche.

Remarque

Pour désactiver la mise en surbrillance des correspondances, utilisez le bouton Mettre en surbrillance dans le portail Data Catalog.

Lorsque vous affichez les résultats de la recherche, il n’est pas toujours évident de comprendre pourquoi une ressource de données a été retournée, même lorsque la mise en surbrillance des correspondances est activée. Étant donné que, par défaut, toutes les propriétés font l’objet de la recherche, une ressource de données peut être retournée si une correspondance avec une propriété de colonne est détectée. Et dans la mesure où plusieurs utilisateurs peuvent annoter des ressources de données inscrites avec leurs propres balises et descriptions, les métadonnées ne sont pas toutes affichées dans la liste des résultats de la recherche.

Dans l’affichage en mosaïque par défaut, chaque vignette affichée dans les résultats de recherche inclut l’icône Afficher les correspondances des termes recherchés. Vous pouvez ainsi visualiser rapidement le nombre de correspondances, ainsi que leur emplacement, et y accéder si vous le souhaitez.

The View search term matches icon is selected in the tile, showing a drop menu of all matched locations.

Résumé

L’inscription des sources de données dans Data Catalog facilite leur détection et leur compréhension, car elle consiste à copier les métadonnées descriptives et structurelles des sources de données dans le service Catalog. Une fois qu’une source de données a été inscrite, vous pouvez la détecter grâce aux fonctionnalités de filtrage et de recherche du portail Data Catalog.

Étapes suivantes