Comment détecter les sources de données dans Azure Data Catalog
Important
Azure Data Catalog a été mis hors service le 15 mai 2024.
Pour les fonctionnalités du catalogue de données, utilisez le service Microsoft Purview, qui offre une gouvernance unifiée des données pour l’ensemble de votre patrimoine de données.
Introduction
Azure Data Catalog est un service cloud entièrement géré qui permet d’inscrire et de détecter les sources de données d’entreprise. En d’autres termes, Data Catalog aide les gens à détecter, à comprendre et à utiliser des sources de données. Il permet aux organisations de mieux exploiter leurs données existantes. Une fois qu’une source de données a été inscrite auprès d’Azure Data Catalog, ses métadonnées sont indexées par le service. Vous pouvez donc effectuer des recherches pour détecter les données dont vous avez besoin.
Recherche et filtrage
Dans Data Catalog, la détection utilise deux mécanismes principaux : la recherche et le filtrage.
La recherche est conçue pour être intuitive et puissante. Par défaut, les termes de recherche sont comparés à toutes les propriétés du catalogue, notamment aux annotations fournies par l’utilisateur.
Le filtrage est conçu pour compléter la recherche. Vous pouvez sélectionner des caractéristiques telles que les experts, le type de source de données, le type d’objet ou les balises. Vous pouvez afficher uniquement les ressources de données correspondant à votre recherche et limiter les résultats de recherche aux ressources correspondantes.
En combinant recherche et filtrage, vous pouvez parcourir rapidement les sources de données qui ont été inscrites dans Data Catalog pour découvrir celles qui vous sont utiles.
Syntaxe de recherche
La recherche en texte libre par défaut est simple et intuitive. Cependant, vous pouvez également utiliser la syntaxe de recherche de Data Catalog pour mieux contrôler les résultats de recherche. La recherche avec Data Catalog prend en charge les techniques suivantes :
Technique | Utiliser | Exemple |
---|---|---|
Recherche de base | Recherche de base à l’aide d’un ou plusieurs termes de recherche. Les résultats sont constitués de toutes les ressources correspondant à une propriété quelconque avec un ou plusieurs termes spécifiés. | sales data |
Étendue de la propriété | Retourne des sources de données uniquement si le terme de recherche correspond à la propriété spécifiée. | name:finance |
Opérateurs booléens | Les opérations booléennes permettent d’étendre et de limiter une recherche. | finance NOT corporate |
Parenthèses de regroupement | Utilisez des parenthèses pour grouper les parties de la requête à isoler logiquement, notamment avec des opérateurs booléens. | name:finance AND (tags:Q1 OR tags:Q2) |
Opérateurs de comparaison | Utilisez des comparaisons autres que l’égalité pour les propriétés comportant des types de données numériques et de date. | modifiedTime > "11/05/2014" |
Pour obtenir plus d’informations sur la recherche Data Catalog, consultez l’article API REST Azure Data Catalog.
Mise en surbrillance des correspondances
Lorsque vous affichez les résultats de la recherche, les propriétés affichées correspondant aux termes de recherche spécifiés (par exemple, le nom de la ressource de données, sa description ou ses balises) sont mises en surbrillance. Il est ainsi plus facile d’identifier la raison pour laquelle une ressource de données spécifique a été retournée par une recherche.
Remarque
Pour désactiver la mise en surbrillance des correspondances, utilisez le bouton Mettre en surbrillance dans le portail Data Catalog.
Lorsque vous affichez les résultats de la recherche, il n’est pas toujours évident de comprendre pourquoi une ressource de données a été retournée, même lorsque la mise en surbrillance des correspondances est activée. Étant donné que, par défaut, toutes les propriétés font l’objet de la recherche, une ressource de données peut être retournée si une correspondance avec une propriété de colonne est détectée. Et dans la mesure où plusieurs utilisateurs peuvent annoter des ressources de données inscrites avec leurs propres balises et descriptions, les métadonnées ne sont pas toutes affichées dans la liste des résultats de la recherche.
Dans l’affichage en mosaïque par défaut, chaque vignette affichée dans les résultats de recherche inclut l’icône Afficher les correspondances des termes recherchés. Vous pouvez ainsi visualiser rapidement le nombre de correspondances, ainsi que leur emplacement, et y accéder si vous le souhaitez.
Résumé
L’inscription des sources de données dans Data Catalog facilite leur détection et leur compréhension, car elle consiste à copier les métadonnées descriptives et structurelles des sources de données dans le service Catalog. Une fois qu’une source de données a été inscrite, vous pouvez la détecter grâce aux fonctionnalités de filtrage et de recherche du portail Data Catalog.
Étapes suivantes
- Pour obtenir des informations détaillées sur la détection des sources de données, consultez Bien démarrer avec Azure Data Catalog.