Data Catalog Référence sur la syntaxe de recherche

Azure Data Catalog est un service entièrement managé hébergé dans Microsoft Azure qui sert de système d’inscription et de système de découverte pour les sources de données d’entreprise. Azure Data Catalog dispose de fonctionnalités qui permettent aux utilisateurs techniques et non techniques de découvrir, de comprendre et d’utiliser des sources de données.

Un aspect clé de la découverte des données est la possibilité de rechercher des sources de données qui ont été inscrites dans Azure Data Catalog. Azure Data Catalog a une syntaxe de recherche puissante qui permet aux utilisateurs de créer facilement des requêtes qui retournent les données dont les utilisateurs ont besoin.

Vue d’ensemble de la syntaxe de recherche

Les recherches Azure Data Catalog sont similaires à celles utilisées par Microsoft Windows et Microsoft Outlook, et doivent être familières aux utilisateurs de ces outils.

Techniques de requête

Technique Utiliser Exemple
Recherche de base Recherche de base à l’aide d’un ou plusieurs termes de recherche. Les résultats sont toutes les ressources correspondant à une propriété quelconque avec un ou plusieurs termes spécifiés. sales data
Étendue de la propriété Renvoie des sources de données uniquement si le terme de recherche est mis en correspondance avec la propriété spécifiée name:finance
Opérateurs booléens Les opérations booléennes permettent d’étendre ou limiter une recherche finance NOT corporate
Parenthèses de regroupement Utilisez des parenthèses pour grouper les parties de la requête à isoler logiquement, notamment lorsque vous appliquez également des opérateurs booléens name:finance AND (tags:tag1 OR tags:tag2)
Opérateurs de comparaison Utilisez des comparaisons autres que l’égalité pour les propriétés comportant des types de données numériques et de date creationTime>"11/05/2014"

Opérateurs de correspondance, de comparaison et booléens

Mot clé/symbole Exemples Fonction
: experts:user@domain.com tags:tag1 Utilisez l’étendue des propriétés et retournez uniquement les ressources où une propriété donnée contient le texte recherché. La sémantique de la requête est « correspondance de préfixe ».
= name=Sales name="Soft Drink Sales" Permet à l’utilisateur de spécifier une correspondance exacte. Seules les ressources qui contiennent la propriété avec exactement la valeur du terme de recherche seront retournées.
<> experts<>user1 tags<>tag2 Opérateur « Non égal à ». Retourne uniquement les ressources qui n’ont pas la valeur indiquée dans la requête de recherche.
"" "social security" Recherche les éléments qui contiennent l’expression exacte sécurité sociale. Il existe un cas particulier d’utilisation de guillemets. Si les guillemets sont utilisés avec l’étendue des propriétés, la sémantique regroupe, mais pas la formulation exacte. Dans ce cas, le comportement est identique à la spécification de la propriété nommée deux fois. Exemple : name:"social security » recherche tous les actifs qui ont une propriété de nom avec le mot social dans celui-ci ou une propriété name avec le mot sécurité dans celle-ci.
() (tags:tag1 AND tags:tag2) OR (name:sales AND database:salesfy15) Recherche les éléments qui contiennent tag1 et tag2 ou qui ont le nom sales dans la base de données salesfy15. Généralement utilisé conjointement avec des opérateurs booléens
>,>= timestamp>"11/05/2014" Recherche les éléments dont la date de modification est postérieure au 05/11/2014.
<,<= timestamp<"11/05/2014" Recherche les éléments dont la date est antérieure au 05/11/2014.
NOT social NOT security Recherche les éléments qui contiennent des éléments sociaux, mais pas de sécurité.
AND social AND security Recherche les éléments qui contiennent des services sociaux et de sécurité.
OR social OR security Recherche les éléments qui contiennent des services sociaux ou de sécurité.
Hsa: has:tags has:description Autorisez le filtrage et retournez uniquement les ressources pour lesquelles une propriété donnée est définie (ou si la propriété représente une collection - elle contient au moins un élément).

Notes

Sémantique des préfixes

Par défaut, toutes les recherches dans Azure Data Catalog sont effectuées à l’aide d’une technique appelée Prefix Match Semantics. Cela signifie que tout terme de recherche démarre une correspondance au début des propriétés de la ressource.

Par exemple, considérez deux ressources fictives inscrites dans Azure Data Catalog avec les noms suivants :

  • SalesData
  • Guillemets vendeurs

Une recherche pour « ventes » retourne ces deux ressources, car leurs noms commencent tous deux par le mot « ventes ». Les versions futures d’Azure Data Catalog incluent la prise en charge des opérateurs de correspondance exacte.

Recherches étendues aux propriétés

La grammaire de requête Azure Data Catalog prend en charge l’étendue des propriétés. Dans l’aperçu actuel, les étendues de propriété respectent la casse. Cela signifie que pour que la requête fonctionne, la casse réelle de la propriété dans la requête de recherche doit correspondre à ce qui se trouve dans l’index.

Les recherches sur des propriétés non valides (propriétés qui n’existent pas) entraînent une erreur.

Les guillemets se comportent d’une manière spéciale lors de l’utilisation de l’étendue des propriétés. Les guillemets dans n’importe quel autre contexte indiquent une formulation exacte. Toutefois, lorsque des guillemets sont utilisés dans l’étendue des propriétés, la sémantique est groupé. Par exemple, name:"Sales Products" effectue une recherche en texte libre en recherchant le contenu de la propriété name à la recherche de « Ventes » ou « Produits ». Par conséquent, la sémantique de : name:"Sales Products" est exactement la même que name:Sales name:Products.

Le principe général pour les noms de propriétés dans Propriétés pouvant être recherchées est camel-case, ce qui signifie que la première lettre est minuscule, puis que chacune des premières lettres de mot est majuscule.

Les propriétés les plus utiles sont répertoriées ci-dessous.

Propriété Utiliser Exemple
name Recherche les éléments où le terme de recherche apparaît dans le nom de la source de données name:finance
description Recherche les éléments où le terme de recherche apparaît dans la description de la source de données description:finance
objectType Recherche les éléments d’un type d’objet spécifique, comme une table, une vue ou un indicateur de performance clé objectType:table
sourceType Recherche les éléments d’un type de source de données spécifique, par exemple SQL Server ou SQL Server Analysis Services multidimensionnel sourceType:"tabular"
tags Recherche les éléments où le terme de recherche apparaît dans les balises de source de données tags:finance
timestamp Recherche les éléments en fonction de la date et de l’heure de leur dernière modification des métadonnées timestamp:>"11/05/2014"
lastRegisteredTime Recherche les éléments en fonction de la date et de l’heure d’inscription de leurs métadonnées lastRegisteredTime:>"11/05/2014"
friendlyName Recherche les éléments où le terme de recherche apparaît dans le nom convivial de la source de données friendlyName: finance
Experts Recherche les éléments où l’expert de la source de données correspond au terme de recherche experts:user@example.com experts:user
termName Recherche les éléments où le terme de recherche apparaît dans les termes du glossaire métier appliqués à la ressource de données termName:marketing

Vous pouvez également utiliser les noms de propriétés suivants avec le filtre « has: » pour case activée où les ressources ont des propriétés spécifiques définies.

Propriété Utiliser Exemple
Prévisualisations Recherche les éléments qui contiennent la préversion has:preview
documentation Recherche les éléments qui contiennent de la documentation has:documentation
tableDataProfiles Recherche les éléments qui ont un profil de table (taille, nombre de lignes, etc.) has:tableDataProfiles
columnsDataProfiles Recherche les éléments qui ont un profil de données de colonne (nombre de valeurs distinctes, min, max, etc.) has:columnsDataProfiles

Exemples de recherche

Les sections suivantes présentent quelques exemples de recherche.

Retourner toutes les ressources avec « ventes » dans le nom

name:sales

Retourner toutes les ressources inscrites après le 20/04/2015 qui incluent les « ventes » dans n’importe quelle propriété

sales AND lastRegisteredTime&gt;"4/20/2015"

Retourner toutes les ressources qui incluent les ventes dans n’importe quelle propriété et qui n’ont pas la balise Q1FY2013

sales AND tags&lt;&gt;"Q1FY2013"

Retourner toutes les ressources qui n’ont pas d’experts ni de documentation affectés

not has:experts and not has:documentation