Comprendre la structure de base d’une requête Kusto

Effectué

Dans tous les secteurs d’activité, les organisations gèrent un flux constant de données qu’elles doivent convertir en insights significatifs et actionnables. Dans le scénario météorologique, vous avez obtenu un jeu de données sur les tempêtes aux États-Unis. Dans cette unité, vous allez découvrir la structure de base du langage de requête Kusto (KQL) afin de pouvoir l’utiliser pour analyser et interpréter ce jeu de données.

Qu’est-ce qu’une requête Kusto ?

Une requête Kusto est une requête en lecture seule de traitement de données et de retour de résultats. La requête est exprimée sous forme de texte brut facile à lire, créer et automatiser. Une requête Kusto contient une ou plusieurs instructions de requête et retourne des données sous forme de tableau ou de graphe.

Les instructions de requête tabulaire contiennent zéro ou plusieurs opérateurs. Chaque opérateur commence par une entrée tabulaire et retourne une sortie tabulaire. Les opérateurs sont séquencés par une barre verticale (|). Les données sont transmises d’un opérateur au suivant à l’aide du pipe (barre verticale). Les données sont filtrées ou manipulées à chaque étape et alimentent l’étape suivante.

Imaginez un entonnoir dans lequel vous placez une table de données entière. Chaque fois que les données passent par un autre opérateur, elles sont filtrées, réorganisées ou synthétisées. Dans la mesure où le passage des informations d’un opérateur à un autre est séquentiel, l’ordre des opérateurs de la requête est important. À la fin de l’entonnoir, il vous reste une sortie affinée.

Ces opérateurs sont spécifiques au langage KQL, même s’ils ont souvent des similitudes avec le langage SQL ou d’autres langages.

Examinons un exemple de requête :

StormEvents 
| where StartTime between (datetime(2007-11-01) .. datetime(2007-12-01))
| where State == "FLORIDA"  
| count 

La requête commence par une référence à une table appelée StormEvents. Elle contient les opérateurs where et count. Chaque opérateur est séparé par une barre verticale. Les lignes de données de la table source sont filtrées par la valeur de la colonne StartTime, puis filtrées par la valeur de la colonne State. Sur la dernière ligne, la requête retourne une table avec une seule colonne et une seule ligne contenant le nombre de lignes restantes.

Dans les prochaines unités, vous allez vous connecter à un jeu de données et découvrir certains des opérateurs les plus couramment utilisés. Vous utiliserez ensuite les opérateurs pour répondre à des questions sur un exemple de jeu de données qui contient des données météorologiques concernant les États-Unis.