Comprendere la struttura di base di una query Kusto

Completato

Le organizzazioni di tutti i settori gestiscono un flusso costante di dati e devono trasformare questi dati in informazioni significative e utilizzabili. Nello scenario meteorologico è stato ottenuto un set di dati con dati sulle tempeste dagli Stati Uniti. In questa unità si apprenderà la struttura di base del Linguaggio di query Kusto (KQL) in modo che sia possibile usarlo per analizzare e interpretare questo set di dati.

Che cos'è una query Kusto?

Una query Kusto è una richiesta di sola lettura per elaborare i dati e restituire i risultati. La richiesta è formulata in testo semplice, facile da leggere, da scrivere e da automatizzare. Una query Kusto include una o più istruzioni di query e restituisce i dati in un formato tabulare o grafico.

Le istruzioni di query tabulari contengono zero o più operatori. Ogni operatore inizia con un input tabulare e restituisce un output tabulare. Gli operatori vengono sequenziati da una pipe ( | ). I dati fluiscono, o vengono sottoposti a piping, da un operatore all'altro. I dati vengono filtrati o modificati a ogni passaggio e inseriti nel passaggio seguente.

Si pensi a un grafico a imbuto, dove si inizia con un'intera tabella dati. Ogni volta che i dati passano attraverso un altro operatore, vengono filtrati, riorganizzati o riepilogati. Poiché il piping delle informazioni da un operatore a un altro è sequenziale, l'ordine dell'operatore della query è importante. Alla fine del grafico a imbuto, rimane un output affinato.

Questi operatori sono specifici per KQL, anche se spesso presentano parallelismi con SQL o altri linguaggi.

Di seguito è descritta una query di esempio:

StormEvents 
| where StartTime between (datetime(2007-11-01) .. datetime(2007-12-01))
| where State == "FLORIDA"  
| count 

La query inizia con un riferimento a una tabella denominata StormEvents e contiene gli operatori where e count. Ogni operatore è separato da una pipe. Le righe di dati per la tabella di origine vengono quindi filtrate in base al valore della colonna StartTime e filtrate in base al valore della colonna State. Nell'ultima linea la query restituisce una tabella con una singola colonna e una singola riga contenente il conteggio delle righe rimanenti.

Nelle unità successive si effettuerà la connessione a un set di dati e si scopriranno alcuni degli operatori più comunemente usati. Si useranno quindi gli operatori per rispondere alle domande su un set di dati di esempio contenente dati meteorologici statunitensi.