Esercizio: Usare le query per esplorare le tendenze

Completato

Sono stati esaminati i dati non elaborati e l'intervallo di un set di dati meteorologici sconosciuti. In questa unità verranno usate visualizzazioni per vedere come vengono distribuiti i dati.

Diagramma temporale

Alcune delle colonne di dati visualizzate nell'ultima unità erano di tipo DateTime e rappresentavano gli orari di inizio e di fine degli eventi temporaleschi. Per vedere in quali date si sono verificati eventi temporaleschi, è possibile tracciare un grafico che rappresenti il conteggio delle voci in funzione del tempo.

Nell'unità precedente è stato usato un subset di 50 righe di dati, mentre questa unità sarà usato il set di dati completo.

La seguente query crea un grafico temporale con il numero di eventi temporaleschi per un intervallo di 8 ore in funzione del tempo.

  1. Eseguire la query riportata di seguito:

    Eseguire la query

    StormEvents
    | summarize Count = count() by bin (StartTime, 8h)
    | render timechart
    

    Dovrebbero essere visualizzati risultati simili all'immagine seguente:

    Screenshot dei risultati del grafico temporale.

  2. Esaminare il grafo risultante. Sono visibili lacune o anomalie evidenti?

Eventi in base allo stato

Un altro approccio per esaminare la distribuzione dei dati consiste nel raggrupparli in base al luogo dell'evento, in questo caso lo stato, per identificare possibili tendenze nella distribuzione.

  1. Eseguire la query riportata di seguito:

    Eseguire la query

    StormEvents
    | summarize event = count() by State
    | sort by event
    | render barchart 
    

    Dovrebbero essere visualizzati risultati simili all'immagine seguente:

    Screenshot del grafico a barre che mostra i danni per stato.

  2. Esaminare il grafo risultante. L'elenco comprende 67 stati diversi, compresi quelli che non sono stati ufficiali degli Stati Uniti, come le "Samoa americane" e le "acque delle Hawaii". Questo tipo di distribuzione geografica delle tempeste ha senso?

  3. È possibile esaminare i dati sottostanti selezionando la scheda Tabella sopra il grafico. I numeri reali consentono di comprendere meglio la distribuzione dei dati?

    Screenshot della tabella dati per il grafico dei danni.

Eventi in base alla posizione geografica

Abbiamo visto come il numero di eventi varia in base al tempo e allo stato. Il mapping dello schema mostrava che ogni voce relativa a un evento temporalesco contiene informazioni sulla latitudine e sulla longitudine. Esaminiamo come i dati si raggruppano su una mappa.

  1. La seguente query raggruppa gli eventi per cella geografica e conteggia il numero di eventi in ogni cella. Questi risultati vengono visualizzati su una mappa in modo che le dimensioni del cerchio corrispondano al numero di eventi nella cella. Eseguire la query riportata di seguito:

    Eseguire la query

    StormEvents
    | project BeginLon, BeginLat
    | where isnotnull(BeginLat) and isnotnull(BeginLon)
    | summarize count_summary=count() by hash = geo_point_to_s2cell(BeginLon, BeginLat,6)
    | project geo_s2cell_to_central_point(hash), count_summary
    | extend Events = "count"
    | render piechart with (kind = map)
    

    Dovrebbero essere visualizzati risultati simili all'immagine seguente:

    Screenshot del grafico della mappa risultante con i cerchi che mostrano il numero di eventi in una particolare area.

  2. Provare a ingrandire premendo CTRL +. Dopo aver osservato i tipi di tempeste, è comprensibile che ci siano più tempeste di questo tipo nell'area nord-orientale degli Stati Uniti e nel Golfo del Messico?