Oefening: Query's gebruiken om trends te verkennen

Voltooid

U hebt de onbewerkte gegevens en het bereik van een onbekende meteorologische gegevensset verkend. In deze les gebruikt u visualisaties om te zien hoe de gegevens worden gedistribueerd.

Tijddiagram

Zoals u weet, zijn sommige gegevenskolommen die u in de laatste eenheid hebt gezien, van het type DateTime en vertegenwoordigden ze de begin- en eindtijden voor stormgebeurtenissen. Als u wilt zien welke datums stormgegevensgebeurtenissen hebben, kunt u een telling van vermeldingen versus tijd uitzetten.

Houd er rekening mee dat in de vorige eenheid een subset van 50 gegevensrijen is gebruikt, terwijl in deze eenheid de volledige gegevensset wordt gebruikt.

Met de volgende query wordt een tijdsdiagram gemaakt van het aantal stormgebeurtenissen per bin van 8 uur als een functie van tijd.

  1. Voer de volgende query uit.

    De query uitvoeren

    StormEvents
    | summarize Count = count() by bin (StartTime, 8h)
    | render timechart
    

    U krijgt resultaten die eruitzien als de volgende afbeelding:

    Schermopname van tijddiagramresultaten.

  2. Bekijk de resulterende grafiek. Ziet u duidelijke hiaten of afwijkingen?

Gebeurtenissen op status

Een andere manier om gegevensdistributie te bekijken, is door te groeperen op gebeurtenislocatie (in dit geval staat) om te zien wat voor soort trends kunnen worden begrepen uit de distributie.

  1. Voer de volgende query uit.

    De query uitvoeren

    StormEvents
    | summarize event = count() by State
    | sort by event
    | render barchart 
    

    U krijgt resultaten die eruitzien als de volgende afbeelding:

    Schermopname van staafdiagram met schade per status.

  2. Bekijk de resulterende grafiek. Er staan 67 verschillende staten in de lijst, waaronder staten die geen officiële staten zijn in de VS, zoals 'Amerikaans Samoa' en 'Hawaï-wateren'. Is dit type geografische stormverdeling zinvol?

  3. U kunt de onderliggende gegevens bekijken door het tabblad Tabel boven de grafiek te selecteren. Helpen de werkelijke getallen u beter inzicht te krijgen in de gegevensdistributie?

    Schermopname van gegevenstabel voor schadegrafiek.

Gebeurtenissen op geografische locatie

U hebt gezien hoe het aantal gebeurtenissen varieert op basis van tijd en status. Zoals u weet, heeft de schematoewijzing aangetoond dat elke stormgebeurtenisvermelding latitudinale en lengte-informatie bevat. Laten we eens kijken hoe de gegevensclusters op een kaart staan.

  1. Met de volgende query worden gebeurtenissen gegroepeerd op geografische cel en wordt het aantal gebeurtenissen in elke cel geteld. Deze resultaten worden weergegeven op een kaart, waarbij de cirkelgrootte overeenkomt met het aantal gebeurtenissen in die cel. Voer de volgende query uit.

    De query uitvoeren

    StormEvents
    | project BeginLon, BeginLat
    | where isnotnull(BeginLat) and isnotnull(BeginLon)
    | summarize count_summary=count() by hash = geo_point_to_s2cell(BeginLon, BeginLat,6)
    | project geo_s2cell_to_central_point(hash), count_summary
    | extend Events = "count"
    | render piechart with (kind = map)
    

    U krijgt resultaten die eruitzien als de volgende afbeelding:

    Schermopname van het kaartdiagramresultaat met cirkels met het aantal gebeurtenissen in een bepaald gebied.

  2. Probeer in te zoomen door op Ctrl+te drukken. Nu u de soorten stormen hebt gezien, is het logisch dat er meer van deze soorten stormen zijn in het noordoosten van de VS en de golf van Mexico?