Självstudiekurs om realtidsanalys del 5: Använda avancerade KQL-frågor
Kommentar
Den här självstudien är en del av en serie. För föregående avsnitt, se: Självstudie del 4: Utforska dina data med KQL och SQL.
Skapa en KQL-frågeuppsättning
I följande steg använder du funktionerna för avancerad dataanalys i Kusto-frågespråk för att köra frågor mot de två tabeller som du har matat in i databasen.
Bläddra till din KQL-databas med namnet NycTaxiDB.
Välj KQL-frågeuppsättning för nytt relaterat objekt>
Ange nyctaxiqs som KQL-frågeuppsättningens namn.
Välj Skapa. KQL-frågeuppsättningen öppnas med flera exempelfrågor som fylls i automatiskt.
Fråga efter data
I det här avsnittet går vi igenom några av fråge- och visualiseringsfunktionerna i KQL-frågeuppsättningen. Kopiera och klistra in frågorna i din egen frågeredigerare för att köra och visualisera resultatet.
Kör följande fråga för att returnera de 10 främsta upphämtningsplatserna i New York City för gula taxibilar.
nyctaxitrips | summarize Count=count() by PULocationID | top 10 by Count
Den här frågan lägger till ett steg i föregående fråga. Kör frågan för att leta upp motsvarande zoner på de 10 främsta upphämtningsplatserna med hjälp av tabellen Platser . Uppslagsoperatorn utökar kolumnerna i en faktatabell med uppslagsvärden i en dimensionstabell.
nyctaxitrips | lookup (Locations) on $left.PULocationID == $right.LocationID | summarize Count=count() by Zone | top 10 by Count | render columnchart
KQL tillhandahåller även maskininlärningsfunktioner för att identifiera avvikelser. Kör följande fråga för att kontrollera avvikelser i tipsen som ges av kunderna i Manhattan-stadsdelen. Den här frågan använder funktionen series_decompose_anomalies.
nyctaxitrips | lookup (Locations) on $left.PULocationID==$right.LocationID | where Borough == "Manhattan" | make-series s1 = avg(tip_amount) on tpep_pickup_datetime from datetime(2022-06-01) to datetime(2022-06-04) step 1h | extend anomalies = series_decompose_anomalies(s1) | render anomalychart with (anomalycolumns=anomalies)
Hovra över de röda punkterna för att se värdena för avvikelserna.
Du kan också använda den förutsägande kraften i funktionen series_decompose_forecast. Kör följande fråga för att säkerställa att de tillräckligt många taxibilarna fungerar i Manhattan-stadsdelen och prognostisera antalet taxibilar som behövs per timme.
nyctaxitrips | lookup (Locations) on $left.PULocationID==$right.LocationID | where Borough == "Manhattan" | make-series s1 = count() on tpep_pickup_datetime from datetime(2022-06-01) to datetime(2022-06-08)+3d step 1h by PULocationID | extend forecast = series_decompose_forecast(s1, 24*3) | render timechart
Relaterat innehåll
Mer information om uppgifter som utförs i den här självstudien finns i:
Gå vidare
Feedback
https://aka.ms/ContentUserFeedback.
Kommer snart: Under hela 2024 kommer vi att fasa ut GitHub-problem som feedbackmekanism för innehåll och ersätta det med ett nytt feedbacksystem. Mer information finns i:Skicka och visa feedback för