Självstudiekurs om realtidsanalys del 5: Använda avancerade KQL-frågor

Kommentar

Den här självstudien är en del av en serie. För föregående avsnitt, se: Självstudie del 4: Utforska dina data med KQL och SQL.

Skapa en KQL-frågeuppsättning

I följande steg använder du funktionerna för avancerad dataanalys i Kusto-frågespråk för att köra frågor mot de två tabeller som du har matat in i databasen.

  1. Bläddra till din KQL-databas med namnet NycTaxiDB.

  2. Välj KQL-frågeuppsättning för nytt relaterat objekt>

    Screenshot of the New related item dropdown showing the option to create a new related KQL queryset.

  3. Ange nyctaxiqs som KQL-frågeuppsättningens namn.

  4. Välj Skapa. KQL-frågeuppsättningen öppnas med flera exempelfrågor som fylls i automatiskt.

Fråga efter data

I det här avsnittet går vi igenom några av fråge- och visualiseringsfunktionerna i KQL-frågeuppsättningen. Kopiera och klistra in frågorna i din egen frågeredigerare för att köra och visualisera resultatet.

  1. Kör följande fråga för att returnera de 10 främsta upphämtningsplatserna i New York City för gula taxibilar.

    nyctaxitrips
    | summarize Count=count() by PULocationID
    | top 10 by Count
    

    Screenshot of query result in Real-Time Analytics in Microsoft Fabric.

  2. Den här frågan lägger till ett steg i föregående fråga. Kör frågan för att leta upp motsvarande zoner på de 10 främsta upphämtningsplatserna med hjälp av tabellen Platser . Uppslagsoperatorn utökar kolumnerna i en faktatabell med uppslagsvärden i en dimensionstabell.

    nyctaxitrips
    | lookup (Locations) on $left.PULocationID == $right.LocationID
    | summarize Count=count() by Zone
    | top 10 by Count
    | render columnchart
    

    Screenshot of top 10 location results in Real-Time Analytics in Microsoft Fabric.

  3. KQL tillhandahåller även maskininlärningsfunktioner för att identifiera avvikelser. Kör följande fråga för att kontrollera avvikelser i tipsen som ges av kunderna i Manhattan-stadsdelen. Den här frågan använder funktionen series_decompose_anomalies.

    nyctaxitrips
    | lookup (Locations) on $left.PULocationID==$right.LocationID
    | where Borough == "Manhattan"
    | make-series s1 = avg(tip_amount) on tpep_pickup_datetime from datetime(2022-06-01) to datetime(2022-06-04) step 1h
    | extend anomalies = series_decompose_anomalies(s1)
    | render anomalychart with (anomalycolumns=anomalies)
    

    Screenshot of anomaly chart result in Real-Time Analytics in Microsoft Fabric.

    Hovra över de röda punkterna för att se värdena för avvikelserna.

  4. Du kan också använda den förutsägande kraften i funktionen series_decompose_forecast. Kör följande fråga för att säkerställa att de tillräckligt många taxibilarna fungerar i Manhattan-stadsdelen och prognostisera antalet taxibilar som behövs per timme.

    nyctaxitrips
    | lookup (Locations) on $left.PULocationID==$right.LocationID
    | where Borough == "Manhattan"
    | make-series s1 = count() on tpep_pickup_datetime from datetime(2022-06-01) to datetime(2022-06-08)+3d step 1h by PULocationID
    | extend forecast = series_decompose_forecast(s1, 24*3)
    | render timechart
    

    Screenshot of forecast results in Real-Time Analytics in Microsoft Fabric.

Mer information om uppgifter som utförs i den här självstudien finns i:

Gå vidare