Kurz analýzy v reálném čase – část 5: Použití pokročilých dotazů KQL

Poznámka:

Tento kurz je součástí série. Předchozí část najdete v části Kurz 4: Prozkoumání dat pomocí KQL a SQL.

Vytvoření sady dotazů KQL

V následujícím kroku použijete pokročilé možnosti analýzy dat dotazovací jazyk Kusto k dotazování dvou tabulek, které jste do databáze ingestují.

  1. Přejděte do databáze KQL s názvem NycTaxiDB.

  2. Výběr nové související položky>KQL Queryset

    Screenshot of the New related item dropdown showing the option to create a new related KQL queryset.

  3. Jako název sady dotazů KQL zadejte nyctaxiqs .

  4. Vyberte Vytvořit. Otevře se sada dotazů KQL s několika automaticky vyplněnými ukázkovými dotazy.

Zadávání dotazů na data

Tato část vás provede některými možnostmi dotazu a vizualizace sady dotazů KQL. Zkopírujte a vložte dotazy do vlastního editoru dotazů, abyste mohli výsledky spustit a vizualizovat.

  1. Spuštěním následujícího dotazu vrátíte prvních 10 míst vyzvednutí v New Yorku pro žluté taxi.

    nyctaxitrips
    | summarize Count=count() by PULocationID
    | top 10 by Count
    

    Screenshot of query result in Real-Time Analytics in Microsoft Fabric.

  2. Tento dotaz přidá krok do předchozího dotazu. Spuštěním dotazu vyhledejte odpovídající zóny 10 nejlepších umístění vyzvednutí pomocí tabulky Umístění . Operátor vyhledávání rozšiřuje sloupce tabulky faktů o hodnoty v tabulce dimenzí.

    nyctaxitrips
    | lookup (Locations) on $left.PULocationID == $right.LocationID
    | summarize Count=count() by Zone
    | top 10 by Count
    | render columnchart
    

    Screenshot of top 10 location results in Real-Time Analytics in Microsoft Fabric.

  3. KQL také poskytuje funkce strojového učení pro detekci anomálií. Spuštěním následujícího dotazu zkontrolujte anomálie v tipech od zákazníků v manhattanském obvodu. Tento dotaz používá funkci series_decompose_anomalies.

    nyctaxitrips
    | lookup (Locations) on $left.PULocationID==$right.LocationID
    | where Borough == "Manhattan"
    | make-series s1 = avg(tip_amount) on tpep_pickup_datetime from datetime(2022-06-01) to datetime(2022-06-04) step 1h
    | extend anomalies = series_decompose_anomalies(s1)
    | render anomalychart with (anomalycolumns=anomalies)
    

    Screenshot of anomaly chart result in Real-Time Analytics in Microsoft Fabric.

    Najeďte myší na červené tečky a zobrazte hodnoty anomálií.

  4. Můžete také použít prediktivní výkon series_decompose_forecast funkce. Spuštěním následujícího dotazu se ujistěte, že dostatek taxíků pracuje v manhattanském obvodu a předpovídá počet taxíků potřebných za hodinu.

    nyctaxitrips
    | lookup (Locations) on $left.PULocationID==$right.LocationID
    | where Borough == "Manhattan"
    | make-series s1 = count() on tpep_pickup_datetime from datetime(2022-06-01) to datetime(2022-06-08)+3d step 1h by PULocationID
    | extend forecast = series_decompose_forecast(s1, 24*3)
    | render timechart
    

    Screenshot of forecast results in Real-Time Analytics in Microsoft Fabric.

Další informace o úlohách provedených v tomto kurzu najdete v těchto tématech:

Další krok