Kurz analýzy v reálném čase – část 5: Použití pokročilých dotazů KQL
Poznámka:
Tento kurz je součástí série. Předchozí část najdete v části Kurz 4: Prozkoumání dat pomocí KQL a SQL.
Vytvoření sady dotazů KQL
V následujícím kroku použijete pokročilé možnosti analýzy dat dotazovací jazyk Kusto k dotazování dvou tabulek, které jste do databáze ingestují.
Přejděte do databáze KQL s názvem NycTaxiDB.
Výběr nové související položky>KQL Queryset
Jako název sady dotazů KQL zadejte nyctaxiqs .
Vyberte Vytvořit. Otevře se sada dotazů KQL s několika automaticky vyplněnými ukázkovými dotazy.
Zadávání dotazů na data
Tato část vás provede některými možnostmi dotazu a vizualizace sady dotazů KQL. Zkopírujte a vložte dotazy do vlastního editoru dotazů, abyste mohli výsledky spustit a vizualizovat.
Spuštěním následujícího dotazu vrátíte prvních 10 míst vyzvednutí v New Yorku pro žluté taxi.
nyctaxitrips | summarize Count=count() by PULocationID | top 10 by Count
Tento dotaz přidá krok do předchozího dotazu. Spuštěním dotazu vyhledejte odpovídající zóny 10 nejlepších umístění vyzvednutí pomocí tabulky Umístění . Operátor vyhledávání rozšiřuje sloupce tabulky faktů o hodnoty v tabulce dimenzí.
nyctaxitrips | lookup (Locations) on $left.PULocationID == $right.LocationID | summarize Count=count() by Zone | top 10 by Count | render columnchart
KQL také poskytuje funkce strojového učení pro detekci anomálií. Spuštěním následujícího dotazu zkontrolujte anomálie v tipech od zákazníků v manhattanském obvodu. Tento dotaz používá funkci series_decompose_anomalies.
nyctaxitrips | lookup (Locations) on $left.PULocationID==$right.LocationID | where Borough == "Manhattan" | make-series s1 = avg(tip_amount) on tpep_pickup_datetime from datetime(2022-06-01) to datetime(2022-06-04) step 1h | extend anomalies = series_decompose_anomalies(s1) | render anomalychart with (anomalycolumns=anomalies)
Najeďte myší na červené tečky a zobrazte hodnoty anomálií.
Můžete také použít prediktivní výkon series_decompose_forecast funkce. Spuštěním následujícího dotazu se ujistěte, že dostatek taxíků pracuje v manhattanském obvodu a předpovídá počet taxíků potřebných za hodinu.
nyctaxitrips | lookup (Locations) on $left.PULocationID==$right.LocationID | where Borough == "Manhattan" | make-series s1 = count() on tpep_pickup_datetime from datetime(2022-06-01) to datetime(2022-06-08)+3d step 1h by PULocationID | extend forecast = series_decompose_forecast(s1, 24*3) | render timechart
Související obsah
Další informace o úlohách provedených v tomto kurzu najdete v těchto tématech:
Další krok
Váš názor
https://aka.ms/ContentUserFeedback.
Připravujeme: V průběhu roku 2024 budeme postupně vyřazovat problémy z GitHub coby mechanismus zpětné vazby pro obsah a nahrazovat ho novým systémem zpětné vazby. Další informace naleznete v tématu:Odeslat a zobrazit názory pro