Cvičení – výběr sloupců k vrácení pomocí operátoru projektu

Dokončeno

Pomocí dotazů Kusto můžete filtrovat data a vracet konkrétní informace.

Vzpomeňte si, že jste se podívali na libovolné řádky dat, abyste získali představu o jeho struktuře. V této lekci se dozvíte, jak vybrat konkrétní datové sloupce, které se vztahují k typům bouře, umístěním a škodlivým účinkům.

Použití operátoru project

Pokud si pamatujete, v příkladu meteorologických dat je poměrně málo sloupců. Ne všechny tyto sloupce jsou pro toto zkoumání smysluplné. Pro zobrazení zvolíte jenom několik sloupců. Operátor použijete project k definování sloupců, které chcete zobrazit ve výstupu. Názvy sloupců jsou oddělené čárkami.

  1. Spusťte následující dotaz. Tento dotaz pojmenuje sloupce, které mají být vráceny, a jejich pořadí v rámci operátoru project .

    Spuštění dotazu

    StormEvents
    | project EventType, State, DamageProperty, DamageCrops, InjuriesDirect, InjuriesIndirect
    | take 10
    
  2. Měli byste získat výsledky, které vypadají jako na následujícím obrázku:

    Screenshot of project operator results with six columns.

  3. Všimněte si, že ve výstupu project se zobrazí pouze sloupce uvedené v operátoru.

Přejmenování a definování nových sloupců pomocí project

Chcete-li porozumět dopadům bouřek v USA, chcete získat celkový počet zranění a celkové množství škod. Pomocí operátoru project můžete sečíst celočíselné hodnoty z různých sloupců a vrátit výsledky do nového sloupce. Sloupce můžete také přejmenovat, aby byly smysluplnější pro vaši analýzu.

Existují například další země nebo oblasti se státy. Může být užitečné přejmenovat sloupec stavu, aby bylo jasné, že výsledky jsou pro státy USA. Pojďme se podívat, jak změnit předchozí dotaz, abyste získali celkový počet zranění a množství škod ve státech USA.

  1. Aktualizujte předchozí dotaz tak, aby vytvořil nový sloupec, který zobrazuje součet ZraněníDirect a InjuriesIndirect:

    Injuries=InjuriesDirect+InjuriesIndirect

  2. Stejný postup proveďte u dvou typů sloupců poškození tak, že seskupíte škody na plodinách a poškození majetku:

    Damage=DamageCrops+DamageProperty

  3. Najeďte myší na název sloupce v editoru dotazů, abyste viděli datový typ obsažený ve sloupcích. K přidání hodnot můžete použít číselný operátor, protože tyto sloupce jsou typu int (celé číslo).

    Screenshot of the data type in a query editor.

  4. Přejmenujte sloupec State na US_State:

    US_State=State

  5. Zkontrolujte aktualizovaný dotaz a spusťte ho. Úplný dotaz zahrnuje výpočty zranění, výpočty škod a přejmenování sloupce Stát .

    Spuštění dotazu

    StormEvents
    | project US_State=State, EventType, Injuries=InjuriesDirect+InjuriesIndirect, Damage=DamageCrops+DamageProperty
    | take 10
    
  6. Měli byste získat výsledky, které vypadají jako na následujícím obrázku:

    Screenshot of query results for a project operator that renames columns.

  7. Všimněte si, že sloupec Stát byl přejmenován na US_State. Sloupec Zranění je nový a byl vypočítán jako součet ZraněníDirect a InjuriesIndirect. Sloupec Poškození je také nový a byl vypočítán jako součet DamageCrops a DamageProperty.

Použití operátoru project-away

Co když chcete odebrat několik vybraných sloupců? Pro účely tohoto průzkumu nemáte žádné použití pro ID přiřazená k jednotlivým epizodám a událostem. Konkrétní sloupce můžete odebrat pomocí operátoru project-away , který označuje, které sloupce se mají odebrat, a přitom ponechat všechny zbývající sloupce. Můžete také použít zástupný znak, například | project-away *Id, k odebrání všech sloupců, které končí ID.

  1. Spusťte tento dotaz:

    Spuštění dotazu

    StormEvents
    | project-away EpisodeId, EventId
    | take 10
    
  2. Zkontrolujte výsledky. Vzpomeňte si, že sloupce EpisodeId a EventId byly mezi sloupci EndTime a State . Které z těchto sloupců vidíte ve výstupu?