Sdílet prostřednictvím


Modul plug-in basket

Modul basket plug-in najde v datech časté vzory atributů a vrátí vzory, které v těchto datech předávají prahovou hodnotu četnosti. Vzor představuje podmnožinu řádků, které mají stejnou hodnotu v jednom nebo více sloupcích. Modul basket plug-in je založen na algoritmu Apriori původně vyvinutém pro dolování dat analýzy košíku.

Syntaxe

Tevaluate ( | basket [ Prahová hodnota, WeightColumn, MaxDimensions, CustomWildcard CustomWildcard,, ... ])

Přečtěte si další informace o konvencích syntaxe.

Parametry

Název Type Požadováno Popis
Prahová hodnota long A double v rozsahu 0,015 až 1, který nastavuje minimální poměr řádků, které se mají považovat za časté. Vzorce s menším poměrem nebudou vráceny. Výchozí hodnota je 0,05. Chcete-li použít výchozí hodnotu, zadejte vlnovku: ~.

Příklad: T | evaluate basket(0.02)
WeightColumn string Název sloupce, který se má použít k zvážení každého řádku ve vstupu podle zadané váhy. Musí být název sloupce číselného typu, například int, long, real. Ve výchozím nastavení má každý řádek váhu 1. Chcete-li použít výchozí hodnotu, zadejte vlnovku: ~. Běžným použitím sloupce hmotnosti je vzít v úvahu vzorkování nebo dělení nebo agregaci dat, která jsou již vložena do každého řádku.

Příklad: T | evaluate basket('~', sample_Count)
MaxDimensions int Nastaví maximální počet nekótovaných dimenzí na koš omezený ve výchozím nastavení, aby se minimalizoval modul runtime dotazu. Výchozí volba je 5. Chcete-li použít výchozí hodnotu, zadejte vlnovku: ~.

Příklad: T | evaluate basket('~', '~', 3)
CustomWildcard string Nastaví hodnotu zástupných znaků pro konkrétní typ ve výsledné tabulce, která bude indikovat, že aktuální vzor nemá omezení pro tento sloupec. Výchozí hodnota je null s výjimkou řetězců sloupců, jejichž výchozí hodnota je prázdný řetězec. Pokud je výchozí hodnota v datech dobrá, měla by se použít jiná hodnota se zástupným znakem, například *. Chcete-li použít výchozí hodnotu, zadejte vlnovku: ~.

Příklad: T | evaluate basket('~', '~', '~', '*', int(-1), double(-1), long(0), datetime(1900-1-1))

Poznámka:

Pokud chcete zadat volitelný parametr, který následuje za volitelným parametrem, nezapomeňte zadat hodnotu pro předchozí volitelný parametr. Další informace naleznete v tématu Práce s volitelnými parametry.

Návraty

Modul basket plug-in vrací časté vzory, které předávají prahovou hodnotu poměru. Výchozí prahová hodnota je 0,05.

Každý vzor je ve výsledcích reprezentován řádkem. Prvním sloupcem je ID segmentu. Další dva sloupce jsou počet a procento řádků z původního dotazu, který odpovídá vzoru. Zbývající sloupce se vztahují k původnímu dotazu s konkrétní hodnotou ze sloupce nebo se zástupnými znaménou hodnotou, která je ve výchozím nastavení null, což znamená hodnotu proměnné.

Poznámka:

Algoritmus používá vzorkování k určení počátečních častých hodnot. Proto se výsledky můžou mírně lišit mezi několika spuštěními pro vzory, jejichž frekvence se blíží prahové hodnotě.

Příklad

StormEvents
| where monthofyear(StartTime) == 5
| extend Damage = iff(DamageCrops + DamageProperty > 0 , "YES" , "NO")
| project State, EventType, Damage, DamageCrops
| evaluate basket(0.2)

Výstup

SegmentId Počet Procenta State Typ události Škoda DamageCrops
0 4574 77.7 NE 0
1 2278 38.7 Krupobití NE 0
2 5675 96.4 0
3 2371 40.3 Krupobití 0
4 1279 21.7 Větrná bouře 0
5 2468 41.9 Krupobití
6 1310 22,3 ANO
7 1291 21.9 Větrná bouře

Příklad s vlastními zástupnými cardy

StormEvents
| where monthofyear(StartTime) == 5
| extend Damage = iff(DamageCrops + DamageProperty > 0 , "YES" , "NO")
| project State, EventType, Damage, DamageCrops
| evaluate basket(0.2, '~', '~', '*', int(-1))

Výstup

SegmentId Počet Procenta State Typ události Škoda DamageCrops
0 4574 77.7 * * NE 0
1 2278 38.7 * Krupobití NE 0
2 5675 96.4 * * * 0
3 2371 40.3 * Krupobití * 0
4 1279 21.7 * Větrná bouře * 0
5 2468 41.9 * Krupobití * -1
6 1310 22,3 * * ANO -1
7 1291 21.9 * Větrná bouře * -1