Condividi tramite


Plug-in basket

Si applica a: ✅Microsoft FabricAzure Esplora dati

Il basket plug-in trova modelli frequenti di attributi nei dati e restituisce i modelli che superano una soglia di frequenza in tali dati. Un criterio rappresenta un subset delle righe con lo stesso valore in una o più colonne. Il basket plug-in si basa sull'algoritmoApriori originariamente sviluppato per il data mining di analisi del carrello.

Sintassi

T | evaluatebasket( [ Threshold,WeightColumn, MaxDimensions, CustomWildcard CustomWildcard,, ... ])

Altre informazioni sulle convenzioni di sintassi.

Parametri

Nome Digita Obbligatorio Descrizione
Soglia long Oggetto double compreso nell'intervallo compreso tra 0,015 e 1 che imposta il rapporto minimo delle righe da considerare frequenti. I modelli con un rapporto inferiore non verranno restituiti. Il valore predefinito è 0,05. Per usare il valore predefinito, immettere la tilde: ~.

Esempio: T | evaluate basket(0.02)
WeightColumn string Nome della colonna da utilizzare per considerare ogni riga nell'input in base al peso specificato. Deve essere un nome di una colonna di tipo numerico, ad esempio int, long, real. Per impostazione predefinita, ogni riga ha un peso pari a 1. Per usare il valore predefinito, immettere la tilde: ~. Una colonna di ponderazione viene in genere usata per tenere in considerazione il campionamento o il bucket/aggregazione dei dati già incorporati in ogni riga.

Esempio: T | evaluate basket('~', sample_Count)
MaxDimensions int Imposta il numero massimo di dimensioni non correlate per carrello, limitato per impostazione predefinita, per ridurre al minimo il runtime di query. L'impostazione predefinita è 5. Per usare il valore predefinito, immettere la tilde: ~.

Esempio: T | evaluate basket('~', '~', 3)
CustomWildcard string Imposta il valore del carattere jolly per un tipo specifico nella tabella dei risultati, che indica che il criterio corrente non prevede una restrizione su questa colonna. Il valore predefinito è null ad eccezione delle colonne stringa il cui valore predefinito è una stringa vuota. Se il valore predefinito è un valore valido nei dati, è necessario usare un valore jolly diverso, ad esempio *. Per usare il valore predefinito, immettere la tilde: ~.

Esempio: T | evaluate basket('~', '~', '~', '*', int(-1), double(-1), long(0), datetime(1900-1-1))

Nota

Per specificare un parametro facoltativo che segue un parametro facoltativo, assicurarsi di fornire un valore per il parametro facoltativo precedente. Per altre informazioni, vedere Uso dei parametri facoltativi.

Valori restituiti

Il basket plug-in restituisce modelli frequenti che superano una soglia di rapporto. La soglia predefinita è 0,05.

Ogni modello è rappresentato da una riga nei risultati. La prima colonna è l'ID segmento. Le due colonne successive sono il conteggio e la percentuale di righe, dalla query originale che corrispondono al modello. Le colonne rimanenti sono correlate alla query originale, con un valore specifico della colonna o un valore con caratteri jolly, ovvero null per impostazione predefinita, ovvero un valore di variabile.

Nota

L'algoritmo usa il campionamento per determinare i valori frequenti iniziali. Di conseguenza, i risultati potrebbero variare leggermente tra più esecuzioni per i modelli la cui frequenza è vicina alla soglia.

Esempi

L'esempio seguente usa il basket plug-in per trovare modelli frequenti nei dati.

StormEvents
| where monthofyear(StartTime) == 5
| extend Damage = iff(DamageCrops + DamageProperty > 0 , "YES" , "NO")
| project State, EventType, Damage, DamageCrops
| evaluate basket(0.2)

Risultato

ID segmento Conteggio Percentuale Provincia TipoDiEvento Danni DamageCrops
0 4574 77.7 NO 0
1 2278 38.7 Grandine NO 0
2 5675 96.4 0
3 2371 40.3 Grandine 0
4 1279 21.7 Vento di tempesta 0
5 2468 41.9 Grandine
6 1310 22,3
7 1291 21.9 Vento di tempesta

L'esempio seguente illustra l'uso del plug-in basket con una colonna peso e caratteri jolly personalizzati per trovare modelli frequenti.

StormEvents
| where monthofyear(StartTime) == 5
| extend Damage = iff(DamageCrops + DamageProperty > 0 , "YES" , "NO")
| project State, EventType, Damage, DamageCrops
| evaluate basket(0.2, '~', '~', '*', int(-1))

Risultato

ID segmento Conteggio Percentuale Provincia TipoDiEvento Danni DamageCrops
0 4574 77.7 * * NO 0
1 2278 38.7 * Grandine NO 0
2 5675 96.4 * * * 0
3 2371 40.3 * Grandine * 0
4 1279 21.7 * Vento di tempesta * 0
5 2468 41.9 * Grandine * -1
6 1310 22,3 * * -1
7 1291 21.9 * Vento di tempesta * -1